文字起こし用に音声を圧縮する方法

Mictooは無料で25 MBまでのファイルを受け付けます。ファイルがより大きい場合、文字起こしの品質を犠牲にせずに縮小する3つの素早い方法があります。ファイルとスキルに合うものを選んでください。

方法1 — 動画ファイルから音声を抽出

主に音声を含む動画ファイル(MP4、WEBM、MOV)がある場合、音声トラックは通常動画より5〜10倍小さくなります。Mictooは音声のみが必要 — 動画は文字起こしに役立ちません。ほとんどのユーザーにとって最速の解決策です。

ffmpeg -i input.mp4 -vn -acodec copy output.m4a

-vnは動画を削除、-acodec copyは音声品質を変更せずに保持します。高速 — 再エンコードなし。

ほとんどのポッドキャストや会議は128〜192 kbpsで録音されています。文字起こしには64 kbpsモノラルで十分以上 — 精度は同じままで、ファイルは2〜3倍小さくなります。長い音声ファイルに最適な方法です。

ffmpeg -i input.mp3 -ac 1 -b:a 64k output.mp3

-ac 1はモノラルに変換(音声はモノラルでうまく聞こえます)、-b:a 64kは音声ビットレートを64 kbpsに設定します。

クイック計算: 64 kbpsは1時間あたり〜28 MB。1時間のインタビューは約28 MBに収まります — 制限に近い。気づくほどの精度損失なしで-b:a 48kに下げると1時間あたり〜21 MBになります。

元の品質を保持する必要がある場合(法律、医療、アーカイブの録音)は、ファイルを20〜25分のチャンクに分割し、それぞれを別々に文字起こしします。その後、任意のテキストエディターで文字起こしを連結します。

ffmpeg -i input.mp3 -f segment -segment_time 1200 -c copy part_%03d.mp3

入力ファイルを20分のチャンク(1200秒)に分割し、part_001.mp3、part_002.mp3などと命名します。次に各部分をMictooにアップロードしてください。

ファイルが25 MB未満になったら、ホームページに戻って文字起こしツールにアップロードしてください。

その他の文字起こしツール