mictoo

文字起こし用に音声を圧縮する方法

Mictooは無料で25 MBまでのファイルを受け付けます。ファイルがより大きい場合、文字起こしの品質を犠牲にせずに縮小する3つの素早い方法があります。 ファイルとスキルに合うものを選んでください。

方法1 — 動画ファイルから音声を抽出

主に音声を含む動画ファイル(MP4、WEBM、MOV)がある場合、音声トラックは通常動画より5〜10倍小さくなります。Mictooは音声のみが必要 — 動画は文字起こしに役立ちません。 ほとんどのユーザーにとって最速の解決策です。

オンライン(インストール不要)

  • Convertio — MP4をドラッグ、MP3またはM4Aを選択、ダウンロード。
  • CloudConvert — MP4 → MP3 / M4A / WAVに対応。
  • Media.io — ブラウザでの高速変換。

コマンドライン(ffmpeg)

ffmpeg -i input.mp4 -vn -acodec copy output.m4a

-vnは動画を削除、-acodec copyは音声品質を変更せずに保持します。高速 — 再エンコードなし。

方法2 — 音声のビットレートを下げる

ほとんどのポッドキャストや会議は128〜192 kbpsで録音されています。文字起こしには64 kbpsモノラルで十分以上 — 精度は同じままで、ファイルは2〜3倍小さくなります。 長い音声ファイルに最適な方法です。

オンライン

コマンドライン(ffmpeg)

ffmpeg -i input.mp3 -ac 1 -b:a 64k output.mp3

-ac 1はモノラルに変換(音声はモノラルでうまく聞こえます)、-b:a 64kは音声ビットレートを64 kbpsに設定します。

クイック計算: 64 kbpsは1時間あたり〜28 MB。1時間のインタビューは約28 MBに収まります — 制限に近い。気づくほどの精度損失なしで-b:a 48kに下げると1時間あたり〜21 MBになります。

方法3 — 短い部分に分割

元の品質を保持する必要がある場合(法律、医療、アーカイブの録音)は、ファイルを20〜25分のチャンクに分割し、それぞれを別々に文字起こしします。 その後、任意のテキストエディターで文字起こしを連結します。

オンライン

  • mp3cut.net — MP3をドラッグ、開始/終了を設定、ダウンロード。
  • Clideo Cut Audio — クリーンなインターフェース、ほとんどのフォーマットに対応。

コマンドライン(ffmpeg)

ffmpeg -i input.mp3 -f segment -segment_time 1200 -c copy part_%03d.mp3

入力ファイルを20分のチャンク(1200秒)に分割し、part_001.mp3part_002.mp3などと命名します。次に各部分をMictooにアップロードしてください。

準備完了?

ファイルが25 MB未満になったら、ホームページに戻って文字起こしツールにアップロードしてください。

↑ 文字起こしに戻る