文字起こし用に音声を圧縮する方法
Mictooは無料で25 MBまでのファイルを受け付けます。ファイルがより大きい場合、文字起こしの品質を犠牲にせずに縮小する3つの素早い方法があります。 ファイルとスキルに合うものを選んでください。
方法1 — 動画ファイルから音声を抽出
主に音声を含む動画ファイル(MP4、WEBM、MOV)がある場合、音声トラックは通常動画より5〜10倍小さくなります。Mictooは音声のみが必要 — 動画は文字起こしに役立ちません。 ほとんどのユーザーにとって最速の解決策です。
オンライン(インストール不要)
- Convertio — MP4をドラッグ、MP3またはM4Aを選択、ダウンロード。
- CloudConvert — MP4 → MP3 / M4A / WAVに対応。
- Media.io — ブラウザでの高速変換。
コマンドライン(ffmpeg)
ffmpeg -i input.mp4 -vn -acodec copy output.m4a-vnは動画を削除、-acodec copyは音声品質を変更せずに保持します。高速 — 再エンコードなし。
方法2 — 音声のビットレートを下げる
ほとんどのポッドキャストや会議は128〜192 kbpsで録音されています。文字起こしには64 kbpsモノラルで十分以上 — 精度は同じままで、ファイルは2〜3倍小さくなります。 長い音声ファイルに最適な方法です。
オンライン
- Online Audio Converter — 品質スライダーを64 kbps、モノラルに設定。
- FreeConvert Audio Compressor — 目標サイズを選択。
コマンドライン(ffmpeg)
ffmpeg -i input.mp3 -ac 1 -b:a 64k output.mp3-ac 1はモノラルに変換(音声はモノラルでうまく聞こえます)、-b:a 64kは音声ビットレートを64 kbpsに設定します。
クイック計算: 64 kbpsは1時間あたり〜28 MB。1時間のインタビューは約28 MBに収まります — 制限に近い。気づくほどの精度損失なしで-b:a 48kに下げると1時間あたり〜21 MBになります。
方法3 — 短い部分に分割
元の品質を保持する必要がある場合(法律、医療、アーカイブの録音)は、ファイルを20〜25分のチャンクに分割し、それぞれを別々に文字起こしします。 その後、任意のテキストエディターで文字起こしを連結します。
オンライン
- mp3cut.net — MP3をドラッグ、開始/終了を設定、ダウンロード。
- Clideo Cut Audio — クリーンなインターフェース、ほとんどのフォーマットに対応。
コマンドライン(ffmpeg)
ffmpeg -i input.mp3 -f segment -segment_time 1200 -c copy part_%03d.mp3入力ファイルを20分のチャンク(1200秒)に分割し、part_001.mp3、part_002.mp3などと命名します。次に各部分をMictooにアップロードしてください。
その他の文字起こしツール