Аудио в текст
Бесплатная AI-расшифровка
Бесплатная AI-расшифровка для любого аудио. MP3, WAV, M4A, FLAC, OGG, AAC. Без аккаунта, без оплаты за минуту.
Перетащите файл сюда
или нажмите, чтобы выбрать
MP3 · MP4 · WAV · M4A · OGG · WEBM · FLAC · Макс. 25 МБ · Макс. 30 мин (60 мин · Войти)
Как это работает
Загрузите аудио
Подходит любой распространённый формат. MP3 с телефона, WAV с диктофона, M4A из iPhone Voice Memos, FLAC из подкаст-экспорта. Перетащите файл или кликните для выбора.
AI расшифрует
Мы используем OpenAI Whisper large-v3. 10-минутный файл готов за 20 секунд. 30-минутный — меньше чем за минуту.
Скопируйте, скачайте или отредактируйте
Прочитайте расшифровку в браузере. Скачайте как TXT для заметок или SRT с таймкодами. Исправьте неточности прямо в редакторе перед экспортом.
Почему Mictoo для аудио в текст
Одна модель, и она сильная
Мы используем Whisper large-v3 для всех. Никакого фокуса с «бесплатный тариф работает на слабой модели». Та же модель, что и в дорогих корпоративных сервисах транскрибации.
Поддержка форматов реально широкая
MP3, WAV, M4A, FLAC, OGG, WEBM, AAC, плюс видео с аудио внутри (MP4, MOV). Никакого «мы принимаем только MP3, сконвертируйте файл сами».
50+ языков, включая билингвальные файлы
Автоопределение языка по первым секундам аудио. Если файл переключается между языками посреди записи (часто в интервью), Whisper следует за переключением.
Файлы не хранятся
Аудио уходит в провайдер транскрибации, обрабатывается и удаляется. Мы не пишем файл в базу или хранилище. Поставщики (Groq, OpenAI) не используют API-данные для обучения.
Бесплатно без звёздочек
До 30 минут на файл без аккаунта. С бесплатной авторизацией — до 60 минут. Больше никаких ограничений.
Когда аудио в текст экономит время
Заметки по интервью
Час с источником в записи. Вместо того чтобы перематывать аудио в поисках одной цитаты, делаете Ctrl+F по расшифровке. Пять секунд вместо пяти минут.
Голосовые заметки в текст
Надиктовали идею в телефон во время прогулки. Теперь нужен текст. Загрузили M4A, получили готовые предложения, скопировали в Notion.
Обзор лекций и вебинаров
Двухчасовая лекция плохо смотрится на скорости 2x. Текстовая расшифровка позволяет пройтись по разделам и зайти только в нужные части.
Подготовка к переводу
Whisper расшифровывает на языке оригинала. Дальше вставляете в DeepL или ChatGPT и получаете чистый перевод. Лучше, чем автоперевод с сырого аудио.
Поиск по архиву аудио
Годы записанных звонков, эпизодов, встреч? Запустите пакетную расшифровку — получите архив, по которому можно искать текстом. Дешевле любого «AI-помощника для встреч» с подпиской.
Советы для чистой расшифровки
Моно подходит. Стерео — лишний трафик
Речи не нужно два канала. Если файл огромный, переконвертируйте в моно — размер падает вдвое без потери качества для распознавания. ffmpeg в одну строку: ffmpeg -i input.wav -ac 1 output.wav.
64 кбит/с для голоса хватает
Если экспортируете из DAW или редактора, 64 кбит/с моно MP3 даёт Whisper всё что нужно. Битрейт выше не улучшает точность расшифровки, только увеличивает файл.
Обрезайте длинные паузы в начале и конце
Если запись начинается с 90 секунд тишины до первого слова, эти 90 секунд съедают лимит длительности. Уберите в Audacity (Effect, Truncate Silence) перед загрузкой.
Для коротких файлов выбирайте язык вручную
Автоопределение анализирует первый кусок аудио. Для файлов короче 5 минут этого недостаточно, и распознавание языка может ошибиться. Выберите язык явно из выпадающего списка.
Фоновая музыка заставляет Whisper галлюцинировать
Если в аудио есть музыка под речью (спонсорские джинглы, интро, b-roll), модель иногда вставляет несуществующие слова в местах, где звучит только музыка. Если есть версия без музыки — используйте её.
Для очень шумного аудио сначала шумодав
Бесплатные варианты: Audacity Noise Reduction (встроено) или Adobe Podcast Enhance (бесплатный веб-инструмент, удивительно хороший). Прогоните файл, потом загружайте.
Частые вопросы
Какой бесплатный конвертер аудио в текст лучший?
Мы предвзяты, но честный ответ: любой инструмент на Whisper large-v3 в топе бесплатного сегмента. Mictoo использует именно эту модель, без регистрации. Otter и Trint хороши, но берут плату за минуту сверх своей бесплатной квоты. Для разовых расшифровок бесплатный сегмент — правильный выбор.
Насколько точна расшифровка аудио?
Для чистой речи на крупном языке — 5–10% ошибок (word error rate). Для шумного аудио, сильных акцентов или специальной лексики точность падает. Для большинства задач (заметки, поиск, черновики) этого достаточно. Для юридических или медицинских записей наймите человека.
Какие форматы аудио поддерживаете?
MP3, WAV, M4A, FLAC, OGG, WEBM, AAC. Также видео — MP4 и MOV (мы извлекаем аудио автоматически). AIFF и ALAC напрямую не поддерживаются. Сконвертируйте их сначала в WAV или FLAC.
Сколько времени занимает расшифровка?
5-минутный файл готов за 10–15 секунд. 30-минутный — за 45–60 секунд. Мы обрабатываем файл целиком, без разбивки на куски с вашей стороны.
Можно расшифровать запись телефонного звонка?
Да. Телефонные звонки обычно 8 кГц моно с компрессией. Whisper справляется, точность чуть ниже, чем для студийного аудио. Убедитесь, что запись звонка законна в вашей юрисдикции.
Нужно ли выбирать язык?
Нет, автоопределение включено по умолчанию. Для аудио короче 5 минут или файлов с неречевым началом выбирайте язык вручную для надёжности.
Есть ли оплата за минуту?
Никаких оплат. Расшифровка бесплатна без счётчика минут. Мы зарабатываем на рекламе и планируемом Pro-тарифе для тех, кому нужно больше.
Какой максимальный размер файла?
25 МБ без аккаунта, 60 МБ после бесплатной авторизации. Если файл больше, см. наш гайд по сжатию.
Мои аудио хранятся на серверах?
Нет. Мы отправляем файл напрямую в провайдер расшифровки, получаем текст и удаляем аудио. Ничего не пишется в базу или хранилище.
Можно отредактировать расшифровку перед скачиванием?
Да. После транскрибации правьте слова прямо в окне результата, потом скачайте отредактированную версию.
Какие форматы экспорта доступны?
Простой текст (TXT), файл субтитров (SRT) с таймкодами и копирование в буфер. SRT работает в YouTube Studio, Premiere Pro, DaVinci Resolve и любом стандартном видеоредакторе.
Mictoo работает на мобильном?
Да. Сайт адаптирован под мобильные. Можно загружать прямо с телефона, включая iOS Files или папку загрузок Android.
Готовы расшифровать?
Прокрутите вверх и загрузите файл. Расшифровка будет готова примерно через минуту.
↑ Вернуться к загрузке