mictoo
MP3 · WAV · M4A · FLAC · GRÁTIS

Áudio em texto
Transcrição IA grátis

Transcrição IA grátis para qualquer arquivo de áudio. MP3, WAV, M4A, FLAC, OGG, AAC. Sem conta, sem cobrança por minuto.

Resumo com IATraduzir, 28 idiomasOpenAI Whisper

Solte seu arquivo aqui

ou clique para procurar

MP3 · MP4 · WAV · M4A · OGG · WEBM · FLAC  ·  Máx. 25 MB  ·  Máx. 30 min (60 min · Entrar)

Arquivo maior? Veja como comprimir.

Gravação mais longa? Veja como dividir.

Como funciona

📂

Solte o áudio

Qualquer formato comum funciona. MP3 do celular, WAV do gravador de campo, M4A de memos de voz do iPhone, FLAC de export de podcast. Arraste o arquivo ou clique para escolher.

A IA transcreve

Usamos OpenAI Whisper large-v3. Um arquivo de 10 minutos demora cerca de 20 segundos. Um de 30 minutos, menos de um minuto.

📋

Copie, baixe ou edite

Leia a transcrição no navegador. Baixe como TXT para anotações ou SRT se precisar de marcadores de tempo. Corrija palavras erradas inline antes de exportar.

Por que Mictoo para áudio em texto

Um modelo, e ele é o melhor

Usamos Whisper large-v3 para todo mundo. Sem truques tipo "a versão grátis roda em modelo mais fraco". O mesmo modelo que move transcrição enterprise cara transcreve seu arquivo.

Suporte amplo a formatos

MP3, WAV, M4A, FLAC, OGG, WEBM, AAC, mais formatos de vídeo com áudio dentro (MP4, MOV). Sem fricção do tipo "só aceitamos MP3, converta antes".

Mais de 50 idiomas, inclusive arquivos bilíngues

A detecção automática escolhe o idioma a partir de uma amostra curta de áudio. Se o seu arquivo trocar de idioma no meio da gravação (típico em entrevistas), o Whisper acompanha a troca.

Nenhum arquivo é guardado

Seu áudio é enviado ao provedor de transcrição, processado e descartado. Nunca gravamos o arquivo em nosso banco ou storage. Os provedores (Groq, OpenAI) não treinam com dados de API.

Grátis sem asterisco

Até 30 minutos por arquivo sem conta. Com cadastro grátis, até 60 minutos por arquivo. Nada mais é limitado.

Quando áudio em texto realmente economiza tempo

Notas de entrevista

Você passou uma hora conversando com uma fonte. Em vez de procurar uma citação ouvindo a gravação, dá Ctrl+F na transcrição. Cinco segundos em vez de cinco minutos.

Limpar memos de voz

Você ditou uma ideia pela metade no celular durante a rua. Agora quer ela como texto. Solta o M4A, recebe frases, cola no Notion.

Revisar aulas e webinars depois

Duas horas de aula em 2x é puxado. Uma transcrição em texto deixa você escanear seção por seção e só mergulhar nas partes que importam.

Preparação para tradução

O Whisper transcreve no idioma original. De lá você cola no DeepL ou ChatGPT e traduz limpo. Melhor do que tradução automática direto do áudio bruto.

Busca em catálogo antigo de áudio

Anos de gravações de calls, episódios ou reuniões? Com transcrição em lote, você de repente tem um arquivo pesquisável. Mais barato do que qualquer "ferramenta IA de meeting" com assinatura.

Dicas para uma transcrição de áudio limpa

1

Mono basta. Stereo é largura de banda desperdiçada

Fala não precisa de dois canais. Se o arquivo está enorme, reencode para mono e o tamanho cai pela metade sem perda de qualidade na transcrição. Comando ffmpeg: ffmpeg -i input.wav -ac 1 output.wav.

2

MP3 a 64 kbps é mais que suficiente para fala

Ao exportar de uma DAW ou editor, MP3 mono a 64 kbps dá ao Whisper tudo o que ele precisa. Bitrates maiores não melhoram a precisão, só engordam o arquivo.

3

Corte silêncios longos no começo e no fim

Se a sua gravação tem 90 segundos de ar morto antes da primeira palavra, esses 90 segundos comem o limite de duração. Corte em Audacity (Effect, Truncate Silence) antes do upload.

4

Escolha o idioma manualmente para arquivos curtos

A detecção automática amostra o primeiro chunk de áudio para identificar o idioma. Em arquivos abaixo de 5 minutos a amostra é pequena e a detecção fica menos confiável. Escolha o idioma explicitamente no menu.

5

Música de fundo faz o Whisper alucinar

Se o áudio tem música por baixo da fala (sponsor reads, intro beds, B-roll), o modelo às vezes inventa palavras em trechos só de música. Se você tem uma versão sem música, use ela.

6

Para arquivos muito ruidosos, faça denoise antes

Opções grátis: Audacity Noise Reduction (integrado) ou Adobe Podcast Enhance (web grátis, surpreendentemente bom). Passe o arquivo uma vez e depois carregue a versão limpa.

Perguntas frequentes

Qual é o melhor conversor grátis de áudio em texto?

Somos suspeitos, mas a resposta honesta: qualquer ferramenta que use Whisper large-v3 está no topo do free tier. Mictoo roda exatamente esse modelo sem muro de cadastro. Otter e Trint são bons, mas cobram por minuto além da cota grátis. Para transcrições ocasionais, free é o nível certo.

Quão precisa é a conversão de áudio em texto?

Para fala limpa em idioma principal: 5 a 10 por cento de taxa de erro por palavra. Para áudio ruidoso, sotaques fortes ou vocabulário técnico, a precisão cai. Para a maioria dos usos (notas, busca, rascunhos) é o bastante. Para registros jurídicos ou médicos, contrate um humano.

Quais formatos de áudio vocês suportam?

MP3, WAV, M4A, FLAC, OGG, WEBM, AAC. Também arquivos de vídeo como MP4 e MOV (extraímos o áudio automaticamente). AIFF e ALAC não são suportados diretamente. Converta para WAV ou FLAC antes.

Quanto tempo demora a transcrição?

Um arquivo de 5 minutos costuma ficar pronto em 10 a 15 segundos. Um de 30 minutos em 45 a 60. Processamos o arquivo inteiro como uma única requisição, sem precisar dividir do seu lado.

Posso transcrever uma gravação de chamada?

Sim. Chamadas telefônicas costumam ser 8 kHz mono com alguma compressão. O Whisper lida bem, a precisão é um pouco menor que áudio de estúdio. Garanta que a gravação seja legal na sua jurisdição.

Preciso escolher o idioma?

Não, detecção automática vem por padrão. Para áudio abaixo de 5 minutos ou arquivos que começam com algo não-falado, escolha o idioma manualmente para resultados mais confiáveis.

Tem cobrança por minuto?

Sem cobrança. Transcrição é grátis sem contador de minutos. Nos financiamos com publicidade display e um plano Pro planejado para power users.

Qual o tamanho máximo de arquivo?

25 MB sem conta, 60 MB com cadastro grátis. Se o arquivo for maior, veja nosso guia de compressão.

Meu áudio é guardado nos seus servidores?

Não. Enviamos o arquivo direto ao provedor de transcrição, recebemos o texto de volta e descartamos o áudio. Nada é gravado em banco de dados ou storage nosso.

Posso editar a transcrição antes do download?

Sim. Após a transcrição, dá para corrigir palavras erradas inline no visualizador de resultado e baixar a versão editada.

Quais formatos de saída tem?

Texto puro (TXT), arquivo de legenda (SRT) com timecode e copiar para a área de transferência. O SRT funciona no YouTube Studio, Premiere Pro, DaVinci Resolve e qualquer editor de vídeo padrão.

Mictoo funciona no celular?

Sim. A página é mobile-friendly. Dá para carregar direto do celular, inclusive do app Arquivos do iOS ou da pasta Downloads do Android.

Pronto para transcrever?

Role para cima e solte seu arquivo. A transcrição fica pronta em cerca de um minuto.

↑ Voltar ao uploader