Transcrição de entrevista
Transcrições de entrevista grátis
Transforme qualquer gravação de entrevista em texto limpo e citável. Para jornalistas, pesquisadores, podcasters, times de recruiting. Sem cadastro, sem cobrança por minuto, sem email.
Solte seu arquivo aqui
ou clique para procurar
MP3 · MP4 · WAV · M4A · OGG · WEBM · FLAC · Máx. 25 MB · Máx. 30 min (60 min · Entrar)
Como funciona
Solte o áudio da entrevista
MP3 de um gravador de voz, M4A de um telefone, MP4 de uma videochamada, WAV de um gravador de campo. Tudo funciona.
A IA transcreve
O Whisper large-v3 lê o áudio. Uma entrevista de 30 minutos normalmente termina em cerca de um minuto.
Leia, edite, exporte
Folheie a transcrição com timecode. Corrija nomes ou jargão errados inline. Baixe como TXT para notas, SRT para vídeo, ou copie para o software de coding.
Por que Mictoo para transcrição de entrevista
O Whisper se dá bem com entrevistas
Gravações únicas com duas vozes e troca clara são o caso mais limpo para reconhecimento de fala. A maioria das entrevistas chega a 90-95% de precisão na primeira passada.
Timecode para citação e busca de fonte
Cada linha do export SRT tem um timecode. Quando você precisa verificar uma citação ou voltar a um momento exato da gravação, o timecode diz onde.
Sem custo por entrevista
Alguns serviços de transcrição cobram por minuto ou por entrevista. Nós não. Transcreva uma ou cinquenta, o preço é o mesmo (grátis).
Mais de 50 idiomas, inclusive entrevistas bilíngues
Entrevistas cross-linguísticas são comuns em pesquisa e jornalismo. O Whisper lida com code-switching melhor que a maioria dos serviços.
Privacidade e proteção de fonte
O arquivo vai ao provedor de transcrição e é descartado. Não guardamos o áudio. Para material-fonte sensível, isso conta.
Quem usa transcrições de entrevista
Jornalismo e escrita de feature
Repórteres transcrevem entrevistas para citar com precisão e percorrer conversas longas em busca do material mais útil. Uma entrevista de 60 minutos frequentemente vira 3-5 citações-chave no texto publicado.
Pesquisa qualitativa e estudos acadêmicos
Pesquisadores transcrevem entrevistas semi-estruturadas para codificar e analisar em ferramentas como NVivo, Atlas.ti ou MAXQDA. A transcrição é o dataset.
Entrevistas de podcast
Hosts transcrevem entrevistas com convidados para show notes, posts de blog de episódio e gráficos de citação para social. O áudio alcança um público, o texto alcança outro via busca.
Recruiting e screening de candidatos
Recruiters e hiring managers transcrevem entrevistas para compartilhar com o time. Mais fácil que vídeo para revisores em fusos diferentes. Mais fácil comparar notas quando todo mundo tem o mesmo texto.
User research e customer interview
Times de produto transcrevem conversas com clientes para achar padrões. A transcrição vai no research repository (Dovetail, Marvin ou um Notion compartilhado).
Dicas para transcrever entrevistas
Use um microfone de verdade, mesmo para entrevista por telefone
Um lavalier ou USB para o entrevistado presencial, e cuffies decentes para o entrevistador no telefone. A qualidade da gravação é o maior fator individual na precisão da transcrição.
Grave num lugar tranquilo
Entrevistas em café ficam ótimas na câmera e transcrevem mal. Música de fundo e papo paralelo prejudicam a precisão mais do que as pessoas acham.
Para entrevistas a duas vozes, transcreva a gravação inteira e depois adicione etiquetas de orador manualmente
O Whisper não faz diarização. Para uma entrevista limpa de pergunta-resposta, adicionar "Entrevistador:" e "Fonte:" leva cerca de 5 minutos para cada 30 minutos de entrevista.
Se você tem faixas de áudio separadas (Riverside, SquadCast), transcreva cada uma separadamente
Aí você recebe atribuição limpa sem chute. Alguns gravadores de pesquisa capturam dois microfones em dois canais de um arquivo stereo. Você pode dividir em dois arquivos mono antes.
Salve a transcrição com data e nome da fonte
Um arquivo de transcrição chamado 2026-05-25-jane-smith.txt é mais fácil de achar seis meses depois que transcript-final-v2.txt.
Edite as 50 primeiras linhas para precisão, deixe o resto
As pessoas escaneiam transcrições. A parte inicial conta mais. Daí em diante, corrija só as citações que você pensa em usar.
Defina o idioma manualmente se a entrevista não é em inglês
A detecção automática funciona na maioria dos arquivos, mas um falso início de 5 segundos no começo pode enganar. Escolher o idioma explicitamente é mais confiável.
Perguntas frequentes
É preciso o bastante para citação jornalística?
Para citação literal, você deve sempre verificar contra o áudio. O Whisper acerta 90-95% das palavras em áudio de entrevista limpo. Os 5-10% que erra frequentemente incluem nomes, termos técnicos e fala sobreposta. Use os timecodes SRT para voltar à gravação em qualquer citação que você publicar.
Vou ter etiquetas de orador?
Não automaticamente. Você as adiciona com base no fluxo da conversa. Para uma entrevista de 2 oradores é rápido. Para painéis ou focus groups, planeje mais tempo ou suba a faixa de cada orador separadamente se você as tem.
Posso transcrever uma entrevista em outro idioma?
Sim, mais de 50 idiomas com detecção automática. Para entrevistas abaixo de 5 minutos ou entrevistas não-inglesas que começam com small talk em inglês, escolha o idioma manualmente.
Minha entrevista é de 90 minutos. O que faço?
Divida em pedaços abaixo do cap de 60 minutos. A pausa natural está onde a conversa para (café no meio da entrevista, mudança de tópico).
Quão precisos são termos técnicos e nomes próprios?
Menos precisos que o vocabulário comum. O Whisper não sabe o nome da empresa da sua fonte, o termo médico que ela usou ou o software específico que mencionou. Espere corrigir manualmente. O resto da transcrição vai ser sólido.
O áudio é guardado?
Não. O arquivo vai ao provedor de transcrição (Groq, com OpenAI como backup), é processado, depois descartado. Não guardamos o áudio nos nossos servidores.
É compatível com políticas de ética de pesquisa?
A maior parte dos protocolos de pesquisa aprovados por IRB exige saber onde o áudio é processado. Nossos provedores processam nos EUA. Não retemos. Para compliance IRB específico, documente o workflow e cheque com seu IRB.
Posso importar a transcrição no NVivo, Atlas.ti ou Dedoose?
Sim. Baixe como TXT e importe na sua ferramenta de análise qualitativa. A transcrição é texto puro, sem formato especial necessário.
Quanto demora a transcrição?
Cerca de 1-2% da duração do áudio. Uma entrevista de 30 minutos termina em cerca de 60 segundos.
E se a entrevista tem qualidade de áudio ruim?
Passe primeiro por uma ferramenta de denoise (Audacity Noise Reduction ou Adobe Podcast Enhance). Depois suba a versão limpa. Input melhor dá output notavelmente melhor.
Posso transcrever uma entrevista gravada no telefone?
Sim. Voice Memos do iPhone salva como M4A, gravadores de voz Android normalmente como M4A ou MP3. Os dois funcionam. AirDrop ou email para o computador, depois suba aqui.
Os timecodes no SRT vão bater exato com a gravação original?
Sim, ao milissegundo. Os timecodes SRT refletem o tempo real no arquivo de áudio. Funcionam para voltar a um momento específico em qualquer player de áudio ou vídeo.
Pronto para transcrever?
Role para cima e solte seu arquivo. A transcrição fica pronta em cerca de um minuto.
↑ Voltar ao uploader