mictoo
Periodismo · Research · Gratis

Transcripción de entrevistas
Transcripciones de entrevista gratis

Convierte cualquier grabación de entrevista en texto limpio y citable. Para periodistas, investigadores, podcasters, equipos de selección. Sin registro, sin tarifa por minuto, sin email.

Resumen con IATraducir, 28 idiomasOpenAI Whisper

Suelta tu archivo aquí

o haz clic para buscar

MP3 · MP4 · WAV · M4A · OGG · WEBM · FLAC  ·  Máx. 25 MB  ·  Máx. 30 min (60 min · Iniciar sesión)

¿Archivo más grande? Cómo comprimir.

¿Grabación más larga? Cómo dividir.

Cómo funciona

🎙️

Sube el audio de la entrevista

MP3 de una grabadora de voz, M4A de un móvil, MP4 de una videollamada, WAV de una grabadora de campo. Todos sirven.

La IA lo transcribe

Whisper large-v3 lee el audio. Una entrevista de 30 minutos suele estar lista en alrededor de un minuto.

📋

Lee, edita, exporta

Repasa la transcripción con marcas de tiempo. Arregla nombres o jerga en el editor. Descarga como TXT para notas, SRT para vídeo, o copia a tu software de codificación.

Por qué Mictoo para transcribir entrevistas

Whisper se maneja bien con entrevistas

Una sola grabación con dos voces y turnos claros es el caso más limpio para reconocimiento de voz. La mayoría de entrevistas salen al 90–95 % de precisión en la primera pasada.

Marcas de tiempo para citar y rastrear citas

Cada línea del export SRT tiene su timestamp. Cuando necesitas verificar una cita o volver a un momento concreto de la grabación, la marca te dice exactamente dónde.

Sin coste por entrevista

Algunos servicios cobran por minuto o por entrevista. Nosotros no. Transcribe una o cincuenta, el precio es el mismo (gratis).

Más de 50 idiomas, incluso entrevistas bilingües

Las entrevistas multilingües son comunes en research y periodismo. Whisper maneja el code-switching mejor que la mayoría de servicios.

Privacidad y protección de fuentes

El archivo va al proveedor de transcripción y se descarta. No conservamos el audio. Para material sensible, esto importa.

Quién usa transcripciones de entrevista

Periodismo y reportajes

Los reporteros transcriben entrevistas para citar con precisión y para repasar conversaciones largas en busca del material más útil. Una entrevista de 60 minutos a menudo acaba como 3–5 citas clave en la pieza publicada.

Research cualitativo y estudios académicos

Los investigadores transcriben entrevistas semiestructuradas para codificar y analizar en NVivo, Atlas.ti o MAXQDA. La transcripción es el dataset.

Entrevistas de podcast

Los anfitriones de podcast transcriben entrevistas con invitados para show notes, posts de blog del episodio y citas para redes. El audio llega a una audiencia, el texto llega a otra distinta a través del buscador.

Selección y entrevistas con candidatos

Reclutadores y hiring managers transcriben entrevistas para compartir con el equipo. Más fácil que un vídeo para revisores en distintas zonas horarias. Más fácil comparar notas cuando todos tienen el mismo texto.

User research y customer interviews

Los equipos de producto transcriben conversaciones con clientes para encontrar patrones. La transcripción va al repositorio de research (Dovetail, Marvin o un Notion compartido).

Consejos para transcribir entrevistas

1

Usa un micrófono de verdad, incluso para la entrevista por teléfono

Un lavalier o USB para el entrevistado en persona, y un cascos decente para el entrevistador al teléfono. La calidad de la grabación es el factor único más grande en la precisión de la transcripción.

2

Graba en un espacio tranquilo

Las entrevistas en cafetería quedan muy bien en cámara y se transcriben mal. La música de fondo y el bullicio degradan la precisión más de lo que la gente cree.

3

Para entrevistas de dos voces, transcribe primero y añade etiquetas de hablante a mano después

Whisper no hace diarización. Para una entrevista de ida y vuelta limpia, añadir "Entrevistador:" y "Fuente:" tarda unos 5 minutos por entrevista de 30.

4

Si tienes pistas de audio separadas (Riverside, SquadCast), transcribe cada una por separado

Entonces obtienes atribución limpia sin adivinar. Algunas grabadoras de research capturan dos micros en dos canales de un solo archivo estéreo. Puedes dividirlo en dos mono primero.

5

Guarda la transcripción con la fecha y el nombre de la fuente

Un archivo llamado 2026-05-25-jane-smith.txt es más fácil de encontrar seis meses después que transcript-final-v2.txt.

6

Edita las primeras 50 líneas con cuidado, deja el resto como está

La gente ojea las transcripciones. La parte de inicio importa más. Más allá, arregla solo las citas que vayas a usar.

7

Fija el idioma manualmente si la entrevista no es en inglés

La detección automática funciona para la mayoría de archivos, pero un falso arranque de 5 segundos al principio puede engañarla. Elegir el idioma explícitamente es más fiable.

Preguntas frecuentes

¿Es lo bastante preciso para citas periodísticas?

Para citas literales, siempre verifica contra el audio. Whisper acierta el 90–95 % de las palabras en audio de entrevista limpio. El 5–10 % que falla suele incluir nombres, términos técnicos y solapes. Usa las marcas SRT para volver a la grabación en cualquier cita que vayas a publicar.

¿Tendré etiquetas de hablante?

No automáticamente. Las añades según el flujo de conversación. Para una entrevista de 2 hablantes esto es rápido. Para mesas o focus groups, planifica más tiempo o sube la pista de cada hablante por separado si las tienes.

¿Puedo transcribir una entrevista en otro idioma?

Sí, más de 50 idiomas con detección automática. Para entrevistas de menos de 5 minutos o no en inglés que abran con chit-chat en inglés, elige el idioma manualmente.

Mi entrevista dura 90 minutos. ¿Qué hago?

Divídela en trozos por debajo del tope de 60 minutos. El corte natural es donde la conversación pausa (un café a media entrevista, un cambio de tema).

¿Qué precisión tiene con términos técnicos y nombres propios?

Menos precisa que con vocabulario común. Whisper no sabe el nombre de la empresa de tu fuente, el término médico que usó o el software específico que mencionó. Cuenta con tener que arreglar estos a mano. El resto de la transcripción será sólido.

¿Se guarda el audio?

No. El archivo va al proveedor de transcripción (Groq, con OpenAI como respaldo), se procesa y se descarta. No conservamos el audio en nuestros servidores.

¿Esto cumple con las políticas de ética de research?

La mayoría de protocolos aprobados por un IRB exigen saber dónde se procesa el audio. Nuestros proveedores procesan en EE. UU. No conservamos. Para cumplimiento específico de IRB, documenta el flujo y consulta con tu IRB. Para máximo control, usa una instalación local de Whisper en tu propia máquina.

¿Puedo importar la transcripción a NVivo, Atlas.ti o Dedoose?

Sí. Descarga como TXT e importa en tu herramienta de análisis cualitativo. La transcripción es texto plano, no hace falta ningún formato especial.

¿Cuánto tarda la transcripción?

Alrededor del 1–2 % de la duración del audio. Una entrevista de 30 minutos termina en torno a 60 segundos.

¿Qué pasa si la entrevista tiene mala calidad de audio?

Pásala primero por una herramienta de denoise (Audacity Noise Reduction o Adobe Podcast Enhance). Luego sube la versión limpia. Una mejor entrada da una salida notablemente mejor.

¿Puedo transcribir una entrevista grabada con el móvil?

Sí. Las Notas de voz del iPhone se guardan como M4A, las grabadoras de Android suelen ser M4A o MP3. Ambos sirven. AirDrop o email el archivo a tu ordenador y súbelo aquí.

¿Los timestamps del SRT coinciden exactamente con la grabación original?

Sí, al milisegundo. Los timestamps SRT reflejan el tiempo real en el archivo de audio. Funcionan para volver a un momento concreto en cualquier reproductor de audio o vídeo.

¿Listo para transcribir?

Sube la página y suelta tu archivo. La transcripción estará lista en aproximadamente un minuto.

↑ Volver al uploader