mictoo
Journalisme · Recherche · Gratuit

Transcription d'interview
Transcriptions d'interview gratuites

Transformez n'importe quel enregistrement d'interview en texte propre et citable. Pour journalistes, chercheurs, podcasteurs, équipes de recrutement. Sans inscription, sans tarif à la minute, sans email.

Résumé IATraduire, 28 languesOpenAI Whisper

Déposez votre fichier ici

ou cliquez pour parcourir

MP3 · MP4 · WAV · M4A · OGG · WEBM · FLAC  ·  Max 25 Mo  ·  Max 30 min (60 min · Connexion)

Fichier plus volumineux ? Voir comment compresser.

Enregistrement plus long ? Voir comment diviser.

Comment ça marche

🎙️

Déposez l'audio de l'interview

MP3 d'un dictaphone, M4A d'un téléphone, MP4 d'un appel vidéo, WAV d'un enregistreur de terrain. Tout marche.

L'IA transcrit

Whisper large-v3 lit l'audio. Une interview de 30 minutes finit en général en environ une minute.

📋

Lisez, éditez, exportez

Parcourez la transcription avec horodatages. Corrigez les noms ou le jargon dans l'éditeur. Téléchargez en TXT pour les notes, en SRT pour la vidéo, ou copiez vers votre logiciel de codage.

Pourquoi Mictoo pour la transcription d'interview

Whisper gère bien les interviews

Un enregistrement unique avec deux voix et des échanges clairs, c'est le cas le plus propre pour la reconnaissance vocale. La plupart des interviews sortent à 90–95 % de précision dès la première passe.

Horodatages pour citer et retrouver les citations

Chaque ligne de l'export SRT a son horodatage. Quand vous devez vérifier une citation ou revenir à un moment précis de l'enregistrement, l'horodatage vous dit exactement où.

Pas de coût par interview

Certains services de transcription facturent à la minute ou à l'interview. Nous, non. Transcrivez-en une ou cinquante, le prix est le même (gratuit).

Plus de 50 langues, interviews bilingues comprises

Les interviews multilingues sont fréquentes en recherche et en journalisme. Whisper gère le code-switching mieux que la plupart des services.

Confidentialité et protection des sources

Le fichier va au prestataire de transcription et est jeté. On ne garde pas l'audio. Pour du matériel sensible, ça compte.

Qui utilise les transcriptions d'interview

Journalisme et reportages

Les reporters transcrivent leurs interviews pour citer avec précision et pour parcourir de longues conversations à la recherche du matériau le plus utile. Une interview de 60 minutes finit souvent en 3 à 5 citations clés dans le papier publié.

Recherche qualitative et études académiques

Les chercheurs transcrivent des interviews semi-structurées pour coder et analyser dans des outils comme NVivo, Atlas.ti ou MAXQDA. La transcription, c'est le dataset.

Interviews de podcast

Les animateurs d'émission transcrivent les interviews d'invités pour les show notes, les posts de blog d'épisode et les visuels de citation pour les réseaux sociaux. L'audio touche une audience, le texte en touche une autre via la recherche.

Recrutement et présélection de candidats

Recruteurs et hiring managers transcrivent les interviews pour les partager avec l'équipe. Plus facile qu'une vidéo pour des relecteurs dans différents fuseaux. Plus facile de comparer les notes quand tout le monde a le même texte.

User research et customer interviews

Les équipes produit transcrivent les conversations avec les clients pour trouver des patterns. La transcription va dans le repository de recherche (Dovetail, Marvin ou un Notion partagé).

Astuces pour la transcription d'interview

1

Utilisez un vrai micro, même pour l'interview au téléphone

Un lavalier ou USB pour l'interviewé en présentiel, et un casque correct pour l'intervieweur au téléphone. La qualité de l'enregistrement est le facteur unique le plus déterminant pour la précision.

2

Enregistrez dans un endroit calme

Les interviews en café rendent super à l'image et se transcrivent mal. La musique de fond et le brouhaha dégradent la précision plus que ce que les gens pensent.

3

Pour les interviews à deux voix, transcrivez l'enregistrement entier puis ajoutez les étiquettes de locuteur à la main

Whisper ne fait pas de diarisation. Pour une interview propre en question-réponse, ajouter « Intervieweur : » et « Source : » prend environ 5 minutes pour 30 minutes d'interview.

4

Si vous avez des pistes audio séparées (Riverside, SquadCast), transcrivez chacune séparément

Vous obtenez alors une attribution propre sans deviner. Certains enregistreurs de recherche captent deux micros sur deux canaux d'un même fichier stéréo. Vous pouvez le séparer en deux fichiers mono d'abord.

5

Sauvegardez la transcription avec la date et le nom de la source

Un fichier de transcription appelé 2026-05-25-jane-smith.txt est plus facile à retrouver six mois plus tard que transcript-final-v2.txt.

6

Éditez les 50 premières lignes pour la précision, laissez le reste

Les gens survolent les transcriptions. La partie de début compte le plus. Au-delà, corrigez seulement les citations que vous comptez utiliser.

7

Fixez la langue manuellement si l'interview n'est pas en anglais

La détection automatique marche pour la plupart des fichiers, mais un faux départ de 5 secondes au début peut l'égarer. Choisir la langue explicitement est plus fiable.

Questions fréquentes

Est-ce assez précis pour des citations journalistiques ?

Pour citer mot à mot, vérifiez toujours contre l'audio. Whisper a 90 à 95 % des mots justes sur de l'audio d'interview propre. Les 5 à 10 % qu'il manque incluent souvent les noms, termes techniques et chevauchements. Utilisez les horodatages SRT pour revenir à l'enregistrement pour toute citation que vous voulez publier.

Aurai-je des étiquettes de locuteur ?

Pas automatiquement. Vous les ajoutez en suivant le flow de la conversation. Pour une interview à 2 locuteurs, c'est rapide. Pour les panels ou focus groups, prévoyez plus de temps ou chargez la piste de chaque locuteur séparément si vous les avez.

Puis-je transcrire une interview dans une autre langue ?

Oui, plus de 50 langues avec détection automatique. Pour les interviews de moins de 5 minutes ou non-anglaises qui démarrent en chit-chat anglais, choisissez la langue manuellement.

Mon interview fait 90 minutes. Que faire ?

Découpez en morceaux sous le plafond de 60 minutes. La coupure naturelle, c'est là où la conversation fait une pause (café à mi-interview, changement de sujet).

Quelle précision pour les termes techniques et les noms propres ?

Moins précis que le vocabulaire courant. Whisper ne connaît pas le nom de l'entreprise de votre source, le terme médical qu'elle a utilisé ou le logiciel spécifique qu'elle a mentionné. Comptez sur le fait de devoir corriger ça à la main. Le reste de la transcription sera solide.

L'audio est-il stocké ?

Non. Le fichier va au prestataire de transcription (Groq, avec OpenAI en backup), est traité, puis jeté. On ne garde pas l'audio sur nos serveurs.

Est-ce conforme aux politiques d'éthique de la recherche ?

La plupart des protocoles approuvés par un IRB demandent de savoir où l'audio est traité. Nos prestataires traitent aux États-Unis. On ne garde rien. Pour la conformité IRB précise, documentez le workflow et vérifiez avec votre IRB. Pour un contrôle maximal, utilisez une installation locale de Whisper sur votre propre machine.

Puis-je importer la transcription dans NVivo, Atlas.ti ou Dedoose ?

Oui. Téléchargez en TXT et importez dans votre outil d'analyse qualitative. La transcription est en texte simple, pas besoin de format spécial.

Combien de temps prend la transcription ?

Environ 1 à 2 % de la durée audio. Une interview de 30 minutes finit en environ 60 secondes.

Et si la qualité audio de l'interview est mauvaise ?

Passez-la d'abord par un outil de débruitage (Audacity Noise Reduction ou Adobe Podcast Enhance). Puis chargez la version nettoyée. Une meilleure entrée donne une bien meilleure sortie.

Puis-je transcrire une interview enregistrée sur mon téléphone ?

Oui. Les mémos vocaux iPhone se sauvent en M4A, les dictaphones Android en général en M4A ou MP3. Les deux marchent. AirDrop ou email vers votre ordi, puis charge ici.

Les horodatages SRT correspondent-ils exactement à l'enregistrement original ?

Oui, à la milliseconde. Les horodatages SRT reflètent le temps réel dans le fichier audio. Ils fonctionnent pour revenir à un moment précis dans n'importe quel lecteur audio ou vidéo.

Prêt à transcrire ?

Remontez et déposez votre fichier. La transcription est prête en environ une minute.

↑ Retour à l'uploader