Interview-Transkription
Kostenlose Interview-Transkripte
Verwandeln Sie jede Interview-Aufnahme in sauberen, zitierbaren Text. Für Journalisten, Forscher, Podcaster, Recruiting-Teams. Ohne Anmeldung, ohne Tarif pro Minute, ohne E-Mail.
Datei hier ablegen
oder zum Auswählen klicken
MP3 · MP4 · WAV · M4A · OGG · WEBM · FLAC · Max. 25 MB · Max. 30 Min. (60 Min. · Anmelden)
So funktioniert es
Interview-Audio ablegen
MP3 von einem Sprachrekorder, M4A von einem Handy, MP4 von einem Videoanruf, WAV von einem Field Recorder. Alles geht.
KI transkribiert
Whisper large-v3 liest das Audio. Ein 30-Minuten-Interview ist meist in rund einer Minute fertig.
Lesen, bearbeiten, exportieren
Durchblättern des Transkripts mit Zeitstempeln. Korrigieren Sie falsche Namen oder Fachbegriffe inline. Laden Sie als TXT für Notizen herunter, als SRT für Video oder kopieren Sie in Ihre Coding-Software.
Warum Mictoo für Interview-Transkription
Whisper kommt mit Interviews gut zurecht
Einzelne Aufnahmen mit zwei Stimmen und klarem Hin und Her sind der sauberste Fall für Spracherkennung. Die meisten Interviews kommen im ersten Durchgang auf 90 bis 95 Prozent Genauigkeit.
Zeitstempel für Zitate und Quellensuche
Jede Zeile im SRT-Export hat einen Zeitstempel. Wenn Sie ein Zitat verifizieren oder zu einem bestimmten Moment in der Aufnahme zurückspringen müssen, sagt Ihnen der Zeitstempel genau, wo.
Keine Kosten pro Interview
Manche Transkriptions-Services berechnen pro Minute oder pro Interview. Wir nicht. Transkribieren Sie eines oder fünfzig, der Preis ist derselbe (kostenlos).
Über 50 Sprachen, auch zweisprachige Interviews
Sprachenübergreifende Interviews sind in Forschung und Journalismus üblich. Whisper handhabt Code-Switching besser als die meisten Services.
Privatsphäre und Quellenschutz
Die Datei wird zum Transkriptions-Anbieter gestreamt und verworfen. Wir behalten das Audio nicht. Für sensibles Quellenmaterial zählt das.
Wer Interview-Transkripte nutzt
Journalismus und Feature-Schreiben
Reporter transkribieren ihre Interviews, um präzise zu zitieren und lange Gespräche nach dem nützlichsten Material zu durchforsten. Ein 60-Minuten-Interview wird oft zu 3 bis 5 Schlüsselzitaten im veröffentlichten Stück.
Qualitative Forschung und akademische Studien
Forscher transkribieren halbstrukturierte Interviews, um sie in Tools wie NVivo, Atlas.ti oder MAXQDA zu codieren und zu analysieren. Das Transkript ist der Datensatz.
Podcasting-Interviews
Show-Hosts transkribieren Gast-Interviews für Show Notes, Episoden-Blog-Posts und Zitat-Grafiken für Social Media. Das Audio erreicht eine Audience, der Text erreicht über die Suche eine andere.
Recruiting und Kandidaten-Screening
Recruiter und Hiring Manager transkribieren Interviews, um sie mit dem Team zu teilen. Einfacher als ein Video für Prüfer in verschiedenen Zeitzonen. Einfacher, Notizen zu vergleichen, wenn alle denselben Text haben.
User Research und Customer Interviews
Produktteams transkribieren Gespräche mit Kunden, um Muster zu finden. Das Transkript landet im Research-Repository (Dovetail, Marvin oder ein geteiltes Notion).
Tipps für Interview-Transkription
Ein echtes Mikro verwenden, auch beim Telefon-Interview
Ein Lavalier oder USB-Mikro für die Vor-Ort-Person und ein anständiges Headset für den Interviewer am Telefon. Die Qualität der Aufnahme ist der größte Einzelfaktor für die Transkriptions-Genauigkeit.
In einer ruhigen Umgebung aufnehmen
Café-Interviews sehen vor der Kamera toll aus und transkribieren schlecht. Hintergrundmusik und Geplapper schaden der Genauigkeit mehr, als die Leute denken.
Bei Zwei-Sprecher-Interviews zuerst die gesamte Aufnahme transkribieren, dann Sprecher-Labels manuell hinzufügen
Whisper macht keine Sprecher-Diarisierung. Für ein sauberes Hin-und-Her-Interview dauert das Hinzufügen von „Interviewer:" und „Quelle:" rund 5 Minuten pro 30-Minuten-Interview.
Wenn Sie separate Audiospuren haben (Riverside, SquadCast), jede separat transkribieren
Dann bekommen Sie eine saubere Zuordnung ohne Raterei. Manche Forschungsrekorder erfassen zwei Mikros in zwei Kanälen einer Stereo-Datei. Sie können das zuerst in zwei Mono-Dateien aufteilen.
Transkript mit Datum und Quellennamen speichern
Eine Transkript-Datei namens 2026-05-25-jane-smith.txt ist sechs Monate später leichter zu finden als transcript-final-v2.txt.
Erste 50 Zeilen auf Genauigkeit bearbeiten, Rest lassen
Leute überfliegen Transkripte. Der Anfangsteil zählt am meisten. Darüber hinaus nur die Zitate korrigieren, die Sie verwenden wollen.
Sprache manuell setzen, wenn das Interview nicht auf Englisch ist
Auto-Erkennung funktioniert für die meisten Dateien, aber ein 5-Sekunden-Fehlstart am Anfang kann sie irreführen. Sprache explizit zu wählen ist zuverlässiger.
Häufig gestellte Fragen
Ist das genau genug für Journalismus-Zitate?
Für wörtliches Zitieren sollten Sie immer gegen das Audio verifizieren. Whisper bekommt 90 bis 95 Prozent der Wörter bei sauberem Interview-Audio richtig. Die 5 bis 10 Prozent, die er verfehlt, beinhalten oft Namen, Fachbegriffe und überlappende Sprache. Nutzen Sie die SRT-Zeitstempel, um für jedes Zitat, das Sie veröffentlichen wollen, zur Aufnahme zurückzuspringen.
Bekomme ich Sprecher-Labels?
Nicht automatisch. Sie fügen sie basierend auf dem Gesprächsfluss hinzu. Bei einem 2-Sprecher-Interview ist das schnell. Bei Panels oder Fokusgruppen planen Sie mehr Zeit ein oder laden Sie die Spur jedes Sprechers separat hoch, falls vorhanden.
Kann ich ein Interview in einer anderen Sprache transkribieren?
Ja, über 50 Sprachen mit Auto-Erkennung. Für Interviews unter 5 Minuten oder nicht-englische Interviews, die mit englischem Small Talk beginnen, wählen Sie die Sprache manuell.
Mein Interview ist 90 Minuten. Was tun?
In Stücke unter unserem 60-Minuten-Cap teilen. Die natürliche Pause ist dort, wo das Gespräch innehält (Kaffee in der Mitte des Interviews, Themenwechsel). Unser Teil-Guide erklärt, wie es geht.
Wie genau sind Fachbegriffe und Eigennamen?
Weniger genau als gängiges Vokabular. Whisper kennt den Firmennamen Ihrer Quelle nicht, den medizinischen Begriff, den sie benutzt hat, oder die spezifische Software, auf die sie verwiesen hat. Rechnen Sie damit, das manuell zu korrigieren. Der Rest des Transkripts wird solide sein.
Wird das Audio gespeichert?
Nein. Die Datei wird zum Transkriptions-Anbieter (Groq, mit OpenAI als Backup) gestreamt, verarbeitet und dann verworfen. Wir behalten das Audio nicht auf unseren Servern.
Ist das mit Forschungsethik-Richtlinien konform?
Die meisten IRB-genehmigten Forschungsprotokolle verlangen zu wissen, wo Audio verarbeitet wird. Unsere Anbieter verarbeiten in den USA. Wir behalten nichts. Für spezifische IRB-Konformität dokumentieren Sie den Workflow und prüfen Sie mit Ihrem IRB. Für maximale Kontrolle nutzen Sie stattdessen eine lokale Whisper-Installation auf Ihrem eigenen Rechner.
Kann ich das Transkript in NVivo, Atlas.ti oder Dedoose importieren?
Ja. Als TXT herunterladen und in Ihr qualitatives Analyse-Tool importieren. Das Transkript ist reiner Text, kein spezielles Format nötig.
Wie lange dauert die Transkription?
Etwa 1 bis 2 Prozent der Audiolänge. Ein 30-Minuten-Interview ist in rund 60 Sekunden fertig.
Was, wenn das Interview schlechte Audioqualität hat?
Lassen Sie es zuerst durch ein Denoise-Tool laufen (Audacity Noise Reduction oder Adobe Podcast Enhance). Dann die saubere Version hochladen. Bessere Eingabe gibt deutlich bessere Ausgabe.
Kann ich ein Interview transkribieren, das ich auf meinem Handy aufgenommen habe?
Ja. iPhone Sprachmemos werden als M4A gespeichert, Android-Sprachrekorder meist als M4A oder MP3. Beides funktioniert. AirDrop oder E-Mail die Datei an Ihren Computer, dann hier hochladen.
Werden die Zeitstempel im SRT exakt mit der Originalaufnahme übereinstimmen?
Ja, auf die Millisekunde. Die SRT-Zeitstempel spiegeln die tatsächliche Zeit in der Audiodatei wider. Sie funktionieren, um in jedem Audio- oder Videoplayer zu einem bestimmten Moment zurückzuspringen.
Bereit zum Transkribieren?
Scrollen Sie nach oben und legen Sie Ihre Datei ab. Das Transkript ist in etwa einer Minute fertig.
↑ Zurück zum Uploader