Podcast-Transkription
Kostenloser Transkript-Generator
Verwandeln Sie jede Episode in sauberen Text. Laden Sie Ihre MP3, MP4 oder M4A hoch und erhalten Sie in Sekunden das Transkript. Ohne Konto, ohne Tarif pro Minute.
Datei hier ablegen
oder zum Auswählen klicken
MP3 · MP4 · WAV · M4A · OGG · WEBM · FLAC · Max. 25 MB · Max. 30 Min. (60 Min. · Anmelden)
So funktioniert es
Episode ablegen
MP3, MP4, M4A, WAV oder FLAC. Cloud Recording von Riverside, Exports aus Descript, rohes Audio aus Zoom, Anchor.fm-Dateien. Alles geht.
KI macht die Arbeit
Whisper large-v3 läuft auf unserem Backend und wandelt das Audio in Text um. Die meisten 30-Minuten-Episoden sind in unter einer Minute fertig.
Kopieren, herunterladen oder bearbeiten
Holen Sie sich den Text als TXT, als SRT für Untertitel, oder fügen Sie ihn direkt in Ihren Show-Notes-Editor ein. Korrigieren Sie falsche Wörter in unserem Viewer vor dem Export.
Warum Podcaster Mictoo nutzen
Lange Episoden sind kein Problem
Bis zu 60 Minuten pro Datei nach kostenloser Anmeldung. Bei einer Aufteilung in zwei Teile behalten wir relative Zeitstempel, damit Sie die SRT-Dateien ohne Rechnerei wieder zusammensetzen können.
Akzente und Crosstalk halten stand
Whisper large-v3 ist das stärkste offene Sprachmodell, das wir für nicht-muttersprachliches Englisch kennen. Wenn Ihr Co-Host aus Berlin oder São Paulo kommt, wird das Transkript nicht zu Brei.
Musik-Beds brechen es nicht
Unsere Pipeline führt Voice Activity Detection vor der Transkription aus. Lange instrumentale Intros werden als Stille markiert, nicht als erfundene Wörter. Sponsor-Reads mit Musik-Bett kommen ebenfalls sauber durch.
Kein Abo
Viele Podcaster transkribieren eine oder zwei Episoden im Monat. 15 Dollar für einen monatlichen Seat dafür zu zahlen, ist Verschwendung. Laden Sie die Datei nach Bedarf hoch. Wir verdienen mit Werbung und einem geplanten Pro-Tarif für Power-User.
Ihr Audio wird nicht gespeichert
Dateien werden direkt zum Sprach-Anbieter gestreamt, transkribiert und gelöscht. Wir behalten Ihre Episoden nicht, und die Anbieter (Groq, OpenAI) trainieren nicht auf API-Daten.
Was Podcaster wirklich mit dem Transkript machen
Show Notes und Blog-Posts
Fügen Sie das Transkript in Ihr CMS ein, markieren Sie Kapitel, fügen Sie Links hinzu, veröffentlichen Sie den Blog-Post. Eine 45-Minuten-Episode liefert meist 6000 bis 8000 Wörter Quellmaterial. Drei oder vier leicht bearbeitete Blog-Posts aus einer Aufnahme.
Episoden-Zitate für Social Media
Scannen Sie das Transkript nach der Zeile, die gesessen hat, und machen Sie eine Grafik daraus. Viel schneller, als das Audio in 1,5x-Geschwindigkeit nach dem Zeitstempel zu durchsuchen.
Durchsuchbares Archiv des Backkatalogs
Lassen Sie Ihre alten Episoden durch Batch-Transkription laufen, und plötzlich haben Sie ein Strg+F über Jahre an Gesprächen. Nützlich, wenn ein Gast zurückkommt und Sie sich erinnern wollen, worüber Sie das letzte Mal gesprochen haben.
Ersatz für YouTube-Auto-Untertitel
YouTubes Auto-Untertitel sind mittelmäßig für Podcasts mit zwei Stimmen und Musik. Laden Sie stattdessen eine Mictoo-SRT hoch. Bessere Zeichensetzung, weniger Fehler, bessere Barrierefreiheit.
Barrierefreiheits-Transkript-Link
Viele Podcaster fügen einen „Transkript lesen"-Link in den RSS-Show-Notes hinzu. Das hilft gehörlosen und schwerhörigen Hörern, und es hilft Suchmaschinen, Ihre Inhalte zu finden.
Tipps für sauberere Podcast-Transkripte
Intro- und Outro-Musik zuerst entfernen
Whisper ignoriert Musik gut, aber ein 90 Sekunden langes instrumentales Cold Open löst manchmal Geisterwörter aus. Wenn Ihr Intro in jeder Episode gleich ist, schneiden Sie die ersten 1:30 in Audacity vor dem Upload weg. Spart ein paar Minuten Cleanup später.
In 64 kbps Mono exportieren, wenn die Rohdatei riesig ist
Stimme braucht kein Stereo, und 64 kbps reichen für Sprache. Eine zweistündige Episode mit 64 kbps Mono ist rund 55 MB. Passt in das 60-MB-Limit mit Anmeldung ohne Teilen. ffmpeg: ffmpeg -i episode.wav -ac 1 -b:a 64k episode.mp3.
Bei Interviews mit schlechtem Gast-Audio jede Spur einzeln transkribieren
Wenn Sie auf Riverside oder SquadCast aufnehmen und separate Audiospuren pro Sprecher haben, laden Sie jede für sich hoch. Whisper kommt mit einer Stimme nach der anderen leichter klar. Sauberere Zuordnung, weniger verlorene Wörter bei Überlappungen.
Bei kurzen Episoden die Sprache explizit setzen
Die Auto-Erkennung samplet den ersten Audio-Chunk. Wenn Sie mit einem einwortigen Cold Open oder einem Lachen öffnen, kann die Erkennung in die falsche Sprache fallen. Für alles unter 5 Minuten die Sprache manuell wählen.
Zeichensetzung wird unvollkommen sein. Erste 10 Zeilen korrigieren, Rest stehen lassen
Whisper bekommt die meiste Zeichensetzung richtig hin, aber verpasst manchmal Strichpunkte und direkte Rede. Für Show Notes zählen die ersten 10 Zeilen (Leute überfliegen sie). Darüber hinaus: rausschicken wie es ist.
SRT-Export nutzen, auch wenn Sie keine Untertitel brauchen
SRT gibt Ihnen alle paar Sekunden Zeitstempel. Selbst wenn Sie in einen Blog-Post einfügen, helfen diese Zeitstempel, ins Audio zurückzuspringen, um ein Zitat zu verifizieren. Wir haben einen kostenlosen SRT-Generator direkt hier.
Häufig gestellte Fragen
Kann ich eine 2-Stunden-Episode transkribieren?
Ja, aber teilen Sie sie zuerst. Unser Datei-Cap ist 30 Minuten kostenlos, oder 60 Minuten nach Anmeldung. Für eine 2-Stunden-Episode in zwei oder drei Teile teilen und jeden transkribieren. Unser Audio-Teilen-Guide erklärt, wie das in 60 Sekunden mit ffmpeg oder Audacity geht.
Bekomme ich Sprecher-Labels (Host vs. Gast)?
Derzeit nicht automatisch. Whisper selbst macht keine Sprecher-Diarisierung. Wenn Sie separate Spuren pro Sprecher haben (üblich bei Riverside, SquadCast, Zencastr), laden Sie jede separat hoch und beschriften Sie sie selbst im finalen Transkript. Wir schauen uns Diarisierung an, aber nur, wenn wir es gut hinbekommen.
Wie kommt es mit Akzenten und zweisprachigen Podcasts klar?
Whisper large-v3 wurde auf 680.000 Stunden mehrsprachiges Audio trainiert. Nicht-muttersprachliches Englisch, regionale Akzente und Code-Switching funktionieren besser als bei kleineren Modellen. Für einen Podcast, der mitten in der Episode zwischen Englisch und Spanisch wechselt, wählen Sie „Auto-Erkennung" als Sprache, und Whisper folgt dem Wechsel.
Welche Audioformate unterstützen Sie für Podcasts?
MP3, M4A, WAV, FLAC, OGG, WEBM und AAC. Plus Videodateien wie MP4 und MOV (wir extrahieren das Audio). Wenn Ihr Podcast-Hoster einen Download in einem davon bietet, sind Sie startklar. AIFF und ALAC werden nicht direkt unterstützt, konvertieren Sie zuerst in WAV.
Gibt es ein Wörter-Limit pro Episode?
Kein Wörter-Limit. Nur das Dateigrößen-Limit (25 MB kostenlos, 60 MB mit Anmeldung) und die Dauer (30 Min kostenlos, 60 Min mit Anmeldung). Eine typische 60-Minuten-Episode produziert rund 9000 bis 11.000 Wörter.
Wie genau ist die Podcast-Transkription im Vergleich zu menschlichen Transkribierern?
Für sauberes Studio-Audio landet Whisper large-v3 typischerweise bei 5 bis 10 Prozent Wortfehlerrate. Menschliche Transkribierer liegen bei 3 bis 5 Prozent. Für die meiste Show-Notes- und Blog-Repurposing-Arbeit ist KI gut genug. Für Gerichtsaussagen oder akademische Zitate nehmen Sie einen Menschen.
Wird meine Episode auf Ihren Servern gespeichert?
Nein. Wir leiten das Audio direkt zum Transkriptions-Anbieter (Groq, mit OpenAI als Backup). Sie verarbeiten es, und wir verwerfen es. Wir schreiben Ihre Podcast-Datei nie in unsere Datenbank oder unseren Speicher.
Kann ich als SRT für Untertitel herunterladen?
Ja. Klicken Sie nach der Transkription den SRT-Download-Button. Nutzen Sie ihn direkt in YouTube Studio, Premiere Pro, DaVinci Resolve oder jedem Video-Editor.
Berechnen Sie pro Minute?
Nein. Transkription auf Mictoo ist kostenlos. Wir sind derzeit werbefinanziert, mit einem bezahlten Pro-Tarif, der später für Nutzer kommt, die längere Dateien oder Batch-Uploads brauchen.
Meine Episode hat explizite Sprache. Wird sie zensiert?
Keine Filterung. Das Transkript spiegelt exakt wider, was gesagt wurde. Wenn Sie Schimpfwörter für eine saubere Version bearbeiten wollen, machen Sie das selbst nach dem Download.
Kann ich das Transkript vor dem Download bearbeiten?
Ja. Es gibt einen einfachen Editor im Ergebnis-View. Korrigieren Sie falsche Wörter, dann laden Sie die bearbeitete Version als TXT oder SRT herunter.
Ist die Podcast-Transkription auf Mictoo DSGVO-konform?
Wir speichern Audio oder Transkript nicht auf unseren Servern, nachdem Sie die Seite verlassen. Wir sind in Europa, und unsere Anbieter (Groq US, OpenAI US) haben DPAs unterzeichnet. Für spezifische Compliance-Fragen siehe unsere Datenschutzerklärung oder schreiben Sie an info@mictoo.com.
Bereit zum Transkribieren?
Scrollen Sie nach oben und legen Sie Ihre Datei ab. Das Transkript ist in etwa einer Minute fertig.
↑ Zurück zum UploaderWeitere Transkriptions-Tools