mictoo
Dziennikarstwo · Badania · Za darmo

Transkrypcja wywiadu
Darmowe transkrypcje wywiadów

Zamień każde nagranie wywiadu w czysty, cytowalny tekst. Dla dziennikarzy, badaczy, podcasterów, zespołów rekrutacyjnych. Bez rejestracji, bez opłaty za minutę, bez emaila.

Streszczenie AITłumacz, 28 językówOpenAI Whisper

Upuść swój plik tutaj

lub kliknij, aby wybrać

MP3 · MP4 · WAV · M4A · OGG · WEBM · FLAC  ·  Maks. 25 MB  ·  Maks. 30 min (60 min · Zaloguj)

Większy plik? Zobacz, jak skompresować.

Dłuższe nagranie? Zobacz, jak podzielić.

Jak to działa

🎙️

Upuść audio wywiadu

MP3 z dyktafonu, M4A z telefonu, MP4 z rozmowy wideo, WAV z rejestratora terenowego. Wszystko działa.

AI transkrybuje

Whisper large-v3 czyta audio. Wywiad 30-minutowy jest zwykle gotowy w około minutę.

📋

Czytaj, edytuj, eksportuj

Przewijaj transkrypcję z timecode. Popraw błędne nazwiska lub żargon inline. Pobierz jako TXT do notatek, SRT dla wideo lub skopiuj do oprogramowania do kodowania.

Dlaczego Mictoo do transkrypcji wywiadu

Whisper dobrze radzi sobie z wywiadami

Pojedyncze nagrania z dwoma głosami i czystą wymianą to najczystszy przypadek dla rozpoznawania mowy. Większość wywiadów osiąga 90-95% dokładności w pierwszym przejściu.

Timecode dla cytatów i wyszukiwania źródeł

Każda linia w eksporcie SRT ma timecode. Gdy musisz zweryfikować cytat lub wrócić do dokładnego momentu w nagraniu, timecode mówi dokładnie gdzie.

Bez kosztu za wywiad

Niektóre serwisy transkrypcji liczą za minutę lub za wywiad. My nie. Transkrybuj jeden lub pięćdziesiąt, cena ta sama (darmowa).

Ponad 50 języków, także wywiady dwujęzyczne

Wywiady międzyjęzykowe są częste w badaniach i dziennikarstwie. Whisper radzi sobie z code-switching lepiej niż większość serwisów.

Prywatność i ochrona źródeł

Plik jest strumieniowany do dostawcy transkrypcji i odrzucany. Nie przechowujemy audio. Dla wrażliwego materiału źródłowego to ma znaczenie.

Kto używa transkrypcji wywiadu

Dziennikarstwo i pisanie feature

Reporterzy transkrybują wywiady, aby precyzyjnie cytować i przeglądać długie rozmowy w poszukiwaniu najbardziej użytecznego materiału. Wywiad 60-minutowy często staje się 3-5 kluczowymi cytatami w opublikowanym tekście.

Badania jakościowe i studia akademickie

Badacze transkrybują wywiady półustrukturyzowane, aby kodować i analizować w narzędziach jak NVivo, Atlas.ti lub MAXQDA. Transkrypcja to dataset.

Wywiady podcastowe

Hosty transkrybują wywiady z gośćmi do show notes, postów blogowych odcinka i grafik cytatów na social. Audio dociera do jednej publiczności, tekst do innej przez wyszukiwarkę.

Rekrutacja i screening kandydatów

Rekruterzy i hiring managerowie transkrybują wywiady, aby udostępniać zespołowi. Łatwiejsze niż wideo dla recenzentów w różnych strefach. Łatwiej porównać notatki, gdy wszyscy mają ten sam tekst.

User research i customer interview

Zespoły produktowe transkrybują rozmowy z klientami, aby znaleźć wzorce. Transkrypcja trafia do research repository (Dovetail, Marvin lub współdzielony Notion).

Wskazówki do transkrypcji wywiadów

1

Użyj prawdziwego mikrofonu, nawet do wywiadu telefonicznego

Lavalier lub USB dla osoby na miejscu i porządne słuchawki dla wywiadującego przez telefon. Jakość nagrania to największy pojedynczy czynnik dokładności transkrypcji.

2

Nagrywaj w cichym miejscu

Wywiady w kawiarni wyglądają świetnie na kamerze i kiepsko transkrybują. Muzyka tła i pogwarki szkodzą dokładności bardziej, niż ludzie myślą.

3

Dla wywiadów na dwa głosy najpierw transkrybuj całe nagranie, potem ręcznie dodaj etykiety mówców

Whisper nie robi diaryzacji. Dla czystego wywiadu pytanie-odpowiedź dodanie "Rozmówca:" i "Źródło:" zajmuje około 5 minut na każde 30 minut wywiadu.

4

Jeśli masz osobne ścieżki audio (Riverside, SquadCast), transkrybuj każdą osobno

Wtedy dostajesz czystą atrybucję bez zgadywania. Niektóre rejestratory badawcze przechwytują dwa mikrofony w dwóch kanałach jednego pliku stereo. Możesz podzielić na dwa pliki mono wcześniej.

5

Zapisz transkrypcję z datą i nazwiskiem źródła

Plik transkrypcji nazwany 2026-05-25-jan-kowalski.txt jest łatwiejszy do znalezienia sześć miesięcy później niż transcript-final-v2.txt.

6

Edytuj pierwsze 50 linii pod kątem dokładności, resztę zostaw

Ludzie skanują transkrypcje. Początek liczy się najbardziej. Powyżej koryguj tylko cytaty, których planujesz użyć.

7

Ustaw język ręcznie, jeśli wywiad nie jest po angielsku

Auto-wykrywanie działa w większości plików, ale 5-sekundowy fałszywy start na początku może je zmylić. Wybór języka wyraźnie jest bardziej niezawodny.

Najczęściej zadawane pytania

Czy to wystarczająco dokładne dla cytatów dziennikarskich?

Dla cytowania dosłownego zawsze powinieneś weryfikować z audio. Whisper trafia 90-95% słów na czystym audio wywiadu. 5-10%, które myli, często obejmuje nazwiska, terminy techniczne i nakładającą się mowę. Użyj timecode SRT, aby wrócić do nagrania dla każdego cytatu, który publikujesz.

Czy dostanę etykiety mówców?

Nie automatycznie. Dodajesz je w oparciu o przepływ rozmowy. Dla wywiadu na 2 mówców jest to szybkie. Dla paneli lub focus groups planuj więcej czasu lub wgrywaj ścieżkę każdego mówcy osobno, jeśli je masz.

Czy mogę transkrybować wywiad w innym języku?

Tak, ponad 50 języków z auto-wykrywaniem. Dla wywiadów poniżej 5 minut lub wywiadów nieangielskich zaczynających się od small talk po angielsku wybierz język ręcznie.

Mój wywiad ma 90 minut. Co robić?

Podziel na kawałki poniżej naszego cap 60-minutowego. Naturalna przerwa jest tam, gdzie rozmowa zatrzymuje się (kawa w środku wywiadu, zmiana tematu).

Jak dokładne są terminy techniczne i nazwy własne?

Mniej dokładne niż popularne słownictwo. Whisper nie zna nazwy firmy twojego źródła, terminu medycznego, którego użył, ani konkretnego oprogramowania, do którego się odwołał. Spodziewaj się ręcznego poprawiania. Reszta transkrypcji będzie solidna.

Czy audio jest zapisywane?

Nie. Plik jest strumieniowany do dostawcy transkrypcji (Groq, z OpenAI jako backup), przetwarzany, potem odrzucany. Nie zatrzymujemy audio na naszych serwerach.

Czy to jest zgodne z politykami etyki badań?

Większość protokołów badawczych zatwierdzonych przez IRB wymaga wiedzy, gdzie audio jest przetwarzane. Nasi dostawcy przetwarzają w USA. Nie zatrzymujemy. Dla konkretnego compliance IRB udokumentuj workflow i sprawdź ze swoim IRB.

Czy mogę zaimportować transkrypcję do NVivo, Atlas.ti lub Dedoose?

Tak. Pobierz jako TXT i zaimportuj do swojego narzędzia analizy jakościowej. Transkrypcja to czysty tekst, bez specjalnego formatu.

Jak długo trwa transkrypcja?

Około 1-2% długości audio. Wywiad 30-minutowy kończy się w około 60 sekund.

Co jeśli wywiad ma kiepską jakość audio?

Przepuść najpierw przez narzędzie denoise (Audacity Noise Reduction lub Adobe Podcast Enhance). Potem wgraj czystą wersję. Lepszy input daje zauważalnie lepszy output.

Czy mogę transkrybować wywiad nagrany na telefonie?

Tak. iPhone Voice Memos zapisuje jako M4A, dyktafony Android zwykle jako M4A lub MP3. Oba działają. AirDrop lub email plik na komputer, potem wgraj tutaj.

Czy timecode w SRT będą dokładnie pasować do oryginalnego nagrania?

Tak, do milisekundy. Timecode SRT odzwierciedlają rzeczywisty czas w pliku audio. Działają, aby wrócić do konkretnego momentu w dowolnym playerze audio lub wideo.

Gotowy do transkrypcji?

Przewiń do góry i upuść plik. Transkrypcja będzie gotowa w około minutę.

↑ Wróć do uploadera