Jak rychle přepsat audio s použitím Google Docs

ikona Dokumentů Google 
Způsobů, jak rychle převést audio na text, což se může hodit jak v žurnalistice, tak v sociálněvědním výzkumu, je už docela dost. Když pomineme ty, které stojí peníze, tak se liší v tom, kolik stojí času a práce a jak uspokojivé výsledky přinášejí.

Nejjednodušší cesta je samozřejmě ruční přepis. Ten má základní nevýhodu v tom, že je opravdu pomalý a pracný. Kdo se nechce namáhat, může zkusit nějaké nástroje na automatický přepis.

Já jsem si v poslední době navyknul na Dokumenty Google. V menu „Nástroje“ najdete volbu „Hlasové zadávání“, v jiné aplikaci (anebo třeba z diktafonu, mobilu, magnetofonu či kamery) si spustíte svůj audiozáznam a přes mikrofon (v notebooku bude vestavěný, u stolního počítače si asi budete muset pomoct s externím, ale možná existuje i cesta přímo vnitřkem počítače bez mikrofonu, pokud přehráváte zvuk z aplikace v počítači – na způsob nastavení počítače pro takový účel se ale zeptejte někoho jiného) nahrajete zvuk do Dokumentů. Ty ho hned pošlou do cloudu Google (takže potřebujete pokud možno i rychlé internetové připojení) a z něho se vám vrátí přepsaný text. Funguje to i v češtině a výsledky jsou většinou použitelné minimálně pro základní orientaci.

Zjednodušeně zhodnoceno: Je to zdarma a poměrně málo pracné. Složitěji řečeno: Zdarma to být nemusí, není vyloučeno, že Google si s daty, která mu takto poskytuje, bude dělat, co se mu zlíbí. A pracné to opravdu moc není, ale výsledky nejsou ideální. Zejména ve chvíli, kdy máte audiozáznam z rušného prostředí.

Tady je příklad přepisu z rozhovoru s kolegou o jeho pracovních povinnostech, když nahrávka právě má hlučnější pozadí:

Ta práce pro mě je určitě jiná v tom že i když jsem tam během toho dne třeba jenom třikrát za pár minut a to je připravil jsou okruhy řekli o baletu že by jsi na mě čekat nebo chemie Litera mě vlastně veškerý ten štáb a nikomu bych ho webkamera jak nebo moderátorech přijal a Vnímám to tak že to opravdu na vysoké profesionální úrovni 24.
V originále jde o 45sekundový úryvek, kterého v Dokumentech zpracování trvá cca 50-55 sekund, tj. zhruba v poměru 1,2:1.

Není to tak moc srozumitelné, že? Podtržené části se shodují s originálem, zbytek jsou chyby a nesmysly. Úspěšnost zhruba 50 %. Dobré tak akorát pro představu, o čem zhruba mluvčí hovořil. Originál byl totiž následující:
Ta práce pro mne určitě je jiná v tom, že i když jsem tam během toho dne třeba jenom třikrát na pár minut, tak té přípravě věnuju opravdu celý den i potom večer, protože to pro mě nejsou okruhy, ve kterých bych se běžně pohyboval, ať už je to medicína, fyzika, nebo chemie.  A čeho si tedy vážím, tak od prvního dne mě vlastně veškerý ten štáb, ať už mluvím o produkčních, kameramanech nebo moderátorech, přijal a vnímám to tak, že je to opravdu na vysoké profesionální úrovni ta Čtyřiadvacítka.
Tohle je samozřejmě lepší. Na první pohled si můžete všimnout zejména funkční interpunkce. Ale taky to trvalo 3,5 minuty, tedy poměr víc než 4,5:1. A to píšu na klávesnici dost rychle. Přepisovat takhle hodinový audiomateriál...

Jak tedy dospět k relativně nejlepšímu výsledku z hlediska pracnosti i přesnosti? Vhodná je samozřejmě kombinace obou metod. Nechat si projet originál audiem - a pak ho jen opravovat ručně (čehož se stejně asi nezbavíte). Tak se dá dojít k výsledku cca 2,5-3:1. Výhodou je, že v takovém případě můžete vyčistit ručně jen ty části, které vám na základě výběru z „hrubého přepisu“ přijdou užitečné.

Existuje ale ještě jeden zajímavý zlepšovák, který jsem s dovolením – nebo vlastně bez dovolení – obšlehnul z toho, co mi kdosi dávno referoval o způsobu vytváření skrytých titulků pro vysílání České televize. I tam funguje strojový přepis a i tam by byl velmi nespolehlivý, pokud by byl založený na originální audiostopě. Proto tam slouží „předčítači“, kteří fakticky dělají to, že simultánně tlumočí mluvené texty z češtiny do češtiny. Tlumočí je ale v laboratorně tichém prostředí a s kvalitní artikulací, takže si s výsledkem stroj poradí mnohem lépe.

Tady je výsledek, když jsem tenhle postup uplatnil na uvedený úryvek:
Ta práce pro mě určitě jediná v tom že i když jsem tam během toho dne třeba jenom třikrát na pár minut tak to je přípravě věnuji opravdu celý den i potom večer protože to pro mě nejsou okruhy ve kterých bych se běžně pohyboval ať už je to medicína fyzika nebo chemie a čeho si opravdu vážím tak od 1.dne mě vlastně veškerý ten štáb ať už mluvím o produkčních kameramanem operátorech přijal a Vnímám to tak že je to opravdu na vysoké profesionální úrovni ta 24.
Přestože přepis trval opět zhruba jen 50-55 sekund (přesah vzniká tím, že Dokumenty přepisují audio do textu s určitým zpožděním, které souvisí nejen s používáním chytrých technologií, ale do určité míry i s rychlostí internetového spojení. Při pomalejším spojení můžete v nejhorším případě očekávat i ztrátu částí textu...), je výsledek takřka perfektní. Interpunkce tedy stále schází, ale úspěšnost je řekněme 85-90 %.

Je ale třeba říct, že tenhle postup je samozřejmě o dost pracnější. Simultánní překlad je aktivita docela vyčerpávající, a to platí i pro „překlad z češtiny do češtiny“. Pomohou určitě dobrá sluchátka – a pak už jen schopnost naučit se průběžně opakovat slyšený text a zároveň přitom poslouchat a pamatovat si „dopředu“ další.

Jak moc chcete mít text přesný, tak moc musíte být pečliví při tlumočení. Můžete si všimnout v ukázce, že slovo „opravdu“ ve frázi „čeho si opravdu vážím“ vzniklo jistě chybou v „překladu“.

I když tedy má tenhle systém svoje mouchy, ze kterých připomínám:
  1. nutnost předat veřejně data do cloudu (existují i desktopové aplikace, které to umějí ve vlastním prostředí, jejich kvalitu ale neznám a nemohu posoudit; něco tuším zvládá i MS Word),
  2. psychickou náročnost „simultánního tlumočení“ z češtiny do češtiny,
  3. nutnost zajistit si příslušné pracovní podmínky a nástroje pro tlumočení (rychlé a spolehlivé připojení, sluchátka, mikrofon, ticho...);
má i své značné výhody, zejména:
  1. vysokou rychlost přepisu,
  2. poměrně vysokou spolehlivost.
Proto ho každému vřele doporučuji. 

Nicméně pokud máte někdo lepší postup, uvítám jeho popis.

Komentáře

Populární příspěvky z tohoto blogu

Za Janem Sokolem

Užitečnost, odbornost, Wikiverzita : 2. díl : Sebevzdělávání

Zásada pro chování wikisprávců: Komunikovat a být otevřený