Rozpoznávání a generování řeči

Přepis mluvené řeči do textu

Nástroj pro převod mluvené řeči na text, který podporuje i češtinu, vytvořilo Open AI a jmenuje se Whisper. Navíc si docela dobře poradí i se šumem. Povinná výbava každého novináře, který dělá rozhovory. Přepsaný text se nedá nikdy přímo publikovat, protože my lidé mluvíme jako Hotentoti, je to samé éééé, jakoby, nóóó, vlastně, prostě, atd. Je nutné ho přepsat, uhladit, a taky opravit chyby, které udělá Whisper. A právě zde může výrazně pomoci GPT. Řekni mu, že mu předáváš strojově přepsané mluvené slovo a chceš ho stylisticky opravit. Ať se snaží.

Mrkni na přehled nástrojů.

Když AI čte nahlas

To jsme byli ještě malí, když maminky říkávaly: „Čti, uměligence, čti!“ Dnes už mámě čteme sami, oči letí nad stránkami jako vážky po řece.

Číst, neboli převádět text na mluvené slovo, zvládají počítače, mobily a tablety a už dávno. Stačí označit text a nechat ho přečíst. Že text čte robot je zatím evidentní, ale vznikají stále lepší a lepší modely a brzy se rozdíl smaže. Nejprve samozřejmě v angličtině, později i v češtině.

Můžeš vyzkoušet tyto dvě služby:

  • SpeechGen – realistický převodník textu na řeč
  • HeyGen – vytvoří video s mluvčím nebo digitálním učitelem

Mrkni na návod Jak naklonovat hlas.