Čínský DeepSeek R1: jako Hannibal Lecter, ale bez krve

Pamatujete na scénu z filmu Hannibal, kde doktor Lecter při večeři odkryl lebku Paula Krendlera a pozoroval jeho mozek? Podobně fascinující zážitek nám nyní nabízí novinka od čínské společnosti DeepSeek [dý psík]🐕 – její jazykový model nám umožňuje sledovat myšlenkové pochody, naštěstí bez toho nepříjemného řezání.

Můžete si ji vyzkoušet na webu (zaklikněte DeepThink) nebo v mobilní apce. Jen mějte na paměti, že veškerá konverzace putuje na servery v Číně, takže tam neposílejte nic citlivého, zejména ne rozmístění strategických zbraní v ČR.

Co dělá tento model výjimečným? Je to jeho schopnost UVAŽOVÁNÍ.

Když se vás někdo zeptá, kolik je 2×5, odpovíte okamžitě 10. Ale když se vás zeptá, kolik je 1247×863, začnete si to rozepisovat na papír a postupovat krok za krokem. Dosavadní AI modely fungovaly jako v prvním případě – snažily se vypálit odpověď od boku. Proto také často produkovaly naprosté nesmysly. Nepřemýšlely tolik, protože přemýšlení bolí (provozovatele v jejich peněženkách).

Prostě by to bylo neúnosně drahé a pomalé. Jako když Houston komunikuje s astronauty na Měsíci – každá odpověď trvá 2.6 sekundy, než dorazí signál tam a zpět. Ale tady by to bylo v minutách. Jako dialog s programátorem ponořeným do práce: „Hmm… (32 vteřin ticha) …co jsi říkala?“

Přitom jsou situace, kdy je hluboké přemýšlení nezbytné. Vezměme třeba úlohu, kterou mi kdysi říkal strýc Láďa Musil: „U zdi stojí bedna, metr vysoká, metr široká. Před bednou stojí desetimetrový žebřík opřený o zeď, který se jí dotýká. Do jaké výšky žebřík sahá?“ Na první pohled jednoduchá otázka. Ale správné řešení vyžaduje doktorát z matiky. Pro představu, zadal jsem tento úkol (25 slov) do DeepSeek a ten si sám pro sebe zapřemýšlel vyprodukováním 21.000 slov (což je za hranicí možností ChatGPT) a nakonec dal odpověď dlouhou 250 slov. A navíc, což je příjemný bonus, správnou.

Dosud jsme museli AI modely k přemýšlení postrkovat chytrým promptem, kde se psalo něco jako „Nejdřív si to rozmysli a pak odpověz“. Ale výkon modelů se zvýšil, cena klesla a tak vstupujeme do éry přemýšlejících modelů (a funkční prompty bude moci psát i skladník v šroubárně). Takovým je třeba „o1“, který nedávno představilo OpenAI. Jenže… skrývá před námi myšlenkový proces. Je to černá skříňka a to mě fakt vadí. Palec dolů.

Naštěstí přichází DeepSeek, který nás nechává do svého myšlenkového procesu koukat. Je to fascinující čtení, protože je přitom děsně ňuňu! Když modelu zadám úkol, začne si povídat sám se sebou: „Hmm, uživatel chce vyřešit tenhle problém… Zkusme to udělat takhle… Moment, moment! To není správně… Počkat, teď mě něco napadlo! … Ne, ne, to je hloupost…“ A tak dále. Je to fakt jako nahlížet někomu do proudu vědomí.

Dokonce jednou jsem mu dal úkol, hodně se nad tím trápil a pak vidím, jak sám pro sebe píše: „…tyjo mám pocit, že uživatel nám dal asi blbě zadání, furt mi to nevychází…“, tak kouknu, a já mu ho fakt blbě zkopíroval. Tak jsem hned ťunťu zastavil a opravil se.

Samozřejmě ne vždy potřebujeme, aby model takhle hluboce přemýšlel. Když se zeptáte na hlavní město Francie, je zbytečné rozmýšlet půl hodiny. Nebo když chcete shrnout text, vygenerovat seznam synonym, atd. Na to není potřeba povolávat profesora češtiny.

Ale do budoucna bude přemýšlení zcela standardní součástí všech jazykových AI modelů. Samy si vyhodnotí, kdy stačí rychlá odpověď a kdy je potřeba se nad problémem zamyslet. Vlastně úplně stejně, jako to děláme my lidé. S výjimkou sobotního rána.