Deep Research: Když AI nahradí celý výzkumný tým

Představte si, že máte osobního výzkumníka – někoho, kdo dokáže během několika minut prozkoumat stovky webových stránek, přečíst desítky článků, porovnat protichůdné informace a předložit vám ucelenou zprávu s citacemi zdrojů. Tedy jako kdyby Google dodával k vyhledávači ještě malou Armádu Indů.

Tohle není sci-fi ani vzdálená budoucnost. Je to funkcionalita zvaná Deep Research (nebo Deep Search, hluboký výzkum), která se v posledních měsících objevila v předních AI nástrojích. Jde o naprostou revoluci v tom, jak hledáme a získáváme informace. V tomto článku se dozvíte vše důležité – jak přesně tato technologie funguje a jak ji můžete efektivně využít pro své potřeby.

Co dokáží nástroje pro hluboký výzkum?

Za posledních 25 let jsme si zvykli na stejný model vyhledávání: zadáte dotaz v podobě pár klíčových slov, dostanete seznam odkazů a pak je procházíte, abyste našli odpověď. Málokomu vydrží energie, aby se dostal dál než za první stránku výsledků. Teď ale přichází nový nástroj, kterému napíšete podrobnou otázku (tady opak klíčových slov) a on výsledky prokliká a pročte za vás, včetně analýzy a syntézy informací. A nemusíte být IT expert, aby vám to fungovalo – stačí stisknout tlačítko. Wow!

Tento typ AI technologie se nazývá „hluboký výzkum“, protože provádí komplexní vícekrokový výzkum na internetu. Podívejme se detailněji na to, jak to funguje v praxi a co všechno umí:

  1. Prohledává desítky až stovky webových stránek
  2. Čte a analyzuje jejich obsah
  3. Porovnává informace z různých zdrojů
  4. Generuje strukturovanou odpověď s citacemi

Je to, jako byste místo pouhé průkazky do knihovny dostali osobního asistenta s doktorátem, který za vás projde všechny relevantní knihy, udělá výpisky a sestaví ucelený report – a to vše bez nutnosti platit mu zdravotní pojištění nebo poslouchat historky o jeho kočce, která má blíže nespecifikované trávicí potíže. Celý proces trvá typicky 2–30 minut.

Tyto nástroje kombinují schopnosti jazykových modelů (LLM) s přístupem k webu a s mechanismy pro autonomní rozhodování. Proto se o nich často mluví jako o AI agentech – systémech, které samostatně plánují, rozhodují se a provádějí akce k dosažení cíle. Kdyby se tito agenti mohli představovat, budou říkat: „Jsem Research. Deep Research.“

Technologie hlubokého výzkumu vyniká v několika klíčových oblastech:

  • Šířka pokrytí – během minut prozkoumá stovky stránek a zdrojů, což by člověku trvalo hodiny nebo dny
  • Syntéza informací – propojí údaje z různých zdrojů do koherentního celku
  • Strukturované výstupy – informace jsou přehledně organizovány s logickou strukturou
  • Úspora času – proces, který by člověku zabral hodiny nebo dny, zvládne za minuty

Hledání pravdy: jak spolehlivý je hluboký výzkum?

Jazykové modely nejsou zdrojem pravdy! Ostatně jako jím nejsou ani internetové stránky nebo většina lidí, které znám, takže laťka není zase tak vysoko.

Nicméně, díky funkci hlubokého výzkumu se jazykový model najednou stává nástrojem, který nejen opakuje, co viděl v učících datech, ale pouští se do role digitálního detektiva – prohledává aktuální internetové zdroje, porovnává různé informace a snaží se poskládat mozaiku faktů co nejpřesněji. Klíčovou vlastností je, že ke každému tvrzení připojí jeho zdroj, což umožňuje vlastní kritické hodnocení. To znamená, že uživatel může sám posoudit věrohodnost zdrojů, z nichž AI čerpala.

Dá se tedy použít i pro fact-checking. Zadáte-li dotaz o kontroverzním tématu, research vám může pomoci rychle identifikovat různé pohledy, ověřit faktická tvrzení a porovnat, co říkají různé zdroje – což je ideální způsob, jak se vyhnout informačním bublinám a dezinformacím (ukázka).

Při hodnocení výsledků je lepší se vyhnout absolutním pojmům jako pravda/nepravda – jsou to příliš složité konstrukty pro svět AI. Tyto nástroje bychom měli vnímat spíše jako užitečná vodítka, která nám pomáhají se k pravdě přiblížit vlastním kritickým myšlením, než jako definitivní zdroje pravdy.

Co to nedokáže?

Navzdory sofistikovaným metodám, které technologie hlubokého výzkumu využívá, existují důležitá omezení, na která by uživatelé měli pamatovat:

  • Omezený přístup k informacím: AI nemůže procházet placený obsah za paywally nebo získat přístup k neveřejným datům. A ani nemá kamaráda, který by mu posílal jejich screenshoty přes WhatsApp.
  • Závislost na dostupných zdrojích: Existují-li na internetu k tématu pouze nekvalitní nebo zaujatá data, výsledky analýzy budou také problematické. Jinými slovy, ani ta nejchytřejší AI nedokáže upéct lahodný dort, když má k dispozici jen písek a štěrk.
  • Potenciální „halucinace“: I pokročilé modely mohou občas vytvořit nepřesné informace nebo chybně interpretovat zdroje.
  • Potíže s komplexními vzorci: Některé recenze ukazují, že nástroje mohou mít problémy s interpretací vzorců a identifikací subtilních souvislostí.

OpenAI otevřeně uznává, že jejich výzkumný nástroj může stále dělat chyby nebo obsahovat dezinformace. Proto je důležité, aby uživatelé udržovali kritický přístup k výsledkům.

Průvodce džunglí Deep Research nástrojů

Na trhu již existuje několik implementací hlubokého výzkumu, které se liší dostupností, cenami i výkonem:

Deep Research v ChatGPT (OpenAI)

  • S předplatným ChatGPT Plus (10 dotazů za měsíc) a Pro (120/měsíc)
  • Výstupy jsou obvykle delší a analytičtější, s důkladným rozebráním tématu
  • Dosahuje 26.6% na benchmarku Humanity's Last Exam, což je nejvyšší skóre mezi konkurenty
  • Možnost vybrat z modelů GPT-4o, o3-mini a o3-mini-high (tento dává nejlepší výsledky)

Deep Research v Gemini Advanced (Google)

  • Generuje předem plán výzkumu, který můžete upravit
  • Reporty jsou stručnější, ale dobře strukturované s možností exportu do Google Docs
  • Report obsahuje seznam referencí s proklikem
  • Nabízí vynikající pokrytí díky přístupu k Google indexu a dobrou integraci s Google Workspace.

Perplexity Deep Research

  • Dostupné zdarma se základním limitem (5 dotazů denně) nebo neomezeně s Pro
  • Typicky dokončí výzkum v rozmezí 2–4 minut, což je mnohem rychlejší než konkurence
  • Ale zdaleka není tak důkladný, výsledek je povrchní

Grok s funkcí DeepSearch (xAI)

  • Dostupné v rámci předplatného X Premium (Twitter)
  • Využívá nejnovější jazykový model Grok
  • Výzkum dokončí také v řádu minut

Existují i další specializované nástroje jako Kompas AI (zaměřený na generování strukturovaných reportů), Elicit (specializovaný na akademické publikace) nebo You.com, které nabízejí podobné funkce pro specifické cílové skupiny.

Pro praktické srovnání výkonnosti těchto nástrojů stojí za pozornost příspěvky Michaely Liegertové, která se věnuje testování různých modelů deep search. V tomto článku analyzuje přednosti a slabiny zde uvedených modelů.

Od otázky k odpovědi: jak to funguje?

Použití hlubokého výzkumu je překvapivě jednoduché, což je součást jeho kouzla. Obvyklý postup vypadá takto:

  1. Zadání dotazu – formulujete svou otázku v přirozeném jazyce. Může být jednoduchá („Jaké jsou nejnovější trendy v solární energii?“) nebo složitá („Analyzuj změny v mezinárodních zákonech o deepfakes od roku 2020 a jejich dopady na mediální průmysl“).
  2. Upřesnění a plánování – některé nástroje vás požádají o dodatečné informace nebo vám ukáží plán výzkumu. Google Deep Research přímo zobrazí plánované kroky, které můžete upravit. ChatGPT často klade upřesňující otázky, aby lépe pochopil váš požadavek.
  3. Proces výzkumu – po zahájení můžete u většiny nástrojů sledovat průběh v reálném čase. Uvidíte, jak AI prochází webové stránky, extrahuje informace a formuluje myšlenky. ChatGPT zobrazuje proces v postranním panelu.
  4. Výsledný report – po dokončení (obvykle za 2–30 minut) dostanete strukturovanou zprávu obsahující shrnující téma, sekce s podrobnými informacemi, citace a odkazy na zdroje a u některých nástrojů i vizualizace dat nebo grafy.
  5. Navazující interakce – po přečtení reportu můžete klást doplňující otázky. Například „Můžeš rozebrat první bod podrobněji?“ nebo „Existují protichůdné názory na toto téma?“ nebo „Proč jsi tak chytrý, zatímco já tady sedím v pyžamu ve dvě odpoledne a diskutuji s počítačem?“.

Výsledky jsou obvykle formulovány neutrálním, objektivním tónem a obsahují informace z různých zdrojů, často s upozorněním na případné rozpory nebo nejasnosti v dostupných datech.

Tipy pro dokonalé výsledky

Hluboký výzkum je zvláště užitečný pro otázky, které vyžadují syntézu informací z různých zdrojů, porovnávání různých pohledů nebo sledování vývoje v čase. Důležité je formulovat dotaz co nejkonkrétněji – čím přesnější otázka, tím cílenější bude výsledek. Obecné dotazy jako „Řekni mi o elektromobilech“ poskytnou široké, povrchní odpovědi, zatímco specifické otázky jako „Jaké jsou celkové emise CO2 při výrobě a provozu elektrických vs. benzínových aut za dobu jejich životnosti podle studií z posledních 3 let?“ jsou mnohem lepší. Je to jako rozdíl mezi tím, když se ptáte dítěte „Jak bylo ve škole?“ (odpověď: „Dobře.“) versus „Co tě dnes ve škole nejvíc překvapilo?“ (odpověď: pravděpodobně něco o žížalách nebo kdo vyzvracel svačinu).

Pro získání co nejspolehlivějších výsledků je dobré:

  1. Formulovat konkrétní dotazy: Čím přesnější otázka, tím cílenější bude výzkum.
  2. Ověřovat klíčové údaje: Projít si zdroje u důležitých tvrzení. Ano, vím, že tohle udělá málokdo, ale pokud rozhodujete o milionové investici, možná byste měli.
  3. Zadávat doplňující otázky: Pokud je něco nejasné nebo podezřelé, požádat AI o další informace nebo vysvětlení. AI nebude uražená, že jste zpochybnili její autoritu.
  4. Používat více nástrojů: U opravdu důležitých témat porovnat výsledky různých Deep Research systémů.

Od byznysu po volný čas: praktické využití

Hluboký výzkum nachází uplatnění v mnoha oblastech a může výrazně zefektivnit práci s informacemi v profesionálním i osobním životě:

  • Výzkumníci a analytici – rychlá rešerše v nových oborech, přehled nejnovějšího vývoje
  • Novináři – ověřování faktů, získávání kontextu ke zprávám, identifikace zdrojů
  • Investoři – analýza trendů na trhu, průzkum konkurence, hodnocení nových technologií
  • Právníci – vyhledávání precedentů, změny v legislativě, příprava argumentace
  • Marketéři – analýza trhu, výzkum cílových skupin, identifikace influencerů
  • Nákupní rozhodnutí – komplexní porovnání produktů, sledování recenzí a zkušeností
  • Cestování – plánování cest, průzkum destinací, bezpečnostní situace
  • Vzdělávání – rychlé získání přehledu o nových tématech, příprava na zkoušky
  • Finanční rozhodnutí – analýza investičních možností, průzkum pojištění, hypotéky

Konkrétní příklady výzkumů:

  • „Jaké jsou aktuální přístupy k léčbě chronické únavy a jaké jsou výsledky jejich účinnosti?“
  • „Jaké jsou hlavní technologické překážky ve vývoji kvantových počítačů a jaké jsou realistické předpovědi pro jejich masové nasazení?“
  • „Jaké jsou argumenty pro a proti čtyřdennímu pracovnímu týdnu?“
  • „Porovnej různé přístupy ke zpomalení procesu stárnutí na buněčné úrovni podle nejnovějších výzkumů.“
  • „Porovnej efektivitu různých vzdělávacích metod pro výuku cizích jazyků podle výzkumných studií.“
  • „Jaký je současný stav výzkumu neurodegenerativních onemocnění a jaké jsou nejslibnější směry léčby Alzheimerovy choroby?“
  • „Porovnej různé taktiky, jak se vyhnout rozhovoru s otravným sousedem při náhodném setkání v supermarketu, hodnocené podle efektivity a minimalizace sociální trapnosti.“

…a tak dále.

Pod kapotou technologie Deep Research

Jste připraveni se ponořit do hloubky? Pojďme na to! Za zdánlivě jednoduchým uživatelským rozhraním se skrývá komplexní technologie kombinující řadu pokročilých prvků.

Technologie hlubokého výzkumu staví na velkých jazykových modelech (LLM), které fungují jako mozek celého systému. OpenAI používá specializovaný model o3, Google využívá starší Gemini 1.5 Pro – tedy modely optimalizovaní pro reasoning neboli uvažován – věnují více času a výpočetního výkonu systematické analýze problému. Také mají multimodální schopnosti – dokáží zpracovávat nejen text, ale i obrázky nebo PDF dokumenty z webu. A disponují delším kontextovým oknem, tedy množstvím informací, které model dokáže najednou zpracovat – na rozdíl ode mě, který zapomene, co šel koupit, jakmile překročí práh Billy.

Zajímavé je, že OpenAI a Google používají odlišné přístupy. OpenAI používá model o3, který byl specificky trénovaný pomocí posilovaného učení (reinforcement learning), aby „přemýšlel před odpovědí“ – má interní soukromý řetězec myšlenek pro plánování kroků. Google Gemini těží z tréninku na rozsáhlých datech a pravděpodobně i z reinforcement learning from human feedback (RLHF), díky čemuž poskytuje užitečné odpovědi.

Proces hlubokého výzkumu začíná plánováním. AI si rozdělí hlavní otázku na dílčí podotázky a naplánuje postup. Například dotaz „Jak se změnila adopce elektrických vozidel v Evropě za poslední dva roky?“ může být rozdělen na části jako „Jaké byly prodeje EV v Evropě v roce 2022?“, „Jaké byly prodeje EV v Evropě v roce 2024?“, „Jaké faktory ovlivnily změny?“ atd.

Následuje iterativní vyhledávání:

  1. Vyhledávání: AI provádí dotazy do webových vyhledávačů, podobně jako byste to dělali vy. Google přímo využívá expertízu svého vyhledávače – nemusí „náhodně brouzdat“, ale dostává kvalitní seznam zdrojů k analýze díky vlastnímu indexu a algoritmům hodnocení stránek jako PageRank. OpenAI využívá zřejmě „interní prohlížeč“ (byť buduje vlastní index), vyhledává informace online, čte obsah stránek a dynamicky mění směr pátrání podle nových zjištění.
  2. Procházení a čtení: AI otevírá nalezené stránky a čte jejich obsah, extrahuje relevantní informace, rozumí kontextu. A na rozdíl od většiny lidí čte články celé, ne jen titulky!
  3. Rekurzivní zpřesňování: Na základě toho, co se dozvěděla, formuluje nové, přesnější dotazy. Pokud například zjistí, že v roce 2023 byl v Norsku významný nárůst prodejů EV, může provést specifický dotaz na norský trh. Tady se vyloženě chová jako zmíněný agent.
  4. Hodnocení zdrojů: AI posuzuje důvěryhodnost zdrojů a preferuje oficiální statistiky, akademické publikace nebo renomovaná média.
  5. Syntéza informací: Po nasbírání dostatečného množství dat AI informace skládá dohromady, identifikuje vzory, trendy a případné rozpory.

Během tohoto procesu si modely explicitně formulují myšlenkové kroky, než učiní závěr. Nejde jen o získání informací, ale o jejich skutečné pochopení a propojení.

Při hloubkovém výzkumu se AI musí vypořádat s různými výzvami:

  • Deduplikace informací: Když různé zdroje uvádějí stejné informace, AI je musí rozpoznat jako duplicitní a nezapočítávat je vícekrát.
  • Konflikt informací: Pokud různé zdroje uvádějí odlišná data, AI buď musí vybrat důvěryhodnější zdroj, nebo upozornit na nesoulad. Tato práce se zdroji zahrnuje křížovou kontrolu faktů.

Technicky jde o synergii jazykového modelu (který rozumí textu) s webovým prohlížečem (který získává informace) a vrstvou pro plánování a rozhodování (která řídí celý proces). Je fascinující, že tyto složky společně vytvářejí systém, který se v mnohém podobá tomu, jak by výzkum prováděl člověk – pochopitelně s tím rozdílem, že AI dokáže zpracovat nesrovnatelně více informací v kratším čase a bez litrů kofeinu.

Energetický žrout aneb superpočítače v akci

Hluboký výzkum je extrémně náročný na výpočetní zdroje. Každý dotaz zabere značný výpočetní čas: agent může načíst stovky stránek, zpracovat miliony tokenů textu a vygenerovat desítky tisíc „thinking tokens“ (myšlenkových kroků), z nichž většina není přímo viditelná v konečném výstupu. Je to podobné, jako když člověk při psaní výzkumné práce přečte stovky stran, ale do finálního článku se dostane jen zlomek informací.

OpenAI provozuje své modely na cloudové infrastruktuře Microsoft Azure. Používají hlavně GPU akcelerátory NVIDIA. Google má výhodu vlastního globálního datacentrového ekosystému a specializovaného hardwaru TPU (Tensor Processing Unit). Google také těží z toho, že má oproti konkurenci víc stránek v indexu či mezipaměti, což snižuje zátěž – agent nemusí všechen čas trávit čekáním na stahování webu.

Právě tyto obrovské hardwarové nároky jsou důvodem, proč většina poskytovatelů Deep Research funkcí omezuje počet dotazů na určitou kvótu měsíčně. Představte si energii, kterou vysaje celá flotila vysoušečů vlasů v kadeřnickém salonu během plesové sezóny, a budete na zlomku toho, co tyto systémy spotřebují na vaši otázku o optimálním způsobu skladování avokáda.

Konec rešerší, jak je známe

Stojíme na prahu nové éry práce s informacemi. Technologie hlubokého výzkumu nepředstavuje jen další inkrementální vylepšení – je to fundamentální změna v tom, jak získáváme a zpracováváme znalosti. Přináší schopnosti, které byly dříve výsadou profesionálních výzkumných týmů, do rukou běžných uživatelů.

Jak se AI vyvíjí, mění se i naše role z hledačů informací na jejich kurátory a interprety. Budoucnost nepatří těm, kdo umí nejlépe vyhledávat, ale těm, kdo dokáží správně formulovat otázky a kriticky hodnotit odpovědi.