AI

Jak připravit web pro AI vyhledávače (a proč s tím nemůžete čekat)?

// obsah 10
  1. 01 Proč tohle píšu
  2. 02 Co je GEO a proč to není jen rebrand SEO
  3. 03 První šok: možná AI boty blokujete a nevíte o tom
  4. 04 Checklist technické AI optimalizace
  5. 05 Co je llms.txt a proč ho pravděpodobně nemáte
  6. 06 Co dělat s obsahem (krátký oddíl, protože tohle není moje parketa)
  7. 07 Jak poznat, jestli se to zlepšuje
  8. 08 Často kladené otázky
  9. 09 Co s tím udělat ještě tento týden
  10. 10 Nedělám si z toho tajnou nauku

Lidé přestávají googlit a ptají se ChatGPT, Perplexity nebo Claude. Tyhle nástroje neukazují seznam odkazů — skládají odpověď z 2–7 zdrojů a ty zdroje citují. Pokud váš web není technicky připravený (schema markup, llms.txt, neblokujete AI crawlery, obsah je v HTML a ne až v JS), AI vás buď nepřečte, nebo vás přeskočí. Oprava je z 80 % technická a dá se stihnout za pár dnů. Píšu, co konkrétně kontrolovat.

Proč tohle píšu

Každý druhý klient se mě v posledních měsících ptá na takovouto (nebo podobnou) otázku: „Ptal jsem se ChatGPT na naši službu a vůbec nás nezmínil. Proč?“

Obvykle odpovídám otázkou: „A pustili jste tam AI boty vůbec dovnitř?“

Nastává ticho. Pak: „Jaké boty?“

A tím jsme u toho. Rok 2026 je pro weby zlomový podobně, jako byl rok 2012 s nástupem mobilů. Tehdy kdo neměl responzivní web, zmizel. Teď jde o AI viditelnost a já mám pocit, že velká část českého internetu o tom ještě vůbec neví. Což je pro mě jako pro vývojáře dobrá zpráva (práce je), a zároveň frustrující (prosím, zkontrolujte si aspoň ten robots.txt).

Tenhle článek je pokus to tak nějak srozumitelně vysvětlit, podle toho co jsem nasbíral z internetu (a hlavně z AI, že jo). Je dlouhý, protože to téma není jednoduché, ale je to strukturovaný tak, abyste našli přesně tu část, co vás pálí.

Co je GEO a proč to není jen rebrand SEO

GEO (Generative Engine Optimization) je technická a obsahová optimalizace webu pro generativní AI vyhledávače — ChatGPT, Perplexity, Claude, Gemini a Google AI Overviews — s cílem, aby váš obsah byl použit a citován v odpovědích, které AI skládá uživatelům.

(Tu definici jsem do prvního odstavce dal schválně. AI modely při skládání odpovědí často extrahují definiční věty z úvodu článků. Pokud chcete být citovaní, tohle je první trik.)

Rozdíl proti klasickému SEO je v tom, za co se bojuje. SEO řeší pozici v seznamu odkazů. GEO řeší zmínku uvnitř odpovědi. Google vám dá 10 modrých odkazů a vy bojujete být první. ChatGPT vám napíše jeden odstavec a buď v něm jste citovaní, nebo neexistujete.

Rozdíl je i v mechanice. AI vyhledávač nefunguje jako Google s jedním dotazem a žebříčkem. Funguje to zhruba takhle:

  1. Uživatel se zeptá „Jaký je nejlepší PHP framework pro malý projekt v roce 2026?“
  2. AI to rozseká na sub-dotazy (query fan-out): „PHP framework srovnání 2026″, „Laravel vs Symfony pro malé projekty“, „PHP microframework benchmark“
  3. Pro každý sub-dotaz najde několik zdrojů a z nich skládá odpověď
  4. V odpovědi cituje 2–7 webů — a to jsou ti vítězové

Jak AI vybírá a kombinuje zdroje

Výzkum Princeton University z roku 2024 (ano, GEO má akademický papír, není to čistě marketingový buzzword, ikdyž už není nejnovější) ukazuje, že správné techniky mohou zvýšit viditelnost v AI odpovědích o 30–40 %. A to už stojí za to.

Ještě jedna důležitá věc: GEO není náhrada SEO. Je to nadstavba. AI vyhledávače často čerpají z webů, které už mají silné klasické SEO. Takže pokud vám neběhá robots.txt a máte chaos v hierarchii nadpisů, GEO vás nespasí.

První šok: možná AI boty blokujete a nevíte o tom

Nejčastější problém, se kterým se u klientů setkávám, je, že mají aktivně zakázané AI crawlery a vůbec o tom netuší. Většinou z jednoho ze tří důvodů:

1. Cloudflare to udělal za vás

Cloudflare v roce 2024 změnil defaultní nastavení a nově blokuje AI boty automaticky pro všechny zákazníky. Důvod je rozumný (ochrana obsahu), ale důsledek je, že pokud používáte Cloudflare a neudělali jste explicitní whitelist, ChatGPT váš web nevidí. Vůbec. Ani trochu.

Řešení: Cloudflare dashboard → Security → Bots → AI Scrapers and Crawlers → nastavit podle svých priorit. Pro GEO chcete povolit alespoň ty hlavní (GPTBot, ClaudeBot, PerplexityBot).

2. robots.txt z doby kamenné

Hodně WordPress instalací má v robots.txt nastavení, které někdo před lety zkopíroval z tutoriálu. Dnes tam typicky chybí pravidla pro AI boty a občas je tam naopak zákaz, který tam nepatří.

Minimální rozumné nastavení pro rok 2026:

User-agent: GPTBot
Allow: /

User-agent: ChatGPT-User
Allow: /

User-agent: OAI-SearchBot
Allow: /

User-agent: ClaudeBot
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: Google-Extended
Allow: /

User-agent: CCBot
Allow: /

Sitemap: https://vasweb.cz/sitemap.xml

(Pokud z etických/obchodních důvodů nechcete trénovat AI modely, můžete CCBot a Google-Extended nechat zablokované — to jsou trénovací boti. Ale GPTBot, ChatGPT-User, ClaudeBot a PerplexityBot jsou search boti, ti vám přivádějí traffic a citace. Ty nechte.)

3. Firewall / ModSecurity / Wordfence

Pokud máte přísný firewall nebo Wordfence s agresivními pravidly, klidně může blokovat cokoliv, co vypadá jako neznámý bot. Zkontrolujte v logu, jestli se tam objevují 403 odpovědi pro AI user-agenty.

Z vlastní nedávné zkušenosti – například Wedos u sdíleného hostingu blokuje AI komplet, psal jsem jim to a je to prý záměr, protože to způsobovalo velký traffic.

Rychlý test: v serverových logách zkuste zagrepovat ChatGPT-User, GPTBot, ClaudeBot. Pokud tam za poslední měsíc nic není, máte problém. Buď vás AI nenašla, nebo ji blokujete.

Nebo stačí CURL, kde jako user-agenta dáte ClaudeBot, to je ještě rychlejší.


Checklist technické AI optimalizace

Tohle je zkrácená verze checklistu, který používám při auditech. Projděte si to a červeně si označte, co máte rozbité.

Přístup pro crawlery

  • [ ] robots.txt povoluje GPTBot, ChatGPT-User, OAI-SearchBot, ClaudeBot, PerplexityBot
  • [ ] Cloudflare (pokud ho používáte) má whitelist na AI boty
  • [ ] Serverové logy ukazují, že AI boti web skutečně navštěvují

Dostupnost obsahu

  • [ ] Hlavní obsah je v HTML, ne generovaný JavaScriptem až v prohlížeči
  • [ ] Žádný klíčový obsah za paywallem, loginem nebo „click to expand“
  • [ ] Obrázky mají alt s kontextem (ne keyword stuffing)

Strukturovaná data (JSON-LD)

  • [ ] Organization na homepage (s NAP — jméno, adresa, telefon)
  • [ ] Article / BlogPosting na článcích s autorem a daty publikace/aktualizace
  • [ ] FAQPage u stránek s otázkami
  • [ ] Product + Review + AggregateRating u e-shopů
  • [ ] BreadcrumbList pro navigaci
  • [ ] Autor jako Person s sameAs odkazy na externí profily

Sémantika a struktura

  • [ ] Jedna H1, logická hierarchie H2 / H3
  • [ ] Nadpisy často formulované jako otázky
  • [ ] Sémantické tagy (<article>, <section>, <main>)
  • [ ] Inverted pyramid — odpověď první, kontext potom
  • [ ] První odstavec funguje jako samostatná odpověď

Nové soubory, které klasické SEO neřeší

  • [ ] llms.txt v rootu (mapa obsahu pro LLM)
  • [ ] sitemap.xml s aktuálními lastmod daty
  • [ ] Meta tagy article:published_time, article:modified_time

E-E-A-T signály

  • [ ] Stránky autorů s bio, kvalifikací a externími odkazy
  • [ ] O nás s konkrétními detaily
  • [ ] Citace primárních zdrojů v článcích
  • [ ] Datum aktualizace u evergreen obsahu

Výkon

  • [ ] LCP < 2,5 s, INP < 200 ms, CLS < 0,1
  • [ ] HTTPS a platný certifikát
  • [ ] Mobilní responzivita

Co je llms.txt a proč ho pravděpodobně nemáte

Nový soubor, který se v průběhu roku 2025 etabloval jako standard. Funguje podobně jako robots.txt nebo sitemap.xml, ale je určený LLM modelům a říká jim, které stránky jsou pro ně klíčové a jak jim rozumět.

Umisťuje se do rootu webu (tedy `https://vasweb.cz/llms.txt`) a vypadá zhruba takhle:

# Název firmy

> Krátký popis, co firma dělá (1–2 věty).

## Hlavní stránky

- [Služby](https://vasweb.cz/sluzby): Co nabízíme
- [O nás](https://vasweb.cz/o-nas): Historie a tým
- [Kontakt](https://vasweb.cz/kontakt): Jak nás najít

## Blog

- [Článek 1](https://vasweb.cz/blog/clanek-1): O čem to je
- [Článek 2](https://vasweb.cz/blog/clanek-2): O čem to je

## O firmě

Detailní popis firmy, lokality, specializace, reference.

Žádný standard to zatím není oficiálně přijatý jako W3C, ale iniciativa llmstxt.org je rozumná a implementace je triviální. Udělejte si to. Za půl hodiny je to hotové a do roka to pravděpodobně bude standard.

Co dělat s obsahem (krátký oddíl, protože tohle není moje parketa)

Já jsem vývojář, ne copywriter. Ale tyhle obecné principy platí a měl by je znát i ten, kdo obsah píše:

  1. Definice pojmu hned v úvodu. AI moc ráda extrahuje definiční věty. Pokud článek začíná „V dnešní turbulentní době…“, AI ho přeskočí.
  2. Inverted pyramid. Odpověď na začátku, detaily potom. Ne naopak.
  3. FAQ sekce na konci. Pět až deset konkrétních otázek s krátkými odpověďmi. Plus FAQPage schema.
  4. Konkrétní data, statistiky, citace. „Podle studie X z roku Y…“ — AI takové věty miluje.
  5. Datum aktualizace. AI preferuje čerstvý obsah. Pokud je článek z roku 2023 bez aktualizace, v roce 2026 ho přeskočí.
  6. Nedělejte AI slop. Paradoxně: obsah napsaný ChatGPT pro AI vyhledávače nefunguje dobře. AI modely se učí rozeznávat generický AI obsah a dávají přednost textu s „lidským otiskem“ — konkrétní zkušenost, osobní úhel pohledu, nestandardní formulace.

Jak poznat, jestli se to zlepšuje

Měření GEO je zatím trochu divočina. Nefunguje to jako Google Search Console, kde máte pozice a kliky. Co doporučuji:

Manuálně, zdarma: Vezměte si 10 dotazů, na které byste chtěli být citovaní, a každý měsíc je manuálně proklikejte v ChatGPT, Perplexity a Google AI Overviews. Zapisujte, jestli jste zmínění, jako kolikátý zdroj a v jakém kontextu. Není to sexy, ale je to měřitelné.

Placené nástroje: Otterly.ai, Profound, SE Visible, Zerply.ai, HubSpot AI Search Grader. Ceny od zhruba 50 USD měsíčně výš. Má smysl pro větší firmy, kde na tom stojí byznys.

Serverové logy: Sledujte, jak často AI boti chodí na web a které stránky tahají. Je to nepřímý signál, ale dobrý.

GA4: Nastavte si custom dimenzi pro referrer z AI nástrojů (chat.openai.com, perplexity.ai, claude.ai). Uvidíte, kolik traffic z AI už reálně přichází.

Často kladené otázky

Nahradí GEO klasické SEO?

Ne. GEO je nadstavba. AI vyhledávače často berou obsah z webů, které už mají silné klasické SEO. Bez fungujícího SEO vám GEO moc nepomůže.

Stačí mi nainstalovat nějaký plugin?

Bohužel ne. Pluginy jako Yoast, Rank Math nebo All in One SEO vám pomůžou s technickou stránkou (schema markup, meta tagy, sitemap), ale tu obsahovou a strukturální část nikdo automatizovaně nevyřeší. A tu novou věc typu llms.txt řeší zatím jen část pluginů.

Jak dlouho to trvá, než se projeví výsledky?

U technických úprav je typicky vidět efekt do 2–6 týdnů (jakmile AI boti web znovu projdou a změny se promítnou do modelů). U obsahových úprav a budování autority 3–6 měsíců. U link-buildingu a budování entity recognition 6–12 měsíců.

Má GEO smysl pro malou lokální firmu?

Ano, dokonce víc než pro velké hráče. Lokální dotazy („nejlepší zubař v Budějovicích“) jsou v AI vyhledávačích často položené a konkurence v GEO je tam zatím malá. Je to levná cesta, jak předběhnout.

Je GEO to samé jako AEO nebo LLMO?

V podstatě ano. AEO (Answer Engine Optimization) je starší pojem z éry Google featured snippets. LLMO (Large Language Model Optimization) a AIO (AI Optimization) jsou další varianty toho samého. V roce 2026 se jako standard prosazuje termín GEO.

Musím kvůli GEO psát úplně jiný obsah?

Ne úplně. Ale měli byste přepsat úvody článků tak, aby odpovídaly na otázku hned v prvních 2–3 větách. A přidat FAQ sekci. To je 80 % efektu.

Co s tím udělat ještě tento týden

Když chcete aspoň něco minimálně rozumného, tady je to nejmenší smysluplné zlo:

  1. Otevřete robots.txt a zkontrolujte, jestli tam máte aspoň GPTBot a ClaudeBot povolené.
  2. Zkontrolujte Cloudflare (pokud ho máte), jestli neblokuje AI boty.
  3. Zkontrolujte strukturu H1/H2/H3 na homepage a hlavních stránkách. Pokud je tam chaos, opravte.
  4. Přidejte llms.txt — trvá to 30 minut.
  5. Zeptejte se ChatGPT a Perplexity na 5 otázek, u kterých byste čekali, že budete jako zdroj. Zapište si výsledek. Za měsíc zopakujte.

Pokud tohle uděláte, jste dál než 80 % českého internetu. Což není pochvala internetu, ale realita, ve které žijeme.


Nedělám si z toho tajnou nauku

Všechno, co jsem napsal, je veřejně dostupné. Princetonský paper, llmstxt.org, dokumentace OpenAI k GPTBot, dokumentace Anthropic k ClaudeBot. Nic tajného. Ale zároveň je to mimo obvyklý radar většiny firem a agentur, které se živí SEO — protože spousta z nich ještě neupgradovala slovník.

Pokud si to chcete zkusit sami, tenhle článek vám stačí jako základ. Pokud se vám nechce (nebo máte složitější případ — multisite, e-shop, vícejazyčný web), ozvěte se. Dělám právě tohle, pro klienty v Česku i na Slovensku, většinou na WordPressu, ale klidně i čistě v PHP/Symfony nebo na jiné platformě.

A hlavně: nepanikařte. GEO není světoborná revoluce, je to jen další vrstva v tom, jak se lidé dostávají k informacím. Kdo měl poctivé SEO a dobrý obsah, ten má velkou část práce hotovou. A zbytek se dá doopravit za pár dnů.

Michal Katuščák
Michal Katuščák

Navrhuji a vyvíjím aplikace nad Symfony a Reactem, zajímám se architekturu softwaru. Žiju v Českých Budějovicích.