Roboti prý předehnali lidi na internetu. Zas tak úplně to pravda není

Sdílet

Autor: Radan Dolejš s podporou AI
V posledních týdnech se po sociálních sítích šíří screenshoty z Cloudflare Radar s dramatickým komentářem: „Botů je víc než lidí.“ Někde se k tomu přidá ještě „AI převzala internet“ a je z toho virální příběh. Jenže když si s tím dashboardem chvíli pohrajete, zjistíte, že skutečnost je složitější – a zároveň zajímavější než jednoduché tvrzení „roboti nás přemohli“.

Cloudflare Radar je veřejný náhled do provozu, který teče přes infrastrukturu Cloudflaru. Neukazuje „celý internet“, ale velký vzorek webů, API a služeb, které Cloudflare chrání a akceleruje. Pro sledování trendů a poměrů je to solidní zdroj, nikoli však oficiální „sčítání internetu“.

Na stránce Traffic jsou zásadní tři prvky:

  • přepínač Human / Bot / All,
  • graf „Bot vs Human“,
  • nově také grafy Content type distribution a API traffic share.
Pusťte si jeden z našich úspěšných podcastů
Kyberbezpečnost a zákony bez obalu
Kyberbezpečnost a zákony bez obalu
0:00/

Podstatné je, že všechny tyto grafy mají filtry. Bez znalosti jejich nastavení je velmi snadné vyčíst z vizualizace něco, co ve skutečnosti platí jen pro úzký výsek dat.

Proč tvrzení „botů je víc než lidí“ není tak jednoduché

Sdílené screenshoty obvykle ukazují graf, kde je botí provoz vyšší než lidský. Nejčastěji jde právě o „Bot vs Human“ s určitou kombinací filtrů. A právě zde leží hlavní problém.

Cloudflare k tomuto grafu přidal filtr podle typu obsahu (content type). Je možné sledovat například pouze HTML (klasické webové stránky) nebo všechny typy (HTML, JSON, obrázky, video atd.).

Pokud je zvolen pouze HTML obsah, může skutečně vyjít, že na HTML stránkách převažuje provoz botů. Vysvětlení je poměrně přímočaré: různé crawlery, scrapery a monitorovací či testovací nástroje procházejí HTML web velmi intenzivně.

Jakmile se však přepne na „All content types“, situace se změní. Do statistik se započítají streamovaná videa, obrázky, API požadavky, soubory ke stažení a další typy provozu. V tomto širším pohledu typicky dominuje lidská aktivita: sledování videa, sociální sítě, online hry, videohovory.

Cloudflare přidalo filtr content type a související grafy právě proto, aby bylo zřejmější, jaké složky HTTP provozu přispívají k celkovým číslům. Screenshot „botů je víc než lidí“ bez uvedení nastavení filtrů proto představuje statistiku vytrženou z kontextu. Nemusí být vysloveně nepravdivý, ale nepopisuje celý obraz.

Content type a API: proč jsou nové grafy důležité

V nedávné aktualizaci přibyly na stránku Traffic dva klíčové grafy:

  • Content type distribution – rozložení HTTP odpovědí podle typu obsahu (HTML, JSON, obrázky, video),
  • API traffic share – podíl API požadavků na dynamickém, necacheovaném provozu.

Graf „Bot vs Human“ byl zároveň rozšířen o stejné content type filtry.

Konverzační služby na bázi AI – ač kritizované, rychle rostou Přečtěte si také:

Konverzační služby na bázi AI – ač kritizované, rychle rostou

Důvod je zřejmý: svět se posouvá od „stránek“ k aplikacím a API. Značná část provozu dnes probíhá formou JSON nebo jiných API odpovědí, které uživatel nevidí přímo v prohlížeči jako stránku, ale spotřebovává je aplikace. JSON (JavaScript Object Notation) je jednoduchý textový formát pro strukturovaná data, který vypadá trochu jako zápis objektu nebo slovníku a používá se právě pro výměnu dat mezi serverem a aplikací.

Na API provozu přirozeně dominuje automatizace: integrační skripty, služby na pozadí, microservices komunikující mezi sebou. To jsou rovněž „boti“, ale v jiném smyslu než tradiční webové scrapery.

Kdo je „bot“ v terminologii Cloudflaru

Dalším zdrojem nedorozumění je samotné slovo „bot“. Ve veřejné debatě se často zaměňuje s „AI agentem“ nebo přímo s „útočným botnetem“. Cloudflare však tento pojem používá podstatně šířeji.

Do kategorie botů spadají mimo jiné:

  • legitimní vyhledávače (Googlebot, Bingbot),
  • monitoringy a uptime checkery,
  • API klienti a integrační platformy,
  • různé crawlerové a scrapingové nástroje,
  • automatizované útoky a škodlivý provoz.

V poslední době k tomu přibývají také nové typy provozu: AI crawlery, které indexují web pro trénink modelů, a agentní systémy, které jedním API voláním vykonají několik kroků za uživatele.

Stručně řečeno: „bot“ na Radaru neznamená automaticky „AI“ ani „útočníka“. Jde obecně o automatizovaný provoz rozpoznaný jako ne‑lidský.

Rostou AI agenti a API provoz? Ano. Znamená to, že AI převzala internet? Ne.

Nárůst botího provozu je reálný trend. Firmy nasazují více automatizace, microservices intenzivně komunikují přes API, AI systémy sbírají data a monitorují prostředí. Nové grafy pro content type a API traffic na Radaru tuto realitu odrážejí.

Perimetr selhal. Teď záleží jen na datech, tvrdí Patrick Smith z Everpure Přečtěte si také:

Perimetr selhal. Teď záleží jen na datech, tvrdí Patrick Smith z Everpure

Z toho však nevyplývá, že většina internetového provozu by byla tvořena AI nebo že lidé už tvoří zanedbatelnou menšinu.

Data spíše ukazují:

  • Podíl automatizace na provozu roste. Významnou část tvoří běžné integrační a backendové scénáře, nikoli pouze vyhledávače nebo AI crawlery.
  • V některých výsecích může mít botí provoz navrch. Typicky právě u HTML obsahu nebo u API rozhraní určitého typu služby. Tam dává tvrzení „botů je víc než lidí“ smysl, ale nejde o popis celého internetu.
  • Celkový obrázek je méně dramatický. Lidmi generovaný provoz – streamované video, sociální sítě, hry, videohovory – zůstává obrovský a v mnoha ohledech dominuje.

Co z toho plyne pro provozovatele webů a služeb

Pro administrátory, vývojáře a provozovatele služeb mají grafy z Radaru několik praktických implikací.

Logy budou stále plnější automatizovaných požadavků. Vedle škodlivého provozu jde i o legitimní boty: vyhledávače, monitoring, různé integrace. Bez dobré filtrace se analytika snadno zaplaví šumem.

Školení Kubernetes

Jasná pravidla pro „dobré“ a „špatné“ boty jsou čím dál důležitější. Whitelisting korektně se představujících crawlerů, omezení pro agresivní scrapery, rate limiting na API rozhraních – to vše je dnes součást základní hygieny.

API přestává být vedlejší kanál. Z pohledu objemu i významu už nejde o vedlejší produkt webu, ale často o primární rozhraní služby. Latence, škálování a bezpečnost API jsou minimálně stejně důležité jako klasický webový frontend.

Computertrends - promo

Computertrends si můžete objednat i jako klasický časopis. Je jediným odborným magazínem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.

Obsah Computertrends je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.