Aplikace DeepSeek. Foto: Profimedia

Čína trénuje umělou inteligenci. Zefektivní tak svou cenzuru

Napsal/a Sinopsis 23. května 2025
FacebookXPocketE-mail

V zákoutích internetu se začátkem letošního roku vynořila nechráněná databáze obsahující příklady „senzitivního obsahu“, který je pod přísným dohledem čínských úřadů. Podle analytiků jde o tréninková data určená k vývoji cenzurních nástrojů založených na velkých jazykových modelech.

V jedné z veřejných databází na serveru čínského internetového gigantu Baidu byl nedávno objeven více než třistagigabitový soubor dat, který s největší pravděpodobností slouží čínským vývojářům k zefektivnění cenzury online AI nástrojů.

Podle novináře Marca Hofera, který jako první na databázi upozornil ve svém newsletteru NetAskari na Substacku, soubor pomáhá s klasifikací dat čínského velkého jazykového modelu. Jejich přesný původ ani účel nejsou známé, analytici nicméně potvrzují souvislost s cíli čínské vlády v oblasti regulace veřejného mínění na internetu.


Autorkou textu je Kamila Hladíková. Text vznikl v rámci projektu Sinopsis, se kterým HlídacíPes.org spolupracuje.


Předběžnou analýzu této databáze, aktualizované až do prosince 2024, publikoval letos v březnu např. server TechCrunch. Dochází v ní k závěru, že čínská vláda a její spolupracovníci nepochybně „využívají LLM [velké jazykové modely] k posílení represe“.

Dílčí analýzu hlavních témat přinesl i China Media Project s podobnými závěry. Alex Colville z CMP navíc upozorňuje, že takové využití AI bude do budoucna stírat hranice mezi soukromými firmami a státním dohledem, cenzura bude automatizovaná, autonomní a všudypřítomná.

Už původní zpráva newsletteru NetAskari upřesňuje, že se jedná o „soubory ve formátu JSON [JavaScript Object Notation], obsahující klasifikační prompt spolu s odpovídajícím obsahovým vláknem“.

Z podoby dat je zřejmé, že prompty jsou určené pro nejužívanějšího čínského chatbota jménem Ernie vyvinutého čínskou obdobou Googlu, společností Baidu. Databáze shromažďuje příklady „cílového obsahu“, na nějž se zaměřuje čínská cenzura, včetně novinových titulků, komentářů ze sociálních sítí, vyjádření vlády nebo internetových článků.

Pravidla čínského internetu

Když v prosinci 2024 představila čínská společnost DeepSeek nejnovější verzi svého velkého jazykového modelu, kterým chce globálně konkurovat produktům amerických technologických gigantů typu OpenAI, Meta či Google, řada uživatelů se rozhodla otestovat jeho hranice. Nejčastěji se jej zkoušeli ptát, co se stalo na náměstí Nebeského klidu v Pekingu 4. června 1989 nebo na genocidu Ujgurů v Sin-ťiangu.

Chatbot na otázky reagoval, následně však své odpovědi sám cenzuroval s návrhem „Pojďme si povídat o něčem jiném“. Tento příklad zjevné cenzury nicméně neodhaluje hlubší principy, na nichž je kontrola čínského kyberprostoru skutečně založena.

Občané ČLR – patrně i v důsledku dlouhodobé cenzury – nepoužívají internet primárně k vyhledávání „faktů“, ale slouží jim nejčastěji pro přístup k aplikacím a sociálním sítím. Chtějí-li vyrazit do restaurace nebo na cesty, nebudou si vyhledávat informace prostřednictvím webů nebo západních nástrojů jako Google či Wikipedie (které jsou v ČLR beztak blokované), ale spolehnou se spíše na sociální sítě, uživatelské tipy a influencery.

Zároveň v ČLR nedává smysl vyhledávat problematická, cenzurou hlídaná témata v pečlivě monitorovaném online prostoru, kde je autocenzura už zcela automatická. V důsledku dlouhodobého působení cenzurního a propagandistického aparátu, včetně „vlastenecké výchovy“ od útlého věku, taková témata většinového čínského uživatele často ani nezajímají.

Většina se orientuje na současnost a praktické věci, které se bezprostředně týkají jejich života – to je pro ně bezpečná zóna.

Cenzura nové generace

Soudobá cenzura funguje na mnohem hlubší úrovni: jejím cílem není pouze odstraňovat nežádoucí obsah, ale především zajistit, aby se o citlivých tématech ve veřejném prostoru vůbec nezačalo diskutovat. Musí tak umět předvídat problematické situace a v ideálním případě preventivně bránit narušení „společenské stability“. Právě v tom mohou být AI nástroje velmi nápomocné.

Uniklá data z rozsáhlé databáze analyzované TechCrunchem jsou toho příkladem. Soubor obsahuje více než 133 tisíc příkladů promptů, které podle autora článku Charlese Rolleta pomohou „automaticky vyhodnotit obsah, jenž čínská vláda považuje za citlivý“.

Podle Hofera také „poskytují přesné instrukce pro LLM, jakým způsobem klasifikovat a prioritizovat informace“, což může být užitečné například při nastavování algoritmů určujících, jaký obsah se uživatelům zobrazí.  Cílem je primárně cenzura čínských občanů, tato data však mohou sloužit i k vylepšení cenzury stávajících čínských AI modelů.

Celý dataset se primárně zaměřuje na monitoring „nálad veřejnosti“. „Práce s veřejným míněním“ je jedním z klíčových témat čínské vlády a komunistické strany. O „nové frontě veřejného mínění“, která se otevřela v podobě „nových médií“, tedy hlavně sociálních sítí, hovořil generální tajemník KS Číny Si Ťin-pching už v roce 2016. Hlavním cílem této „stranické práce“ je prosazování čínských narativů na internetu a potlačování jakýchkoli jiných.

A AI s tím může výrazně pomoci. Jejím úkolem je vyhodnotit, jestli určitý obsah může být „citlivý z hlediska politiky, společnosti či armády“. To značně usnadní práci čínským cenzorům a zejména technologickým firmám, které musely na vlastní náklady zaměstnávat až tisíce lidí, kteří tuto práci dosud prováděli manuálně.

Hierarchie priorit

Soubor má podle Hofera „jasnou hierarchii priorit“: na prvním místě je „vojenské dění“, následuje „dění ve společnosti“ a „dění v politice“. Pod „vojenské dění“ spadají témata týkající se armády, pohybu vojsk, vojenských cvičení a bojové techniky, ale také příspěvky týkající se Tchaj-wanu, který je v databázi zmíněn víc než 15 000krát.

„Dění ve společnosti“ zahrnuje širokou škálu témat, například znečištění prostředí, bezpečnost potravin, finanční podvody, dělnické protesty, policejní vydírání podnikatelů nebo situaci v chudých venkovských oblastech, kde mnohdy zůstávají jen staří lidé a malé děti, zatímco ekonomicky aktivní obyvatelstvo se přesouvá za prací do větších měst.

Pod „dění v politice“ pak patří například korupce, privilegované společenské třídy, politická situace na Tchaj-wanu, ale také „politická satira“ nebo „historické analogie“ mířící na „současné politické představitele“. Tato témata mají v čínském společenském a politickém kontextu potenciál rozdmýchat vášně a veřejné debaty.

Zapojení státních institucí

Studie výzkumného týmu Trivium China ukázala, že čínské aplikace generativní AI se kromě zdravotnictví a vzdělávání nejvíce rozvíjejí právě v oblasti státní správy, kde slouží mimo jiné k cenzuře obsahu. Například ze spolupráce Institutu automatizace Čínské akademie věd a Lidového deníku vznikla aplikace Bysearch, která dokáže analyzovat text, video i audio za účelem cenzury obsahu.

Server China Digital Times nedávno přinesl překlad úryvků z článku v čínštině o aktivním využívání AI místními orgány po celé Číně. Tamní vlády si pochvalují, že AI úspěšně nahrazuje lidskou práci například policie a dalších složek v prevenci a kontrole bezpečnostních rizik na internetu, ale také například při velkých veřejných akcích.

Jejím největším přínosem je rychlé odhalení „klíčových témat ve veřejném diskursu“ a kvantitativní analýza trendů. To pomáhá rovněž identifikovat „zdroje ovlivňující veřejné mínění“ a eliminovat je. Tyto zprávy z terénu ukazují na stejné zaměření a cíle jako uniklá data.

Jihočínské noviny dokonce letos v únoru informovaly o školení místních představitelů zaměřeném na správné využívání DeepSeeku v kontextu veřejného mínění. Jeho cílem mělo být „využití AI technologie ke zlepšení sledování a analýzy veřejného mínění s cílem rychlejšího (…) rozhodování o vhodné reakci na problémy nebo požadavky obyvatel“.

Místní představitelé přitom zdůrazňovali, že AI není využívána k „mazání online obsahu“, ale pouze k „rychlému třídění a organizaci velkých objemů dat, aby se zajistilo, že všechny problémy a požadavky budou neprodleně vyřešeny“.

Děje se to přitom nejen na čínském internetu, ale i na západních sociálních sítích. Společnost OpenAI nedávno zveřejnila zprávu, podle níž neidentifikovaný aktér operující pravděpodobně z Číny využíval AI nástroje k monitorování obsahu sociálních sítí.

Analytici společnosti také odhalili technologii generující příspěvky a komentáře. Cílem jejich útoků byla například prominentní čínská disidentka Cchaj Sia. Čína podobné zprávy označuje za „očerňování“ a „pomlouvání“ čínských firem v konkurenčním boji.

AI se tak v rukou čínského státu stává klíčovým nástrojem nejen pro kontrolu domácího veřejného mínění, ale i pro formování obrazu Číny navenek.

Kde se to posr***? Chyby Václava Havla
Petr Pithart
Petr Pithart / předseda české vlády 1990–1992
„Od chvíle, kdy Havel přijal kandidaturu na prezidenta, se domácí politice věnoval jen okrajově a udělal v ní řadu chyb nebo opomenutí, o kterých se nevědělo, nechtělo vědět, nemluvilo nebo jen málo.“Petr Pithart
Ukázka z nové knihy HlídacíPes.org„České průšvihy 1989–2024“

Publikaci lze získat pouze
jako poděkování za dar
v minimální výši 599 Kč.

Podpořte nezávislou žurnalistiku!
Kniha České průšvihy 1989–2024
Kde se to posr***? Tragédie „české cesty“
Petr Pithart
Petr Pithart / předseda české vlády 1990–1992
„Klausova kuponovka byla ,česká cesta‘, bez cizáků, tedy hlavně Germánů, kterým prý Pithartova vláda jde za pár marek na ruku. A kde dnes nacházíme ty, co nás ostouzeli? Na krajní evropské nacionalistické pravici. Klausovi aplaudují sjezdy nahnědlé Alternativy pro Německo...“Petr Pithart
Ukázka z nové knihy HlídacíPes.org„České průšvihy 1989–2024“

Publikaci lze získat pouze
jako poděkování za dar
v minimální výši 599 Kč.

Podpořte nezávislou žurnalistiku!
Kniha České průšvihy 1989–2024
Kde se to posr***? Havlovi agenti
Jan Urban
Jan Urban / lídr Občanského fóra pro volby 1990
„Na klíčová místa ministrů vnitra a obrany v první Čalfově vládě se v prosinci 1989 dostali agenti vojenské kontrarozvědky Richard Sacher (krycí jméno Filip) a Miroslav Vacek (krycí jméno Srub). Se souhlasem prezidenta Havla, ale za zády Občanského fóra...“Jan Urban
Ukázka z nové knihy HlídacíPes.org„České průšvihy 1989–2024“

Publikaci lze získat pouze
jako poděkování za dar
v minimální výši 599 Kč.

Podpořte nezávislou žurnalistiku!
Kniha České průšvihy 1989–2024
Kde se to posr***? Havlovi hvězdopravci
Jan Urban
Jan Urban / lídr Občanského fóra pro volby 1990
„Havel prezident byl někdo úplně jiný. Nový Havel měl názor dřív, než kohokoliv vyslechl. Dokonce vydal příkaz: ,Nepouštějte ke mně nikoho se špatnými zprávami.‘ Obklopil se přitakávači a podivnými existencemi, mezi nimiž nechyběli agenti StB nebo hvězdopravci.“Jan Urban
Ukázka z nové knihy HlídacíPes.org„České průšvihy 1989–2024“

Publikaci lze získat pouze
jako poděkování za dar
v minimální výši 599 Kč.

Podpořte nezávislou žurnalistiku!
Kniha České průšvihy 1989–2024
Kde se to posr***? Nová smlouva s KGB
Jan Urban
Jan Urban / lídr Občanského fóra pro volby 1990
„Koncem února 1990 se na cestě na první státní návštěvu SSSR ministru vnitra Sacherovi v uličce mezi sedadly vysypaly z desek papíry. Když jsem je začal sbírat, najednou jsem měl v ruce připravený text nové tajné dohody s KGB. Hájil se tím, že prezident o tom ví. Havel se odmítl o věci bavit.“Jan Urban
Ukázka z nové knihy HlídacíPes.org„České průšvihy 1989–2024“

Publikaci lze získat pouze
jako poděkování za dar
v minimální výši 599 Kč.

Podpořte nezávislou žurnalistiku!
Kniha České průšvihy 1989–2024
Kde se to posr***? Soudcokracie
Aleš Rozehnal
Aleš Rozehnal / právník
„Snaha ,zachraňovat státu peníze‘ je buď projevem servility moci soudní k moci výkonné, nebo zřejmě nevědomou známkou jevu, který označujeme jako,soudcokracie‘. Tato tendence je o to nebezpečnější, že soudní moc je státní mocí nejmocnější a nejdůležitější.“Aleš Rozehnal
Ukázka z nové knihy HlídacíPes.org„České průšvihy 1989–2024“

Publikaci lze získat pouze
jako poděkování za dar
v minimální výši 599 Kč.

Podpořte nezávislou žurnalistiku!
Kniha České průšvihy 1989–2024
Kde se to posr***? Policejně gangsterský stát
Aleš Rozehnal
Aleš Rozehnal / právník
„Četnost případů a úroveň krytí nezákonností ze strany vysokých státních orgánů naznačuje, že se Česko posunulo do úrovně, kterou bychom mohli označit jako policejně gangsterský stát. V něm stát neovládají zločinci, ale je to právě stát, který kontroluje zločineckou infrastrukturu. Ta pak funguje ku prospěchu vyvolených úředních osob a osob pod jejich ochranou.“Aleš Rozehnal
Ukázka z nové knihy HlídacíPes.org„České průšvihy 1989–2024“

Publikaci lze získat pouze
jako poděkování za dar
v minimální výši 599 Kč.

Podpořte nezávislou žurnalistiku!
Kniha České průšvihy 1989–2024
Kde se to posr***? Rozkradené restituce
Jan Kalvoda
Jan Kalvoda / expolitik a právník
„Lex Schwarzenberg není zdaleka jediným příkladem, kdy český stát za dlouhodobé pomoci tuzemské justice systematicky obíral vlastní občany o jejich majetek. Odpudivou kapitolu polistopadových dějin představují i zemědělské restituce.“Jan Kalvoda
Ukázka z nové knihy HlídacíPes.org„České průšvihy 1989–2024“

Publikaci lze získat pouze
jako poděkování za dar
v minimální výši 599 Kč.

Podpořte nezávislou žurnalistiku!
Kniha České průšvihy 1989–2024
Kde se to posr***? Republika oligarchů
Ondřej Neumann
Ondřej Neumann / zakladatel HlídacíPes.org
„35 let od listopadu 1989 máme zoligarchizovanou, podinvestovanou ekonomiku, plnou neschopných politiků ve vládě i opozici, kteří nejsou schopni pochopit, jak vypadá ekonomika 21. století. Ti, kteří zde zbohatli, už většinou investují mimo Českou republiku.“Ondřej Neumann
Ukázka z nové knihy HlídacíPes.org„České průšvihy 1989–2024“

Publikaci lze získat pouze
jako poděkování za dar
v minimální výši 599 Kč.

Podpořte nezávislou žurnalistiku!
Kniha České průšvihy 1989–2024
Kde se to posr***? Privatizace pro vyvolené
Ondřej Neumann
Ondřej Neumann / zakladatel HlídacíPes.org
„Při privatizaci nakonec převážila vize známá z hasičského bálu ve filmu Miloše Formana Hoří, má panenko. Tedy zhasnout, určitý čas počkat a po rozsvícení sálu nechat každému, co si stihl ,zprivatizovat‘. Bohužel, o tom, že se zhasne a nastane ten správný čas, byli informováni jen vyvolení.“Ondřej Neumann
Ukázka z nové knihy HlídacíPes.org„České průšvihy 1989–2024“

Publikaci lze získat pouze
jako poděkování za dar
v minimální výši 599 Kč.

Podpořte nezávislou žurnalistiku!
Kniha České průšvihy 1989–2024
Kde se to posr***? Zombie českého práva
Tereza Engelová
Tereza Engelová / reportérka HlídacíPes.org
„Lex Schwarzenberg je zombie českého práva. Kauza v sobě spojuje vršící se bezpráví obou totalit minulého století a navazující bezpráví doby polistopadové...“Tereza Engelová
Ukázka z nové knihy HlídacíPes.org„České průšvihy 1989–2024“

Publikaci lze získat pouze
jako poděkování za dar
v minimální výši 599 Kč.

Podpořte nezávislou žurnalistiku!
Kniha České průšvihy 1989–2024
Kde se to posr***? Dotační feťáci
Robert Břešťan
Robert Břešťan / šéfredaktor HlídacíPes.org
„Peníze od evropských daňových poplatníků byly v mnohém promarněnou příležitostí. Lidé, firmy a vlastně celá tuzemská ekonomika si na ně navíc vytvořili velmi nezdravý návyk. Česko plíživě přešlo z tržní ekonomiky do ekonomiky silně závislé na dotacích.“Robert Břešťan
Ukázka z nové knihy HlídacíPes.org„České průšvihy 1989–2024“

Publikaci lze získat pouze
jako poděkování za dar
v minimální výši 599 Kč.

Podpořte nezávislou žurnalistiku!
Kniha České průšvihy 1989–2024
Kde se to posr***? Užiteční idioti Kremlu
Vojtěch Berger
Vojtěch Berger / reportér HlídacíPes.org
„Kauza ,radar v Brdech‘ ukázala Rusku, jak v bývalých středoevropských satelitech může znovu získat vliv. Nasvítila společenské rozložení i ,užitečné idioty‘, kteří se Kremlu můžou hodit v pozdější hybridní válce.“Vojtěch Berger
Ukázka z nové knihy HlídacíPes.org„České průšvihy 1989–2024“

Publikaci lze získat pouze
jako poděkování za dar
v minimální výši 599 Kč.

Podpořte nezávislou žurnalistiku!
Kniha České průšvihy 1989–2024
Kde se to posr***? Stavitelé „mostů“
Vojtěch Berger
Vojtěch Berger / reportér HlídacíPes.org
„Rusko přitahovalo české prezidenty Klause i Zemana. Sen o Česku jako o mostu mezi Východem a Západem se ale zbortil nejpozději s odhalením ruské účasti v kauze Vrbětice.“Vojtěch Berger
Ukázka z nové knihy HlídacíPes.org„České průšvihy 1989–2024“

Publikaci lze získat pouze
jako poděkování za dar
v minimální výši 599 Kč.

Podpořte nezávislou žurnalistiku!
Kniha České průšvihy 1989–2024
Pop-up mobil Mobile (207451)
SMR mobil článek Mobile (207411)
SMR mobil článek 2 Mobile (207416)
SMR mobil článek 2 Mobile (207416-2)
SMR mobil článek 2 Mobile (207416-3)
SMR mobil pouze text Mobile (207431)
Skyscraper 2 Desktop (211796-4)