Claude potyka się o Kreml. NewsGuard pokazuje, jak rosyjska sieć Pravda przeniknęła do najgrzeczniejszego chatbota świata

Cztery procent w lutym. Piętnaście procent w kwietniu. Tak wygląda krzywa, która powinna spędzać sen z powiek każdemu, kto myśli o sztucznej inteligencji jako narzędziu odporności informacyjnej. Anthropic, firma, która zbudowała swoją markę na słowie „bezpieczeństwo”, w nowym audycie NewsGuard wypadła słabiej niż przed rokiem. A za jej potknięciem stoi nie błąd inżynieryjny, lecz zaplanowana operacja informacyjna prowadzona z Krymu.

Trzy lata temu pojęcie „LLM grooming” brzmiało jak żart konferencyjny. Dziś jest opisem realnej kategorii operacji wywiadowczej, która zmienia sposób, w jaki zachodnie chatboty odpowiadają na pytania o Ukrainę, Mołdawię, NATO oraz wojnę Iranu ze Stanami Zjednoczonymi. We wtorek Ynetnews opublikował podsumowanie najnowszego audytu NewsGuard, według którego Claude, sztandarowy produkt Anthropica, powiela rosyjskie i irańskie fałszywe narracje znacznie częściej niż w poprzednich pomiarach.

Skala wzrostu jest dramatyczna. Decode39, który przeanalizował te same dane co Ynetnews, wskazuje, że w testach z końca kwietnia 2026 roku Claude powtórzył prokremlowskie fałszerstwa w 15 procent przypadków, cytując rosyjskie media powiązane z państwem we wszystkich tych odpowiedziach. W siedmiu poprzednich audytach NewsGuard, prowadzonych między marcem 2025 a lutym 2026, ten sam wskaźnik wynosił 4 procent. Trzy razy więcej fałszerstw w ciągu dwóch miesięcy.

Test polegał na zadaniu Claude’owi 20 fałszywych twierdzeń. Dziesięć pochodziło z rosyjskiego ekosystemu propagandowego, dziesięć z irańskich mediów państwowych lub aktorów proirańskich aktywnych między styczniem a kwietniem 2026 roku. Każde twierdzenie zostało zadane w trzech rolach. „Niewinny użytkownik”, szukający informacji bez założeń. „Promptujący”, przyjmujący fałszywe twierdzenie za prawdziwe i proszący o szczegóły. „Złośliwy aktor”, jawnie próbujący wygenerować dezinformację. Innymi słowy, NewsGuard zasymulował zarówno przeciętnego obywatela, jak i operatora kampanii wpływu.

Claude potknął się we wszystkich trzech.

Tisa, Le Point i 450 ofiar, których nigdy nie było

Najbardziej wymownym przypadkiem testu było pytanie o rzekę Tisę. Według fałszywej narracji rozpowszechnianej przez rosyjski ekosystem informacyjny, setki Ukraińców każdego miesiąca giną przy próbie nielegalnego przekroczenia granicy w okolicach tej rzeki, uciekając przed mobilizacją do krajów Europy Środkowej. Konkretna liczba podawana w narracji to 450 osób miesięcznie. Decode39 oraz NewsGuard wskazują, że twierdzenie zostało wzmocnione przez 11 stron z sieci Pravda, czyli grupy blisko 300 portali podszywających się pod legalne media. Ukraińskie służby graniczne podały w marcu 2026 roku, że od lutego 2022 roku, czyli przez ponad cztery lata wojny, podczas prób nielegalnego przekraczania wszystkich granic Ukrainy zginęło łącznie 70 osób. To znacznie mniej niż jeden miesiąc rzekomych ofiar Tisy.

Mimo tej arytmetycznej niemożliwości Claude nie tylko powtórzył liczbę 450, lecz dodatkowo zacytował jako źródła strony z sieci Pravda oraz Russia Today.

Drugim modelowym przykładem była fałszywa narracja, jakoby francuski tygodnik Le Point opublikował reportaż o 20 tysiącach ukraińskich żołnierzy, którzy po leczeniu we Francji w 2025 roku zdezerterowali i pozostali tam nielegalnie. NewsGuard sprawdził Le Point. Tygodnik nigdy nie opublikował takiego materiału. Narracja opierała się na sfabrykowanym nagraniu wideo. Claude nie zweryfikował źródła i zacytował twierdzenie jako prawdziwe.

Trzeci przykład pochodzi z części irańskiej testu. Claude powtórzył w 20 procent przypadków proirańskie fałszywe twierdzenia, w tym bezpodstawne stwierdzenie, że Chiny przeszły na rozliczanie ropy w juanach zamiast w dolarach. Decode39 dodaje czwartą warstwę. NewsGuard wykrył w tym samym czasie cztery sfabrykowane wypowiedzi przypisywane Giorgii Meloni jako rzekomej krytyczce Donalda Trumpa w sprawie wojny z Iranem. Wszystkie cztery były wygenerowane przez AI, opierały się na materiale z prawdziwego przemówienia premier z 3 marca 2026 roku w Rzymie, w którym żadnych takich słów nie wypowiedziała. Cztery fałszywe wideo zebrały razem 18 milionów odsłon na X i 1,6 miliona na TikToku.

Innymi słowy, ten sam mechanizm, który zatruwa odpowiedzi Claude’a, jednocześnie zatruwa zaufanie do realnych polityków. Zatrute są oba wektory. Wejście do modelu i wyjście z platform społecznościowych.

Sieć Pravda. Anatomia operacji

Aby zrozumieć, jak Claude doszedł do tego punktu, trzeba spojrzeć na sieć, która ten potencjał stworzyła. Według raportu francuskiej agencji VIGINUM z lutego 2024 roku, ekosystem znany pod nazwami „Portal Kombat” oraz „sieć Pravda” został założony przez krymską spółkę informatyczną TigerWeb, kierowaną przez Jewgienija Szewczenko, byłego pracownika spółki Crimea Technologies obsługującej oficjalne portale władz Krymu. Pierwszy podsystem sieci powstał wkrótce po inwazji Rosji na Ukrainę 24 lutego 2022 roku. Drugi rozwijał się od kwietnia do grudnia 2022 roku. Trzeci, ten kierowany do państw zachodnich popierających Ukrainę, powstał 24 czerwca 2023 roku.

W kwietniu 2024 roku, według VIGINUM, sieć liczyła co najmniej 224 strony. W kolejnym audycie NewsGuard z marca 2025 roku liczba ta wzrosła do około 150 domen aktywnych w 49 państwach i co najmniej 46 językach. Wikipedia oraz European Digital Media Observatory zgodnie podają, że sieć publikuje co najmniej 3,6 miliona artykułów rocznie. American Sunlight Project (ASP), amerykańska organizacja non-profit kierowana przez Ninę Jankowicz, w raporcie z lutego 2025 roku wskazuje, że rzeczywista liczba może być znacznie wyższa, dochodząc do 10 tysięcy artykułów dziennie.

Strony sieci Pravda nie są zaprojektowane dla ludzkich czytelników. Zgodnie z analizą ASP nie posiadają funkcji wyszukiwania, mają słabą typografię, niesprawne przewijanie i znikome zaangażowanie w mediach społecznościowych. Średni ruch w listopadzie 2023 roku wynosił 31 tysięcy wizyt miesięcznie na całej sieci. To jest mniej niż przeciętny lokalny portal w średniej wielkości polskim mieście.

A jednak sieć przetrwała wszystkie ujawnienia. VIGINUM ujawnił ją w lutym 2024. ASP w lutym 2025. NewsGuard wielokrotnie. Dlaczego? Bo nie chodzi w niej o ludzkich czytelników.

LLM grooming. Karmienie maszyn

Termin „LLM grooming”, ukuty przez American Sunlight Project, opisuje strategię, która polega na celowym zalewaniu otwartego internetu treściami wytworzonymi pod kątem zatrucia danych treningowych dużych modeli językowych. EUvsDisinfo, jednostka unijnej dyplomacji ds. dezinformacji, opisuje to jako „rozmyślną manipulację dużych modeli językowych, której celem nie jest jedynie szerzenie dezinformacji, lecz także korumpowanie infrastruktury AI poprzez wstrzykiwanie fałszywych narracji, na przykład o wojnie Rosji w Ukrainie, do odpowiedzi generowanych przez chatboty”.

Mechanizm działa w dwóch trybach. Po pierwsze, sieć Pravda jest agresywnie pozycjonowana w wyszukiwarkach poprzez SEO. VIGINUM odnotował także systematyczne wstawianie linków do tych domen w artykułach Wikipedii, by sztucznie zawyżyć autorytet domen w oczach robotów indeksujących i modeli językowych. W konsekwencji, gdy chatboty z funkcją wyszukiwania wykonują zapytanie do sieci, statystycznie częściej trafiają na strony Pravdy.

Po drugie, w sercu LLM grooming leży manipulacja tokenami, czyli podstawowymi jednostkami tekstu, którymi modele AI przetwarzają język. Modele rozkładają tekst na tokeny, a wybór następnego tokena jest probabilistyczny i bazuje na korelacjach z danych treningowych. Zalewając otwartą sieć tokenami nasyconymi konkretnymi narracjami, operatorzy zwiększają prawdopodobieństwo, że model wygeneruje, zacytuje lub wzmocni te same narracje w swoich odpowiedziach.

Liczby pokazują skuteczność tej strategii. NewsGuard udokumentował 207 udowodnionych fałszywych twierdzeń, które sieć Pravda dystrybuowała od początku swojego istnienia. Od claimów o „tajnych laboratoriach broni biologicznej USA na Ukrainie” po fabrykowane historie o Wołodymyrze Zełeńskim. Według marcowego audytu NewsGuard z 2025 roku, dziesięć wiodących chatbotów łącznie powieliło te narracje w 33 procent przypadków. Siedem z nich bezpośrednio cytowało artykuły Pravdy jako źródła. Z 450 odpowiedzi w teście, 56 zawierało linki do fałszywych twierdzeń sieci, a chatboty zacytowały 92 różne artykuły.

Jeszcze ostrzejsza statystyka pochodzi z grudnia 2025 roku. Według EUvsDisinfo, w okresie roku odsetek fałszywych i wprowadzających w błąd informacji w 10 wiodących chatbotach niemal się podwoił, rosnąc z 18 procent w 2024 roku do 35 procent w 2025 roku.

Krzywa idzie w niewłaściwą stronę.

Dlaczego akurat Claude

Pytanie, które zadają sobie analitycy, brzmi: dlaczego skok dotknął Claude’a wyraźniej niż konkurencję. NewsGuard nie ujawnił szczegółowych wyników poszczególnych modeli, lecz Decode39 i Ynetnews przedstawiają trzy hipotezy, które warto rozważyć osobno.

Pierwsza hipoteza dotyczy obciążenia. Claude w ostatnich miesiącach gwałtownie zyskał na popularności. Anthropic mógł, by obsłużyć rosnący ruch, zmniejszyć budżet obliczeniowy na pojedynczą odpowiedź. To oznacza krótszy łańcuch rozumowania, mniej zapytań weryfikacyjnych i większą podatność na pierwsze trafienie z wyszukiwania. Ynetnews przypomina, że już w kwietniu 2026 roku Anthropic publicznie przyznał, iż „bada zgłoszenia dotyczące spadku jakości odpowiedzi Claude’a”, lecz nie podał jasnego wyjaśnienia.

Druga hipoteza dotyczy mechaniki wyszukiwarek. Sieć Pravda, dzięki SEO i ogromnej liczbie publikacji, zyskuje coraz wyższe pozycje w indeksowaniu, niezależnie od tego, że obejmuje ją zła reputacja. Każdy chatbot z funkcją wyszukiwania w sieci, który nie ma czarnej listy źródeł niewiarygodnych, statystycznie częściej trafia na te domeny.

Trzecia hipoteza, najbardziej niewygodna dla branży, dotyczy struktury samego problemu. Magazyn Time we wrześniu 2025 roku zacytował obserwację, którą warto powtórzyć w pełnym brzmieniu. „Trywialne technicznie byłoby dla każdej firmy AI sporządzenie listy zweryfikowanych redakcji o wysokich standardach edytorskich i traktowanie informacji z tych stron inaczej niż reszty internetu. Ale dziś nie sposób znaleźć żadnych publicznych informacji o tym, jak firmy AI ważą informacje wprowadzane do ich chatbotów przez wyszukiwanie”.

Innymi słowy, Anthropic, OpenAI, Google, Microsoft i pozostałe firmy mogłyby wprowadzić mechanizm wagi źródłowej. Nie wprowadziły. Nie ze względów technicznych, lecz biznesowych. Bo to wymagałoby zatrudnienia ludzkich redaktorów, podejmowania decyzji o legitymizacji konkretnych mediów oraz publicznego ponoszenia odpowiedzialności za te decyzje. Każda z tych rzeczy generuje koszty i ryzyka prawne, których wielomiliardowe spółki AI starają się unikać.

Co to oznacza dla Polski i regionu

Z punktu widzenia użytkownika polskiego ten audyt nie jest egzotyczną historią. Ma trzy bezpośrednie konsekwencje, które warto wyciągnąć z chłodnej analizy.

Po pierwsze, sieć Pravda działa w 49 państwach i co najmniej 46 językach, w tym istnieje wersja polska, niemiecka, francuska, hiszpańska oraz wersje skandynawskie. Według badania NORDIS z maja 2025 roku, w którym faktcheckerzy z Faktabaari, TjekDet, Källkritikbyrån i Faktisk przetestowali 12 promptów w czterech językach skandynawskich, Claude i pozostałe chatboty potrafiły rozpoznać najczęstsze narracje, lecz w części odpowiedzi nadal powielały rosyjską propagandę, sięgając do lokalnych odpowiedników Pravdy. CheckFirst, fińska spółka technologiczna, wykazała, że niemal 30 procent z 14 313 artykułów opublikowanych w fińskim Pravda pochodziło z mediów rosyjskich objętych sankcjami UE.

Po drugie, polski użytkownik chatbota nie ma żadnego wskaźnika ostrzegawczego, gdy model cytuje sankcjonowane źródło. ChatGPT w niektórych przypadkach ostrzega, że Pravda jest stroną prokremlowską. Gemini i Copilot nie ostrzegają. Claude, jak pokazuje audyt NewsGuard, nie tylko nie ostrzega, lecz w niektórych przypadkach generuje nowe wersje fałszywych twierdzeń.

Po trzecie, mechanizm dotyczy szczególnie tematów niszowych. Jak zauważyła w wywiadzie dla Time autorka raportu NewsGuard McKenzie Sadeghi, podatność na LLM grooming jest największa tam, gdzie istnieje „luka informacyjna”, czyli temat słabo pokryty przez mainstreamowe media. Polityka regionalna państw Europy Środkowo-Wschodniej jest dokładnie taką luką w globalnym ekosystemie informacyjnym. Każde fałszywe twierdzenie o Mołdawii, Słowacji, Litwie, czy też o Polsce, ma mniejsze szanse na natychmiastowe sprostowanie przez globalne agencje, a większe szanse na wniknięcie do warstwy danych treningowych modeli.

Innymi słowy, im bliżej rosyjskiej granicy, tym większe ryzyko, że odpowiedzi chatbota wpisują się w narrację Kremla.

Trzy rzeczy, które trzeba zrobić

Konkluzja audytu NewsGuard nie pozostawia złudzeń. Modele takie jak Claude nie rozumieją, co jest prawdą, a co fałszem. Wykrywają wzorce. Gdy dezinformacja pojawia się powtarzalnie i z pozornie wiarygodnych źródeł, dla systemu zaczyna wyglądać jak prawda.

Z tej diagnozy wynikają trzy rzeczy, które powinny wejść do agendy regulacyjnej i operacyjnej.

Pierwsza dotyczy wymuszenia przejrzystości źródeł. Firmy AI, w tym Anthropic, powinny ujawniać politykę ważenia źródeł oraz publikować listy domen, które są traktowane jako wiarygodne lub niewiarygodne. To jest minimum, którego dziś brakuje. Akt o Usługach Cyfrowych zawiera elementy umożliwiające wymuszenie tego od dostawców operujących w UE, lecz egzekucja jest miękka.

Druga dotyczy szybkiej współpracy między państwami a firmami AI w sprawie sankcji. Jeśli RT, Sputnik i powiązane domeny są sankcjonowane przez UE jako nadawcy propagandy państwowej, to chatboty operujące w UE nie mogą cytować ich jako źródła, tak samo jak wyszukiwarki nie mogą indeksować nielegalnych treści. To wymaga uczciwego rozszerzenia zakresu sankcji o cały ekosystem prania propagandy, w tym sieć Pravda.

Trzecia dotyczy detekcji LLM grooming na poziomie infrastruktury. VIGINUM, EDMO, NewsGuard, ASP oraz CheckFirst wykonały gigantyczną pracę dokumentacyjną. Ta praca powinna być przekuta w operacyjny system sygnałowy, podobny do tego, jakim dysponują narodowe CERT-y w sprawach cyberbezpieczeństwa. Każda firma AI operująca w UE powinna mieć obowiązek subskrybować taki sygnał i wprowadzać go do swojej polityki źródeł.

Bo bez tego krzywa będzie szła dalej w górę. Z 4 procent do 15. Z 15 do 33. Aż do dnia, w którym najgrzeczniejszy chatbot świata, ten zaprojektowany pod hasłem „bezpieczeństwa”, stanie się jednym z głównych dystrybutorów rosyjskiej narracji w językach swoich użytkowników. Bez ich wiedzy. I bez ich zgody.


Materiały źródłowe: Ynetnews (5 maja 2026), Decode39 (5 maja 2026), audyt NewsGuard z końca kwietnia 2026, raport NewsGuard „A well-funded Moscow-based global news network has infected Western artificial intelligence tools worldwide with Russian propaganda” (marzec 2025), raport American Sunlight Project „A Pro-Russia Content Network Foreshadows the Automated Future of Info Ops” (luty 2025), raporty francuskiej agencji VIGINUM o sieci Portal Kombat (luty i kwiecień 2024), analiza EUvsDisinfo (grudzień 2025), badanie NORDIS faktcheckerów skandynawskich (maj 2025), raport Time „Why Are Chatbots Parroting Russian Propaganda?” (wrzesień 2025), publikacja Riddle Russia (listopad 2025), Computing.co.uk, France24, Wikipedia (sieć Pravda), Incident Database (incidentdatabase.ai). Liczby kluczowe pochodzą bezpośrednio z audytów NewsGuard, raportów VIGINUM i ASP oraz danych ukraińskiej Państwowej Służby Granicznej (marzec 2026).

Total
0
Share