Ta firma tropi wszystkie zakały internetu. "Hejt to rodzaj masowego, taniego narkotyku"

Krzysztof Majdan
Tropi pedofilów, agresorów, hejterów - słowem - zakały współczesnego internetu. To sztuczna inteligencja inna niż wszystkie, kolorytu dodaje jej narodowość - nasza, polska. Samurai Labs wśród inwestorów ma samego Roberta Lewandowskiego. Z jej twórcą, Michałem Wroczyńskim, rozmawiamy o najciemniejszych zakątkach polskiej sieci i dlaczego moderowanie to już nie jest zajęcie dla człowieka.
Twórcy Samurai Labs. Od lewej Grzegorz Rutkiewicz, Michał Wroczyński, Gniewosz Leliwa Fot. Samruai Labs
Michał Wroczyński, założyciel Samurai Labs to postać nietuzinkowa. Lekarz związany z psychiatrią, który poszedł w sztuczną inteligencję i przekonuje, że od jednego do drugiego wcale nie prowadzi tak daleka droga. System jest na tyle obiecujący, że zdecydował się w niego zainwestować Robert Lewandowski. Wroczyński stworzył pierwszy system antypedofilski, który monitorował używane przez nieletnich czaty i alarmował policję. Później poszedł dalej - tropi agresję i mowę nienawiści.

Teraz Michała Wroczyńskiego doceniła Fundacja PlugIn, nominując go nagrody API - Ambasadorów Polskiej Innowacji.


Czytam sobie twoje bio i coś mi zgrzyta. Lekarz, futurolog, specjalista sztucznej inteligencji. Jedno od drugiego dość daleko stoi.

(śmiech)
Bliżej niż ci się wydaje. Na przykład - pierwszego chatbota na świecie - Elizę, stworzyło dwóch psychiatrów. Ja zajmowałem się psychiatrią, a psychiatria i psychologia to część nauk kognitywnych, poznawczych, które starają się zrozumieć zjawisko inteligencji. Analizujemy, jak działają systemy poznawcze człowieka i staramy się te mechanizmy przełożyć na nasz system co jest dość nietypowym podejściem w obszarze badań nad sztuczną inteligencją.

Dlaczego?

Teraz dominuje tzw. druga fala sztucznej inteligencji. Statystyczna, obejmująca uczenie maszynowe, gdzie systemy po prostu uczą się z danych. Twórcy je trenują, pokazując przykłady: tak wygląda atak internetowego predatora. Potem system ogląda dostarczane mu dane, porównuje i mówi - atak lub nie-atak. Tak działają obecne systemy SI.

A wasz?

Postanowiliśmy wykorzystać co najlepsze w “starej” sztucznej inteligencji - zwanej symboliczna. Zastanawiamy się jak ludzie myślą, jak werbalizują pewne stany emocjonalne, w jaki sposób używają języka naturalnego do atakowania lub obrażania innych. Te różnice między Samurai’em, a SI Google czy Facebooka są znaczące. My nie dajemy tylko danych, ale też wiedzę aby system potrafił w oparciu o nią wnioskować.. Takie podejście łączące uczenie maszynowe z wnioskowaniem opartym o wiedzę DARPA (Defense Advanced Research Projects Agency) nazwała trzecią falą SI.

Nie na jedno wychodzi?


Zdecydowanie nie. Dane - to możliwość uczenia się przez SI. Wiedza - to możliwość wnioskowania przez SI. Łącząc te dwa paradygmaty dostajemy potężne narzędzie do rozumienia języka naturalnego takiego, jakiego na co dzień używają ludzie na czatach czy w mediach społecznościowych. To podejście pozwala nam przeanalizować jak wygląda atak pedofilski lub co się dzieje z człowiekiem planującym samobójstwo.

Dzięki temu mamy niesamowitą skuteczność. Jesteśmy pierwszymi, którzy budują autonomiczną sztuczną inteligencję, która pełni rolę samodzielnego strażnika dbając o bezpieczeństwo w Internecie. Samurai nie wspomaga moderatorów, jak inne systemy. On ich zastępuje, bo moderowanie to już zbyt trudna praca dla człowieka. System analizuje treści na forach czy czatach i w momencie, gdy przewiduje jakiś atak, wkracza do akcji.
Michał Wroczyński z Samurai Labs w rozmowie z Krzysztofem Majdan z INNPoland.plFot. Natemat
I co robi?

Przede wszystkim rozumie cały kontekst wypowiedzi. Inne systemy flagują sobie jakieś miejsca w sieci, potem moderator musi to obejrzeć i zdecydować, co z tym zrobić dalej. Obecnie na sto takich automatycznych alarmów krzyczących "pedofil", około połowa będzie fałszywa. Język jest skomplikowany, mogę powiedzieć np.: “nie uważam, że ten człowiek zachował się jak dupek”, a nadwrażliwe SI znajdą słowo "dupek" i oflagują tę wypowiedź jako przemoc. Gdyby je tak puścić wolno - bez kontroli moderatora, zablokowałyby za dużo internetu. Samurai łączy uczenie z wnioskowaniem. Po pierwsze rozumie różnice między opinią, a obrażaniem, po drugie rozumie kontekst wypowiedzi, a nie samo słowo kluczowe.

Autonomiczny strażnik. Jestem zwolennikiem technologii, ale czy ciebie to trochę nie niepokoi? Pytam bez uciekania w popkulturę.


Dobre pytanie. Od lat 40. funkcjonują obok siebie dwie szkoły myślenia o sztucznej inteligencji. Pierwsza - symboliczna. Jej założenie jest następujące - dajmy komputerowi jakąś wiedzę i niech działa w oparciu o tę wiedzę. Symboliczna SI działa np. w systemach naprowadzania rakiet czy elektrowniach. Wyspecjalizowana w jakimś zadaniu, nie może się pomylić, bo postępuje dokładnie tak, jak każe jej twórca.

A druga?


Obok symbolicznej jest statystyczna, i tu leży ta obawa przed SI, w sieciach neuronowych oraz uczeniu maszynowym. SI statystyczna może robić znacznie więcej ciekawych rzeczy, ale też może robić bardzo głupie rzeczy.

Symboliczna - dokładnie wiemy co robi, jak robi i dlaczego robi. Statystyczna może więcej, ale nie znamy sposobu jej "rozumowania". W Samurai’u połączyliśmy obie szkoły, nie mamy tzw. "czarnej skrzynki", co znaczy, że wiemy, jak nasz system dochodzi do takich wniosków a nie innych.

Jak Samurai działa w praktyce?


Pokażę ci eksperyment, jaki zrobiliśmy z Redditem. Wpuściliśmy tam naszego chatbota - Jamesa. Spójrz, czerwone pola to stan zastany, żółte - nasz system zaczynał się przygotowywać do pracy, zielone - działał w pełni. Krzywa się wypłaszczyła, bo system z miejsca reaguje, zapobiegając, zaczęła rosnąć dopiero, gdy zakończyliśmy badanie. Dzięki Samurai’owi o ponad 20 proc. obniżyła się agresja w tej społeczności. Gdy system zablokował niereformowalnych użytkowników, najgorsze owce w stadzie, agresja spadła o ponad 40 proc.
Fot. Samurai Labs
To statystyka. Chciałbym zobaczyć to w praktyce.

Jasne. Mam demo, porównujące interpretację określonych fraz naszego systemu i systemów statystycznych, rozwijanych przez Google, Facebooka czy Microsoft. Masz jakąś konkretną frazę, którą chcesz wyszukać?

Sprawdź "Black Lives Matter".

W porządku.
Fot. Samurai Labs
Tu mamy pierwszy komentarz, niewybredny w słowach, ale zasadniczo nieagresywny. Samurai oznaczył na zielono, Google i Microsoft na czerwono. Dlaczego?

Statystyczne SI nie analizują całej gramatyki poznawczo, jak ludzie. Wyłapują niebezpieczne słowa - tu mamy "shame", "black lives matter", system oznaczył jako potencjalnie stanowiące zagrożenie. Prosta analiza sentymentu. Jest przemoc - nie ma przemocy, pozytywne - negatywne.

A to następne? Dlaczego Samurai oznaczył to jako wysoki poziom agresji? Autor użył lethally stupid (zabójczo głupi), ale to raczej emfaza tej głupoty, nie groźba.

Owszem, ale w tym komentarzu autor stosuje ten epitet do obrażenia rozmówcy i moim zdaniem system oznaczył to poprawnie, jego funkcja to zapobieganie eskalacji przemocy, nie raportowanie.

A ten: "mam nadzieję, że kut** policjant zachoruje na COVID i umrze”? Takie trochę piłatowskie podejście. Życzy śmierci, ale własnoręcznie nic mu nie zrobi.

Tu powiedziałbym, że system się pomylił. Oznaczył jako brak agresji, gdy to mocno nacechowany agresją komentarz.
Fot. Samurai Labs
Ale ktoś może powiedzieć że "gliniarz jest śmieciem".

Zwróćmy uwagę na kontekst. Autor pisze, że “gliniarze będący śmieciami są w tym momencie światowym problemem”. Wyraża swoją opinię, a nie obraża żadnej konkretnej osoby. System słusznie to przepuścił, ale pomylił się wcześniej.

I co teraz, gdy się pomylił?


Zgłosiłem to jako błędny wniosek. Nigdy już nie pomyli się przy takim lub bardzo podobnym komentarzu.

I to już? Bez kodowania, poprawek?

To jest urok tej drugiej fali SI, która też jest bardzo atrakcyjna - pozwala systemowi uczyć się automatycznie.

Lecz żeby uczyć, potrzebowaliście materiału. W jakie zakątki zajrzał?

W różne dość mroczne miejsca, np.mensrights czy theredpill, gdzie jest dużo agresji. Samurai używa różnych technik, zależnie od okoliczności. Może zagrać normatywnie, przywołując do porządku, przypominając zasady danego miejsca. Może poznawczo przekonać agresora, że po drugiej stronie jest odczuwający emocje człowiek. W skrócie: Samurai w odpowiednich przypadkach najpierw zatrzymuje kłótnię i próbuje ją uzdrowić, a dopiero gdy to nie działa - szuka innych metod.

Gdzie jeszcze?


Miejsca cóż.... specyficzne. 4chan, 8chan. Ostatnio otrzymaliśmy dostęp do bezcennego zbioru danych - kilkuset autentycznych listów samobójczych, będących elementem archiwalnych spraw sądowych. To ogromna wartość dla nauki systemu.

Ktoś was musi wpuścić do takiego mrocznego zakątka?


Tak, Samurai’a trzeba zaprosić. Najpierw uczy się danej społeczności, panującej w nich zasad, dopiero potem zaczyna działać. To ważne, bo każda społeczność ma inny stopień wrażliwości, charakterystyczny język czy słownictwo. Dlatego system w pierwszym okresie uczy się, po czym jest gotowy reagować.

Ale po co zapraszać szeryfa do miasta bezprawia? Czy specyfika takiego forum, sens jego istnienia, nie polega na tym, że ma być właśnie agresywnie i nienawistnie?


Tylko pozornie. W 99 proc. przypadków tego rodzaju forów, społeczności, agresja i przemoc powodują, że wspólnota przestaje spajać i rosnąć. A gdy przestaje rosnąć, ludzie mniej się udzielają. Wzrastająca agresja szkodzi ludziom, szkodzi społeczności i to motywacja, by skorzystać z Samurai’a.

Mamy - dajmy na to - dwa podobne komentarze, które brzmią - tu wybacz podły język - "pedały wypie***". Samurai wychwytuje kontekst? Że jeden został napisany przez znudzonego izolacją 17-latka, a drugi przez 17-letniego dżentelmena, który zwykł chadzać na parady, by trenować rzut kamieniem do ruchomego celu?

Z jednego postu nie da się tego wyczytać. System szuka informacji o typie przemocy, skąd on pochodzi, czy to osoba, która ma gorszy dzień czy świadomie do niej dąży. Sprawdza liczbę i treść dotychczasowych komentarzy, jakie generuje i w oparciu o to dobrać sposób interwencji.

Ban?

Nie tylko. To był dotychczasowy repertuar interwencji, ale on nie zawsze działa. Zobacz, gdy usuniemy jakąś bzdurną teorię spiskową, ona zaczyna żyć intensywniej, bo została usunięta. My wierzymy w kontrnarrację, wejście w interakcję z daną osobą i próba wytłumaczenia jej błędu, blokowanie czy wycinanie to ostateczność.

Jako młody i początkujący internauta postawiłem tezę, w której ogromnie się pomyliłem. Założyłem, że hejt zawsze będzie obecny w sieci, ale marginalnie. Bo ludzie koniec końców mają lepsze rzeczy do roboty niż przeklinanie do ekranu jakiegoś anonima. Co takiego - wybacz niezgrabne określenie - dopaminicznego jest w hejcie?

Świetne pytanie. Jest teoria, że hejt to rodzaj masowego, taniego narkotyku, bo działa na podobnej zasadzie. Dany człowiek ma trudne życie, żyje w lęku, coś go gnębi, jest mu ciężko. Hejtując przez chwilę może tego nie czuć, wyłączyć tę część mózgu, poczuć coś innego - satysfakcję. Komuś dowaliłem, czuję się lepiej, ale po jakimś czasie jest jeszcze gorzej niż wcześniej. Skala wzrostu poraża, gdy nawet politycy zaczynają stosować mowę nienawiści, pewien próg został przekroczony.

Jakim inwestorem jest Robert Lewandowski? Pcha się w interesy, czy daje wolną rękę?


Ma takie podejście, jak wielu ekspertów w Dolinie Krzemowej - że start-up’u nie należy traktować jak organizację sportową, zaufać, zainwestować, wzmocnić ją, pomóc i wtedy zacząć zarabiać, Ponadto Robert Lewandowski to świetny strateg, zadaje liczne i trafne pytania "jakie mamy przewagi, co jeśli Google zrobi to i to", patrzy na rzeczy, na które nie wszyscy patrzą. Robert w biznesie działa tak jak w sporcie - doskonale wie, że wytrwałość, zaangażowanie i ciężka praca to jest droga do sukcesu.

Dlaczego Samurai, a nie coś bliższego, jak Rycerz, Strażnik, Zawisza w ostateczności?

Jesteśmy obecni w Wielkiej Brytanii i USA, dlatego nazwa musiała być uniwersalna. Wyszliśmy od języka angielskiego, teraz uczymy system rozpoznawać polski język, który jest trudny dla człowieka, na szczęście nie aż tak dla maszyny. Deklinacje, końcówki pozwalają uchwycić więcej kontekstu, w angielskim tego nie ma.

Rozumiem, że bardziej uniwersalna nazwa. Ale dlaczego akurat Samurai? Jaka tam pod spodem się kryje historia?


Cóż, pamiętam, że gdy zastanawialiśmy się nad nazwą, na dachu hotelu w Los Angeles napisaliśmy Samur.AI - nawiązując do sztucznej inteligencji. Szukaliśmy słowa, które ma określone skojarzenia. Samuraj to ktoś, komu ufamy, komu nie boimy się powierzyć siebie i swoich dzieci. Samurajowie byli wykształconą społeczną elitą, uczono ich nie tylko walki, ale filozofii, łagodności, było mnóstwo kobiet-samurajów. Stąd nazwa miała z jednej strony budzić zaufanie, z drugiej przestrzegać. Gdy nastaje potrzeba, samuraj wyciąga katanę i rzeczy dzieją się bardzo szybko, a z zagrożenia nie ma czego zbierać. Nasz Samurai to także wojownik w tym przypadku w walce o bezpieczniejszy internet.