
Lubisz Facebooka? Spędzasz tam godziny dziennie, odpalasz aplikację tuż po przebudzeniu, na chwilę przed zaśnięciem i kiedy budzisz się w nocy? No to masz problem, bo twoi znajomi mogą wiedzieć o tobie wszystko. Polski naukowiec, doktor Michał Kosiński z Uniwersytetu Stanforda opracował algorytm, który na podstawie naszej aktywności w mediach społecznościowych tworzy kompletny obraz, który powie o tobie więcej niż najbliższa ci osoba. Nie wierzycie? To wiedzcie, że Facebook natychmiast zaoferował mu pracę. A dział prawny FB równolegle zagroził podjęciem kroków prawnych. O jego skuteczności przekonał się również Donald Trump. Ekscentryczny miliarder jest jedną z pierwszy osób, która wykorzystała odkrycie Polaka na masową skalę.
Całe szczęście, że nie wyciągnęła ich więcej. 70 polubień wystarcza, aby przewidzieć znajomość charakteru danej osoby lepiej, niż jej przyjaciel, 150 lepiej, niż rodzice. Przy 300 lajkach maszyna zna już człowieka lepiej od jego życiowego partnera.
Opublikowaliśmy w Internecie (Kosiński studiował wówczas na uniwersytecie w Cambridge - przyp. red.) kwestionariusz mierzący tzw. wielką piątkę cech osobowości. Zainteresowanie Internautów przerosło nasze oczekiwania – wypełniło go kilka milionów ludzi, a ja zyskałem ogromną bazę, dzięki której mogłem zestawić ze sobą osobowość ludzi i cyfrowe ślady, które zostawiają.
W dniu ogłoszenia pierwszych wyników dostałem dwa telefony z Facebooka. Jeden z działu Badania Danych z propozycją pracy, drugi z działu prawnego, grożący podjęciem kroków prawnych.
Modele stają się coraz lepsze i coraz dokładniejsze. Sądzę jednak, że dalszy postęp nie będzie polegał na wyciskaniu coraz większej ilości informacji z coraz mniejszej liczby lajków. Ludzie zostawiają bowiem coraz więcej cyfrowych śladów.
Kwestionariusze i testy używane w psychologii są czasem podobne do takich quizow, opierają się jednak na żmudnych i starannych badaniach. Zachowanie ludzkie nie jest przypadkowe. Nasze preferencje, wybory polityczne są ze sobą powiązane. Niektóre w dużym stopniu. Np. jeżeli lubi pan Kaczyńskiego, to będzie to w raczej oczywisty sposób powiązane z pana poglądami. Jeżeli chodzi pan w adidasach, lub lubi pływać, to związek ten nie jest taki oczywisty. Nie znaczy to jednak, że go nie ma! Jest bardzo prawdopodobne ze liberałowie noszą adidasy trochę częściej niż konserwatyści lub odwrotnie. Człowiek takiej prawidłowości nie wykryje, komputer nie będzie miał z tym problemu. Dodając do siebie ogromnie ilości takich pozornie nic nie znaczących kawałków informacji, może on stworzyć bardzo dokładny obraz danego człowieka.
Rzeczywiście, cyfrowe ślady dziennikarzy mogą być nietypowe. Rdzeń pana zachowań i tak będzie jednak dawał wyraźny sygnał, co do pana preferencji. Nawet jeżeli 90 proc. pana zachowania w sieci będzie losowe, to w końcu odwiedzi Pan swój bank albo kupi te swoje ukochane adidasy. Mając wystarczająco dużo danych, algorytm odróżni informacyjne ziarna od informacyjnych plew.
Modele robią się tak skomplikowane, że człowiek nie jest w stanie zrozumieć co dzieje się „pod maską”. Podstawowe zasady są oczywiście proste. Kiedy jednak połączymy części algorytmów w ogromne algorytmy, to stają się one tak skomplikowane, że człowiek nie jest w stanie ich rozgryźć. Pokażmy to na przykładzie: komputer diagnozuje nasz stan zdrowia. Wiemy, że zrobił to dokładnie, bo możemy to zmierzyć. Nie wiemy jednak, jak doszedł do tych wniosków. To ciekawy problem filozoficzny. Ufamy danemu algorytmowi, ale nie wiemy jak działa.
Całkowite odłączenie się od cyfrowej rzeczywistości też nie pomoże. Trudno usunąć dane które zostawiliśmy w przeszłości. Nawet jeżeli przeprowadzi się Pan do lasu, prędzej czy później jakiś grzybiarz zrobi Panu zdjęcie, wrzuci je do Internetu i jest pan ponownie w sieci.
Napisz do autora: adam.sienko@innpoland.pl
