Pojawił się nowy mistrz nad mistrzami. Sęk w tym, że to... nie człowiek

Marcin Długosz
Tym razem bez oszustw - sztuczna inteligencja DeepMind ograła najlepszych z najlepszych, graczy, którzy poświęcili lata na doskonalenie grania w kultowego Star Crafta II. – To było ekscytujące, oglądać, jak opracowuje własne strategie, inaczej niż ludzcy gracze – mówił Grzegorz MaNa Komincz, profesjonalny gracz w StarCrafta II.
AlphaStar, sztuczna inteligencja firmy DeepMind pokonała arcymistrzów kultowego StarCrafta II i to bez dopingu. Fot. Derek Hatfield / Flickr.com / CC BY 2.0
DeepMind, brytyjska firma kupiona przez Alphabet (Google) robi różne cuda związane ze sztuczną inteligencją. To jej program przetłumaczył tekst ze starożytnej greki w ciągu sekund - czyli wykonał pracę zajmującą godziny ludziom.

Sztuczna inteligencja arcymistrzem
SI tej firmy pokonało arcymistrza starożytnej gry planszowej go. Teraz obserwujemy potyczkę w świecie wirtualnym - bardzo popularnej, kultowej już gry StarCraft II. Program AlphaStar osiągnął poziom arcymistrza (Grandmaster), zarezerwowany dotąd tylko dla najlepszych.

O sprawie czytamy w pracy opublikowanej w nature.com. A dodajmy tu, że przy go, szachy to zabawa dla świeżaków, z kolei StarCraft jest znacznie bardziej skomplikowany niż go, wiąże się z szerszym wachlarzem ruchów, jakie można wykonać.


SI zdobyła swój tytuł w staromodnym stylu, tocząc dziesiątki pojedynków z ludzkimi graczami, ucząc się ich strategii, próbując dzięki analizie przewidzieć ich następny ruch. Tym samym AlphaStar jest lepszy niż 99,98 proc. graczy.

Tym razem SI bez dopingu
To nie pierwszy raz, gdy AlphaStar dokopała ludzkim mistrzom, ale umówmy się - wtedy program grał na dopingu. Mógł kierować tylko określoną frakcją w grze, widział większy obszar mapy niż ludzie.

Tym razem szanse zrównano. Naukowcy z DeepMind chcieli jak najwierniej odwzorować potyczkę na "ludzkich" warunkach, stąd AlphaStar obserwował grę za pomocą kamer, podobnie, jak ludzie widzą plac rozgrywki. Innymi słowy, program musiał samodzielnie zdecydować, kiedy i na jakim fragmencie rozgrywki się skupia. Pewnego rodzaju smyczą nałożoną na program była zasada, że w danej jednostce czasu może wykonać określoną liczbę ruchów, tyle, ile byłby w stanie wykonać człowiek.

Co ciekawe, Blizzard, wydawca gry, poinformował przed paroma miesiącami graczy, że mogą natrafić na AlphaStar, choć pozostanie anonimowy i mogą bez żadnych konsekwencji porzucić taką walkę, ci w zdecydowanej większości postanowili spróbować swoich sił. Jeden z wierchuszki ludzkich graczy, Dario TLO Wünsch stwierdził, że batalia była wyrównana, nie miał wrażenia, że mierzy się z "superczłowiekiem".

– To było ekscytujące, oglądać, jak opracowuje własne strategie, inaczej niż ludzcy gracze. [...] Choć jako profesjonalista wciąż dostrzegam niektóre słabości systemu - mówił Grzegorz MaNa Komincz, polski profesjonalny gracz

Jak przebiegał trening? Najpierw AlphaStar oglądał powtórki potyczek między najlepszymi graczami, łącznie było ich niemal milion. Potem zbudowano całą ligę treningową, w której AlphaStar, mądrzejszy o wnioski z powtórek, grał sam ze sobą.

Dla DeepMind to pewnego rodzaju kamień milowy, dowodzący, że SI może zajmować się coraz bardziej skomplikowanymi zadaniami. Powtórki potyczek z AlphaStar możecie obejrzeć tutaj.