Robot czyta książkę na tle polskiej flagi
Język polski okazał się być najlepszy do rozmawiania z AI. Angielski daleko w tyle Fot. Canva/INNPoland

Choć uznawany za jeden z najtrudniejszych języków świata, polski okazał się najbardziej precyzyjny w rozmowach z AI – zwłaszcza przy bardzo długich poleceniach, liczących nawet kilkadziesiąt stron tekstu. Badanie Uniwersytetu Maryland i Microsoftu pokazuje, że sztuczna inteligencja popełnia mniej błędów i trafniej analizuje informacje w języku polskim niż w angielskim czy francuskim.

REKLAMA

Naukowcy z Uniwersytetu Marylandu i Microsoftu dowiedli, że język polski – choć uznawany za jeden z najtrudniejszych na świecie – ma swoją nieoczywistą zaletę. Okazuje się być najlepszy do promptowania sztucznej inteligencji. Jednak im dłuższe polecenie dla AI, tym lepszy efekt.

Język polski najlepszy do rozmawiania ze sztuczną inteligencją

Badanie One ruler to measure them all: Benchmarking multilingual long-context language models (Jedna miara, by ocenić je wszystkie: analiza porównawcza wielojęzycznych modeli długiego kontekstu) opierało się na przetestowaniu sześciu modeli językowych takich firm jak OpenAI czy Gemini.

Badacze rozmawiali ze sztuczną inteligencją w 26 językach. Modele popełniały mniej błędów, trafniej odpowiadały na zadania oraz lepiej analizowały duże zbiory dokumentów w języku polskim (88 proc.) niż w angielskim (83,9 proc.).

Język polski okazał się być najbardziej precyzyjny – głównie jednak podczas długich konwersacji ze sztuczną inteligencją (promptów mających nawet 128 tys. znaków, czyli kilkadziesiąt stron tekstu). Drugie miejsce zajął jęz. francuski (87 proc.), później kolejno: włoski (86 proc.), hiszpański (85 proc.) oraz rosyjski (84 proc.).

Język polski najlepszy w długich konwersacjach z AI. Wyprzedza angielski

Warto też zaznaczyć, że zwycięstwo języka polskiego dotyczy bardzo konkretnego zadania. Modele AI miały znaleźć i podać konkretne informacje ukryte w bardzo długich tekstach. Musiały też rozpoznać, kiedy w tekście brakowało konkretnej odpowiedzi na pytanie.

"Eksperymenty z otwartymi i zamkniętymi modelami LLM ujawniają rosnącą różnicę w wydajności między językami o niskich i wysokich zasobach, wraz ze wzrostem długości kontekstu z 8 tys. do 128 tys. tokenów. Co zaskakujące, język angielski nie jest językiem o najwyższej wydajności w zadaniach długiego kontekstu (zajął 6. miejsce na 26), a na szczyt listy wysuwa się język polski" – czytamy w raporcie, który przytacza serwis Benchmark.pl.

Nie ma jednoznacznej odpowiedzi na to, dlaczego sztuczna inteligencja upodobała sobie język polski. Eksperci stawiają jednak kilka hipotez, mówiąc m.in. o precyzyjnej gramatyce, która minimalizuje ryzyko niejednoznaczności. To zdecydowanie ułatwia sztucznej inteligencji analizę i wyciąganie trafnych wniosków z długich tekstów.