Logo Bielik i Łuk Triumfalny.
Polski startup pokazał w Paryżu dużą premierę modeli językowych Bielik podczas prestiżowego wydarzenia. Fot. East News/SpeakLeash/kolaż naTemat.
REKLAMA

Pierwszy dzień wyjazdu pod patronatem Ministerstwa Cyfryzacji otworzyli bombą – prezentując nową rodzinę Bielik. Wolnodostępną, praktyczną i gotową do wdrożenia.

Nowe modele językowe Bielik

We wtorek w Paryżu zadebiutowały: 

Bielik 3.0 – 1.5B (architektura Qwen) 

Bielik 3.0 – 4.5B (architektura Qwen)

Bielik 2.5 – 11B (architektura Mistral)

Mini modele 3.0 są już dostępne na Hugging Face. Duży model 2.5 będzie przez miesiąc w API Cyfronet AGH (PL Grid), a po miesiącu również na Hugging Face.

Co potrafią nowe modele językowe? SpeakLeash wylistowało polski dedykowany tokenizer, możliwość wywoływania zewnętrznych narzędzi, odpowiedzi gotowe do automatycznego przetwarzania oraz gotowość do działania jako agenci AI tzw. agent readiness. Modele 3.0 bazują na architekturze Qwen 2.5 

No dobrze, ale co to wszystko oznacza? Tokenizer to mechanizm, który dzieli tekst na jednostki zrozumiałe dla modelu (np. słowa, frazy lub ich fragmenty). Został on zoptymalizowany specjalnie pod język polski, co przekłada się na szybsze i trafniejsze generowanie wypowiedzi.

Z kolei Bielik 2.5 – 11B obsługuje formaty strukturalne (np. JSON), potrafi wnioskować (jest to jeszcze w fazie eksperymentalnej) i współpracuje z zewnętrznymi narzędziami. Te narzędzia są w pełni otwarte i dostępne dla każdego. Również dlatego, że nie trzeba mieć wielkiego zaplecza sprzętowego, aby je uruchomić.

Zadaniem takiego modelu jest wyłącznie zrozumienie czy ktoś chce kawę czy nie. Natomiast dokonaliśmy takiego skoku technologicznego, że 4.5B Mini w wielu Benchmarkach jest na równi lub przebija obecnego Bielika v2 11B, a wymaga dużo mniej mocy obliczeniowej.

Michał Domański

ambasador BielikAI, komentarz dla INNPoland

Wedle wcześniejszych zapowiedzi, te modele miały spisać się dla biznesu. Jak? Michał Domański wskazuje, że są idealne do nauczenia ich konkretnych zadań, jak stworzenie klasyfikatora, analiza sentymentu oraz rozpoznawanie intencji użytkownika.

"Tool use i zalążek modelu wnioskującego to bardzo ważny element w rozwoju Bielika. Dzięki temu oraz możliwościom uruchomienia modeli na dowolnej nawet niewielkiej infrastrukturze agent readiness staje się faktem. Co więcej, małe modele można łatwo dostroić – dlatego agent do zadań specjalnych może być dziś dostępny dla każdego" – podkreśla Remigiusz Kinas, szef działu R&D projektu Bielik. 

"W małych modelach wymieniliśmy tokenizer i wypróbowaliśmy zupełnie nową architekturę, natomiast w wersji v2.5 dodaliśmy eksperymentalnie elementy modelu wnioskującego. Chcemy zebrać mocny feedback i zaproponować już za chwilę całkowicie nową wersję Bielika" – mówi Krzysztof Ociepa, lider zespołu trenującego modele Bielik.

Czym jest Bielik?

Bielik to otwarty model językowy stworzony przez społeczność SpeakLeash we współpracy z ACK Cyfronet AGH – jednym z najważniejszych ośrodków HPC w Europie Środkowej. Trening modeli odbywał się na superkomputerach Helios i Athena, z użyciem wyłącznie danych na wolnych licencjach i z naciskiem na jakość języka polskiego. Modele publikowane są na licencji Apache 2.0, co oznacza pełną otwartość – także komercyjną.

O działalności społeczności SpeakLeash i ich modelu językowym rozmawialiśmy z ich ambasadorem, Michałem Domańskim.

– Kiedy ludzie usłyszeli, że jest w Polsce inicjatywa szaleńców, którzy po godzinach, za darmo, poświęcając swój czas, energię i pieniądze, budują sztuczną inteligencję i każdy może dołączyć, to dopiero zaczął się szał – opowiada. Więcej znajdziecie w wideo, umieszczonym w artykule poniżej.

Czytaj także: