INNPoland_avatar

Google naciąga nas z Gemini? To zrobili, by wyglądał atrakcyjniej

Sebastian Luc-Lepianka

10 grudnia 2023, 16:01 · 3 minuty czytania
Na początku grudnia Google postanowiło olśnić świat, pokazując swoją nową sztuczną inteligencję. Maszyna, integrująca w sobie różne funkcje generatywne, na zaprezentowanym materiale reagowała płynnie i naturalnie na działania człowieka. Teraz pojawiają się głosy, że to może być przekłamanie.


Google naciąga nas z Gemini? To zrobili, by wyglądał atrakcyjniej

Sebastian Luc-Lepianka
10 grudnia 2023, 16:01 • 1 minuta czytania
Na początku grudnia Google postanowiło olśnić świat, pokazując swoją nową sztuczną inteligencję. Maszyna, integrująca w sobie różne funkcje generatywne, na zaprezentowanym materiale reagowała płynnie i naturalnie na działania człowieka. Teraz pojawiają się głosy, że to może być przekłamanie.
Film został ubarwiony. Fot. Google/YouTube
Więcej ciekawych artykułów znajdziesz na stronie głównej
  • Google informowało, że materiał wideo z Gemini pokazuje faktyczne testy.
  • Te są kreatywnym montażem z bardziej żmudnego procesu pracy z AI.
  • Wiceprezes zespołu DeepMind przyznał, że to nagranie ma być inspiracją i pokazem tego, co chcieliby osiągnąć w przyszłości.
  • Wielu internautów czuje się oszukanych przez Google.

Dopiero co informowaliśmy was o tym przełomie w dziedzinie AI, a teraz na jaw wychodzą fakty, rzucające cień na obietnice Google. Sprawę nagłośniła redakcja agencji Bloomberga, pokazując nowe szczegóły, a Internauci zaczynają czuć się oszukani.

Filmik pokazowy Gemini jest przesadzony

Dowodem jest dokumentacja związana z AI. Znajdziemy w niej przykład gry w papier-nożyce-kamień, obecnej na materiale promocyjnym - wedle dokumentacji, Gemini nie rozpoznaje po pojedynczym geście, tylko trzeba mu pokazać najpierw serię, a potem napisać podpowiedź, że to jest gra. Tego na filmie nie pokazano. Jak wyglądało uczenie maszyny, możecie przeczytać sami tutaj.

Nie jest to szczególnie pomocne, gdy użytkownicy przekazują sobie film na mediach społecznościowych. Ani gdy na samym wstępie Google informuje, że to "nagrane materiały testów w szerokim zakresie wyzwań".

Łatwo jest odnieść wrażenie, że wideo pokazuje produkt gotowy. Google nie ukrywa, że pozwoliło sobie na trochę licentia poetica, pomijając przy tym kilka szczegółów.

Pokazują dynamicznie przesuwające się obrazy, podczas gdy AI analizowało nieruchome. Przyspieszyli odpowiedzi od bota, by nagranie oglądało się atrakcyjniej, ale maszyna nie rozmawiała z człowiekiem. Odpowiadała tylko na polecenia tekstowe i obrazki.

Komentarz Google

Do sprawy odniósł się Oriol Vinyals, jeden ze współtwórców Gemini.

"Wszystkie polecenia użytkownika i wyniki w filmie są autentyczne, skrócone dla zwięzłości. Film ilustruje, jak mogą wyglądać wielomodalne doświadczenia użytkownika zbudowane przy użyciu Gemini. Zrobiliśmy go, aby zainspirować deweloperów" – napisał na X (dawny Twitter) Vinyals, wiceprezes zespołu DeepMind.

Więc oglądaliśmy nie "hands-on", czyli pokaz gotowego produktu, a to, co można w przyszłości osiągnąć. Na umieszczonym na X materiale od twórcy modelu widzimy, że odpowiada on znacznie wolniej, niż można pomyśleć po viralowym nagraniu.

W komentarzach pod wpisem użytkownicy nie kryją frustracji i zawodu zachowaniem Google. Jeden z nich porównał pokaz Gemini to prezentacji konceptu samochodu sportowego, którego jeszcze nie ma - imponujące, ale nadal nieistniejące.

Kiedy Gemini będzie dostępne?

Model Gemini już w ciągu najbliższych miesięcy dostanie sparowanie z produktami Google. W pierwszej kolejności będzie dostępny w Google Chrome, Duet AI i Google Ads. Warto zaznaczyć, że usługa ta zostanie udostępniona w języku angielskim w ponad 170 krajach i regionach. Co istotne, Google planuje rozszerzyć zakres dostępnych opcji i wkrótce udostępni model Gemini Pro w kolejnych miejscach i językach.

Użytkownicy mogą już skorzystać z Gemini w ramach modelu Bard, który korzysta z Gemini Pro. Z kolei od 13 grudnia deweloperzy i klienci biznesowi będą mieli możliwość skorzystania z modelu Gemini Pro poprzez Gemini API, udostępnione w ramach platform Google AI Studio oraz Google Cloud Vertex AI.

Gemini 1.0, pierwsza wersja modelu stworzonego przez Google, została opracowana z myślą o różnych zastosowaniach i zoptymalizowana dla trzech wariantów, spełniających różne potrzeby użytkowników.

Gemini Ultra to najbardziej wydajna i największa wersja modelu, zaprojektowana do obsługi bardzo złożonych zadań. Jest to narzędzie dedykowane dla użytkowników, którzy potrzebują maksymalnej mocy obliczeniowej do rozwiązania skomplikowanych problemów.

Gemini Pro to model o bardziej zrównoważonych parametrach, doskonale sprawdzający się do różnorodnych zastosowań. Jest zoptymalizowany pod kątem skalowania, co oznacza, że może być efektywnie wykorzystywany w szerokim zakresie zadań, dostarczając użytkownikom elastyczność i efektywność.

Gemini Nano to z kolei wersja modelu stworzona specjalnie do zastosowań na urządzeniach, oferując możliwość korzystania z zaawansowanych funkcji sztucznej inteligencji nawet na mniejszych, przenośnych platformach.

Czy Gemini to nowy krok ewolucji AI?

Chociaż nagranie jest ubarwione, Gemini nadal jest krokiem naprzód w ewolucji tej technologii. Czy jest to AGI? Możemy bezpiecznie powiedzieć, że nie, ale może stanowić ku temu pierwszy krok dla Google. Co jednak oznaczają te trzy literki i dlaczego wielu się ich boi, wyjaśniamy na INNPoland.

Czytaj także: https://innpoland.pl/201757,czym-jest-agi-nadchodzi-era-superinteligencji