Ilus.: Kolaż INNPoland

OpenAI prezentuje najbardziej zaawansowaną wersję ChatGPT w historii. Nowy Agent nie tylko odpowiada na pytania – potrafi samodzielnie działać w internecie, analizować dane, klikać, kupować i planować spotkania.

REKLAMA

OpenAI zaprezentowało w czwartek nową funkcję ChatGPT o nazwie "ChatGPT Agent". Umożliwia ona wykonywanie złożonych zadań cyfrowych przez chatbota, który korzysta z wirtualnego komputera oraz narzędzi, by działać samodzielnie w sieci – poinformowała firma w trakcie transmisji na żywo.

Agent do zadań specjalnych

"ChatGPT agent pozwala teraz myśleć i działać" – czytamy w oficjalnym komunikacie. Według OpenAI, narzędzie może np. "przeanalizować kalendarz i przygotować notatki z nadchodzących spotkań klientów, opierając się na aktualnych wiadomościach", a także "zaprojektować menu japońskiego śniadania dla czterech osób i nawet kupić potrzebne produkty".

To połączenie wcześniejszych technologii Operator i Deep Research, umożliwiające bardziej spójną automatyzację. Operator potrafi poruszać się po stronach internetowych – klikać, scrollować i wypełniać formularze – natomiast Deep Research gromadzi i analizuje informacje.

Wiadomość zaprezentował dyrektor generalny firmy Sam Altman podczas transmisji na żywo: "Ludzie chcieli jednego agenta, który używa własnego komputera, by wykonywać naprawdę złożone zadania", powiedział.

Funkcja "agent mode" jest już dostępna dla subskrybentów planów Pro, Plus i Team – wystarczy aktywować ją w menu narzędzi ChatGPT. Użytkownik zachowuje pełną kontrolę: narzędzie prosi o potwierdzenie przy istotnych działaniach i pozwala zatrzymać wykonywanie zadania w dowolnym momencie.

OpenAI równocześnie podkreśliło, że pomimo bogatych możliwości, ChatGPT Agent znajduje się dopiero na początkowym etapie udostępniania. Firma zapowiada, że będzie stopniowo dodawać kolejne funkcje i usprawnienia.

Nowa faza konkurencji o AI

Ogłoszenie ma miejsce w czasie, gdy OpenAI mierzy się z presją ze strony Big Tech. Microsoft, Google, Meta i Amazon intensywnie rozwijają własnych agentów

Agentowy tryb ChatGPT konkurencyjnie zbliża się do funkcji w narzędziach takich jak Microsoft Copilot czy Google Workspace, oferując możliwość "automatycznej nawigacji po stronach internetowych, logowania, generowania prezentacji i arkuszy kalkulacyjnych".

OpenAI jednocześnie przedstawiło najsilniejsze dotychczas zabezpieczenia. Agent jest wyposażony w filtry blokujące działania wrażliwe, tzw. "watch mode", które umożliwiają obserwację krok po kroku, oraz wymóg akceptacji ze strony użytkownika przy działaniach o dużym znaczeniu. 

"ChatGPT agent dokonuje analizy wniosków użytkownika, informuje o niepewności i odmawia, gdy sytuacja jest ryzykowna" – zapewnia OpenAI

Dostępność ChatGPT Agent na razie ogranicza się do Anglii i USA (Pro, Plus, Team), bez objęcia Klientów Enterprise i rynków EEA. Taka ekspansja zaplanowana jest na kolejne miesiące.

Według założeń Sama Altmana – dyrektora generalnego OpenAI, jesteśmy w połowie rozwoju systemów AI. W połowie ubiegłego roku stwierdził on, że doskonalenie sztucznej inteligencji można podzielić na 5 etapów: chatboty, systemy rozumujące, agenci, innowatorzy i autonomiczne organizacje.