
OpenAI prezentuje najbardziej zaawansowaną wersję ChatGPT w historii. Nowy Agent nie tylko odpowiada na pytania – potrafi samodzielnie działać w internecie, analizować dane, klikać, kupować i planować spotkania.
OpenAI zaprezentowało w czwartek nową funkcję ChatGPT o nazwie "ChatGPT Agent". Umożliwia ona wykonywanie złożonych zadań cyfrowych przez chatbota, który korzysta z wirtualnego komputera oraz narzędzi, by działać samodzielnie w sieci – poinformowała firma w trakcie transmisji na żywo.
Agent do zadań specjalnych
"ChatGPT agent pozwala teraz myśleć i działać" – czytamy w oficjalnym komunikacie. Według OpenAI, narzędzie może np. "przeanalizować kalendarz i przygotować notatki z nadchodzących spotkań klientów, opierając się na aktualnych wiadomościach", a także "zaprojektować menu japońskiego śniadania dla czterech osób i nawet kupić potrzebne produkty".
To połączenie wcześniejszych technologii Operator i Deep Research, umożliwiające bardziej spójną automatyzację. Operator potrafi poruszać się po stronach internetowych – klikać, scrollować i wypełniać formularze – natomiast Deep Research gromadzi i analizuje informacje.
Wiadomość zaprezentował dyrektor generalny firmy Sam Altman podczas transmisji na żywo: "Ludzie chcieli jednego agenta, który używa własnego komputera, by wykonywać naprawdę złożone zadania", powiedział.
Funkcja "agent mode" jest już dostępna dla subskrybentów planów Pro, Plus i Team – wystarczy aktywować ją w menu narzędzi ChatGPT. Użytkownik zachowuje pełną kontrolę: narzędzie prosi o potwierdzenie przy istotnych działaniach i pozwala zatrzymać wykonywanie zadania w dowolnym momencie.
OpenAI równocześnie podkreśliło, że pomimo bogatych możliwości, ChatGPT Agent znajduje się dopiero na początkowym etapie udostępniania. Firma zapowiada, że będzie stopniowo dodawać kolejne funkcje i usprawnienia.
Nowa faza konkurencji o AI
Ogłoszenie ma miejsce w czasie, gdy OpenAI mierzy się z presją ze strony Big Tech. Microsoft, Google, Meta i Amazon intensywnie rozwijają własnych agentów.
Agentowy tryb ChatGPT konkurencyjnie zbliża się do funkcji w narzędziach takich jak Microsoft Copilot czy Google Workspace, oferując możliwość "automatycznej nawigacji po stronach internetowych, logowania, generowania prezentacji i arkuszy kalkulacyjnych".
OpenAI jednocześnie przedstawiło najsilniejsze dotychczas zabezpieczenia. Agent jest wyposażony w filtry blokujące działania wrażliwe, tzw. "watch mode", które umożliwiają obserwację krok po kroku, oraz wymóg akceptacji ze strony użytkownika przy działaniach o dużym znaczeniu.
"ChatGPT agent dokonuje analizy wniosków użytkownika, informuje o niepewności i odmawia, gdy sytuacja jest ryzykowna" – zapewnia OpenAI
Dostępność ChatGPT Agent na razie ogranicza się do Anglii i USA (Pro, Plus, Team), bez objęcia Klientów Enterprise i rynków EEA. Taka ekspansja zaplanowana jest na kolejne miesiące.
Według założeń Sama Altmana – dyrektora generalnego OpenAI, jesteśmy w połowie rozwoju systemów AI. W połowie ubiegłego roku stwierdził on, że doskonalenie sztucznej inteligencji można podzielić na 5 etapów: chatboty, systemy rozumujące, agenci, innowatorzy i autonomiczne organizacje.
Zobacz także
