
Najnowszy model OpenAI, Sora 2, pozwala tworzyć złożone nagrania wideo z realistycznym ruchem i synchronizacją dźwięku. Producent ChatGPT zaprezentował również opcję społecznościową w nowej aplikacji Sora. Na razie pobrać ją mogą tylko osoby, które dostały zaproszenie.
OpenAI przedstawiło właśnie nową wersję swojego systemu do generowania wideo. Sora 2 ma tworzyć bardziej realistyczne nagrania, lepiej odwzorowujące zasady fizyki, a także umożliwiać synchronizację obrazu z dialogami. Dodatkowo firma udostępniła nową platformę społecznościową do publikowania wytworzonych nagrań.
OpenAI przedstawia nowe narzędzie do generowania filmów: Sora 2
Firma podaje, że ich nowy model potrafi radzić sobie z bardziej złożonymi scenami niż jego poprzednik. W przykładowych materiałach pokazano m.in. akrobacje sportowe i sceny z udziałem wielu obiektów, które poruszają się w sposób spójny i przewidywalny. OpenAI przyznaje jednak, że system nadal popełnia błędy, choć "coraz częściej wyglądają one jak drobne potknięcia w symulacji, a nie poważne zakłócenia".
Nowością jest też funkcja tzw. cameo, pozwalająca wstawić do generowanego filmu postać stworzoną na podstawie nagrania użytkownika – z zachowaniem jego wyglądu i głosu.
Sora 2 pojawi się najpierw w aplikacji mobilnej "Sora" na iPhone’y w USA i Kanadzie. Appka nazywana "TikTokiem dla filmów AI" będzie pozwalała przeglądać filmy innych użytkowników. Dostęp będzie ograniczony – na początku pobiorą ją tylko osoby, które otrzymały zaproszenie. OpenAI planuje późniejsze rozszerzenie usługi na inne kraje.
Kwestie bezpieczeństwa i kontrowersje wokół "TikToka filmów AI"
Obok technologii, firma podkreśla kwestie bezpieczeństwa. W aplikacji pojawią się ograniczenia dla nastolatków, np. dzienny limit wygenerowanych treści i możliwość ustawienia kontroli rodzicielskiej. OpenAI deklaruje, że algorytmy rekomendujące w aplikacji mają promować kreatywność zamiast bezmyślnego przewijania treści.
Na razie korzystanie z Sora 2 ma być bezpłatne, choć firma zastrzega, że koszty obliczeniowe mogą w przyszłości wymusić wprowadzenie subskrypcji lub opłat za większą ilość wygenerowanych treści.
Premiera Sora 2 pokazuje, że OpenAI chce wyjść poza tekst i coraz mocniej rozwijać systemy multimodalne (czyli łączące tekst, dźwięk i wideo). To część szerszej rywalizacji firm technologicznych o stworzenie modeli, które potrafią nie tylko odpowiadać na pytania, ale też symulować fragmenty rzeczywistości.
Dodatkowo aplikacja do publikowania i przeglądania wygenerowanych nagrań może wzbudzać kontrowersje związane z postępującą degradacją treści w mediach społecznościowych. Platformy pokroju Instagrama czy TikToka zalewane są w ostatnich miesiącach AI slopem, co wciąż spotyka się z krytyką użytkowników.
Zobacz także
