
Wymyśliłem film, a Sora AI go zrobiła. Cóż, kariera w Hollywood musi poczekać…
Strzeżcie się, twórcy hollywoodzkich blockbusterów za setki milionów dolarów. Właśnie zainwestowałem 100 zł, odpaliłem Sorę i… A dobra, już nieważne.
Sora to hucznie zapowiadany generator filmów, stworzony przez OpenAI. Twórcy ChataGPT udostępnili ją pod koniec ubiegłego roku, ale mieszkańcy Europy musieli poczekać kilka tygodni dłużej.
Chciałbym napisać, że warto było czekać. Ale chcieć to sobie mogę.
Sora w akcji. Jakość generowanych przez AI filmów jest… dyskusyjna
Sora działa na zasadzie podobnej do generatorów obrazów. Wystarczy słownie opisać, co ma się znaleźć na filmie, a sztuczna inteligencja wygeneruje wideo o wybranej długości, rozdzielczości i proporcjach. Ja ograniczyłem się do 10-sekundowych filmów 480p w klasycznych 16:9.
W ramach rozgrzewki zacząłem od najprostszego przykładu jaki przyszedł mi do głowy.
"Kobieta kroi pomidory na blacie wypełnionym warzywami. Zbliżenie na dłonie, widok z góry, delikatny ruch kamery":
Nie spodziewałem się, że AI twórców ChataGPT polegnie już na takiej błahostce. Ale dałem drugą szansę i zmodyfikowałem prompt precyzując, że chodzi o krojenie pomidora w plasterki. Niestety efekt wcale nie uległ poprawie.
Gdybym jednak potrzebował prostego ujęcia z kuchni, po prostu pobrałbym wideo z jakiegoś darmowego stocka. W założeniu Sora ma pomóc w realizacji bardziej skomplikowanych projektów, prawda? No to spróbujmy.
"Mężczyzna w pomarańczowej koszulce z białym napisem BENCHMARK siedzi pod drzewem. Na drzewie zamiast liści rosną smartfony. Humanoidalny robot podchodzi do drzewa, zrywa jeden smartfon i podaje mężczyźnie. W tle widać ubogą średniowieczną osadę. Powolny ruch kamery":
Zaczęło się nieźle, ale skończyło się na typowym AI. Ale OK, może wymagam zbyt wiele, więc uprośćmy polecenie. Przy okazji od razu poprosiłem o wygenerowanie dwóch filmów.
"Mężczyzna w pomarańczowej koszulce z białym napisem benchmark.pl siedzi pod drzewem, na którym zamiast liści rosną smartfony. Powolne zbliżenie na zamyśloną twarz. W oddali widać średniowieczną osadę":
Wciąż nie jest idealnie, ale pierwszego klipu od biedy dałoby się użyć w jakimś projekcie.
Dobra, pora odpiąć wrotki.
"Skrzyżowanie w Nowym Jorku. Tłumy ludzi spacerujących i zapatrzonych w swoje smartfony. Z nieba błyskawicznie zlatuje superbohater ubrany w pomarańczowy kostium z białym napisem benchmark.pl na klatce piersiowej. Uderzenie superbohatera w ziemię sprawia, że budynki w tle się zawalają":
Cóż, Marvel może jeszcze czuć się bezpiecznie.
A co z innymi stylami graficznymi?
"Styl kreskówki Disneya z lat 30. XX wieku. Humanoidalna żyrafa z zabawnym wyrazem twarzy biegnie za odjeżdżającym pociągiem, ale w ostatniej chwili przewraca się o skórkę od banana. Ludzie na peronie wytykają żyrafę palcami i pękają ze śmiechu":
Widzę tu przebłyski inteligencji, bo styl graficzny mi się podoba. Niestety animacja nie ma żadnego sensu, a wykorzystanie sztucznej inteligencji jest bardziej niż oczywiste.
Z ożywianiem zdjęć Sora również radzi sobie średnio
Alternatywną funkcją Sory jest przerabianie zdjęć na filmy. No to załóżmy, że zrobiłem sobie fotkę na MWC 2025, ale chciałbym jej użyć w wideo.
Sztuczna inteligencja zrobiła dziwne rzeczy z moją twarzą, ale zadziwiająco dobrze ogarnęła tło. Z tego 10-sekundowego klipu przy odrobinie chęci dałoby się wyciąć krótki fragment i użyć go jako przebitki, a może nawet nikt by się nie zorientował, że to AI.
Kolejny przykład. Tym razem zdjęcie wzbogacone o prompt "wyścigi uliczne, samochody jadące z zawrotną prędkością":
Cała sekwencja jest pozbawiona sensu, bo w pewnym momencie samochód zmienia swój wygląd, gdyż powody. Gdy już jednak zaczyna się właściwy wyścig, efekt staje się używalny.
Sora to na razie loteria. Droga loteria
Aby skorzystać z Sory konieczne jest wykupienie płatnego planu, a więc minimum ChatGPT Plus za ok. 100 zł miesięcznie. W ramach abonamentu użytkownik otrzymuje 1000 kredytów, których zużycie uzależnione jest od jakości, długości i proporcji filmu.
5 sekund | 10 sekund | 15 sekund | 20 sekund | |
---|---|---|---|---|
480p kwadrat | 20 kredytów | 40 kredytów | 60 kredytów | 80 kredytów |
480p | 25 kredytów | 50 kredytów | 100 kredytów | 150 kredytów |
720p kwadrat | 30 kredytów | 75 kredytów | 150 kredytów | 225 kredytów |
720p | 60 kredytów | 180 kredytów | 360 kredytów | 540 kredytów |
1080p kwadrat | 100 kredytów | 300 kredytów | 650 kredytów | 1000 kredytów |
1080p | 200 kredytów | 600 kredytów | 1300 kredytów | 2000 kredytów |
W najlepszym razie za te 100 zł można wygenerować 50 klipów. Nie ma jednak gwarancji, że wszystkie będą nadawać się do użytku, bo dobre filmy pochłaniają tyle samo kredytów, co te kompletnie zmasakrowane. A - jak widać - Sorze zdarza się generować pozbawiony składu szum.
Niestety aktualna skuteczność Sory w połączeniu z takim modelem sprzedaży sprawia, że realne koszty usługi są ciężkie do oszacowania. Gdyby dziś przełożony polecił mi wygenerowanie 30-sekundowego spotu promocyjnego, nie umiałbym wskazać nawet przybliżonych kosztów. Może wystarczyłoby mi 1000 kredytów, a może i po włożeniu 10 000 zostałbym z niczym. Loteria.
Pamiętając jaką drogę przeszły generatory obrazów wierzę, że i Sora któregoś dnia sprawi, że firany pospadają mi w domu z wrażenia. Ale to jeszcze nie ten moment.
Komentarze
1"Cała sekwencja jest pozbawiona sensu, bo w pewnym momencie samochód zmienia swój wygląd, gdyż powody."