Zatím jde jen o krátké, několik vteřin trvající klipy. Google ale přišel s revolučním metodou, jak za pomoci umělé inteligence proměnit text ve video. AI nástroj Lumiere zvládá rozpohybovat statické obrázky, zcela změnit stylizaci videa, ale také obarvit určité části. Vedle Googlu se o generování videí snaží i konkurence, která ale zatím není tak daleko jako společnost z Mountain View.
Stačí jen pět sekund, aby Google ukázal průlomovou technologii. Nový AI model Lumiere, který minulý týden představili výzkumníci Googlu, ukazuje, jak snadno se dá vytvořit video jen na základě textového zadání.
MOHLO BY VÁS ZAJÍMAT: Fotbalová revoluce: Skauty nahrazuje umělá inteligence, mistrovi Evropské ligy hledá hráče
Chcete pejska přehrabujícího listí, červený sportovní automobil prohánějící se po okruhu nebo psa s brýlemi v jedoucím kabrioletu? Google Lumiere nemá s ani jedním příkladem problém.
Není to jediná funkce, kterou model zvládá. Umělá inteligence umí rozpohybovat také statické obrázky, což americká firma demonstrovala například na slavné Moně Lise od Leonarda da Vinciho a dokázala ji rozesmát.
Další možností je stylizace obrázku. Na základě jednoho referenčního díla je možné vytvořit celou sadu krátkých videí. To platí i v případě proměny některého z objektů. Ze skutečného vozu Tesla dokázal Lumiere vytvořit model, který vypadá jako složený z Lego kostiček nebo ze dřeva.
Lumiere je také schopný rozhýbat část fotografie, ať už jde o animaci plamenů v ohništi, nebo páru z lokomotivy. Posledním trikem je schopnost rozpoznat šaty na člověku a poté je přebarvit podle zadání.
Google se svým nástrojem vstoupil do segmentu, kde už působí řada konkurenčních firem. Ať už jde například o generátor obrázků a videí Stable Diffusion, nebo model Emu od společnosti Meta, která provozuje sociální sítě Facebook či Instagram.
Průlomová AI od Googlu? Gemini ohromil svět, pak se autoři přiznali, že vše bylo trochu jinak
Google na poli umělé inteligence strádal. Americký technologický gigant na začátku letošního roku s velkou slávou ukázal svůj vyhledávač Bard, doplněný o AI model. Při srovnání s konkurencí byl ale pozadu. Nyní však přichází s novým modelem Gemini a ukazuje, že chce být lepší než konkurenční ChatGPT. Nástroj umí podle vývojářů rozpoznávat prezentované předměty a precizně reagovat na zvukové pokyny. Následně ale Google přiznal, že to, co předvedl veřejnosti, bylo spíše takové „divadlo“.
Na rozdíl od konkurence ale Google Lumiere má mnohem plynulejší pohyb objektů. To souvisí i s použitou technologií. Web Arstechnica napsal, že Lumiere využívá nerunovou síť, která generuje celé video najednou, zatímco konkurenční nástroje skládají statické snímky dohromady.
Výzkumníci Googlu upozornili, že vygenerovaná videa jsou zatím v nízkém rozlišení 1024 x 1024 pixelů. Přesto jde o působivé výtvory.
Zásadní je, s jakou lehkostí Google ukázal, jak nástroj může fungovat. Stačí jen označit část obrazu, kterou uživatel chce upravit, napsat zadání a umělá inteligence se o vše postará.
V tuto chvíli je zatím jasně zřetelné, že videa nejsou skutečná a vytvořila je umělá inteligence. Filmaři ani další tvůrci videí se zatím nemusí obávat, že by je v brzké době nahradily nástroje AI. Zároveň vždy bude potřeba člověk, který daný nástroje bude ovládat a bude do něj vkládat příkazy.
Jak ale upozorňuje magazín The Verge, je potřeba mít na paměti fakt, že výsledky umělé inteligence se budou neustále zlepšovat. Ještě nedávno byly generátory obrázků jako Stable Diffusion či DALL-E jen terčem posměchu, ale v posledním roce se dostaly od nesrozumitelné tvorby až k fotorealistickým výtvorům.
„Je to úžasný pokrok. Vytvořit video je mnohem složitější než vygenerovat fotografii, protože kromě správné tvorby jednotlivých pixelů musí systém také předvídat, jak se budou v průběhu času měnit,“ popsal Mark Zuckerberg při představování nástroje Meta Make-A-Video, s čím musí umělá inteligence bojovat při generování videí.
Lumiere je další snahou Googlu prosadit se na poli umělé inteligence. Americký gigant na začátku prosince představil jazykový model Gemini, o němž tvrdil, že je největším a nejschopnějším modelem poháněným umělou inteligencí. Záhy se ale ukázalo, že si Google některé funkce přikrášlil, aby v prezentaci vypadaly lépe, než ve skutečnosti fungují.
Na umělou inteligenci ve velkém sází i korejský výrobce telefonů Samsung. Ten nedávno představil svůj klíčový model Galaxy S24 Ultra. V něm jsou k dispozici funkce simultanního překladu nebo překladač, které v reálném čase zvládají přeložit rozhovor do 13 světových jazyků. Tyto nástroje Samsung vyvíjí ve spoluprací s umělou inteligencí od Googlu.
MOHLO VÁM UNIKNOUT: Hádka v Partii vybičovala Tománkovou k nevídané reakci