Domů Lifestyle Věda a technologie

Přijdou brzy filmaři o práci? Umělá inteligence Googlu působivě promění text ve video

Name: Hádka v Partii vybičovala Tománkovou k nevídané reakci
Uploaded: 2024-01-21T13:19:12+00:00
Duration: 59 min 41 s
Description: Hádka v Partii vybičovala Tománkovou k nevídané reakci

Umělá inteligence od Googlu promění text ve video. Lumiere zvládá i rozpohybovat fotografii nebo upravit konkrétní část obrazu.

15 fotografií

Přijdou brzy filmaři o práci? Umělá inteligence Googlu působivě promění text ve video

Umělá inteligence od Googlu promění text ve video. Lumiere zvládá i rozpohybovat fotografii nebo upravit konkrétní část obrazu. Zdroj: Google

Jan Hrušovský

5. úno 2024, 11:02

Zatím jde jen o krátké, několik vteřin trvající klipy. Google ale přišel s revolučním metodou, jak za pomoci umělé inteligence proměnit text ve video. AI nástroj Lumiere zvládá rozpohybovat statické obrázky, zcela změnit stylizaci videa, ale také obarvit určité části. Vedle Googlu se o generování videí snaží i konkurence, která ale zatím není tak daleko jako společnost z Mountain View.

Stačí jen pět sekund, aby Google ukázal průlomovou technologii. Nový AI model Lumiere, který minulý týden představili výzkumníci Googlu, ukazuje, jak snadno se dá vytvořit video jen na základě textového zadání.

MOHLO BY VÁS ZAJÍMAT: Fotbalová revoluce: Skauty nahrazuje umělá inteligence, mistrovi Evropské ligy hledá hráče

Chcete pejska přehrabujícího listí, červený sportovní automobil prohánějící se po okruhu nebo psa s brýlemi v jedoucím kabrioletu? Google Lumiere nemá s ani jedním příkladem problém.

Není to jediná funkce, kterou model zvládá. Umělá inteligence umí rozpohybovat také statické obrázky, což americká firma demonstrovala například na slavné Moně Lise od Leonarda da Vinciho a dokázala ji rozesmát.

Další možností je stylizace obrázku. Na základě jednoho referenčního díla je možné vytvořit celou sadu krátkých videí. To platí i v případě proměny některého z objektů. Ze skutečného vozu Tesla dokázal Lumiere vytvořit model, který vypadá jako složený z Lego kostiček nebo ze dřeva.

Lumiere je také schopný rozhýbat část fotografie, ať už jde o animaci plamenů v ohništi, nebo páru z lokomotivy. Posledním trikem je schopnost rozpoznat šaty na člověku a poté je přebarvit podle zadání.

Google se svým nástrojem vstoupil do segmentu, kde už působí řada konkurenčních firem. Ať už jde například o generátor obrázků a videí Stable Diffusion, nebo model Emu od společnosti Meta, která provozuje sociální sítě Facebook či Instagram.

Na rozdíl od konkurence ale Google Lumiere má mnohem plynulejší pohyb objektů. To souvisí i s použitou technologií. Web Arstechnica napsal, že Lumiere využívá nerunovou síť, která generuje celé video najednou, zatímco konkurenční nástroje skládají statické snímky dohromady.

Výzkumníci Googlu upozornili, že vygenerovaná videa jsou zatím v nízkém rozlišení 1024 x 1024 pixelů. Přesto jde o působivé výtvory.

Zásadní je, s jakou lehkostí Google ukázal, jak nástroj může fungovat. Stačí jen označit část obrazu, kterou uživatel chce upravit, napsat zadání a umělá inteligence se o vše postará.

V tuto chvíli je zatím jasně zřetelné, že videa nejsou skutečná a vytvořila je umělá inteligence. Filmaři ani další tvůrci videí se zatím nemusí obávat, že by je v brzké době nahradily nástroje AI. Zároveň vždy bude potřeba člověk, který daný nástroje bude ovládat a bude do něj vkládat příkazy.

Jak ale upozorňuje magazín The Verge, je potřeba mít na paměti fakt, že výsledky umělé inteligence se budou neustále zlepšovat. Ještě nedávno byly generátory obrázků jako Stable Diffusion či DALL-E jen terčem posměchu, ale v posledním roce se dostaly od nesrozumitelné tvorby až k fotorealistickým výtvorům.

„Je to úžasný pokrok. Vytvořit video je mnohem složitější než vygenerovat fotografii, protože kromě správné tvorby jednotlivých pixelů musí systém také předvídat, jak se budou v průběhu času měnit,“ popsal Mark Zuckerberg při představování nástroje Meta Make-A-Video, s čím musí umělá inteligence bojovat při generování videí.

Lumiere je další snahou Googlu prosadit se na poli umělé inteligence. Americký gigant na začátku prosince představil jazykový model Gemini, o němž tvrdil, že je největším a nejschopnějším modelem poháněným umělou inteligencí. Záhy se ale ukázalo, že si Google některé funkce přikrášlil, aby v prezentaci vypadaly lépe, než ve skutečnosti fungují.

Na umělou inteligenci ve velkém sází i korejský výrobce telefonů Samsung. Ten nedávno představil svůj klíčový model Galaxy S24 Ultra. V něm jsou k dispozici funkce simultanního překladu nebo překladač, které v reálném čase zvládají přeložit rozhovor do 13 světových jazyků. Tyto nástroje Samsung vyvíjí ve spoluprací s umělou inteligencí od Googlu.

MOHLO VÁM UNIKNOUT: Hádka v Partii vybičovala Tománkovou k nevídané reakci

video umělá inteligence (AI) Instagram Facebook Google

Jan Hrušovský

Honza působí v médiích od roku 2017. Začínal jako editor sociálních sítí na Aktuálně.cz, později zde moderoval on-line pořad Asociál, který se věnoval digitálním technologiím, gamingu a sociálním sítím. Pro Hospodářské noviny připravoval byznysové podcasty Ranní brífink a Poprvé. Od dubna 2022 působí na CNN Prima News, kde píše o videohrách nebo technologiích a také moderuje a připravuje televizní pořad Enter.

Návrhy pro vás

5 fotografií

Žebříček nejhorších jídel světa. Umístily se i tři české pokrmy, vévodí skandinávská kuchyně

31 fotografií

Sníh, jak ho neznáte: Jak rychle padá i z čeho se skládá. A vločky nejsou bílé