Начало / Любопитно / Изкуствен интелект ще създава видео по текст

Изкуствен интелект ще създава видео по текст

cinema-4153289_960_720

AI генераторите на текст към изображение вече печелят популярност, но изследователите постепенно преминават към следващата граница: AI генератори на текст към видео.

Екип от инженери по машинно обучение в Meta представи най-новото си постижение в сферата на изкуствения интелект – Make-A-Video. Това е най-новото попълнение в семейството на Meta AI, което доказва, че изкуственият интелект може да прави всичко – от това да шофира кола или да се научи как се играе покер и шах, до овладяване на творчески процеси като създаване на визуални произведения на изкуството.

Както подсказва името, този AI модел позволява на потребителите да направят кратко описание на сцена, а впоследствие роботът генерира кратко видео, съответстващо на техния текст. Изследванията на Make-A-Video се основават на скорошния напредък в технологията за генериране на текст към изображение, създадена, за да позволи генерирането на текст към видео. Системата използва изображения с описания, за да научи как изглежда светът. С тези данни Make-A-Video ви позволява да вдъхнете живот на въображението си, като генерирате  уникални по рода си видеоклипове само с няколко думи или редове текст. Освен това моделът има възможността да анимира вече създадени изображения или дори класически произведения на изкуството. Макар и елементарни на вид, видеоклиповете представляват значително развитие в областта на генерирането на AI съдържание.

pexels-photo-2599244

Изпълнителният директор на компанията побърза да коментира новата разработка в социалните мрежи. В публикация във Facebook Марк Зукърбърг описа работата като „удивителен напредък“, добавяйки: „Много по-трудно е да се генерира видео, отколкото снимки, защото освен правилното генериране на всеки пиксел, системата също трябва да предвиди как те ще се движат и променят с времето”. Изкуственият интелект разполага с възможността да разбира концепцията за движение във физическия свят и да я прилага към традиционното генериране на изображение към текст.

Изследователите споделят, че моделът е изправен пред много технически ограничения, които предстои да бъдат преодолени. В момента Make-A-Video произвежда 16 кадъра видео с разделителна способност 64 на 64 пиксела, които след това се увеличават по размер с помощта на отделен AI модел до 768 на 768. Клиповете са не по-дълги от пет секунди, не съдържат аудио и очевидно са компютърно генерирани. Въпреки това специалистите твърдят, че качеството им бързо ще се усъвършенства и изкуственият интелект ще създава много по-реалистични и изпипани сюжети. За сравнение, само за няколко години генераторите на изображения с изкуствен интелект преминаха от създаване на неразбираеми картини към фотореалистично съдържание. И въпреки че напредъкът във видеото може да бъде по-бавен предвид сложността на темата, крайната цел за създаване на перфектно съдържание ще мотивира много компании да влеят големи ресурси в проекта.

В публикацията в блога на Meta, представящи Make-a-Video, компанията отбелязва, че инструментите за генериране на видео могат да бъдат безценни „за творци и артисти“. Meta казва, че открито споделя своите AI изследвания и резултати с общността, за да получи обратна връзка и ще продължи да използва своята отговорна AI рамка, за да усъвършенства и развие подхода към тази нововъзникваща технология. Все пак съществува и реалната опасност подобен софтуер да бъде използван за създаване на фалшиво съдържание, дезинформация и диийпфейк, но компанията не уточнява по какъв начин ще бъде ограничено използването на модела, така че да се контролира създаваното съдържание. Компанията публикува документ с изследванията си относно модела, макар все още да не го предоставя на широката аудитория. Вероятно това ще се случи в бъдеще, след като резултатите бъдат усъвършенствани, а сигурността и защитата от злоупотреби бъдат подсигурени.

„Нашата цел е в крайна сметка да направим тази технология достъпна за обществеността, но засега ще продължим да анализираме, тестваме и изпробваме Make-A-Video, за да гарантираме, че всяка стъпка е безопасна и добре обмислена“, споделят създателите на Make-A-Video.

Въпреки новаторският подход на Meta, това не е единствената компания, работеща върху подобни AI видео генератори. По-рано тази година група изследователи от Университета в Цинхуа и Пекинската академия за изкуствен интелект (BAAI) пуснаха свой собствен модел за текст към видео, наречен CogVideo (единственият друг публично достъпен модел със същата функционалност). Все пак трябва да се отбележи, че Make-A-Video се отличава значително по отношение на процеса си на „обучение“ – фактор, който е от особено значение, когато става въпрос за изкуствен интелект.


Автор: Entrepreneur Team