Google Lumiere: все, що потрібно знати про мультимодальну модель штучного інтелекту для створення відео

Модель штучного інтелекту для створення відео Lumiere дає користувачам можливість використовувати для послідовного редагування відео методи на основі тексту, – зазначили в Google.

У компанії Google представили нову мультимодальну модель штучного інтелекту «Lumiere» для створення відео. У Google зазначили: «Lumiere – це модель для створення відеоконтенту на основі тексту, розроблена для синтезу відеоматеріалів, які відображають реалістичні, різноманітні та узгоджені рухи».

Компанія звертає особливу увагу на те, що дана модель полегшує процес створення контенту та використання застосунків для редагування відео, таких як застосунки для перетворення зображень на відео, створення відео в живописі та створення стилізованого відео.

- Реклама -

Згідно з інформацією від Google, модель Lumiere використовує для створення відео архітектуру Space-Time u-Net (STUNet). Використовуючи цю архітектурну конструкцію, модель обробляє всі кадри у відео відразу, замість того, щоб генерувати ключові кадри, а потім заповнювати відсутні кадри за допомогою моделей тимчасової надроздільності (TSR), яка є типовою для чинних відеогенераторів.

У Google заявили, що Lumiere генерує всю часову тривалість відео відразу, застосовуючи як просторову, так і часову зменшувальну та збільшувальну дискретизацію. На практиці це означає, що модель спочатку генерує відео з повною частотою кадрів у низькій роздільній здатності, а потім покращує створене відео за допомогою моделі просторової суперроздільності (SSR) для отримання кінцевого результату.

Підписуйтесь на Mediasat у Telegram: тут найцікавіші новини ТБ та телекому

У дослідницькій статті, присвяченій попередньому огляду можливостей Lumiere, компанія Google стверджує, що зразки відео, створені моделлю штучного інтелекту, мають довжину 80 кадрів із частотою 16 кадрів за секунду, тобто, фактично це фрагменти тривалістю у 5 секунд. На початку згенероване за допомогою нової моделі відео має роздільну здатність 128 x 128, а потім за допомогою SSR масштабується до роздільної здатності 1024 x 1024.

Як стверджують у компанії Google, модель створення відео Lumiere також дозволяє користувачам застосовувати для послідовного редагування відео методи редагування зображень із використанням тексту як основи. Наприклад, наявна в моделі функція Cinemagraphs дозволяє користувачам для створення відео анімувати певну область зображення. Для генерації стилізованого відео модель Lumiere може генерувати відео в обраному стилі, використовуючи одне еталонне зображення, надане користувачем.

- Реклама -

Якщо ви знайшли помилку, будь ласка, виділіть фрагмент тексту та натисніть Ctrl+Enter.

Борис Скуратівський
Борис Скуратівський
Журналіст, медіа-експерт та «літописець» історії українського радіо. За освітою – філолог (мав навчати діточок розмовляти, читати й писати англійською мовою, а також – любити українську мову та літературу, але так вже склалося, що несу знання дорослим і поважним людям, інформуючи їх про новини зі світу радіо, телебачення та суміжних технологій). За розвитком телебачення і радіо в Україні уважно слідкую з 1990-го року (коли почали з’являтися перші недержавні мовники) – спочатку робив це як пасивний спостерігач, а з лютого 1997 року, коли на шпальтах кіномузичного тижневика «П’ятниця» вперше вийшла моя рубрика «Новини радіо», - вже в якості журналіста. Згодом в різні роки співпрацював з газетою «Хрещатик», а також галузевими журналами «Телерадіокур’єр», «Телемир», «Медиа-Эксперт» та низкою інших видань. З 1998 по 2001 рік працював на радіостанції «Радіо РОКС – Україна», де вперше отримав можливість вивчати життя радіо, так би мовити, «зсередини». Згодом протягом певного часу працював редактором-наповнювачем сайту радіостанції «ХІТ FM», а потім співпрацював ще з низкою радіостанцій в якості копірайтера. З 1999 року веду власний інтернет-портал ProRadio.Org.Ua – один з перших україномовних ресурсів для фахівців в Україні, який став продовженням моєї газетної рубрики «Новини радіо» і повністю присвячений темі радіомовлення в Україні. Люблю класичний хард-рок, ціную оригінальність та нестандартність. Цікавлюсь історією, лінгвістикою, сучасним українським кінематографом та психологією.
- Реклама -

Читайте також

У Нідерландах з’явився найбільший у Європі музей Apple

В Утрехті відкрився найбільший у Європі музей Apple: понад 2000 м² тематичних залів із колекцією від перших комп'ютерів до iPhone та відтворенням гаража Джобса.

YouTube пояснив появу 90-секундної реклами на телевізорах технічною помилкою

YouTube визнав, що 90-секундний відлік реклами без пропуску на телевізорах виник через технічну помилку, і вже розгортає виправлення для користувачів.

I-O Data та Verbatim продовжать випуск пристроїв і дисків Blu-ray

I-O Data та Verbatim підтвердили продовження виробництва приводів і дисків Blu-ray. Рішення прийнято на тлі виходу з ринку Elecom, Buffalo та Sony.

У Південній Кореї запровадили безплатний базовий мобільний інтернет — навіть після вичерпання трафіку

Абоненти трьох провідних операторів Південної Кореї отримають безплатний мобільний інтернет після вичерпання трафіку. Гарантована базова швидкість — 400 кбіт/с.

YouTube тестує автоматичну швидкість відтворення та режим «На ходу» для Premium-підписників

YouTube тестує для підписників Premium автоматичну зміну швидкості відео та режим «На ходу». Тест триватиме до 27 квітня — потім Google вирішить їхню долю.