На конференції Google I/O 2026, що відбулась 19 травня, компанія Google анонсувала нову мультимодальну лінійку штучного інтелекту (ШІ) Gemini Omni. Першою моделлю серії стала Gemini Omni Flash. Про це оголосив голова Google DeepMind і технічний директор компанії Демис Хассабіс. За його словами, лінійка має стати ще одним кроком до створення ШІ загального призначення (AGI).
Головна особливість Gemini Omni Flash — здатність не лише генерувати відео з нуля, а й редагувати вже наявні ролики за текстовими командами в діалоговому режимі. На відміну від попередньої моделі Veo, яка генерувала відео з тексту з нуля, Omni Flash приймає будь-який вхідний формат — текст, зображення, аудіо чи готові відеоматеріали. Модель змінює в них саме те, що потрібно користувачеві. Так, Omni Flash дозволяє замінити персонажів, об’єкти або події в кадрі, скоригувати стиль, кут камери та оточення без повторного створення ролика.
Редагування відбувається у форматі ланцюжка команд — кожна наступна інструкція спирається на попередню. При цьому персонажі зберігаються, а сцена «пам’ятає» контекст попередніх правок. Окрему увагу Google приділила фізичній правдивості: модель краще відтворює гравітацію, кінетичну енергію та поведінку рідин. Завдяки цьому з короткого текстового запиту можна, наприклад, створити наочний науковий ролик. На презентації Google продемонструвала анімацію про згортання білків у стилі пластилінової анімації.
Компанія також тестує функцію Avatars — створення цифрового аватара на основі фотографій і голосового запису користувача. Після початкового завантаження матеріалів аватар можна використовувати у нових роликах, генерованих лише за текстовим описом. Водночас зміна чужого голосу й звуку на старті недоступна — Google утримується від цієї можливості, поки не опрацює механізми безпечного поширення.
Підписуйтесь на Mediasat у Telegram: тут найцікавіші новини ТБ та телекому
З погляду безпеки, кожне відео, створене через Omni Flash, автоматично отримує приховану цифрову мітку SynthID. Перевірити походження ролика можна через додаток Gemini, пошук Google або браузер Chrome.
Модель вже надходить до користувачів. Доступ отримали підписники тарифів Google AI Plus, Pro і Ultra через додаток Gemini та кінематографічний інструмент Flow. Авторам у YouTube Shorts і додатку YouTube Create Omni Flash доступна безплатно. Найближчими тижнями Google планує відкрити доступ до моделі через API й інструменти для розробників.
Паралельно Google анонсувала старшу модель лінійки — Gemini Omni Pro, деталі якої обіцяють розкрити пізніше. У перспективі Omni навчиться генерувати не лише відео, а й зображення зі звуком. Такий підхід вписується в ширшу стратегію Google — стати єдиною платформою для генерації контенту з інтегрованою дистрибуцією через YouTube, пошук і власні застосунки.
