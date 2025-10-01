Компания OpenAI анонсировала вторую версию своего флагманского генератора видео и аудио на основе искусственного интеллекта Sora. Разработчики сравнивают этот релиз с появлением модели GPT-3.5, которая стала прорывом в текстовой генерации. Новая версия демонстрирует качественный скачок в симуляции физических процессов и поведения объектов в виртуальном пространстве.

Ключевым отличием Sora 2 от предшественников стала способность моделировать реальное поведение объектов вместо создания визуально правдоподобной, но физически некорректной картинки. Предыдущие генераторы видео часто нарушали элементарную логику движения — баскетбольный мяч мог «телепортироваться» в корзину даже при промахе. Новая модель точно воспроизводит физику: промах означает, что мяч отскочит от щита, а фигурист при выполнении тройного акселя может ошибиться и упасть.

- Реклама -

Такая способность имитировать не только успешные действия, но и ошибки открывает новые возможности для создания реалистичных симуляторов и разработки систем для роботов. По словам разработчиков, Sora 2 устраняет типичные проблемы предыдущих версий — странные деформации объектов и нарушение логики сцены ради соблюдения текстового запроса пользователя.

This is Sora 2

Смотрите это видео на YouTube

Модель демонстрирует значительный прогресс в контролируемости генерации. Sora 2 уверенно справляется со сложными многоэтапными сценами, сохраняя согласованность объектов, локаций и освещения на протяжении всего видео. Компания привела примеры роликов, где фигуристка выполняет программу с котом на голове, или где персонаж аниме участвует в зрелищной битве. Все эти сцены сохраняют целостность мира, связность кадров и эмоции на лицах персонажей. Система поддерживает три основных стиля визуализации: реалистичный, кинематографический и аниме.

Подписывайтесь на Mediasat в Telegram: здесь самые интересные новости из мира технологий

Помимо видеогенерации, Sora 2 получила мощные возможности для создания аудиосопровождения. Модель генерирует сложные фоновые звуковые ландшафты, речь и звуковые эффекты с высоким уровнем реалистичности. Для точного воспроизведения внешности, мимики и голоса конкретного человека достаточно короткой видеозаписи. Эта функция работает универсально для любого человека, животного или объекта.

Sound on for Sora 2

Смотрите это видео на YouTube

Вместе с запуском Sora 2 OpenAI представила социальное iOS-приложение Sora App. По концепции оно напоминает TikTok: пользователи видят ленту с вертикальными видео, могут лайкать, комментировать и репостить контент, а также создавать ремиксы на работы других авторов. Принципиальное отличие заключается в том, что весь контент в приложении сгенерирован с помощью ИИ. Живой человек может появиться в видео исключительно через функцию «камео», которая позволяет интегрировать себя или друзей в любую сгенерированную сцену. Для этого нужно записать короткое видео через приложение и подтвердить свой голос для создания образа.

Команда OpenAI сообщила, что во время тестирования приложения внутри компании сотрудники использовали функцию «камео» для знакомства и общения между собой. Разработчики считают социальный формат лучшим способом продемонстрировать возможности Sora 2.

Этичное использование технологии стало приоритетом для платформы. Пользователи самостоятельно контролируют, кто и как может использовать их «камео», а также могут удалить любое видео со своим участием в любой момент. Алгоритмы и модераторы блокируют контент с вредоносным содержанием или созданный без согласия людей.

Приложение Sora стало доступно для пользователей iPhone в США и Канаде через систему приглашений. Через несколько недель Sora 2 появится в веб-версии. Базовый вариант сервиса бесплатный с «щедрыми лимитами» на генерацию. Подписчики ChatGPT Pro вскоре получат доступ к экспериментальной модели Sora 2 Pro с улучшенным качеством. Монетизация предусматривает оплату дополнительных генераций при высоком спросе. В ближайших планах компании — расширение географии сервиса и открытие доступа через программный интерфейс приложений (API).