Компания Google добавила новую функцию в мобильное приложение искусственного интеллекта (ИИ) Gemini. Теперь нейросеть умеет обрабатывать аудиозаписи наряду с привычными форматами данных — текстом, изображениями и видео. Об этом сообщает 9to5Google.

Новая возможность создает множество вариантов практического использования. В частности, ИИ-помощник может составлять конспекты совещаний, выделяя самые важные моменты обсуждения. Система также умеет кратко пересказывать подкасты, отбрасывая лишнюю информацию.

Добавление аудиофайлов в разговор с чат-ботом остается простым. Пользователи могут загружать записи с помощью кнопки со знаком плюса, которую используют для других типов контента. В компании уточняют, что Gemini работает с самыми распространенными аудиоформатами, в частности WAV, M4A и MP3.

Отметим, что Google ввела различные ограничения для каждого типа подписки. Пользователи бесплатной версии могут загружать файлы продолжительностью до 10 минут. Тогда как подписчики Google AI Pro или Google AI Ultra имеют возможность обрабатывать записи до двух часов.

Компания также установила ежедневные ограничения на количество запросов. Пользователи бесплатной версии могут выполнять не более пяти операций с аудиофайлами в день. Это ограничение не касается владельцев платных подписок.