На ежегодной конференции I/O технологический гигант Google официально анонсировал Gemini Omni — инновационную мультимодальную модель, предназначенную для высококачественной генерации видеоконтента. Новинка способна обрабатывать и комбинировать различные типы входных данных, включая текст, изображения и аудио, что открывает новые возможности для профессионального и любительского видеопроизводства в экосистеме сервисов компании.
Мультимодальные возможности и интеграция
Ключевой особенностью Gemini Omni является её универсальность: нейросеть позволяет не только создавать ролики «с нуля» по текстовым запросам, но и редактировать готовое видео, используя команды на естественном языке. Разработчики обеспечили глубокую интеграцию инструмента в существующую инфраструктуру Google. Согласно официальным данным, поддержка функций Omni будет реализована в следующих продуктах:
- Модель Gemini Flash для быстрой обработки данных;
- Мобильное приложение Gemini;
- Платформа автоматизации Google Flow;
- Видеохостинг YouTube Shorts для создания короткого контента.
В ближайшем будущем разработчики планируют существенно расширить функционал продукта, добавив специализированные инструменты для продвинутой генерации сложных аудиовизуальных эффектов и детализированных изображений.
Технологическое значение и экспертная оценка
По словам представителей DeepMind, новая архитектура ориентирована на достижение максимального реализма и плавности движений в генерируемых сценах. Высокая производительность модели позволяет использовать её не только для развлекательного контента, но и в академических целях.
Omni может генерировать видео высокого качества и предоставляет широкие возможности для обучения и исследования в области искусственного интеллекта — подчеркнул Кори Кавукуоглу, главный архитектор ИИ и технический директор DeepMind.
Появление Gemini Omni знаменует собой переход Google к более агрессивной стратегии на рынке генеративного видео, где конкуренция с каждым месяцем усиливается. Текущая реализация модели подтверждает стремление компании создать единую экосистему, в которой создание сложного медиаконтента станет доступным для пользователей без навыков профессионального монтажа. Ожидается, что постепенное внедрение функций Omni в YouTube Shorts значительно изменит ландшафт пользовательского контента в ближайшие годы.