Alibaba представила Qwen3.7-Plus: мультимодальный агент нового поколения

Лаборатория Tongyi Lab, принадлежащая технологическому гиганту Alibaba, официально анонсировала выпуск Qwen3.7-Plus — передового мультимодального агента. Новая модель объединяет в себе глубокое понимание визуального контента с вычислительными и логическими мощностями предыдущих итераций серии Qwen. Основная концепция устройства системы базируется на триаде «видеть, думать, действовать», что позволяет ИИ-агенту не просто анализировать данные, но и активно взаимодействовать с программной средой в режиме реального времени.

Автономная разработка и управление интерфейсами

Ключевой особенностью Qwen3.7-Plus является способность реализовывать сквозной замкнутый цикл операций. Система демонстрирует высокую эффективность в управлении графическими интерфейсами (GUI), выполнении команд в CLI-интерфейсах и написании программного кода с последующей самопроверкой. Благодаря интеграции мультимодальных рассуждений, агент способен интерпретировать визуальную информацию из приложений и веб-страниц для выполнения сложных пользовательских сценариев.

  • Мультимодальные рассуждения: распознавание сложных графических образов и контекстуальный анализ.
  • Генерация кода: автоматическое создание программ на основе технических заданий и визуальных макетов.
  • Визуально управляемый дизайн: возможность преобразования изображений и видео в векторный код (SVG) и готовые веб-интерфейсы.
  • Автоматизация GUI: навигация и взаимодействие с элементами управления сторонних приложений без участия человека.

Результаты практических испытаний

В ходе стресс-тестирования система Hybrid-Agent, функционирующая на базе Qwen3.7-Plus, продемонстрировала беспрецедентный уровень автономности. Инструмент работал непрерывно более 11 часов, в течение которых самостоятельно спроектировал и реализовал приложение для изучения иностранных языков. За этот период нейросеть сгенерировала более 10 000 строк кода и произвела свыше 1000 системных вызовов.

Модель успешно охватила весь жизненный цикл разработки: от формирования документации с требованиями и написания исходного кода до автоматического развертывания, создания тестовых сценариев и проведения итераций обновления версий.

Перспективы внедрения мультимодальных систем

Выход Qwen3.7-Plus знаменует собой переход от пассивных языковых моделей к активным ИИ-агентам, способным заменять человека в рутинных процессах разработки и тестирования ПО. Возможность улучшенного поиска ответов с опорой на визуальные данные и инструменты самопроверки значительно снижает вероятность возникновения ошибок в финальных продуктах. Ожидается, что интеграция подобных решений в корпоративный сектор существенно ускорит темпы цифровой трансформации и автоматизации бизнес-процессов на глобальном рынке.

Материал соответствует редакционной политике Techimo Все публикации проходят проверку фактов и соответствуют стандартам независимой журналистики.
Подробнее

Techimo в Telegram

Самые свежие новости технологий, инсайды и обзоры гаджетов раньше, чем на сайте. Без спама.

Подписаться на канал