Hugging Face создаёт AI-агента с открытым исходным кодом, конкурирующего с OpenAI Deep Research


Hugging Face разрабатывает AI-агента, конкурирующего с OpenAI Deep Research

Команда Hugging Face, возглавляемая Томасом Вольфом, создала версию системы Deep Research OpenAI с открытым исходным кодом всего за 24 часа. Их цель — сделать AI-агентов доступными для всех, используя альтернативные методы автоматизированного исследования.

Как работает AI-агент Hugging Face?

Главное отличие системы Hugging Face от OpenAI Deep Research — способ выполнения задач.

В Deep Research OpenAI AI-модели используют JSON-действия для выполнения шагов.
Hugging Face применяет Code Agent, который написан на программном языке и может выполнять весь процесс в одном цикле, снижая издержки на 30%.
Для работы команда заимствовала два ключевых элемента из Magentic-One от Microsoft:

Текстовый веб-браузер — позволяет агенту искать информацию.
Текстовый инспектор — анализирует файлы различных форматов.
Например, при расчёте стоимости смартфона в разных странах Code Agent Hugging Face может выполнить все вычисления в одном цикле, тогда как системы на основе JSON требуют отдельного шага для каждого действия.

Как AI-агент Hugging Face справляется с тестами?

Для оценки возможностей система была протестирована в бенчмарке GAIA, который проверяет AI-агентов на выполнение многошаговых исследовательских задач.

Пример задачи:

«Какие фрукты, изображённые на картине 2008 года «Вышивка из Узбекистана», подавались в меню завтрака в 1949 году на океанском лайнере, который позже использовался в фильме «Последнее путешествие»? Приведите список, отсортированный по часовой стрелке».

Для решения требуется:

Анализ изображения (распознавание фруктов).
Поиск сведений о лайнере и фильме.
Определение меню 1949 года.
Форматирование ответа по заданным критериям.
Результаты теста GAIA:

Hugging Face — 55,15%
Microsoft Magentic-One — 46%
OpenAI Deep Research — 67%
Хотя система Hugging Face пока уступает OpenAI, разрыв между AI с открытым исходным кодом и проприетарными решениями сокращается быстрее, чем ожидалось.

Опубликовано: 07.02.2025 02:22