Hugging Face разрабатывает AI-агента, конкурирующего с OpenAI Deep Research
Команда Hugging Face, возглавляемая Томасом Вольфом, создала версию системы Deep Research OpenAI с открытым исходным кодом всего за 24 часа. Их цель — сделать AI-агентов доступными для всех, используя альтернативные методы автоматизированного исследования.Как работает AI-агент Hugging Face?
Главное отличие системы Hugging Face от OpenAI Deep Research — способ выполнения задач.В Deep Research OpenAI AI-модели используют JSON-действия для выполнения шагов.
Hugging Face применяет Code Agent, который написан на программном языке и может выполнять весь процесс в одном цикле, снижая издержки на 30%.
Для работы команда заимствовала два ключевых элемента из Magentic-One от Microsoft:
Текстовый веб-браузер — позволяет агенту искать информацию.
Текстовый инспектор — анализирует файлы различных форматов.
Например, при расчёте стоимости смартфона в разных странах Code Agent Hugging Face может выполнить все вычисления в одном цикле, тогда как системы на основе JSON требуют отдельного шага для каждого действия.
Как AI-агент Hugging Face справляется с тестами?
Для оценки возможностей система была протестирована в бенчмарке GAIA, который проверяет AI-агентов на выполнение многошаговых исследовательских задач.Пример задачи:
«Какие фрукты, изображённые на картине 2008 года «Вышивка из Узбекистана», подавались в меню завтрака в 1949 году на океанском лайнере, который позже использовался в фильме «Последнее путешествие»? Приведите список, отсортированный по часовой стрелке».
Для решения требуется:
Анализ изображения (распознавание фруктов).
Поиск сведений о лайнере и фильме.
Определение меню 1949 года.
Форматирование ответа по заданным критериям.
Результаты теста GAIA:
Hugging Face — 55,15%
Microsoft Magentic-One — 46%
OpenAI Deep Research — 67%
Хотя система Hugging Face пока уступает OpenAI, разрыв между AI с открытым исходным кодом и проприетарными решениями сокращается быстрее, чем ожидалось.