Большая языковая модель A-Vibe от «Авито» заняла первое место среди облегченных моделей в независимом российском бенчмарке MERA. Таким образом, она обошла международные аналоги от OpenAI, Google и Anthropic. В рейтинге учитывались результаты небольших моделей (до 10 млрд параметров) – такие нейросети быстры в работе и потребляют меньше ресурсов.
Бенчмарк MERA — это российский стандарт оценки языковых моделей, разработанный научным сообществом. Проект поддерживает Альянс ИИ, ведущие индустриальные игроки и академические партнеры, которые занимаются исследованием языковых моделей.
Результаты замера показали, что A-Vibe лучше аналогичных моделей понимает запросы, генерирует код и поддерживает осмысленный диалог. Технология уже работает в сервисах «Авито» — например, помогает продавцам писать продающие описания и быстрее договариваться о сделке в мессенджере. До конца года компания планирует добавить еще 20 новых сценариев, а в будущем может открыть код модели для всех.

«Первое место доказывает, что оптимизированная архитектура и качественные данные могут обеспечить отличные результаты даже при небольшом размере модели. A-Vibe создавалось оптимальной по соотношению между качеством, скоростью работы и затратой ресурсов. Такой баланс позволяет обеспечивать быструю обработку запросов даже в периоды пиковой нагрузки и масштабировать технологию на всю аудиторию платформы. Именно обучение небольшой модели под наши нужды позволяет нам закладывать окупаемость инвестиций: «Авито» планирует вложить в GenAI около 12 млрд рублей, а заработать более 21 млрд рублей к 2028 году», – рассказал старший директор по данным и аналитике «Авито» Андрей Рыбинцев.
Разработчики постоянно совершенствовали нейросеть. Благодаря этому, сейчас A-Vibe может одновременно обрабатывать до 32 тыс. текстовых фрагментов (токенов), а значит способна эффективно работать с объемными текстами.
Руководитель разработки больших языковых моделей «Авито» Анастасия Рысьмятова отмечает, что сейчас рассматривается возможность выпуска модели в открытый доступ. «Это поможет малому бизнесу внедрять передовые технологии без значительных инвестиций, образовательным учреждениям создавать прикладные программы, а независимым разработчикам строить современные сервисы на базе отечественных технологий. Для нас это возможность получить ценную обратную связь от рынка и улучшить наши модели», — комментирует Анастасия Рысьмятова.
*Чтобы попасть в рейтинг, в фильтре «Размер модели» выберите «≥5B — 10B». Это значит, что в рейтинг попадут модели размером от 5 до 10 миллиардов параметров. Цифры HUMAN BENCHMARK — это реальные результаты людей. Языковые модели приближаются к этим значениям, но окончательно превзойти человека ещё не смогли