IT и стартапы

Arena достигла $100 млн ARR за 8 месяцев: как лидерборд AI-моделей стал бизнесом

Стартап из UC Berkeley превратил краудсорсинговую оценку нейросетей в коммерческий продукт — и уже конкурирует с Scale AI за бюджеты на пост-тренинг.

Редактор:Казакевич Алексей

2 июл. 20265 мин

Arena достигла $100 млн ARR за 8 месяцев: как лидерборд AI-моделей стал бизнесом

Платформа Arena, которую большинство разработчиков знают как бесплатный рейтинг языковых моделей, объявила о достижении $100 млн в годовом исчислении выручки. На это ушло всего восемь месяцев с момента запуска коммерческого продукта — результат, который сами основатели называют неожиданным даже для себя.

Arena выросла из исследовательского проекта Калифорнийского университета в Беркли в 2023 году. Публичная часть платформы работает просто: пользователь вводит запрос, система отправляет его двум моделям одновременно, а затем человек выбирает, какой ответ лучше. За три года таких сравнений накопилось более 10 миллионов оценок — это и есть основа рейтинга, которому доверяют исследователи и инженеры по всему миру.

Как бесплатный рейтинг превратился в платный продукт

В сентябре 2024 года Arena запустила AI Evaluations — коммерческий сервис для лабораторий и корпораций. Вместо агрегированного публичного рейтинга клиенты получают детальную аналитику производительности своих моделей, собранную из той же краудсорсинговой базы. По сути, компания монетизировала то, что уже существовало: сообщество оценщиков, которых привлекает ранний доступ к ещё не выпущенным моделям.

Важный нюанс: несмотря на то что Arena использует аббревиатуру ARR, генеральный директор Анастасиос Ангелопулос уточнил, что речь идёт о потреблении, а не о подписке. Клиенты платят за объём использования, а не фиксированную ежемесячную сумму. Это означает, что выручка может колебаться вместе с активностью рынка — что одновременно и риск, и показатель реального спроса.

««Многие до сих пор не понимают, что наш бизнес вообще зарабатывает деньги. Люди по-прежнему воспринимают нас как open source проект», — сказал Ангелопулос в интервью TechCrunch.»

Динамика роста впечатляет: когда в январе 2025 года Arena объявила о привлечении $150 млн в раунде Series A при оценке $1,7 млрд, её годовая выручка составляла $30 млн. За следующие несколько месяцев показатель вырос более чем втрое.

Конкуренция за бюджеты на пост-тренинг моделей

Arena не имеет прямых аналогов: стартап Yupp, который строил похожую краудсорсинговую платформу выбора моделей, закрылся в марте 2025 года. Однако Ангелопулос признаёт, что компания борется за те же бюджеты, что и сервисы разметки данных — Mercor, Surge и Scale AI. Все они помогают разработчикам моделей улучшать качество на этапе пост-тренинга.

Рынок пост-тренинговой оптимизации сейчас на подъёме. По данным The Information, годовая выручка Handshake от AI-тренинга почти удвоилась с января — с $550 млн до почти $1 млрд. Mercor в начале 2025 года превысил отметку $1 млрд, тогда как в сентябре 2024-го показатель был вдвое меньше. Спрос со стороны крупных AI-лабораторий на качественные человеческие оценки продолжает расти.

Arena оценивает модели по широкому спектру задач: текстовая генерация, программирование, компьютерное зрение, создание изображений. Недавно платформа добавила Agent Mode — режим для тестирования сложных многошаговых сценариев с AI-агентами, что открывает новый сегмент корпоративных клиентов.

Компанию основали трое выходцев из UC Berkeley: сам Ангелопулос (CEO), Вэй-Лин Чян (CTO) и профессор Ион Стойка — один из сооснователей Databricks, который курировал проект ещё до его корпоративного оформления в апреле 2025 года. Всего Arena привлекла $250 млн от инвесторов, среди которых Andreessen Horowitz, Kleiner Perkins, Lightspeed Venture Partners и Felicis.

Что это значит для рынка AI-оценки

История Arena показывает работающую модель монетизации в AI-инфраструктуре: сначала создать доверие через открытый инструмент, затем продавать глубину тем, кому нужны детали. Это особенно актуально в контексте того, что крупные AI-лаборатории — OpenAI, Anthropic, Google DeepMind — тратят огромные ресурсы на улучшение моделей после базового обучения, и им нужны независимые бенчмарки.

Для белорусских IT-компаний, работающих с AI-продуктами или предоставляющих услуги разработки под заказ, кейс Arena релевантен с нескольких сторон. Во-первых, он демонстрирует, что инфраструктурные инструменты для оценки моделей — это отдельный и быстрорастущий рынок. Во-вторых, краудсорсинговый подход к сбору данных, который лежит в основе платформы, потенциально воспроизводим в нишевых доменах — например, для оценки моделей на специфических языках или профессиональных задачах. Резидентам ПВТ, занимающимся AI-разработкой, стоит следить за тем, как Arena будет расширять партнёрскую программу для корпоративных клиентов.

Пока рынок пост-тренинговой оптимизации продолжает консолидироваться вокруг нескольких крупных игроков, Arena занимает нишу независимого арбитра качества — и судя по темпам роста выручки, эта позиция оказалась коммерчески очень ценной.

— По материалам TechCrunch: оригинальная статья. Перевод и адаптация — редакция Digital Business.

Теги:#Искусственный интеллект #Стартапы #Венчур #benchmarks

Поделиться VK

Редакция

30 июн. 20266 мин