IT и стартапы

Perplexity представила Search as Code: ИИ-агенты пишут поисковые сценарии сами

Новая архитектура позволяет языковым моделям генерировать Python-скрипты вместо вызова фиксированных API — и сокращает расход токенов на 85%.

Редактор:Казакевич Алексей

10 июн. 20266 мин

Perplexity представила Search as Code: ИИ-агенты пишут поисковые сценарии сами

Perplexity анонсировала архитектуру Search as Code (SaC), которая меняет саму логику взаимодействия языковых моделей с поисковыми системами. Вместо того чтобы вызывать готовый API и получать стандартный список результатов, модель генерирует собственный Python-скрипт, выполняет его в защищённой среде и управляет поиском на уровне отдельных операций. По данным компании, в тестах на реальных задачах новый подход сократил расход токенов на 85% и превзошёл конкурентов на четырёх из пяти бенчмарков.

Почему стандартный поиск стал узким местом для агентов

Современные поисковые системы проектировались под человека: пользователь вводит запрос, получает список ссылок, кликает. Для ИИ-агента, которому нужно выполнить сотни запросов за несколько минут, такая схема работает плохо. Агент может менять только поисковую фразу — всё остальное остаётся чёрным ящиком.

Perplexity описывает эту ситуацию как структурный тупик в своём техническом отчёте. Стандартный пайплайн вынужден загружать в контекстное окно модели весь «мусор» из результатов поиска, потому что логика фильтрации заблокирована внутри API. Чем длиннее исследовательская сессия, тем больше нерелевантных данных накапливается — и тем хуже модель удерживает нить рассуждений.

Search as Code решает эту проблему радикально: модель сама пишет фильтры, сама решает, что включать в контекст, и сама определяет порядок запросов. Контекстное окно остаётся компактным, а агент сохраняет ориентацию даже в многошаговых задачах.

Три слоя архитектуры и тест на уязвимостях

Архитектура SaC состоит из трёх уровней. Верхний — языковая модель, которая понимает задачу и формирует стратегию поиска. Средний — изолированная песочница, где выполняется сгенерированный код. Нижний — Agentic Search SDK, который разбивает поисковый движок Perplexity на отдельные переиспользуемые функции: получение результатов, фильтрация, дедупликация, ранжирование.

Стандартные API никуда не исчезают — они остаются для простых, однозначных запросов. Но когда задача сложная, модель уходит глубже: запускает параллельные запросы, программно отсеивает нерелевантные источники и тянет в контекст только то, что действительно нужно.

Чтобы продемонстрировать возможности SaC, Perplexity протестировала архитектуру на задаче из области кибербезопасности. Агенту поручили собрать данные о 200 критических уязвимостях (CVE), опубликованных с 2023 по 2025 год. По каждой нужно было найти официальный бюллетень вендора, затронутое ПО и точную версию патча — новостные статьи и блоги не считались.

Модель написала трёхэтапный скрипт. Сначала — параллельные запросы с учётом того, как конкретные вендоры вроде Mozilla или Google оформляют свои бюллетени безопасности. Затем — анализ собственных результатов, выявление пробелов и точечные дополнительные запросы. Наконец — верификация по схеме: CVE, продукт и версия патча должны совпасть. Агент справился, потратив при этом на 85% меньше токенов, чем стандартный пайплайн. Конкурирующие системы правильно закрыли менее четверти задач.

Сравнение с OpenAI и Anthropic

Perplexity утверждает, что SaC обошла Responses API от OpenAI и Managed Agents от Anthropic на четырёх из пяти бенчмарков. Наибольший разрыв зафиксирован на WANDR — внутреннем бенчмарке Perplexity для широких исследовательских задач, который компания планирует опубликовать в ближайшее время. Единственная категория, где SaC фактически сыграла вничью с OpenAI, — HLE.

К самооценке через собственные бенчмарки стоит относиться с осторожностью: компания сама формирует условия теста и интерпретирует результаты. Тем не менее сравнение SaC со старым пайплайном Perplexity на одном и том же железе показывает устойчивый прирост по всем пяти категориям — и это уже сложнее оспорить.

Search as Code уже доступна в Perplexity Computer и через Agent API. Компания позиционирует её как часть более широкого тренда: наиболее мощные системы сочетают языковые модели для стратегии, детерминированные среды выполнения для пакетной обработки и поисковую инфраструктуру как слой ввода-вывода.

Что это значит для разработчиков и рынка

SaC затрагивает проблему, которая давно беспокоит исследователей. Недавнее независимое исследование показало: популярные поисковые агенты нередко «жульничают» на бенчмарках вроде BrowseComp — вместо реального поиска они извлекают ответы из обучающих данных и используют веб только для подтверждения. Когда тех же агентов тестировали на свежих фактах, результаты падали на 25–40 пунктов. Все эти системы работали на стандартных поисковых инструментах.

Отдельный обзорный доклад фиксирует, что написание кода становится основным способом взаимодействия агентов с внешним миром. Авторы называют код новым операционным слоем для автономных систем и указывают, что реальным узким местом становится уже не сама модель, а окружающая инфраструктура: инструменты, песочницы, механизмы верификации.

Для белорусских разработчиков, которые строят агентные системы или интегрируют поиск в продукты, SaC — это сигнал о направлении рынка. Компании в ПВТ, работающие с RAG-пайплайнами и корпоративными ИИ-решениями, уже сейчас сталкиваются с теми же проблемами: раздутые контексты, нерелевантные результаты, высокая стоимость токенов. Подход «поиск как код» предлагает архитектурный ответ, который можно адаптировать независимо от того, используется ли инфраструктура Perplexity или собственный поисковый бэкенд.

— По материалам The Decoder: оригинальная статья. Перевод и адаптация — редакция Digital Business.

Теги:#Искусственный интеллект #search #perplexity #ai agents #llm

Поделиться VK

Редакция

25 июн. 20266 мин