Перейти к содержимому
IT и стартапы

Словарь AI-терминов: что на самом деле означают LLM, RAG, AGI и другие аббревиатуры

Разбираем ключевые понятия искусственного интеллекта, которые всё чаще встречаются в деловой и технической среде — без воды и лишних упрощений.

Казакевич Алексей
6 мин
Словарь AI-терминов: что на самом деле означают LLM, RAG, AGI и другие аббревиатуры

Искусственный интеллект не только меняет индустрии — он создаёт собственный язык, которым всё активнее пользуются инвесторы, разработчики и менеджеры. Пять минут чтения любого отраслевого материала — и вы уже утопаете в аббревиатурах: LLM, RAG, RLHF, AGI. Этот материал — попытка разобраться в ключевых терминах без академической зауми, но и без чрезмерного упрощения.

Базовые концепции: от AGI до агентов

AGI (Artificial General Intelligence) — пожалуй, самый спорный термин в отрасли. Под ним понимают ИИ, способный превосходить среднего человека в большинстве задач. Генеральный директор OpenAI Сэм Альтман описывал AGI как «эквивалент среднестатистического сотрудника, которого можно нанять на работу». Устав той же компании трактует AGI как «высокоавтономные системы, превосходящие людей в большинстве экономически значимых задач». Google DeepMind формулирует иначе: ИИ, который «как минимум не уступает человеку в большинстве когнитивных задач». Три определения от трёх ведущих игроков — и ни одного консенсуса. Это само по себе говорит о том, насколько размыто понятие на практике.

AI-агент — инструмент, который выполняет многошаговые задачи самостоятельно, без участия человека на каждом этапе. Не просто отвечает на вопрос, как чат-бот, а бронирует билеты, подаёт заявки на возврат расходов, пишет и поддерживает код. Агент может задействовать сразу несколько AI-систем для достижения одной цели. Инфраструктура под такие сценарии ещё строится, поэтому термин пока размытый — разные компании вкладывают в него разный смысл.

Coding agent — частный случай AI-агента, заточенный под разработку программного обеспечения. Такой агент не просто предлагает фрагмент кода для вставки — он пишет, тестирует и отлаживает код самостоятельно, работая со всей кодовой базой. Находит баги, запускает тесты, вносит правки с минимальным контролем со стороны человека. Аналогия из оригинала точная: очень быстрый стажёр, который не спит и не теряет концентрацию — но его работу всё равно нужно проверять.

API endpoints — это «кнопки» на бэкенде программного обеспечения, которые другие приложения могут нажимать, чтобы заставить его что-то сделать. Разработчики используют их для интеграций: одно приложение тянет данные из другого, AI-агент управляет сторонними сервисами без ручного вмешательства. По мере роста возможностей агентов они всё чаще находят и используют такие точки входа самостоятельно — что открывает как новые сценарии автоматизации, так и новые риски безопасности.

Как модели учатся и думают

Chain of thought (цепочка рассуждений) — подход, при котором языковая модель разбивает сложную задачу на промежуточные шаги, прежде чем дать финальный ответ. Аналог того, как человек берёт ручку и бумагу, чтобы решить задачу с курами и коровами, а не пытается угадать ответ сходу. Ответ занимает больше времени, зато точность — особенно в логических и программных задачах — существенно выше. Именно на этом принципе строятся так называемые reasoning models.

Deep learning (глубокое обучение) — подраздел машинного обучения, в котором алгоритмы организованы в многослойные искусственные нейронные сети, имитирующие структуру нейронов мозга. Такие системы сами выявляют важные признаки в данных — без того, чтобы инженеры задавали их вручную. Они учатся на ошибках и итеративно улучшают результаты. Обратная сторона: для хорошей работы нужны миллионы точек данных, а обучение обходится дороже, чем у более простых моделей.

Diffusion (диффузия) — технология, лежащая в основе большинства генеративных моделей для изображений, музыки и текста. Принцип заимствован из физики: система постепенно «разрушает» структуру данных, добавляя шум, пока от исходного не остаётся ничего. Затем модель учится обратному процессу — восстанавливать данные из шума. Именно так работают популярные генераторы изображений.

Distillation (дистилляция) — техника переноса знаний от большой модели («учитель») к меньшей («ученик»). Разработчики отправляют запросы учителю, фиксируют его ответы и используют их для обучения ученика. Результат — компактная, быстрая модель, которая ведёт себя похоже на крупную. Предположительно, именно так OpenAI создала GPT-4 Turbo. Важный нюанс: дистилляция чужой модели, как правило, нарушает условия использования её API — это актуально для любой компании, которая строит продукты на базе сторонних LLM, в том числе белорусских стартапов из ПВТ.

Fine-tuning (дообучение) — дополнительное обучение уже готовой модели на специализированных данных, чтобы она лучше справлялась с конкретной задачей или отраслью. Именно этот путь выбирает большинство AI-стартапов: берут крупную базовую модель и «затачивают» её под медицину, юриспруденцию, финансы или другую нишу. Для белорусских команд, работающих в ПВТ, это один из наиболее реалистичных способов создать конкурентный продукт без миллиардных бюджетов на обучение с нуля.

GAN (Generative Adversarial Network) — архитектура машинного обучения, в которой две нейронные сети соревнуются друг с другом. Первая генерирует данные (например, изображения), вторая оценивает их на реалистичность. В процессе «соревнования» обе сети улучшаются. GAN лежат в основе многих технологий создания дипфейков и синтетических медиа — тема, которая становится всё более актуальной с точки зрения регулирования и информационной безопасности.

Compute (вычислительные мощности) — обобщённый термин для аппаратной инфраструктуры, на которой работают AI-модели: GPU, CPU, TPU и другие специализированные чипы. Именно доступ к compute определяет, кто может обучать самые мощные модели. Это ключевой ресурс в глобальной технологической гонке — и одна из причин, почему крупные облачные провайдеры сейчас инвестируют в собственные AI-чипы.

Понимание этих терминов — не академическое упражнение. Для разработчика, менеджера продукта или инвестора это рабочий инструмент: он позволяет точнее оценивать технические решения, задавать правильные вопросы на переговорах и не попадаться на маркетинговый туман, которым перегрет рынок AI прямо сейчас.

— По материалам TechCrunch: оригинальная статья. Перевод и адаптация — редакция Digital Business.

ПоделитьсяVK

Свежие новости

Все новости