AdvertBench
Marketing
Описание
Эксперимент по оценке способности LLM создавать рекламные изображения с использованием инструментов в песочнице E2B.
Original (EN)
ranking the ability of LLMs to create image ads — Experiment that I've made. The models get access to an E2B sandbox and are instructed to create an ad according to the specifications (they can choose whatever tools they want to use for it, e.g. Pillow, Chromium) as a proxy for their ability to use tools, create other kinds of images, do complex layouts etc. Currently Opus 4.8 is on top (not surprising, but it did take 66 conversation turns to create the image) and GLM-5.2 is on fifth (which I do find surprising because it doesn't have image capabilty).
Проблема
Сложность автоматизации создания сложных рекламных макетов с использованием ИИ.
Решение
LLM самостоятельно выбирают инструменты (Pillow, Chromium) для генерации изображений по спецификациям.
Для кого
Исследователи ИИ и маркетологи, оценивающие возможности генеративных моделей.
Идея для адаптации в РБ
1. Интеграция с белорусскими маркетплейсами (Onliner, Kufar) для автоматической генерации рекламных баннеров под локальные товары (евроопт, белвест) с адаптацией под визуал брендов. 2. Партнёрство с ПВТ-резидентами (например, MSQRD, AIMATTER) для тестирования генерации рекламы под нишевые IT-продукты с учётом белорусской локализации (ERIP-платежи, MTS Cashback).
⚠ AI-черновик. Используй как seed для собственных идей — конкретные цифры, ниши и партнёров проверяй сам.