Cross-engine prompt research — знайти промпти, що важать

Параметр	Значення
Медіанна довжина LLM-промпта	11–14 слів проти 3–5 у Google-запитів на тому ж бізнес-інтенті
Рекомендований стартовий prompt universe	50–80 промптів на сайт, оновлення раз на квартал
Інвестиція часу	12–16 годин на повний сетап, 2–3 години щокварталу на refresh
Найбільш ігноровне джерело	GSC запити 7+ слів — служать одночасно long-tail SEO-можливостями і LLM-промптами
Коефіцієнт дедупу	Приблизно 3 сирі промпти зливаються в 1 унікальний інтент після дедупу
Сигнал competitive density	Кількість окремих доменів, які двигун цитує у 7-денному вікні на промпт

Не можеш оптимізувати під промпти, яких не бачив. Google keyword volume каже, що люди вбивали у пошуковий рядок торік. Не каже, що питають ChatGPT, Perplexity, Claude чи Gemini сьогодні — і на більшості B2B-ніш розрив достатньо великий, щоб важити.

Ми робимо prompt research на кожному новому ретейнері. Метод нижче пережив чотири ітерації. Не теорія — реальна операційна процедура, з пʼятьма джерелами пулу, правилом дедупу і трьохосьовою моделлю скорингу для відбору working universe.

Чому самих Google-даних мало

Два емпіричних спостереження з нашого портфеля.

LLM-промпти довші. Медіанна довжина у нашому трекінгу — 11–14 слів. Медіана Google-запитів на тому ж бізнес-інтенті — 3–5. Приклад — «best AEO agency for B2B SaaS with 50-200 employees» — це те, що людина питає ChatGPT. «AEO agency» — те, що вбиває у Google. У першого нема Google-volume. Він і далі несе реальний LLM-трафік.

Інтент LLM-промптів зсунутий інакше. Google досі тримає купу навігаційного і short-tail informational. LLM забирають диспропорційну частку commercial-intent і comparison-промптів. Тож навіть коли Google-volume є — LLM-volume на тому ж бренді зосереджений в іншій формі промпта, зазвичай довшій, decision-orient’ованій.

Уперше, коли ми це виміряли, 35–55% pool’у були невидимі, якщо користуватись тільки Google keyword-data. Це розрив, який метод нижче закриває.

Джерело 1 — GSC long-tail запити (7+ слів)

Найдешевше поодиноке джерело. Якщо в тебе Google Search Console верифікований — воно вже в тебе є.

Витягни вимір queries за останні шість місяців. Профільтруй на все ≥7 слів. Це розмовні запити, які Google вже бачить на твоєму бренді — і та сама форма, проти якої LLM індексуються. Деталі — у prompt research vs keyword research, коротка версія: long-tail GSC — найвищий signal-per-hour.

Типовий pull із 6-місячного ретейнерного сайту повертає 40–120 унікальних запитів ≥7 слів. Більшість — шум. Ті 20–30, що збігаються з реальним бізнес-інтентом, — золото.

Джерело 2 — скрейпери типу AnswerThePublic

Інструменти типу AnswerThePublic, AlsoAsked, Keyword Tool — скрейплять Google autocomplete плюс People-Also-Ask і подають як дерево питань. Самі по собі — Google-only autocomplete. Корисні як starting point, бо одразу видають десятки question-shaped промптів.

Catch — ці інструменти Google-центричні. Пропустять промпти, які існують у Perplexity чи ChatGPT, але не виринають у Google PAA. Використовуй як generation-джерело, не як повне.

Цінність — у seed’і. Витягни 100 питань з AnswerThePublic, далі прогани кожне через Джерела 3 і 4, щоб побачити, які LLM трактують як реальні запити.

Джерело 3 — engine-by-engine autocomplete і «people also ask»

У кожного LLM своя версія autocomplete. Perplexity показує related-питання під відповідями. ChatGPT (free) показує suggested follow-ups. Gemini виносить related queries. Bing Copilot має свій PAA-pull. Це first-party сигнали від самого двигуна, що він вважає повʼязаним із твоїм seed-запитом.

Процес — обери 10 seed-промптів, що важать для бізнесу. Прогани через кожен двигун. Для кожного двигуна логай related-запити. Повторюй два тижні. За 14 днів матимеш список 200–400 engine-suggested промптів з атрибуцією на двигун.

Це трудомістко. Зазвичай ділимо між двома членами команди й спільним шпредшітом. Аутпут — найбільш engine-faithful prompt-джерело без платного інструменту.

Джерело 4 — Perplexity API-логи (найчистіший сигнал)

Perplexity — єдиний двигун із реальним API на тому ж retrieval-стеку, що й продукт. Налаштуй малий щоденний скрипт, який ганяє твої seed-промпти проти API і логає citation’и плюс related queries. Сетап ми описали у Perplexity citations tactics.

Що це відкриває — related-query pool у 2–3 рази більший, ніж показує веб-UI за той самий період, бо API не агресивно дедупить між сесіями. Після 30 днів щоденного логання матимеш сильну картину, які промпти Perplexity вважає повʼязаними з твоїм бізнесом.

Кошти низькі — приблизно $30 на місяць на промпти типового ретейнера.

Джерело 5 — 1:1 інтервʼю з покупцями

Єдине джерело, яке більшість команд пропускає. Воно ж — найточніший сигнал того, що покупці реально питають.

Метод — обери 5–8 покупців, що закрились за останні 12 місяців. Запиши 30-хвилинні дзвінки. Питай одне — «якби тобі треба було знайти таку компанію, як наша, сьогодні, без попередніх знань — що б ти вбив у ChatGPT чи Perplexity». Дай подумати і друкувати вголос. Більшість видасть 4–6 окремих промптів за сесію.

З 6 інтервʼю на типовий B2B SaaS зазвичай збираємо 25–40 унікальних промптів. Приблизно половина перетинається з Джерелами 1–4. Друга половина — реально нові, і саме вони найточніше відображають реальне рішення про купівлю, а не дженерик top-of-funnel research.

Якщо запускаєш лише одне з пʼяти джерел — запускай це.

Дедуп — за інтентом, не за рядком

Після pull’у з усіх пʼяти матимеш 400–700 сирих промптів. Більшість перетинаються. «Best AEO agency for SaaS», «top AEO consultant for SaaS company» і «AEO services for SaaS companies» — це один інтент, не три.

Правило дедупу — згортай до унікального інтенту, не унікального рядка. Два промпти у одному кластері, якщо покупець прийме ту ж відповідь на обидва. Перевірка проста — якби ти написав одну answer-сторінку, чи обслужила б вона обидва промпти. Якщо так — дедуп.

Бачимо приблизно 3:1 collapse на cross-engine pool’ах. 600 сирих стає 200 унікальних інтентів. Це число досі завелике, щоб діяти. Скори і пріоритезуй.

Трьохосьова модель скорингу

Кожен унікально-інтентний промпт отримує бал по трьох осях. Кожен — 1–5 ручний скор; не знайшли надійного способу автоматизувати без втрати точності.

Business fit (1–5). Наскільки промпт відповідає тому, що ти реально продаєш. Промпт «best AEO agency» — 5 для AEO-агентства, 1 для непов’язаного SaaS. Більшість промптів у pool’і отримають 2–3 — informational-сусіди, не прямо комерційні.

Поточна citation-видимість (1–5). Чи ти цитуєшся на цей промпт зараз. 5 = цитується на кожному двигуні. 1 = невидимий. Цікавий бакет — 1–2: промпти, які ще не заробив, але міг би.

Competitive density (1–5, менше — краще). Скільки окремих конкурентних доменів двигуни цитують у 7-денному вікні. 1 = тонке поле, легко зайти. 5 = насичено.

Working universe — 50–80 промптів, де business fit 4–5, поточна видимість 1–3, competitive density 1–3. High-fit, low-current-visibility, low-competition. Там живуть наступні квартальні перемоги.

Решту — лишай у лозі, скори ще раз наступний квартал. Prompt-ландшафти зміщуються.

Операційний ритм

Налаштуй метод раз. Refresh — щокварталу.

Квартал 1. Повний метод, всі пʼять джерел. 12–16 годин аналітика. Аутпут — working universe 50–80 промптів зі скорингом.

Наступні квартали. Перезапусти Джерела 1, 3, 4. Пропусти AnswerThePublic і інтервʼю, якщо не онбордиш нові buyer-cohort’и. 2–3 години аналітика. Оновлює існуючий pool плюс ловить нові промпти.

Аутпут лізе прямо у refresh cadence rhythm — на які промпти ціляться щотижневі мікро-правки, які стають квартальними pillar-ставками, які випадають з трекінгу, бо вже не конкурентоспроможні.

Більшість команд обирає промпти так, як обирає ключі — за Google volume і чуттям. Pool, який видає цей метод, менший, але правдивіший. 80 промптів, які можна захистити, переграють 400, які не можна.

Cross-engine prompt research — як знайти промпти, що реально несуть LLM-трафік

Quick Facts