Не можеш оптимізувати під промпти, яких не бачив. Google keyword volume каже, що люди вбивали у пошуковий рядок торік. Не каже, що питають ChatGPT, Perplexity, Claude чи Gemini сьогодні — і на більшості B2B-ніш розрив достатньо великий, щоб важити.
Ми робимо prompt research на кожному новому ретейнері. Метод нижче пережив чотири ітерації. Не теорія — реальна операційна процедура, з пʼятьма джерелами пулу, правилом дедупу і трьохосьовою моделлю скорингу для відбору working universe.
Чому самих Google-даних мало
Два емпіричних спостереження з нашого портфеля.
LLM-промпти довші. Медіанна довжина у нашому трекінгу — 11–14 слів. Медіана Google-запитів на тому ж бізнес-інтенті — 3–5. Приклад — «best AEO agency for B2B SaaS with 50-200 employees» — це те, що людина питає ChatGPT. «AEO agency» — те, що вбиває у Google. У першого нема Google-volume. Він і далі несе реальний LLM-трафік.
Інтент LLM-промптів зсунутий інакше. Google досі тримає купу навігаційного і short-tail informational. LLM забирають диспропорційну частку commercial-intent і comparison-промптів. Тож навіть коли Google-volume є — LLM-volume на тому ж бренді зосереджений в іншій формі промпта, зазвичай довшій, decision-orient’ованій.
Уперше, коли ми це виміряли, 35–55% pool’у були невидимі, якщо користуватись тільки Google keyword-data. Це розрив, який метод нижче закриває.
Джерело 1 — GSC long-tail запити (7+ слів)
Найдешевше поодиноке джерело. Якщо в тебе Google Search Console верифікований — воно вже в тебе є.
Витягни вимір queries за останні шість місяців. Профільтруй на все ≥7 слів. Це розмовні запити, які Google вже бачить на твоєму бренді — і та сама форма, проти якої LLM індексуються. Деталі — у prompt research vs keyword research, коротка версія: long-tail GSC — найвищий signal-per-hour.
Типовий pull із 6-місячного ретейнерного сайту повертає 40–120 унікальних запитів ≥7 слів. Більшість — шум. Ті 20–30, що збігаються з реальним бізнес-інтентом, — золото.
Джерело 2 — скрейпери типу AnswerThePublic
Інструменти типу AnswerThePublic, AlsoAsked, Keyword Tool — скрейплять Google autocomplete плюс People-Also-Ask і подають як дерево питань. Самі по собі — Google-only autocomplete. Корисні як starting point, бо одразу видають десятки question-shaped промптів.
Catch — ці інструменти Google-центричні. Пропустять промпти, які існують у Perplexity чи ChatGPT, але не виринають у Google PAA. Використовуй як generation-джерело, не як повне.
Цінність — у seed’і. Витягни 100 питань з AnswerThePublic, далі прогани кожне через Джерела 3 і 4, щоб побачити, які LLM трактують як реальні запити.
Джерело 3 — engine-by-engine autocomplete і «people also ask»
У кожного LLM своя версія autocomplete. Perplexity показує related-питання під відповідями. ChatGPT (free) показує suggested follow-ups. Gemini виносить related queries. Bing Copilot має свій PAA-pull. Це first-party сигнали від самого двигуна, що він вважає повʼязаним із твоїм seed-запитом.
Процес — обери 10 seed-промптів, що важать для бізнесу. Прогани через кожен двигун. Для кожного двигуна логай related-запити. Повторюй два тижні. За 14 днів матимеш список 200–400 engine-suggested промптів з атрибуцією на двигун.
Це трудомістко. Зазвичай ділимо між двома членами команди й спільним шпредшітом. Аутпут — найбільш engine-faithful prompt-джерело без платного інструменту.
Джерело 4 — Perplexity API-логи (найчистіший сигнал)
Perplexity — єдиний двигун із реальним API на тому ж retrieval-стеку, що й продукт. Налаштуй малий щоденний скрипт, який ганяє твої seed-промпти проти API і логає citation’и плюс related queries. Сетап ми описали у Perplexity citations tactics.
Що це відкриває — related-query pool у 2–3 рази більший, ніж показує веб-UI за той самий період, бо API не агресивно дедупить між сесіями. Після 30 днів щоденного логання матимеш сильну картину, які промпти Perplexity вважає повʼязаними з твоїм бізнесом.
Кошти низькі — приблизно $30 на місяць на промпти типового ретейнера.
Джерело 5 — 1:1 інтервʼю з покупцями
Єдине джерело, яке більшість команд пропускає. Воно ж — найточніший сигнал того, що покупці реально питають.
Метод — обери 5–8 покупців, що закрились за останні 12 місяців. Запиши 30-хвилинні дзвінки. Питай одне — «якби тобі треба було знайти таку компанію, як наша, сьогодні, без попередніх знань — що б ти вбив у ChatGPT чи Perplexity». Дай подумати і друкувати вголос. Більшість видасть 4–6 окремих промптів за сесію.
З 6 інтервʼю на типовий B2B SaaS зазвичай збираємо 25–40 унікальних промптів. Приблизно половина перетинається з Джерелами 1–4. Друга половина — реально нові, і саме вони найточніше відображають реальне рішення про купівлю, а не дженерик top-of-funnel research.
Якщо запускаєш лише одне з пʼяти джерел — запускай це.
Дедуп — за інтентом, не за рядком
Після pull’у з усіх пʼяти матимеш 400–700 сирих промптів. Більшість перетинаються. «Best AEO agency for SaaS», «top AEO consultant for SaaS company» і «AEO services for SaaS companies» — це один інтент, не три.
Правило дедупу — згортай до унікального інтенту, не унікального рядка. Два промпти у одному кластері, якщо покупець прийме ту ж відповідь на обидва. Перевірка проста — якби ти написав одну answer-сторінку, чи обслужила б вона обидва промпти. Якщо так — дедуп.
Бачимо приблизно 3:1 collapse на cross-engine pool’ах. 600 сирих стає 200 унікальних інтентів. Це число досі завелике, щоб діяти. Скори і пріоритезуй.
Трьохосьова модель скорингу
Кожен унікально-інтентний промпт отримує бал по трьох осях. Кожен — 1–5 ручний скор; не знайшли надійного способу автоматизувати без втрати точності.
Business fit (1–5). Наскільки промпт відповідає тому, що ти реально продаєш. Промпт «best AEO agency» — 5 для AEO-агентства, 1 для непов’язаного SaaS. Більшість промптів у pool’і отримають 2–3 — informational-сусіди, не прямо комерційні.
Поточна citation-видимість (1–5). Чи ти цитуєшся на цей промпт зараз. 5 = цитується на кожному двигуні. 1 = невидимий. Цікавий бакет — 1–2: промпти, які ще не заробив, але міг би.
Competitive density (1–5, менше — краще). Скільки окремих конкурентних доменів двигуни цитують у 7-денному вікні. 1 = тонке поле, легко зайти. 5 = насичено.
Working universe — 50–80 промптів, де business fit 4–5, поточна видимість 1–3, competitive density 1–3. High-fit, low-current-visibility, low-competition. Там живуть наступні квартальні перемоги.
Решту — лишай у лозі, скори ще раз наступний квартал. Prompt-ландшафти зміщуються.
Операційний ритм
Налаштуй метод раз. Refresh — щокварталу.
Квартал 1. Повний метод, всі пʼять джерел. 12–16 годин аналітика. Аутпут — working universe 50–80 промптів зі скорингом.
Наступні квартали. Перезапусти Джерела 1, 3, 4. Пропусти AnswerThePublic і інтервʼю, якщо не онбордиш нові buyer-cohort’и. 2–3 години аналітика. Оновлює існуючий pool плюс ловить нові промпти.
Аутпут лізе прямо у refresh cadence rhythm — на які промпти ціляться щотижневі мікро-правки, які стають квартальними pillar-ставками, які випадають з трекінгу, бо вже не конкурентоспроможні.
Більшість команд обирає промпти так, як обирає ключі — за Google volume і чуттям. Pool, який видає цей метод, менший, але правдивіший. 80 промптів, які можна захистити, переграють 400, які не можна.