Де голос вписується у AI-search стек
Покупець, який друкує “best crypto licensing firms for fintech startups” у ChatGPT за столом — той самий покупець, що питає Siri “what’s the best crypto licensing firm” у машині. Той самий покупець, інша поверхня, інший бюджет на довжину відповіді.
Голос — це частина AEO-поверхні, не окрема від неї. Структурний рецепт — Hero, X-is-Y intro, Quick Facts, H2-як-питання, FAQ — працює для обох. Що змінюється для голосу — обмеження на довжину відповіді.
Що любить голос
Три речі, які голос екстрагує агресивніше за text-AI:
- Пряма відповідь ≤ 25 слів — навіть жорсткіше, ніж 30-слівне правило FAQ-блоку
- Однореченнєві визначення — для голосу немає paragraph-level екстракції; він бере одне речення
- Валідація schema як hard gate — у голосу немає fallback. Якщо schema malformed, асистент читає сирий текст сторінки і зазвичай вибирає не те речення
FAQ-блок з прямими відповідями ≤ 30 слів — це міст. Якщо твій FAQ структурований під text-AI екстракцію, він на 80% уже готовий до голосової. Підтягни відповіді трохи (ціль ≤ 25 слів) і додай HowTo schema там, де є процес — це і є voice-specific шар.
Voice-first проти voice-secondary
Voice-first ніші. Local services, retail і food / hospitality. Покупці питають голосових асистентів “best dentist near me”, “what’s open right now”, “is X gluten-free”. Для цих ніш голос — це 30–50% AI-search поверхні, і ти оптимізуєш переважно під нього.
Voice-secondary ніші. B2B SaaS, fintech, legal, edtech. Покупці ресерчать це на екранах. Голос грає роль 5–15% — корисно, але не центрально. Оптимізація — той самий рецепт, без додаткового voice-specific шару, окрім schema.
Для voice-first ніш ми додаємо LocalBusiness (або конкретний підтип) schema і пріоритетно ставимо HowTo schema на сторінки процесу. Для voice-secondary стандартний стек покриває все.
Що не працює для голосу
- Long-form контент без direct-answer блоку — голос не може взяти цитату
- Параграфи з умовами (“it depends on…”) — голос плющить це у одне речення
- Відповіді, забиті назвою бренду (“at AcmeCorp we believe…”) — голос вирізає
- Маркетингова вода у FAQ (“our award-winning approach to…”) — голос ігнорує
Питання Speakable schema
У Schema.org є властивість Speakable, спроєктована під голос. Наш досвід: корисна для news і editorial, ігнорується на комерційному / B2B-контенті. Голосові асистенти (Google, Siri, Alexa) переважно екстрагують з FAQPage і HowTo — не зі Speakable.
Ми не розгортаємо Speakable на комерційних сайтах. Investment-to-return слабкий порівняно з підтягуванням FAQPage-відповідей.
Що зробити цього місяця
Якщо ведеш local services бренд — додай LocalBusiness (або конкретний підтип) schema, якщо її ще немає. Підтягни прямі відповіді FAQ до ≤ 25 слів. Валідуй. Це дешевий voice-шар і правильна точка входу.
Якщо ведеш B2B SaaS чи fintech — голос вторинний. Фокус на text-AI оптимізації. Правило 30 слів у FAQ із чотиришарового рецепту покриває 90% голосу побіжно.
Якщо у тебе вже працює AEO-програма — спитай свою команду, чи стрес-тестували вони топ-5 промптів у голосі (Siri / Google Assistant / Alexa) і чи повертає асистент бренд. Якщо ні — це 30 хвилин аудиту і ймовірне підняття цитувань на голосових поверхнях на 10–15% через підтягування FAQ.