🔥 Google опять врёт. Разбор руководства для AI-поиска (от 15 мая 2026)….
🔥 Google опять врёт. Разбор руководства для AI-поиска (от 15 мая 2026). Часть 3.
Google сказал: "Чанкинг не нужен". Это типичное вранье. Дословно звучит так:
"Вам не нужно разбивать контент на маленькие части. Google понимает страницы с несколькими темами"
Звучит разумно. Проблема одна — это противоречит собственным исследованиям Google.
В 2024 году Google Research выпустил MUVERA (Multi-Vector Retrieval via Fixed Dimensional Encodings). Этот алгоритм — основа retrieval-слоя в современных AI-системах — делает следующее: берёт страницу и разбивает её на passage-level векторы, каждый из которых представляет отдельный смысловой блок. Затем сравнивает каждый блок с запросом пользователя. Результат в их же публикации: +10% recall при −90% задержки по сравнению с предыдущими методами.
То есть Google внутри строит систему, которая автоматически чанкирует ваш контент. И одновременно говорит вам, что чанкинг не нужен.
С 2021 года в Google работает Passage Indexing — официальная фича, которая ранжирует отдельные пассажи страницы независимо от её общего содержания. Если система ранжирует части — качество этих частей имеет значение (вот ссылка на хорошую статью).
Mike King из iPullRank провёл прямой тест на Gemini API — той же системе, что стоит за AI Overviews. Взял абзац, одновременно покрывающий "machine learning" и "data privacy". Измерил cosine similarity к каждой теме:
Цельный абзац: 0.648 / 0.695
После разбивки на два тематически чистых фрагмента: 0.748 / 0.763
Прирост retrieval score: +15% и +10%.
Это измеримый результат в той самой системе, которую Google использует для отбора источников в AI Overviews.
Bing при этом гораздо честней. В мае 2026 он опубликовал документ. Там сказано: процессы чанкирования могут исказить смысл вашего контента при попадании в AI-ответ. Если ваш текст не выживает при разбивке на части — он войдёт в AI Overviews в искажённом виде или не войдёт вовсе.
Почему Google постоянно врет? Да потому, что если в SEO верят, что "всё то же самое" и чанкинг не нужен — они не нанимают GEO/AEO-специалистов, не выделяют бюджет на ChatGPT, Perplexity и Claude-оптимизацию, не инвестируют в brand presence за пределами Google.
Google — это не ваш партнёр по трафику. Это конкурент в борьбе за внимание пользователя.
Выводы таковы:
Дробить сайт на тысячи микро-страниц — не нужно. Google тут прав. Но дробить смысловые блоки внутри страницы — критически важно.
1. Принцип "одна идея — один абзац". Каждый абзац должен содержать одно утверждение + обоснование. Не "machine learning и конфиденциальность данных — это важные темы в современном AI" в одном абзаце. А два отдельных блока: один про ML, один про privacy.
2. Ключевые факты страницы (цены, характеристики, выводы, определения) должны быть в чистом тексте, в первой трети материала, не в JS-компонентах и не в аккордеонах. Именно этот фрагмент grounding-слой читает в первую очередь.
3. Атрибутируемые утверждения — не нарратив. Замените: "многие эксперты считают, что скорость загрузки влияет на конверсии" на: "По данным Google (2024), снижение LCP с 4s до 2.5s увеличивает конверсии на 12%". Провенанс — автор, дата, источник — это то, что AI-система использует для верификации при grounding.
4. Заголовки как "якоря retrieval". Каждый H2/H3 должен быть самодостаточным вопросом или утверждением. Плохо: "Дополнительные сведения". Хорошо: "Почему скорость загрузки влияет на позиции в 2026 году". Система должна уметь "вырвать" секцию вместе с заголовком и получить полноценный смысловой блок.
Чанкинг — это то, что RAG-системы делают с контентом без вашего участия. Вопрос только в том, насколько ваш текст выживает при этом процессе с сохранением смысла.
📔 DrMax: Доказательное SEO 2026 + Введение в Промптоведение:
📚 25 PRO промптов + Pocketbook DrMax: Промптоведение для SEO-стратегов 2026
#DrMax #SEO #Google
Вставить свои 5 копеек: