603 слитых фактора ранжирования Google: что подтверждается источниками, а что Google отрицал в суде
Команда собрала 603 фактора ранжирования Google из четырёх источников: слива Content Warehouse, суда US v. Google, патентов и QRG. Каждый фактор отмечен по уровню доказанности — от подтверждённого до спорного.
Обычно факторы ранжирования Google разбирают по отдельности: то слив, то патенты, то судебные показания. Наш исследовательский отдел захотел сложить всё вместе и сделать перекрёстный анализ — с обнаружением взаимосвязей между источниками. Материала оказалось много: по словам Аркадия, главы отдела, перелопатили слив Content Warehouse (7000+ страниц), 2300+ патентов Google, показания Google в суде с DOJ и руководство для асессоров (QRG).
Что в основе
Методичка сводит пять слоёв данных: LEAK (слив имён полей и признаков), COURT (материалы US v. Google), PATENT (первичные патенты), QRG (Search Quality Rater Guidelines) и GPATENT (дополнительный патентный слой). На выходе — 603 канонических фактора и ещё 404 патентные карточки.
Но главное — не сам список, а подтверждающий анализ. Для каждого фактора указано, насколько он правдоподобен:
- 66 факторов — класс «официальное подтверждает неофициальное»: патент или QRG подтверждает механизм, который всплыл в сливе. Это самое вкусное — когда официальный документ Google подтверждает то, что лежит в неофициальной утечке;
- 17 — подтверждены несколькими типами источников;
- 514 — задокументированы в одном источниковом слое;
- 2 — спорные: там, где данные показывают сигнал, а Google в суде его фактически отрицал.
Что внутри (примеры факторов)
Чтобы было предметно: в базе разобраны NavBoost (кликовая модель ранжирования с 13-месячным окном, подтверждена судом), Q* (статический сайт-привязанный сигнал качества, где PageRank — ключевой вход), Content Effort (LLM-оценка реального труда, вложенного в статью), Racter (классификатор массового AI-контента, понижающий весь домен), отдельный буст для малых авторских сайтов и Anchor Mismatch Demotion (штраф за несоответствие анкора содержанию страницы).
Особо подсвечены косвенно подтверждённые механизмы — когда официальный патент Google подтверждает то, что всплыло в сливе: например Information Gain (глубина и уникальность фактов), Web Quotes (цитирование в контексте, а не только ссылки) и соотношение брендовых запросов к ссылочному профилю.
Слово Аркадия
«Заодно это был стресс-тест: насколько ИИ-агенты тянут реально большие и грязные данные. Спарсить, почистить, собрать, вытащить факты и не растерять их по дороге — один слив 7000+ страниц, 2300+ патентов. Получилось на удивление достойно».
Честная оговорка от команды: итоговой формулы ранжирования и весов факторов в методичке нет — их в данных и не существует. Логика простая: если поле в сливе есть, а Google про него молчит, оно либо устарело, либо его сознательно не выпячивают. Каждый практический совет нужно читать как гипотезу для проверки на своих данных, а не как правило.
Что дальше и зачем это вам
Следующий шаг команды — собрать ИИ-агента, который сам ходит в эту базу и анализирует страницу по факторам. Пока прорабатывается архитектура, чтобы данные снова не терялись.
Практическая ценность для SEO и арбитража прямая, особенно на фоне майского core-апдейта (разбор выше): вместо гонки за «секретными факторами» — приоритизация по уровню доказанности. Берите факторы класса «официально подтверждён», ищите, где у вас совпадает проблема с сильным фактором, и проверяйте гипотезу на когорте URL. Это не обещание роста позиций, а способ перестать гадать и работать с тем, что Google реально измеряет.
Материалы по теме
Вставить свои 5 копеек: