Главная страница TG News ​Как работает Google Search: Поясняем за Retrieval и Ranking
Mike Blazer
03.12.2025
Mike Blazer

​Как работает Google Search: Поясняем за Retrieval и Ranking

Как работает Google Search: Поясняем за Retrieval и Ranking

Согласно официальной доке Vertex & Cloud, подход Гугла к выдаче результатов — это двухфазный процесс: сначала Retrieval (сбор широкого пула потенциально релевантных документов), а затем Ranking (ранжирование этого сабсета для финальной презентации).

Ранжировать вообще все доступные доки было бы слишком затратно по ресурсам, отсюда и последовательность.

1. Retrieval: Поиск кандидатов

Начальный этап: поисковая модель понимает запрос юзера и переписывает его, затем определяет большой сабсет доков (потенциально тысячи) из своих огромных хранилищ, которые релевантны.

Этот процесс опирается на различные сигналы для присвоения начального скора релевантности:

📍Topicality (Топикальность): Сюда входит традиционное совпадение по ключам, инсайты из графов знаний и более широкие веб-сигналы.
📍Embeddings (Эмбеддинги): Продвинутые модели юзают эмбеддинги, чтобы находить концептуально похожий контент, выходя за рамки точного вхождения ключей.
📍Cross-attention: Позволяет модели анализировать сложные связи между запросом и документом для присвоения скора релевантности, захватывая глубокие контекстуальные связи.
📍Freshness (Свежесть): Возраст документов — важный фактор, гарантирующий приоритет актуальной инфы, когда это уместно.
📍User Events (События юзеров): Сигналы конверсии, показывающие, как юзеры взаимодействуют с контентом, внедряются для персонализации.

2. Ranking: Упорядочивание по релевантности

Как только доки собраны (retrieved), модель ранжирования берет этот сабсет и пересортировывает его, присваивая новый скор релевантности на основе нескольких условий.

Из тысяч изначально найденных модель обычно отдает топ-400 ранжированных результатов.

Ключевые методы ранжирования:

📍Boost (Буст): Механизм позволяет поднимать или опускать определенные результаты на основе кастомных атрибутов (например, звездный рейтинг, популярность) или свежести.
📍Search Tuning (Тюнинг поиска): Этот процесс конкретно влияет на то, как модель воспринимает семантическую релевантность документов, и корректирует скоры релевантности эмбеддингов.

Особенно полезно для уточнения поиска под специфические индустриальные или брендовые запросы.

📍Event-based Reranking (Переранжирование на основе событий): Персонализированные результаты доставляются путем обновления ранжирования прямо в момент выдачи, используя модели персонализации на основе user-events.

https://www.kopp-online-marketing.com/what-we-can-learn-about-googles-ai-search-from-the-official-vertex-cloud-documentaion

#Rankings #Embeddings #SemanticSEO

@MikeBlazerX
Но самое «мясо» — в @MikeBlazerPRO

Чо, как вам статья?

Материалы по теме

➡️ Промптоведение. Сезон 3. Часть 2.🔥 Контентный промпт. Этап 1. Сбор сущностей…
➡️ Промптоведение. Сезон 3. Часть 2.🔥 Контентный промпт. Этап 1. Сбор сущностей / интентов/ ключей /Ниже приведена расширенная, формальная и универсальная версия «Этапа 1» контентного промпта, готовая к использованию как верхний слой для любой…
👋 900 тыс бразильцев лишились доступа к лицензированным букмекерам после вступившего в…
👋 900 тыс бразильцев лишились доступа к лицензированным букмекерам после вступившего в силу запрета на участие в ставках лиц, получающих социальную поддержку. iGaming PUSH
🇷🇺 В России раскрыли криптосхему по обналичиванию почти ₽100 млнВ Сургуте правоохранительные…
🇷🇺 В России раскрыли криптосхему по обналичиванию почти ₽100 млнВ Сургуте правоохранительные органы пресекли деятельность организованной группы, занимавшейся обналичиванием и отмыванием средств через криптовалюту. По данным МВД, оборот операций по…

Вставить свои 5 копеек:

Awesome image
Awesome image Awesome image Awesome image Awesome image