Главная страница TG News Как GPT «видит» поиск: Техническая механика
Mike Blazer
24.11.2025
Mike Blazer

Как GPT «видит» поиск: Техническая механика

Как GPT «видит» поиск: Техническая механика

GPT не браузит, не рендерит HTML и не заглатывает документы целиком.

Он работает через ограниченную систему ретривала «скользящего окна» (sliding window) через Assistants API.

1. Начальный пэйлоад (Grounding)

GPT получает структурированный объект, а не веб-страницу.

Данные: Тайтл, URL, Метаданные (Дата/Скор).
Сниппет: Короткий блок текста (1–3 предложения).
`ID`: Внутренняя ссылка (например, turn0search0).

2. Функции навигации

`open(line_number)`: Тянет текстовое окно, центрированное вокруг конкретной строки. Это имитирует «скроллинг», но вытаскивает только ограниченный кусок плейнтекста/маркдауна.
`click()`: Переходит по ссылке, чтобы сгенерить свежий сниппет по правилам оригинального поиска.

3. Скользящее окно

GPT строит контекст, делая последовательные вызовы open() (например, строка 1, 50, 120).

Мало контекста: Минимальные отрывки.
Много контекста: Большие блоки текста/соседние параграфы.
Жесткие лимиты: Полная реконструкция страницы невозможна из-за фиксированных размеров окна, лимитов скорости тулзы и квот на аутпут.

Резюме: GPT парсит последовательные, оконные куски простого текста.

Он никогда не получает доступ к DOM, CSS или полной структуре сайта.

https://dejan.ai/blog/how-gpt-sees-the-web/

#ChatGPT #Crawling #Rendering

@MikeBlazerX
Но самое «мясо» — в @MikeBlazerPRO

Чо, как вам статья?

Материалы по теме

Почему 10-кратный всплеск трафика может сигнализировать о скором коллапсе
Почему 10-кратный всплеск трафика может сигнализировать о скором коллапсе Получить массивный скачок трафика — кажется, что это главная победа, но это может быть обманчивым и опасным сигналом. У нас однажды был проект, который подскочил с 50 000 до…
40-летний житель Великобритании получил условный срок и крупный штраф за организацию нелегального через WhatsApp
40-летний житель Великобритании получил условный срок и крупный штраф за организацию нелегального букмекерского бизнеса через WhatsApp Всё началось с журналистского расследования профильного издания Racing Post ещё в начале 2024 года. По…
Открыта подача заявок на премию SiGMA Awards Eurasia 2026
Открыта подача заявок на премию SiGMA Awards Eurasia 2026Конференция пройдёт c 9 по 11 февраля 2026 года в Дубаи под брендом AIBC (Artificial Intelligence & Blockchain, одно из направления SiGMA Group).Подать заявку на участие в премии можно на…

Вставить свои 5 копеек:

Awesome image
Awesome image Awesome image Awesome image Awesome image