Как Google отличает людей от ботов
Гугл как обычно там с кем-то судится, чтобы вставить палки в колеса OpenAI, но нам интересно не это, а что приоткрылся занавес как гугл отслеживает ботов или скрипты автоматизации. Ниже будут категории и параметры по которым гугл все отслеживает:
Движения мыши 🖱
Люди не перемещают курсор по прямой линии. Мы следуем естественным кривым с ускорением и замедлением — крошечными несовершенствами, которые раскрывают нашу человечность.
Google отслеживает:
🔹 Траекторию (форму пути);
🔹 Скорость (скорость);
🔹 Ускорение (изменения скорости);
🔹 Дрожание (микротреморы).
«Идеальное» движение мыши — линейное, с постоянной скоростью — сразу вызывает подозрение. Боты обычно движутся по точным векторам или телепортируются между точками. Люди ведут себя более хаотично.
Порог обнаружения: отклонение скорости мыши ниже 10 помечается как поведение бота. Нормальное отклонение для человека составляет 50-500.
Ритм клавиатуры ⌨️
У каждого человека есть свой уникальный стиль набора текста.
Google измеряет:
🔸 Интервалы между нажатиями клавиш (время между нажатиями);
🔸 Продолжительность нажатия клавиши (сколько времени удерживается каждая клавиша);
🔸 Шаблоны ошибок;
🔸 Паузы после знаков препинания.
У человека разброс между нажатиями клавиш обычно составляет 80-150 мс. А у бота? Часто менее 10 мс с роботизированной стабильностью.
Порог обнаружения: отклонение продолжительности нажатия клавиши менее 5 мс указывает на автоматизацию. Нормальный человеческий набор текста показывает отклонение 20-50 мс.
Поведение прокрутки 🔘
Естественная прокрутка имеет переменную скорость, изменения направления и замедление, основанное на импульсе. Программная прокрутка часто бывает слишком плавной, слишком быстрой или идеально равномерной.
Google измеряет:
♦️ Амплитуду (насколько далеко);
♦️ Изменения направления;
♦️ Время между прокрутками;
♦️ Паттерны плавности.
Прокрутка с фиксированными приращениями — 100px, 100px, 100px — является тревожным сигналом.
Порог обнаружения: отклонение дельта прокрутки менее 5px указывает на активность бота. Люди обычно демонстрируют отклонение 20-100px.
Колебания времени ⏰️
Это решающий сигнал. Люди непостоянны, и именно это делает нас людьми.
Google использует алгоритм Уэлфорда для расчета отклонения в режиме реального времени с постоянным использованием памяти, что означает, что он может анализировать паттерны без хранения огромных объемов данных, независимо от количества событий. При поступлении каждого события алгоритм обновляет свою текущую статистику.
Если интервалы между вашими действиями имеют отклонение, близкое к нулю, вы попадаете под подозрение.
Если временные интервалы следуют гауссовому распределению с естественным отклонением, вы человек. Если они равномерны или детерминированы, вы бот.
Порог обнаружения: количество событий, превышающее 200 в секунду, указывает на автоматизацию. Нормальное человеческое взаимодействие генерирует 10-50 событий в секунду.
Более 100 элементов DOM, которые отслеживает Google
Помимо поведения, SearchGuard отслеживает среду вашего браузера, контролируя более 100 элементов HTML. Полный список, извлеченный из исходного кода, включает:
🟢 Элементы высокого приоритета (формы): BUTTON, INPUT — им уделяется особое внимание, поскольку боты часто нацелены на интерактивные элементы;
🟢 Структура: ARTICLE, SECTION, NAV, ASIDE, HEADER, FOOTER, MAIN, DIV;
🟢 Текст: P, PRE, BLOCKQUOTE, EM, STRONG, CODE, SPAN и 25 других;
🟢 Таблицы: TABLE, CAPTION, TBODY, THEAD, TR, TD, TH;
🟢 Медиа: FIGURE, CANVAS, PICTURE;
🟢 Интерактивные элементы: DETAILS, SUMMARY, MENU, DIALOG.
Источник: https://searchengineland.com/inside-google-searchguard-467676
🔔 Подписаться на канал | Чат канала
Вставить свои 5 копеек: