Главная страница TG News Тем временем на ARC-AGI-2 ИИ-системе впервые удалось превзойти уровень человека

27.11.2025

Тем временем на ARC-AGI-2 ИИ-системе впервые удалось превзойти уровень человека

Тем временем на ARC-AGI-2 ИИ-системе впервые удалось превзойти уровень человека

В лаборатории Poetiq придумали, как можно соединять разные LLM так, чтобы в разы бустить их производительность (кому интересно, внизу оставим ссылку на код). И вот 20 ноября они заявили, что их подход – микс Gemini 3 и GPT-5.1 – впервые дал на бенчмарке результат, превосходящий человека.

Правда, это только на публичном evaluation-сете. При переносе на semi-private результат, скорее всего, ухудшится. Но учитывая, что по отдельности модели даже близко не дотягивают до 60% (у Gemini 3 45%, у GPT-5 около 20%), все равно новость занятная.

Еще пол года назад ARC-AGI-2 казался для ИИ вообще нерешаемым, а самые топовые модели выбивали на нем 1-2%.

Блогпост | Код

Тем временем на ARC-AGI-2 ИИ-системе впервые удалось превзойти уровень человека

Чо, как вам статья?

Материалы по теме

🌐 Объем ставок на киберспорт вырос на 31% за годВ 2025 году мировой рынок ставок на киберспорт продолжил активно расти. По данным аналитиков Oddin(.)gg, общий объем пари увеличился на 31%, а количество заключенных ставок — на 23%. Рост объема ставок…

Мем дня: Cloudflare, которые годами защищали сайты от ботов-парсеров, выпустили парсер Они анонсировали эндпоинт /crawl для Browser Rendering, который позволяет сканировать и извлекать контент целого сайта одним API-запросом. Он предназначен для…

🔄 Когда нужно начинать реактивацию игроков?Реактивация игрока стоит дешевле, чем привлечение нового.Именно поэтому все проекты покрыты соответствующими кампаниями. Распространенная практика: реактивация стартует через 30+ дней отсутствия игрока. Но…