🚀 Вышла GPT-5.5, тот самый Spud – Модель прокачали в агентном кодинге,…
🚀 Вышла GPT-5.5, тот самый Spud
– Модель прокачали в агентном кодинге, и теперь она лучше использует инструменты и справляется с длинными задачами (в релизе пишут, что задачи на 20 часов человеческого труда решает отлично)
– Метрика на SWE Pro – 58.6%. У Opus 4.7 64.3, кстати.
– Обратите внимание на первый график: модельке теперь требуется меньше токенов, чтобы получать высокий уровень качества ответов. Но сильно не радуемся: цена на модель поднялась.
Самое важное: в основе новая базовая модель, побольше. Почему не назвали GPT-6, непонятно, видимо не хотят нарушать негласный метч в нейминге с Anthropic 🤩
Вставить свои 5 копеек: