Composer 2.5 от Cursor: качество Opus 4.7 и GPT-5.5 в 10 раз…
Composer 2.5 от Cursor: качество Opus 4.7 и GPT-5.5 в 10 раз дешевле
Cursor удивили. Они выпустили очередного Composer, но если предыдущие версии были довольно слабые, то сейчас это уже можно назвать полноценным фронтиром.
Бенчмарки:
– SWE-Bench Multilingual: 79.8% (Opus 4.7: 80.5%, GPT-5.5: 77.8%).
– Terminal-Bench 2.0: 69.3% (Opus 4.7: 69.4%, GPT-5.5: 82.7%).
– CursorBench v3.1: 63.2% (Opus 4.7 max: 64.8%, GPT-5.5 default: 59.2%)
При этом стоит модель всего $0.50 за млн input / $2.50 за млн output. Это в 10 раз дешевле опуса. Fast-тариф стоит чуть дороже ($3.00 input / $15.00 output), но все равно дешевле Opus, примерно как Claude Sonnet 4.6. Единственное: публичного API нет, только внутри Cursor, CLI и веб.
Что касается внутрянки:
– Модель основана на Kimi K2.5 от Moonshot AI (как и Composer 2)
– Но базовые веса составили лишь 15% от потраченного компьюта, все остальное – кастомный RL и дообучение
– Из интересных приемов использовали Targeted RL with textual feedback. В классическом RL модель получает одну награду за весь ответ целиком, и непонятно, где именно она ошиблась. Cursor же делают так: когда модель делает локальную ошибку (например, вызывает несуществующий инструмент), прямо в это место вставляется подсказка, и веса как бы подталкиваются в сторону того, как модель повела бы себя с этой подсказкой.
Кстати, одновременно Cursor анонсировали следующую модель, которую они тренируют с нуля, используя в 10 раз больше компьюта, чем на Composer 2.5, на кластере Colossus 2 совместно с xAI. Конец 2026 года в AI-кодинге будет очень интересным.
Вставить свои 5 копеек: