⚡️ Вышли новые модели от DeepSeek: DeepSeek-V4-Pro и DeepSeek-V4-FlashОбе модели уже в…
⚡️ Вышли новые модели от DeepSeek: DeepSeek-V4-Pro и DeepSeek-V4-Flash
Обе модели уже в опенсорсе и с контекстом до 1 миллиона токенов!
– DeepSeek-V4-Pro: 1.6T параметров / 49B активных. Метрики на уровне ведущих фронтиров. На кодинге уровень Claude Opus 4.6, на World Knowledge уступает только Gemini 3.1 Pro, на ризонинге также бьет многие закрытые модели на бенчмарках. Бесспорно новая открытая SOTA.
– DeepSeek-V4-Flash: 284B параметров / 13B активных. На многих бенчмарках модель достаточно близка к Pro версии, но дешевле и быстрее.
Контекст на 1 миллион токенов теперь стоит по умолчанию во всех сервисах DeepSeek. На длинных контекстах они добились очень высокой эффективности вычислений благодаря механизму внимания DeepSeek Sparse Attention (мы вот тут его разбирали).
Обе модели специально оптимизированы для агентных задач, и DeepSeek пишут, что уже используют их для внутренней разработки.
Попробовать можно в чате: chat.deepseek.com
Либо в API: дока (цены на картинке выше, они максимально приятные)
Вставить свои 5 копеек: