Microsoft опенсорснули проект SkillOpt для оптимизации способностей агентов Это фреймворк, который фоново…
Microsoft опенсорснули проект SkillOpt для оптимизации способностей агентов
Это фреймворк, который фоново улучшает вашего агента через изменение markdown файлов со скиллами.
Это похоже на классический learning loop, но в текстовом пространстве. То есть агент выполняет задачи с текущей версией условного skill.md (это аналог прямого прохода), система легирует все, что тот делает, отмечает ошибки и успешные ответы, а затем на основе этого предлагает небольшие правки в skill (это уже backward pass).
Новая версия md принимается только после прохождения верификации на отдельном сете задач (его можно задать самостоятельно или взять готовый).
Как и в реальном обучении, тут предусмотрено подобие learning rate: чтобы сразу случайно сильно не испортить файл правками, они могут быть только небольшими и должны соответствовать определенным правилам. Так что попробовать инструмент можно довольно безопасно, даже если боитесь за свои md-шки.
Приросты можно посмотреть в большой таблице наверху. Как видите, абсолютно во всех комбинациях моделей и бенчмарков они положительные и заметные, а в Codex и Claude Code на GPT-5.5 средний gain указан вообще как +21.8 и +18.6 соответственно (!).
Статья, код, овервью и инструкции по использованию – все здесь: https://microsoft.github.io/SkillOpt/
Вставить свои 5 копеек: