Главная страница Новости ChatGPT обошел врачей в собственном тесте OpenAI — и это бесплатно для всех
ChatGPT обошел врачей в собственном тесте OpenAI — и это бесплатно для всех

ChatGPT обошел врачей в собственном тесте OpenAI — и это бесплатно для всех

OpenAI обновил медицинские ответы в бесплатном ChatGPT: по собственным тестам компании, GPT-5.5 Instant обошла врачей по точности и полноте в 3500 сравнениях. Впрочем, независимой проверки этих данных пока нет.

OpenAI объявила, что GPT-5.5 Instant — модель по умолчанию для бесплатных пользователей ChatGPT — теперь отвечает на вопросы о здоровье на уровне старших Thinking-моделей компании. Заявление основано на собственных тестах OpenAI и затрагивает категорию, к которой и так приковано пристальное внимание из-за прошлых сбоев ИИ-ответов в медицинской теме.

Что показали тесты

OpenAI ссылается на рост показателей по бенчмаркам HealthBench и его клинической версии HealthBench Professional: GPT-5.5 Instant обошла предыдущую модель GPT-5.3 Instant. Отдельно компания сообщила о снижении доли фактологических ошибок на реальном трафике на 71% за два месяца — эта цифра получена из собственного мониторинга OpenAI, а не от независимых наблюдателей.

Третий тест — сравнение с врачами. Компания попросила практикующих докторов написать ответы на типовые медицинские диалоги, а затем дала отдельной коллегии врачей сравнить эти ответы с ответами модели. По итогам разбора 3500 примеров коллегия оценила ответы GPT-5.5 Instant выше, чем врачебные, по точности, коммуникации и полноте. По заявлению OpenAI, модель реже пропускала тревожные симптомы и реже не уточняла контекст у пользователя, чем как предыдущая модель, так и сами врачи.

Как устроена методология

HealthBench — бенчмарк, который OpenAI разработала вместе с собственной сетью врачей, используя рубрики, написанные докторами, а не экзаменационные вопросы. Компания заявляет о сотрудничестве с более чем 260 врачами из 60 стран, которые с момента запуска проверили свыше 700 тысяч примеров ответов. Ни один из результатов не публиковался для внешней проверки независимыми экспертами.

Масштаб использования

По данным OpenAI, более 230 миллионов человек еженедельно задают ChatGPT вопросы о здоровье и самочувствии — одна из самых частых причин обращения к чат-боту в целом. Здоровье остается защищенной категорией в политике компании: при тестировании рекламы в ChatGPT OpenAI заявляла, что не будет показывать рекламу в разговорах о здоровье, ментальном здоровье и политике.

Почему это важно для индустрии

Медицинские запросы уже показывают самый высокий процент попадания в ИИ-ответы среди всех категорий поисковых запросов Google. Если значительная часть этого спроса смещается в бесплатный тариф ChatGPT, это усиливает давление нулевого клика на медицинские издания и контентные проекты в нише здоровья — пользователи получают ответ внутри чат-бота, не переходя на сайт-источник.

Главная оговорка

Заявления о точности сложно проверить независимо: OpenAI тестировала собственную модель на собственных бенчмарках с привлеченной ею же сетью врачей. Это та же методологическая проблема, что преследует и другие ИИ-ответы в медицинской сфере — компания сообщает об улучшении, но подтвердить это сторонними средствами пока нельзя.

Awesome image

Усиление позиций ChatGPT в медицинских вопросах на бесплатном тарифе означает дальнейший рост zero-click-эффекта в этой нише — конкуренция за клик через классическое SEO в нишах, связанных со здоровьем будет только обостряться. Параллельно открывается GEO-возможность: если ваш контент структурирован так, чтобы быть источником для ИИ-ответов (четкие, проверяемые медицинские факты, цитируемые источники, понятная структура), у вас больше шансов попасть в цепочку цитирования, даже если прямой клик на сайт снижается.

Чо, как вам статья?

Материалы по теме

Как агенты найдут друг друга: Google и партнеры закладывают инфраструктуру агентного веба
Google, Microsoft и еще девять компаний выпустили драфт стандарта ARD — открытый протокол, позволяющий ИИ-агентам находить инструменты и API через каталоги вместо ручной настройки каждого подключения.
Apple разрешила в Бразилии альтернативные магазины приложений и внешние платежи в App Store
Apple открыла App Store в Бразилии для альтернативных магазинов приложений и внешних платежей — по соглашению с регулятором CADE. Разработчикам нужно принять новые условия до 6 июля 2026 года.
Pinterest вооружается ИИ: ассистент для рекламы, агентский MCP и ИИ-шопинг
Pinterest выкатил пакет ИИ: Business Assistant для создания рекламы, MCP для подключения данных к агентским инструментам, динамический выбор креатива и шопинг-приложение Ask Pinterest.

Вставить свои 5 копеек:

Awesome image
Awesome image
Awesome image Awesome image Awesome image Awesome image
Awesome image