Главная страница Новости Битва нейросетей: LinkedIn запустил сервис для слепого тестирования ИИ-моделей
Битва нейросетей: LinkedIn запустил сервис для слепого тестирования ИИ-моделей

Битва нейросетей: LinkedIn запустил сервис для слепого тестирования ИИ-моделей

Какая нейросеть лучше пишет письма, а какая — код? LinkedIn решил выяснить это эмпирически.

Содержание статьи

Новая функция Crosscheck предлагает пользователям ввести запрос и оценить два анонимных ответа от разных ИИ-моделей. Результаты собираются в публичные рейтинги.

Как работает слепой тест

Механика Crosscheck напоминает популярный проект LMSYS Chatbot Arena, но интегрирована непосредственно в профессиональную социальную сеть:

  • Пользователь вводит любой текстовый запрос (промпт)
  • Система выбирает две разные нейросети из пула доступных провайдеров (OpenAI, Anthropic, Google, Microsoft и другие)
  • На экран выводятся два сгенерированных ответа без указания, какая именно модель их создала
  • Пользователь оценивает качество ответов и голосует за лучший вариант

На основе этих голосований LinkedIn формирует отраслевые рейтинги (лидерборды) лучших инструментов искусственного интеллекта для конкретных вертикалей и типов профессиональных запросов. Кроме того, платформа будет передавать обезличенные диалоги и оценки разработчикам нейросетей для улучшения их продуктов.

Нюансы корпоративных связей

Журналисты отмечают потенциальный конфликт интересов: материнская компания LinkedIn — корпорация Microsoft — инвестировала миллиарды долларов в OpenAI и активно внедряет их технологии в свою экосистему. При этом сама Microsoft также разрабатывает собственные модели. Теоретически это может дать инструментам OpenAI определенное преимущество в оценках, однако текущие рейтинги Crosscheck показывают разнообразие и присутствие широкого спектра конкурентов.

Реальность против ожиданий

Запуск Crosscheck ложится в стратегию LinkedIn по продвижению навыков работы с искусственным интеллектом среди профессионалов. Однако агрессивное внедрение технологий пока не коррелирует с реальными бизнес-результатами: согласно недавнему исследованию Национального бюро экономических исследований США (NBER), 89% из 6000 опрошенных руководителей в США, Великобритании, Германии и Австралии заявили, что за последние три года не увидели практически никаких изменений в производительности труда, несмотря на повсеместное внедрение ИИ-инструментов.

Awesome image

Если раньше выбор между платными подписками на ChatGPT, Claude или Gemini базировался на субъективных ощущениях и техно-блогах, то теперь LinkedIn обещает дать агрегированные данные о том, какая нейросеть лучше всего пишет холодные письма (cold outreach) или коммерческие предложения именно по оценкам других сейлз-менеджеров. Появление отраслевых рейтингов нейросетей — еще один шаг к стандартизации рабочих процессов в эпоху генеративного контента.

Чо, как вам статья?

Материалы по теме

Instagram запустил платную подписку Plus за $3,99 в месяц с 11 дополнительными функциями
Instagram Plus за $3,99 в месяц — 11 функций вокруг Stories, аналитики и кастомизации профиля. Звучит скромно, и это намеренно: Meta не может сделать платные функции слишком ценными, не навредив основному бизнесу.
Конец анонимного Рунета случится 1 сентября 2026 — вводится обязательная идентификация доменов .ru, .рф и .su через Госуслуги
С 1 сентября 2026 владельцы доменов в .ru, .рф и .su обязаны пройти идентификацию администратора через Госуслуги по 569-ФЗ. Разбираем закон, сценарии для арбитража, SEO, агентств и нерезидентов.
OpenAI переделывает ChatGPT в суперапп: чат уступает место агентам и корпоративным инструментам
«Чат мертв». ChatGPT превращается в суперапп для агентов и кодинга — это ответ на давление Anthropic и попытка найти корпоративную выручку перед IPO.

Вставить свои 5 копеек:

Awesome image
Awesome image
Awesome image Awesome image Awesome image Awesome image
Awesome image