Пользователи выбрали самый лучший ИИ: это не ChatGPT

Недавнее исследование, проведённое Humaine, выявило ТОП лучших чат-ботов по мнению пользователей, при этом ChatGPT, который полюбился многим, занял лишь 8-е место.

Лидером рейтинга стал Google Gemini 2.5 Pro, обогнав китайский DeepSeek и французский Magistral от компании Mistral. Humaine оценивает чат-боты по критериям удобства общения, способности адаптироваться в диалоге и уровню доверия, который они вызывают.

Топ-10 чат-ботов по версии пользователей

  1. Gemini 2.5 Pro (Google) – возглавляет список. Обладает великолепной адаптивностью, воспринимаемой ясностью информации и плавностью общения, что делает диалог с ним почти человеческим.
  2. DeepSeek v3 (Китай) – вторая строчка. Превосходно отвечает на вопросы, особенно оценён старшими возрастными группами.
  3. Magistral Medium (Mistral, Франция) – третье место. Эта небольшая французская компания продемонстрировала способности создавать модели с естественным общением, хотя показатели доверия и безопасности были немного ниже, чем у лидеров.
  4. Grok 4 (xAI) – четвёртое место. После внесения улучшений модель стала более надёжной и дружелюбной, устранив спорные нюансы, такие как политические предвзятости.
  5. Grok 3 (xAI) – пятая позиция. В некоторых аспектах, например, в этических вопросах, модель даже опередила Grok 4, получив высокие оценки от определённых групп пользователей.
  6. Gemini 2.5 Flash (Google) – шестое место. Эта младшая версия демонстрирует хорошие результаты, хотя и уступает старшей модели в адаптивности.
  7. DeepSeek R1 (Китай) – седьмое место. Младшая модель DeepSeek ведёт диалог стабильно, но менее гибко.
  8. ChatGPT-4.1 (OpenAI) – восьмое место. Несмотря на свою популярность и широкую аудиторию, пользователи Humaine оценили его “человечность” и адаптивность ниже, чем у лидеров.
  9. Gemma (Google) – девятое место. Ещё одна модель от Google, которая показывает стабильные, но не выдающиеся результаты.
  10. Gemini 2.0 Flash (Google) – замыкает десятку. Эта младшая версия линейки Gemini не смогла перепрыгнуть более продвинутых конкурентов.

Методология исследования Humaine

Humaine проводит оценку чат-ботов на основе реальных взаимодействий пользователей. В исследовании приняли участие почти 25 тысяч человек из США и Великобритании, представляющих разные возрастные категории, расы и политические взгляды.

Видео дня

Каждый бот оценивался по четырём параметрам: выполнение задач, логика рассуждений, способность поддерживать диалог и адаптироваться к смене темы, стиль общения и его подача, а также уровни доверия, этичности и безопасности ответов.

Особенность исследования заключается в сравнении “лицом к лицу”: пользователи общались с двумя анонимными моделями и выбирали победителя. Этот подход позволяет получить реальную оценку взаимодействия бота с человеком, а не только тестирования его навыков.

Исследование Humaine иллюстрирует, что для большинства пользователей важны не только корректные ответы на вопросы, но и комфортность, естественность и ясность общения.

Оксана Бойко

Оксана Бойко

Вітаю! Я — Оксана Бойко. На activecar ділюся історіями та порадами, які допомагають по-новому подивитися на автомобільний світ і щоденне життя. Люблю поєднувати практичність із атмосферою подорожей, щоб кожен текст був не лише корисним, а й цікавим. У вільний час займаюся фотографією та обожнюю відкривати нові місця, які згодом часто стають темами для моїх статей.

Схожі Статті

Наступна стаття

Рекомендовано.

В тренді.