Пользователи выбрали самый лучший ИИ: это не ChatGPT

Недавнее исследование, проведённое Humaine, выявило ТОП лучших чат-ботов по мнению пользователей, при этом ChatGPT, который полюбился многим, занял лишь 8-е место.

Лидером рейтинга стал Google Gemini 2.5 Pro, обогнав китайский DeepSeek и французский Magistral от компании Mistral. Humaine оценивает чат-боты по критериям удобства общения, способности адаптироваться в диалоге и уровню доверия, который они вызывают.

Топ-10 чат-ботов по версии пользователей

Gemini 2.5 Pro (Google) – возглавляет список. Обладает великолепной адаптивностью, воспринимаемой ясностью информации и плавностью общения, что делает диалог с ним почти человеческим.
DeepSeek v3 (Китай) – вторая строчка. Превосходно отвечает на вопросы, особенно оценён старшими возрастными группами.
Magistral Medium (Mistral, Франция) – третье место. Эта небольшая французская компания продемонстрировала способности создавать модели с естественным общением, хотя показатели доверия и безопасности были немного ниже, чем у лидеров.
Grok 4 (xAI) – четвёртое место. После внесения улучшений модель стала более надёжной и дружелюбной, устранив спорные нюансы, такие как политические предвзятости.
Grok 3 (xAI) – пятая позиция. В некоторых аспектах, например, в этических вопросах, модель даже опередила Grok 4, получив высокие оценки от определённых групп пользователей.
Gemini 2.5 Flash (Google) – шестое место. Эта младшая версия демонстрирует хорошие результаты, хотя и уступает старшей модели в адаптивности.
DeepSeek R1 (Китай) – седьмое место. Младшая модель DeepSeek ведёт диалог стабильно, но менее гибко.
ChatGPT-4.1 (OpenAI) – восьмое место. Несмотря на свою популярность и широкую аудиторию, пользователи Humaine оценили его “человечность” и адаптивность ниже, чем у лидеров.
Gemma (Google) – девятое место. Ещё одна модель от Google, которая показывает стабильные, но не выдающиеся результаты.
Gemini 2.0 Flash (Google) – замыкает десятку. Эта младшая версия линейки Gemini не смогла перепрыгнуть более продвинутых конкурентов.

Методология исследования Humaine

Humaine проводит оценку чат-ботов на основе реальных взаимодействий пользователей. В исследовании приняли участие почти 25 тысяч человек из США и Великобритании, представляющих разные возрастные категории, расы и политические взгляды.

Видео дня

Каждый бот оценивался по четырём параметрам: выполнение задач, логика рассуждений, способность поддерживать диалог и адаптироваться к смене темы, стиль общения и его подача, а также уровни доверия, этичности и безопасности ответов.

Особенность исследования заключается в сравнении “лицом к лицу”: пользователи общались с двумя анонимными моделями и выбирали победителя. Этот подход позволяет получить реальную оценку взаимодействия бота с человеком, а не только тестирования его навыков.

Исследование Humaine иллюстрирует, что для большинства пользователей важны не только корректные ответы на вопросы, но и комфортность, естественность и ясность общения.