Недавнее исследование, проведённое Humaine, выявило ТОП лучших чат-ботов по мнению пользователей, при этом ChatGPT, который полюбился многим, занял лишь 8-е место.
Лидером рейтинга стал Google Gemini 2.5 Pro, обогнав китайский DeepSeek и французский Magistral от компании Mistral. Humaine оценивает чат-боты по критериям удобства общения, способности адаптироваться в диалоге и уровню доверия, который они вызывают.
Топ-10 чат-ботов по версии пользователей
- Gemini 2.5 Pro (Google) – возглавляет список. Обладает великолепной адаптивностью, воспринимаемой ясностью информации и плавностью общения, что делает диалог с ним почти человеческим.
- DeepSeek v3 (Китай) – вторая строчка. Превосходно отвечает на вопросы, особенно оценён старшими возрастными группами.
- Magistral Medium (Mistral, Франция) – третье место. Эта небольшая французская компания продемонстрировала способности создавать модели с естественным общением, хотя показатели доверия и безопасности были немного ниже, чем у лидеров.
- Grok 4 (xAI) – четвёртое место. После внесения улучшений модель стала более надёжной и дружелюбной, устранив спорные нюансы, такие как политические предвзятости.
- Grok 3 (xAI) – пятая позиция. В некоторых аспектах, например, в этических вопросах, модель даже опередила Grok 4, получив высокие оценки от определённых групп пользователей.
- Gemini 2.5 Flash (Google) – шестое место. Эта младшая версия демонстрирует хорошие результаты, хотя и уступает старшей модели в адаптивности.
- DeepSeek R1 (Китай) – седьмое место. Младшая модель DeepSeek ведёт диалог стабильно, но менее гибко.
- ChatGPT-4.1 (OpenAI) – восьмое место. Несмотря на свою популярность и широкую аудиторию, пользователи Humaine оценили его “человечность” и адаптивность ниже, чем у лидеров.
- Gemma (Google) – девятое место. Ещё одна модель от Google, которая показывает стабильные, но не выдающиеся результаты.
- Gemini 2.0 Flash (Google) – замыкает десятку. Эта младшая версия линейки Gemini не смогла перепрыгнуть более продвинутых конкурентов.
Методология исследования Humaine
Humaine проводит оценку чат-ботов на основе реальных взаимодействий пользователей. В исследовании приняли участие почти 25 тысяч человек из США и Великобритании, представляющих разные возрастные категории, расы и политические взгляды.
Каждый бот оценивался по четырём параметрам: выполнение задач, логика рассуждений, способность поддерживать диалог и адаптироваться к смене темы, стиль общения и его подача, а также уровни доверия, этичности и безопасности ответов.
Особенность исследования заключается в сравнении “лицом к лицу”: пользователи общались с двумя анонимными моделями и выбирали победителя. Этот подход позволяет получить реальную оценку взаимодействия бота с человеком, а не только тестирования его навыков.
Исследование Humaine иллюстрирует, что для большинства пользователей важны не только корректные ответы на вопросы, но и комфортность, естественность и ясность общения.
















