L’arrivée des assistants conversationnels (“chatbots” en anglais) accessibles au grand public marque une étape importante de l’histoire de l’intelligence artificielle. Grâce à l’emblématique ChatGPT, chacun dispose désormais d’un outil convivial qui, contrairement aux moteurs de recherche, fournit des réponses sous forme de textes synthétiques et clairs. Bien que l’utilisateur soit mis en garde contre des risques d’erreur, les réponses obtenues sont généralement de bonne qualité. ChatGPT ne se limite pas à répondre à des demandes d’information : il peut résoudre des problèmes, résumer des rapports, rédiger des articles, commenter des textes, faire des traductions et effectuer bien d’autres tâches encore.
Les performances de ChatGPT et le caractère relativement naturel de ses interactions avec l’utilisateur ont évidemment conduit à de nombreuses comparaisons entre son « intelligence » et celle des humains. Certaines sont allées jusqu’à lui attribuer un QI. Mais peut-on évaluer le QI de ChatGPT ?
Cette question peut s’entendre de deux manières. Dans la première, il s’agit simplement d’une possibilité pratique. La réponse est alors positive puisque de nombreux tests d’intelligence reposent sur des interactions exclusivement verbales. Toutefois, il convient de remarquer que ce type de tests pourrait avantager le chatbot, qui a été entraîné sur un corpus massif de l’ordre de 600 milliards de mots, alors qu’un humain ne rencontre durant sa vie entière que 2 milliards de mots écrits ou parlés1.
Des évaluations, dont on ignore le plus souvent la provenance, circulent sur Internet et s’accompagnent de commentaires parfois ridicules, comme celui plaçant ChatGPT au niveau d’Einstein, tous deux crédités d’un QI de 160 ! Toutefois, certains psychologues qualifiés ont tenté d’évaluer ChatGPT selon une méthodologie explicite et adéquate. Une équipe de chercheurs brésiliens2 est ainsi parvenue à un QI de 137, tandis qu’un psychologue finlandais3 obtenait un QI de 155. Dans les deux cas, ChatGPT se voit attribuer une intelligence supérieure.
Mais la question posée dans le titre de cet article peut être également interprétée dans le sens de l’opportunité et de la légitimité d’attribuer un QI à un système d’intelligence artificielle. On a bien sûr parfaitement le droit pour mesurer les performances d’un chatbot de puiser dans le vaste fonds d’épreuves inventées par la psychologie pour étudier l’intelligence humaine et ses diverses composantes. C’est ainsi que récemment deux chercheurs de l’Institut Max Planck de Tübingen4 ont fait passer un ensemble d’épreuves de raisonnement à GPT-3 comme si le modèle participait à une expérience de psychologie cognitive.