Test de TURING | tperobotique

Comment savoir si la personne à qui l'on parle via une messagerie est véritablement un humain ou s'il ne s'agit pas d'un “bot” ?

Dans quelle mesure une IA peut-elle nous tromper en se faisant passer pour un humain ?

Le robot, appelé plus familièrement « bot » par contraction, se glisse parfois à l’insu de tous dans les conversations, il commence naturellement à discuter, comme le ferait n’importe quel internaute.

Ce robot est un programme suivant des instructions simples, qui lui permettent de simuler des réactions humaines. Les bots informatiques sont principalement utilisés pour effectuer des tâches répétitives qui nécessitent une rapidité d'action, comme les enchères.

LE TEST DE TURING

Est un test élaboré par l’informaticien britannique Alan Turing en 1950 après la rédaction d'un article resté célèbre

« Computing machinery and intelligence » où il pose la question : “Can machines think ?”

Le Test de Turing, originellement appelé « Jeu d'imitation », sert à déterminer si une IA est assez convaincante pour se faire passer pour un humain auprès d’autres humains.

Il faut qu'elle soit capable d'élaborer des réponses s'appuyant sur le fonctionnement de l'esprit humain, et non sur la logique simple. De plus, pour tromper parfaitement son interlocuteur, elle doit faire des erreurs.

Pour un calcul à résoudre, ou toute autre question, la machine devra marquer un temps d’hésitation avant de répondre. Pour réussir à nous tromper, elle doit nous mentir pour tenter de nous ressembler

Au cours du test ,chaque personne faisant patie d'un jury, discute via une messagerie avec deux entités : l’une est un humain, l’autre un robot.

L’examinateur doit déterminer leurs natures “à l’aveugle”, en se basant uniquement sur leur conversation.
Les réponses sont données dans des intervalles de temps définis. Ainsi, l’observateur ne peut démasquer un ordinateur qui répondrait plus vite qu’un autre candidat, surtout sur des questions de mathématiques.

Si l’examinateur qui engage les conversations n’est pas capable de dire lequel de ses interlocuteurs est un ordinateur, on peut considérer que le logiciel de l’ordinateur a passé avec succès le test.

Turing a fixé une limite :

30% des jurés doivent être trompés par la machine durant un test de 5 minutes pour que l’IA le remporte.

Des bots comme le programme ELIZA ont déjà trompé des personnes qui croyaient “chatter” avec d’autres humains. En effet, dans un tel contexte, l’homme n’a pas de raison de suspecter une tromperie et trouvera des excuses aux expressions informelles utilisées par ELIZA ou à sa façon de relancer les discussions, en transformant les affirmations de ses interlocuteurs en questions.

ALICE, un autre logiciel de conversation a remporté à plusieurs reprises le prix Loebner, récompensant le programme le plus proche de réussir le test de Turing.

En septembre 2011, en Inde, le programme Cleverbot a convaincu la majorité des participants de son humanité lors d’un test très proche de celui de Turing. Cleverbot fut considéré humain à 59 % et les interlocuteurs humains à 63 % seulement !

Le 7 juin 2014 une I A répondant au nom de Eugène Goostman a remporté le test de Turing .

Le Test de Turing est considéré comme l’Epreuve à passer pour les Intelligences Artificielles : une machine sera capable de «penser» le jour où les gens qui auront une conversation avec elle croiront 7 fois sur 10 avoir affaire à un humain. Pour réussir ce test, la proposition a été tournée à l’envers: le programme doit réussir à tromper 30% des humains.

Le test de Turing est fondé sur l’hypothèse que les êtres humains peuvent juger de l’intelligence d’une machine en comparant son comportement avec le comportement humain.
Or, ce test est trop subjectif pour être scientifique.

Certaines personnes peuvent être trompées par une première conversation et détecter la machine derrière la suivante. Il reposerait en réalité non pas sur l'intelligence du logiciel, mais sur sa capacité d’imitation de l’homme dans les moindres détails (fautes de frappe, jeu de mots, susceptibilité à des insultes…). La quantité de phrases-clefs et de vocabulaire intégrés dans la mémoire de la machine est déterminante dans ce test. Pour ces raisons et d’autres considérations, certains chercheurs en intelligence artificielle ont mis en doute l’utilité de l’essai, qui relèverait plus de l’erreur humaine que de l’intelligence du bot.

Le test de Turing, s’il a fixé une limite de 30% de jurés à convaincre, aurait également exigé que le Test soit le plus strict possible.

Une alternative à ce test a été imaginée par Hector Levesque, professeur d’informatique à l’Université de Toronto. Il s’agit du Winograd Scheme qui adopte une approche différente.

Au lieu de baser le test sur de courtes conversations à thématique libre, ce qui rend le résultat du test entièrement dépendant de l'appréciation du jury, cette nouvelle épreuve pose une série de questions à choix multiples.

Le trophée ne rentrait pas dans la valise marron parce qu’il était trop grand. Qui était trop grand ?

Réponse 1 : la valise

Réponse 2 : le trophée

Les conseillers municipaux ont refusé de donner aux manifestants une autorisation parce qu’ils craignent la violence. Qui craint la violence ?

Réponse 1 : les conseillers municipaux

Réponse 2 : les manifestants

Ces réponses sont évidentes pour nous, êtres humain, mais pour des bots dépourvus de la capacité de faire le lien de cause à effet entre les mots de ces phrases, ces questions sont ambigües.

Les I A doivent avoir une capacité de raisonnement par elles-mêmes. Des machines puissantes comme le supercalculateur Watson d’IBM, qui utilise des probabilités, devraient avoir du mal à réussir à passer ce nouveau test.

C’est exactement ce que devront tenter de faire les machines qui participeront à ce concours. L’équipe qui parviendrait à répondre correctement à cette série de quarante questions, et donc à faire preuve d’un certain « bon sens », remportera le tournoi et 25 000 dollars. La première édition du Winograd Scheme aura lieu à l’Université de Stanford du 23 au 25 Mars 2015, et sera renouvelé chaque année.