Ist der Turing-Test oder eine seiner Varianten ein zuverlässiger Test für künstliche Intelligenz?

35

Der Turing-Test war der erste Test für künstliche Intelligenz und ist mittlerweile etwas veraltet. Der Total Turing Test soll ein moderner Test sein, der ein viel ausgefeilteres System erfordert. Mit welchen Techniken können wir eine künstliche Intelligenz (schwache KI) und eine künstliche allgemeine Intelligenz (starke KI) identifizieren ?

— Rob Murray
quelle

6

Erfordert auf jeden Fall einen statistischen Ansatz mit einer Reihe von Teilnehmern. Ich habe einige Menschen getroffen, die den Turing-Test nicht bestehen würden.

— SF.

1

Es hängt davon ab, wie Sie Intelligenz definieren.

— Baranskistad

16

Der rhetorische Punkt des Turing-Tests ist, dass er den "Test" für die "Menschlichkeit" nicht in internen Komponenten , sondern in beobachtbaren Ergebnissen platziert . Wenn Sie sich im Umgang mit einer KI genauso verhalten würden wie mit einer Person, wie könnten Sie dann den Unterschied zwischen ihnen erkennen?

Das heißt aber nicht, dass es zuverlässig ist, denn Intelligenz besteht aus vielen verschiedenen Komponenten und es gibt viele verschiedene intellektuelle Aufgaben. Der Turing-Test handelt in gewisser Hinsicht von der Reaktion von Menschen auf Verhalten, das überhaupt nicht zuverlässig ist - denken Sie daran, dass viele Menschen ELIZA , einen sehr einfachen Chatbot, für einen hervorragenden Zuhörer hielten und sich sehr schnell emotional stark engagierten. Es erinnert an die Ikea-Werbung über das Ausschalten einer Lampe , bei der die emotionale Bindung eher vom menschlichen Betrachter (und der Musik) als von der Lampe ausgeht.

Turing-Tests für bestimmte wirtschaftliche Aktivitäten sind viel praktischer - wenn man beispielsweise eine KI schreiben kann, die einen Uber-Fahrer ersetzt, ist das viel klarer, als wenn jemand einen Chatbot für Konversationen erstellen kann.

— Matthew Graves
quelle

10

Das Problem des Turing-Tests ist, dass er die Fähigkeit der Maschine testet, Menschen zu ähneln. Nicht unbedingt jede Form von KI muss dem Menschen ähneln. Dies macht den Turing-Test weniger zuverlässig. Es ist jedoch immer noch nützlich, da es sich um einen tatsächlichen Test handelt. Es ist auch bemerkenswert, dass es einen Preis für das Bestehen des Turing-Tests gibt, den Loebner-Preis .

Die intelligente Agentendefinition von Intelligenz besagt, dass ein Agent intelligent ist, wenn er so handelt, dass der erwartete Wert eines Leistungsmaßes basierend auf früheren Erfahrungen und Kenntnissen maximiert wird. (umschrieben von Wikipedia ). Diese Definition wird häufiger verwendet und hängt nicht von der Fähigkeit ab, Menschen zu ähneln. Es ist jedoch schwieriger, dies zu testen.

— Wythagoras
quelle

7

Der klassische Turing-Test hat sicherlich Grenzen. Da ich es hier noch nicht erwähnt sehe, schlage ich vor, dass Sie über das Chinesische Zimmer lesen , was einer der am häufigsten genannten Gründe ist, warum der Turing-Test tatsächlich nicht in der Lage ist, das wahre „Bewusstsein“ zu ermitteln. Ich würde jedoch auch bemerken, dass sich Turing selbst in der Originalarbeit, die den Turing-Test vorschlug , ausdrücklich eingestand, dass der Test kein Test zur Erkennung des Bewusstseins war :

Ich schlage vor, die Frage zu prüfen: "Können Maschinen denken?" Dies sollte mit Definitionen der Bedeutung der Begriffe "Maschine" und "Denken" beginnen. Die Definitionen könnten so gefasst sein, dass sie die normale Verwendung der Wörter soweit wie möglich widerspiegeln. Diese Einstellung ist jedoch gefährlich Es ist schwierig, sich der Schlussfolgerung zu entziehen, dass die Bedeutung und die Antwort auf die Frage "Können Maschinen denken?" ist in einer statistischen Erhebung wie einer Gallup-Umfrage zu suchen. Das ist aber absurd. Anstatt eine solche Definition zu versuchen, werde ich die Frage durch eine andere ersetzen, die eng damit zusammenhängt und in relativ eindeutigen Worten ausgedrückt wird.

Die neue Form des Problems kann mit einem Spiel beschrieben werden, das wir Nachahmungsspiel nennen. "

Dieses Imitationsspiel ist der Test, den wir heute kennen (und auch die Inspiration für den Namen eines neuen Spielfilms mit Benedict Cumberbatch und Keira Knightley).

— eric.mitchell
quelle

1

Gute Antwort. Ich teile auch die Meinung, dass der Wechsel von "Imitation Game" zu "Turing Test" zu einigen tiefen Missverständnissen über die Folgen geführt hat. (Pornobots bestehen die ganze Zeit den Turing-Test;)

— DukeZhou

5

Es gibt viele Definitionen von künstlicher Intelligenz in freier Wildbahn. Alle diese Definitionen sind Teil eines (oder mehrerer) der Bereiche. Es gibt vier Hauptbereiche, und das Bild unten wird etwas Licht darauf werfen.

Turing Test dreht sich um die linke Seite der Kardinalität, bei der es hauptsächlich darum geht, wie Menschen denken oder handeln. Aber wir wissen, dass dies nicht alles ist. Turing Test hat nicht viel zu bieten, wenn es darum geht, was KI im Allgemeinen ist.
Turing Test wurde, wie in Wikipedia angegeben, entwickelt, um Maschinen zu testen, die ein Verhalten aufweisen, das dem eines Menschen entspricht oder nicht zu unterscheiden ist. Künstliche Intelligenz ist viel mehr als das, was Menschen können oder wie sie handeln. Es gibt viele menschliche Handlungen, die als unintelligent und manchmal auch als unmenschlich gelten.
Das chinesische Raumargument konzentriert sich auf etwas sehr Wichtiges, wenn es um "Bewusstseinssimulation gegen Bewusstseinssimulation" geht.. John Searle argumentierte dort, dass es für eine Maschine (oder einen Menschen) möglich ist, einer Vielzahl vordefinierter Regeln (Algorithmen) zu folgen, um die Aufgabe zu erfüllen, ohne zu denken oder den Verstand zu besitzen. Schwache KIs simulieren die Fähigkeit zu verstehen, verstehen aber nicht wirklich, was sie tun. Sie zeigen kein "Selbstbewusstsein" und bilden keine Repräsentation über sich. "Ich möchte, dass ich weiß, dass ich das will" sind zwei verschiedene Dinge.

Die Theorie des Geistes besagt, dass eine gute KI nicht nur eine Repräsentation der Welt bilden sollte, an der sie arbeitet, sondern auch anderer Akteure und Wesenheiten auf der Welt. Diese beiden Konzepte der Selbsterkenntnis und der Theorie des Geistes ziehen eine dünne Linie zwischen schwacher und starker KI.

Wenn es um den Turing-Test geht, scheitert er aus vielen Gründen, ebenso wie der Total Turing-Test, der dem Test eine weitere Ebene hinzufügt. Die meisten Forscher glauben, dass der Turing-Test nur eine Ablenkung vom Hauptziel darstellt, was sie an der fruchtbaren Arbeit hindert. Nehmen wir an, Sie stellen ein schwieriges Rechenproblem, um zwischen Mensch und Maschine zu unterscheiden. Wenn die Maschine so tun will, als wäre sie ein Mensch, dann lügt sie. Das wollen wir nicht. Beim Turing-Test wird die Obergrenze für die KI festgelegt, die erstellt werden kann. Es ist auch keine gute Idee, AI dazu zu bringen, sich wie Menschen zu verhalten. Menschen sind nicht immer gut darin, richtige Entscheidungen zu treffen. Dies ist der Grund, warum wir in unseren Geschichtsbüchern über Kriege lesen. Entscheidungen, die wir treffen, sind oft voreingenommen, haben selbstsüchtige Ursprünge usw.

Ich glaube nicht, dass es einen Test gibt, um eine KI zu testen. Dies liegt daran, dass AI viele Definitionen und viele Arten hat. Ob eine KI schwach oder stark ist, kann markiert werden, während nach Antworten auf Fragen wie "Ich möchte, dass ich weiß, dass ich das will", "Wer bin ich und was genau ich tue (aus Sicht der Maschine)" oder "Ich möchte" gesucht wird Einige andere Fragen, die ich oben erwähnt habe.

— Ugnes
quelle

3

Dies hängt davon ab, wie der Test durchgeführt wird. Als beispielsweise vor einigen Jahren behauptet wurde, eine Maschine habe den Turing-Test erfolgreich bestanden, waren die Kriterien ziemlich schwach. Es musste nur 30% der Leute für 5 Minuten täuschen. Das ist kein großer Test. Um dies in die richtige Perspektive zu rücken, würden Sie mit diesem Kriterium wahrscheinlich keine Schizophrenie, Autismus, Lernschwäche oder Demenz feststellen.

Trotz des Hype lassen sich die aktuellen KIs mit relativ einfachen Fragen zu 100% erkennen.

— wissenschaftlich
quelle

Guter Punkt. "Bei einer ausreichenden Anzahl von Fragen ..." (Natürlich scheint der Voight-Kampff-Test bei einer begrenzten Anzahl von Fragen ziemlich effektiv zu sein;)