Ist der Turing-Test oder eine seiner Varianten ein zuverlässiger Test für künstliche Intelligenz?


35

Der Turing-Test war der erste Test für künstliche Intelligenz und ist mittlerweile etwas veraltet. Der Total Turing Test soll ein moderner Test sein, der ein viel ausgefeilteres System erfordert. Mit welchen Techniken können wir eine künstliche Intelligenz (schwache KI) und eine künstliche allgemeine Intelligenz (starke KI) identifizieren ?


6
Erfordert auf jeden Fall einen statistischen Ansatz mit einer Reihe von Teilnehmern. Ich habe einige Menschen getroffen, die den Turing-Test nicht bestehen würden.
SF.

1
Es hängt davon ab, wie Sie Intelligenz definieren.
Baranskistad

Antworten:


16

Der rhetorische Punkt des Turing-Tests ist, dass er den "Test" für die "Menschlichkeit" nicht in internen Komponenten , sondern in beobachtbaren Ergebnissen platziert . Wenn Sie sich im Umgang mit einer KI genauso verhalten würden wie mit einer Person, wie könnten Sie dann den Unterschied zwischen ihnen erkennen?

Das heißt aber nicht, dass es zuverlässig ist, denn Intelligenz besteht aus vielen verschiedenen Komponenten und es gibt viele verschiedene intellektuelle Aufgaben. Der Turing-Test handelt in gewisser Hinsicht von der Reaktion von Menschen auf Verhalten, das überhaupt nicht zuverlässig ist - denken Sie daran, dass viele Menschen ELIZA , einen sehr einfachen Chatbot, für einen hervorragenden Zuhörer hielten und sich sehr schnell emotional stark engagierten. Es erinnert an die Ikea-Werbung über das Ausschalten einer Lampe , bei der die emotionale Bindung eher vom menschlichen Betrachter (und der Musik) als von der Lampe ausgeht.

Turing-Tests für bestimmte wirtschaftliche Aktivitäten sind viel praktischer - wenn man beispielsweise eine KI schreiben kann, die einen Uber-Fahrer ersetzt, ist das viel klarer, als wenn jemand einen Chatbot für Konversationen erstellen kann.


10

Das Problem des Turing-Tests ist, dass er die Fähigkeit der Maschine testet, Menschen zu ähneln. Nicht unbedingt jede Form von KI muss dem Menschen ähneln. Dies macht den Turing-Test weniger zuverlässig. Es ist jedoch immer noch nützlich, da es sich um einen tatsächlichen Test handelt. Es ist auch bemerkenswert, dass es einen Preis für das Bestehen des Turing-Tests gibt, den Loebner-Preis .

Die intelligente Agentendefinition von Intelligenz besagt, dass ein Agent intelligent ist, wenn er so handelt, dass der erwartete Wert eines Leistungsmaßes basierend auf früheren Erfahrungen und Kenntnissen maximiert wird. (umschrieben von Wikipedia ). Diese Definition wird häufiger verwendet und hängt nicht von der Fähigkeit ab, Menschen zu ähneln. Es ist jedoch schwieriger, dies zu testen.


7

Der klassische Turing-Test hat sicherlich Grenzen. Da ich es hier noch nicht erwähnt sehe, schlage ich vor, dass Sie über das Chinesische Zimmer lesen , was einer der am häufigsten genannten Gründe ist, warum der Turing-Test tatsächlich nicht in der Lage ist, das wahre „Bewusstsein“ zu ermitteln. Ich würde jedoch auch bemerken, dass sich Turing selbst in der Originalarbeit, die den Turing-Test vorschlug , ausdrücklich eingestand, dass der Test kein Test zur Erkennung des Bewusstseins war :

Ich schlage vor, die Frage zu prüfen: "Können Maschinen denken?" Dies sollte mit Definitionen der Bedeutung der Begriffe "Maschine" und "Denken" beginnen. Die Definitionen könnten so gefasst sein, dass sie die normale Verwendung der Wörter soweit wie möglich widerspiegeln. Diese Einstellung ist jedoch gefährlich Es ist schwierig, sich der Schlussfolgerung zu entziehen, dass die Bedeutung und die Antwort auf die Frage "Können Maschinen denken?" ist in einer statistischen Erhebung wie einer Gallup-Umfrage zu suchen. Das ist aber absurd. Anstatt eine solche Definition zu versuchen, werde ich die Frage durch eine andere ersetzen, die eng damit zusammenhängt und in relativ eindeutigen Worten ausgedrückt wird.

Die neue Form des Problems kann mit einem Spiel beschrieben werden, das wir Nachahmungsspiel nennen. "

Dieses Imitationsspiel ist der Test, den wir heute kennen (und auch die Inspiration für den Namen eines neuen Spielfilms mit Benedict Cumberbatch und Keira Knightley).


1
Gute Antwort. Ich teile auch die Meinung, dass der Wechsel von "Imitation Game" zu "Turing Test" zu einigen tiefen Missverständnissen über die Folgen geführt hat. (Pornobots bestehen die ganze Zeit den Turing-Test;)
DukeZhou

5

Es gibt viele Definitionen von künstlicher Intelligenz in freier Wildbahn. Alle diese Definitionen sind Teil eines (oder mehrerer) der Bereiche. Es gibt vier Hauptbereiche, und das Bild unten wird etwas Licht darauf werfen.

Bildbeschreibung hier eingeben



Turing Test dreht sich um die linke Seite der Kardinalität, bei der es hauptsächlich darum geht, wie Menschen denken oder handeln. Aber wir wissen, dass dies nicht alles ist. Turing Test hat nicht viel zu bieten, wenn es darum geht, was KI im Allgemeinen ist.
Turing Test wurde, wie in Wikipedia angegeben, entwickelt, um Maschinen zu testen, die ein Verhalten aufweisen, das dem eines Menschen entspricht oder nicht zu unterscheiden ist. Künstliche Intelligenz ist viel mehr als das, was Menschen können oder wie sie handeln. Es gibt viele menschliche Handlungen, die als unintelligent und manchmal auch als unmenschlich gelten.
Das chinesische Raumargument konzentriert sich auf etwas sehr Wichtiges, wenn es um "Bewusstseinssimulation gegen Bewusstseinssimulation" geht.. John Searle argumentierte dort, dass es für eine Maschine (oder einen Menschen) möglich ist, einer Vielzahl vordefinierter Regeln (Algorithmen) zu folgen, um die Aufgabe zu erfüllen, ohne zu denken oder den Verstand zu besitzen. Schwache KIs simulieren die Fähigkeit zu verstehen, verstehen aber nicht wirklich, was sie tun. Sie zeigen kein "Selbstbewusstsein" und bilden keine Repräsentation über sich. "Ich möchte, dass ich weiß, dass ich das will" sind zwei verschiedene Dinge.

Die Theorie des Geistes besagt, dass eine gute KI nicht nur eine Repräsentation der Welt bilden sollte, an der sie arbeitet, sondern auch anderer Akteure und Wesenheiten auf der Welt. Diese beiden Konzepte der Selbsterkenntnis und der Theorie des Geistes ziehen eine dünne Linie zwischen schwacher und starker KI.

Wenn es um den Turing-Test geht, scheitert er aus vielen Gründen, ebenso wie der Total Turing-Test, der dem Test eine weitere Ebene hinzufügt. Die meisten Forscher glauben, dass der Turing-Test nur eine Ablenkung vom Hauptziel darstellt, was sie an der fruchtbaren Arbeit hindert. Nehmen wir an, Sie stellen ein schwieriges Rechenproblem, um zwischen Mensch und Maschine zu unterscheiden. Wenn die Maschine so tun will, als wäre sie ein Mensch, dann lügt sie. Das wollen wir nicht. Beim Turing-Test wird die Obergrenze für die KI festgelegt, die erstellt werden kann. Es ist auch keine gute Idee, AI dazu zu bringen, sich wie Menschen zu verhalten. Menschen sind nicht immer gut darin, richtige Entscheidungen zu treffen. Dies ist der Grund, warum wir in unseren Geschichtsbüchern über Kriege lesen. Entscheidungen, die wir treffen, sind oft voreingenommen, haben selbstsüchtige Ursprünge usw.

Ich glaube nicht, dass es einen Test gibt, um eine KI zu testen. Dies liegt daran, dass AI viele Definitionen und viele Arten hat. Ob eine KI schwach oder stark ist, kann markiert werden, während nach Antworten auf Fragen wie "Ich möchte, dass ich weiß, dass ich das will", "Wer bin ich und was genau ich tue (aus Sicht der Maschine)" oder "Ich möchte" gesucht wird Einige andere Fragen, die ich oben erwähnt habe.


3

Dies hängt davon ab, wie der Test durchgeführt wird. Als beispielsweise vor einigen Jahren behauptet wurde, eine Maschine habe den Turing-Test erfolgreich bestanden, waren die Kriterien ziemlich schwach. Es musste nur 30% der Leute für 5 Minuten täuschen. Das ist kein großer Test. Um dies in die richtige Perspektive zu rücken, würden Sie mit diesem Kriterium wahrscheinlich keine Schizophrenie, Autismus, Lernschwäche oder Demenz feststellen.

Trotz des Hype lassen sich die aktuellen KIs mit relativ einfachen Fragen zu 100% erkennen.


Guter Punkt. "Bei einer ausreichenden Anzahl von Fragen ..." (Natürlich scheint der Voight-Kampff-Test bei einer begrenzten Anzahl von Fragen ziemlich effektiv zu sein;)
DukeZhou

2

Ist der Turing-Test oder eine seiner Varianten ein zuverlässiger Test für künstliche Intelligenz?

Kurzsichtigkeit

Ja, wenn man den Begriff Künstliche Intelligenz im Sinne von Alan Turings Imitationsspiel oder einer seiner Varianten definiert. Der Ansatz kann gleichzeitig gültig und als Definition von Intelligenz sehr begrenzt sein, da die Leute das Wort interpretierten, bevor AI auftauchte.

Bewährte Intelligenz

Folglich gibt es eine große Anzahl alternativer Ansätze zur Messung künstlicher oder anderer Intelligenz.

  • Schachgroßmeister werden
  • Erstellen eines erfolgreichen Schachprogramms
  • Erhalt einer höchst selektiven internationalen Auszeichnung
  • Eine Strategie entwickeln, die einen Krieg oder Frieden gewinnt
  • Überwinde Tausende von Eliminierungsrunden in Wirtschaft und Politik, um Präsident zu werden
  • Verfassen von brillanten Artikeln, Papieren, Drehbüchern, Vorträgen, Reden, Büchern oder Gedichten, die signifikante menschliche Paradigmenwechsel hervorrufen
  • Ergebnisse auf Geniestufe in einem Mensa-Test anzeigen
  • Einer der reichsten Menschen der Welt werden

Normale Messung der normalen Intelligenz

Dies sind jedoch Messungen von außergewöhnlicher Intelligenz, vor allem, weil die Verantwortlichen in diesen Bereichen Intelligenz zuverlässig auf mehrere Domänen angewendet haben, was in mehreren realen Szenarien zu bemerkenswerten Erfolgen geführt hat. Die Zuverlässigkeit ist ein Merkmal der Person, die die Intelligenz besitzt, nicht die Prüfung der Intelligenz selbst.

Dies sind profane, aber vielleicht auch valide und verlässliche Maßstäbe für die Intelligenz.

  • Die Erziehung gesunder und liebevoller Kinder ist durch sorgfältige Befragung von Freunden und Mitarbeitern der Familienmitglieder nachweisbar
  • Wiederholte und erfolgreiche Behebung vieler Zustände unterschiedlicher Art, bei denen festgestellt wurde, dass sie in greifbarer und messbarer Weise gebrochen sind und aufgrund der Anwendung von Erkenntnisverständnis, Analyse und Abhilfemaßnahmen messbar korrigiert wurden
  • Gesprächsintelligenz als messbar durch die Teilnehmer am Gespräch, die ihren eigenen Erfolg auf die Ideen und Beispiele des Gesprächspartners zurückführen

Was sind die wirklich gewünschten Endziele?

Vielleicht ist das Hauptmerkmal des Turing-Tests, dass er künstlich ist. Wenn künstliche Intelligenz das ist, was wir von AI-Software wollen, dann erhalten wir diese. Es ist jedoch wahrscheinlich, dass wir etwas entweder wesentlich mehr oder wesentlich weniger wollen.

Wir möchten mehr, dass es nett wäre, dass einige Computer unser Freund, unser Mentor und ein unbezahlter Angestellter mit außergewöhnlichen Fähigkeiten sind, die zu unserem persönlichen Erfolg in Bezug auf Einkommen, Einfluss, Popularität oder Vermächtnis führen.

Wir möchten weniger, dass einige Computer domänenspezifische Aufgaben erledigen und als vollständig untergeordnete Tools verbleiben, möglicherweise mit einer gewissen Persönlichkeit und Wärme, wie ein Schiff oder ein anderes komplexes Gerät, das wir mit menschlichen Namen versehen, jedoch ohne die Unvorhersehbarkeit der weitreichenden Fähigkeiten der menschlichen Intelligenz.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.