Ist AlphaZero ein Beispiel für eine AGI?


11

Aus DeepMinds Forschungsbericht auf arxiv.org:

In diesem Artikel wenden wir einen ähnlichen, aber vollständig generischen Algorithmus, den wir AlphaZero nennen , auf die Spiele Schach und Shogi sowie Go an, ohne zusätzliche Domänenkenntnisse außer den Spielregeln, was zeigt, dass es sich um ein allgemeines Verstärkungslernen handelt Algorithmus kann, tabula rasa, übermenschliche Leistung in vielen herausfordernden Bereichen erreichen.

Bedeutet dies, dass AlphaZero ein Beispiel für AGI (Artificial General Intelligence) ist?

Antworten:


11

Gute Frage!

  • AlphaZero ist zwar ein wichtiger Meilenstein, aber definitiv kein AGI :)

AlphaGo ist zwar stark im Go-Spiel, aber eng stark ("stark-eng-KI"), definiert als Stärke in einem einzelnen Problem oder einer Art von Problem (wie Go und andere nicht zufällige, perfekte Informationsspiele).

  • AGI muss bei allen Problemen, an denen Menschen arbeiten oder die von Menschen gelöst werden , mindestens so stark sein wie Menschen.

AGI wird oft mit Superintelligenz assoziiert , definiert als Intelligenz, die das menschliche Niveau übertrifft.

AGI impliziert nicht unbedingt Superintelligenz in dem Sinne, dass wir einen Android betrachten würden, der alle menschlichen Aktivitäten mit der gleichen Fähigkeit wie Menschen als künstliche allgemeine Intelligenz ausführen kann .

Aber technisch gesehen ist AlphaGo eine enge Superintelligenz, da es alle menschlichen Leistungen in einem einzigen Problem übertrifft.


Es gibt keine engen Superintelligenzen. Wir nennen es schwache KI :). Kein Mensch kann in seinem Leben halboptimale Zusammenstellungen von Microsoft Word oder Excel finden - während moderne Maschinen dies in einigen Stunden tun können.
Quonux

@ Quonux Kommt auf die Definition an, vermute ich. Bostroms Definition von Superintelligenz entspricht in etwa der künstlichen allgemeinen Intelligenz, aber der Begriff selbst bedeutet etymologisch gesehen nur "höhere Intelligenz", wörtlich "über + Intelligenz". Unter dieser grundlegenden Definition könnte "stark-schmale KI" gleichbedeutend mit "schmaler Superintelligenz" sein, da die ursprüngliche Definition von "stark" AGI war. Nach AlphaGo verwendeten die Wissenschaftler das "enge" Qualifikationsmerkmal.
DukeZhou

@Quonux Teil meines Punktes hier ist, dass mit dem Aufkommen von AlphaGo der Begriff "schwach" für KI, der die menschlichen Fähigkeiten in einer einzelnen Aufgabe übersteigt, durch "stark-schmale KI" ersetzt worden zu sein scheint.
DukeZhou

2

Annahmen, die möglicherweise falsch sind

Im Ton des Papiers sind zwei Annahmen erkennbar.

  • Alle mentalen Herausforderungen können auf ein Spiel mit festen Regeln reduziert werden.
  • Maschinen, die besser sind als Menschen, sind das, was Menschen wirklich wollen oder brauchen.

In der Frage sind zwei weitere identifizierbar.

  • Allgemeine Intelligenz existiert beim Menschen 1
  • Wenn es beim Menschen existiert, ist es daher bei Computern machbar.

Alle vier mögen wahr sein, aber keiner der vier ist sicher.

Produktivität von AlphaZero

Wenn sich unser Schachbrett im Spielregal in unserem Schrank befindet, unser Gras lang ist und unser Rasenmäher kaputt ist, würde AlphaZero, wenn es mit einem humanoiden Roboter verbunden ist, keine Spielregeln für die Tasksequenz codieren.

  • Auf die Bitte seines Besitzers hören,
  • Lernen, wie man den Roboter als Marionettenmeister beherrscht,
  • Auffinden und Identifizieren aller unserer Werkzeuge und Ersatzteile,
  • Rasenmäher befestigen und
  • Lassen Sie uns wissen, dass der Rasenmäher einsatzbereit ist.

Daher ist es für uns in diesem Szenario von keinem besonderen Verbraucherwert. Nicht sehr allgemein.

Selbst wenn es den Rasen mit einem bereits funktionierenden Rasenmäher mähen könnte, wäre es von Wert, was nicht die Fähigkeit erfordert, etwas zu gewinnen, sondern die Fähigkeit, zu gehorchen und die untermenschliche Intelligenz zu zeigen, die erforderlich ist, um nicht über das Blumenbeet zu rennen.

Es ist bemerkenswert, dass die klugen Leute von DeepMind die lateinische Tabula Rasa anstelle einer leeren Tafel gewählt haben, aber nicht annähernd so beeindruckend wie die Erstellung eines Lernprogramms, das lernen kann, drei Spiele gut zu spielen, wobei nur die codierten Regeln und das tatsächliche Spiel als Eingabe verwendet werden.

Um diese Spielprogramme in einem Produktbereich als wirklich nützlich zu betrachten, kann man sich nicht auf ein anhaltendes Interesse am Kauf von Software verlassen, die den Käufer jedes Mal schlägt. Damit KI-Produkte funktionsfähig sind, müssen die Lernfunktionen in der Lage sein, umgangssprachlich den gesunden Menschenverstand zu nennen, was ein viel breiteres und flexibleres Domänenwissen erfordert als die festgelegten Spielregeln. Wir können davon ausgehen, dass die meisten Forscher, die Meilensteine ​​beim Gewinnen des Gameplay-Lernens erreicht haben, in diese Richtung drängen. Auch sie wissen, dass ihre Forschungsergebnisse irgendwann produziert werden müssen oder zu einem käuflichen SaaS-Angebot führen müssen.

Für diejenigen außerhalb des Fachgebiets wäre es beeindruckend, wenn diese Fortschritte im Bereich des Rechenzentrums umgeleitet werden könnten, um Gentherapien zur Heilung von Krebs oder Herpes oder zur Umkehrung von Diabetes oder Alzheimer zu generieren. Dann könnten wir den Forschern verzeihen, dass sie uns keinen Download zur Verfügung gestellt haben, mit dem sie einen Roboter zur Reinigung unseres Badezimmers als Marionettenmeister einsetzen könnten. Aus dem Papier geht nicht hervor, dass AlphaZero hinreichend nachgewiesen hat, dass es "übermenschliche Leistung in vielen herausfordernden Bereichen" aufweist.

Was sie getan haben, ist immer noch beeindruckend und in der Richtung, in der auch andere Fortschritte gemacht haben. Nur wenige von uns würden es wagen, ein Spiel zu erfinden, das diese generischen Lernprogramme nicht schnell lernen und uns innerhalb weniger Spielinstanzen besiegen würden.

Fortschritte in der Perspektive gesehen

Sicherlich erweitern die Erfindungen der Menschheit beim Rechnen, Sortieren von E-Mails und jetzt beim Spielen die Fähigkeiten des nackten Menschen, ohne seine Werkzeuge. Dieser Fortschritt versetzt Computersysteme fest in den Bereich eines Werkzeugs. Eine Hinterhacke ist in gewisser Weise auch übermenschlich. Versuchen Sie, einen Kilometer Rohr ohne einen zu verlegen.

Umgekehrt spielt die Menschheit die Rolle des Gesundheitsdienstleisters für Computer. Wenn sie krank werden oder versagen, sind wir gezwungen, ihre Viren und Würmer auszutreiben oder ihre ausgefallenen Teile zu ersetzen. Andernfalls geraten unsere Häuser und Geschäfte in Unordnung.

Technologie sollte wie in allen Dingen in der Perspektive betrachtet werden.

Es wäre klug, wenn Menschen weniger von Spielen und gegenseitigen Schlägen fasziniert wären und sich mehr auf kollaboratives soziales Verhalten konzentrieren würden, das darauf abzielt, soziale und wirtschaftliche Probleme mit den neu erfundenen Werkzeugen zu lösen und dies auf eine Weise zu tun, die keine neuen Probleme schafft oder einlädt neue Gräueltaten.


Fußnoten

Dass das, was als allgemeine Intelligenz beschrieben wurde, beim Menschen existiert, ist aufgrund gegenteiliger Beweise umstritten. Viele würden diese Strategien und Trends als Beweis für Grenzen der menschlichen Intelligenz anführen.

  • Nukleare Abschreckung als Friedensstrategie
  • Ein völliger Mangel an Mäßigung beim Verbrauch endlicher, kritischer natürlicher Energieressourcen
  • Kontinuierlich zunehmende Dichte von Suchtmustern weltweit
  • Verursacht das sechste Massensterben auf der Erde

Vielen Dank für die Bearbeitung, es ist besser so (zumindest für mich), mit mehr Fokus auf die technischen Teile der Antwort. Es gibt vielleicht eine andere Frage, wie perfekt rational oder leistungsfähig eine AGI sein muss. Ebenso, an welche Standards des Verhaltens von Einzelpersonen oder Gruppen wir den Menschen halten wollen - obwohl dies nicht für diese Site gelten würde, es sei denn, es ging speziell um Vergleiche mit künstlichen Intelligenzen.
Neil Slater
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.