Ist es möglich, die Erzeugung der Gewichtungsmatrix mit einem Quantenalgorithmus zu beschleunigen?


9

In diesem [1] Artikel auf Seite 2 erwähnen sie, dass sie die Gewichtungsmatrix wie folgt erzeugen:

W=1Md[m=1m=Mx(m)(x(m))T]Idd

Dabei sind die dimensionalen Trainingsbeispiele (dh wobei ) und es gibt insgesamt Trainingsbeispiele. Diese Erzeugung einer Gewichtungsmatrix unter Verwendung einer Matrixmultiplikation, gefolgt von einer Summe über Terme, scheint eine kostspielige Operation in Bezug auf die Zeitkomplexität zu sein, dh ich schätze um (?).x(m)dx:={x1,x2,...,xd}Txi{1,1}  i{1,2,...,d}MMO(Md)

Gibt es einen Quantenalgorithmus, der die Erzeugung der Gewichtungsmatrix erheblich beschleunigen kann? Ich denke, in der Arbeit kommt ihre Hauptbeschleunigung vom Quantenmatrix-Inversionsalgorithmus (der später in der Arbeit erwähnt wird), aber sie scheinen diesen Aspekt der Erzeugung der Gewichtungsmatrix nicht berücksichtigt zu haben.

[1]: Ein Quantum Hopfield Neural Network Lloyd et al. (2018)

Antworten:


5

Nehmen Sie die Dichtematrix viele Details sind im folgenden Absatz auf Seite 2 enthalten:

ρ=W+Idd=1Mm=1M|x(m)x(m)|,

Entscheidend für die Quantenanpassung neuronaler Netze ist das klassische Einlesen von Aktivierungsmustern in Quanten. In unserer Einstellung läuft das Einlesen eines Aktivierungsmusters auf die Vorbereitung des Quantenzustands . Dies könnte im Prinzip mithilfe der Entwicklungstechniken des Quanten-Direktzugriffsspeichers (qRAM) [33] oder einer effizienten Quantenzustandsvorbereitung erreicht werden, für die eingeschränkte, orakelbasierte Ergebnisse vorliegen [34]. In beiden Fällen ist der Rechenaufwand logarithmisch in Bezug auf . Man kann alternativ eine vollständige Quantenperspektive anpassen und die Aktivierungsmusterx|xd|xdirekt von einem Quantengerät oder als Ausgang eines Quantenkanals. Für erstere ist unsere Vorbereitungslaufzeit immer dann effizient, wenn die Quantenvorrichtung aus einer Anzahl von Gattern besteht, die höchstens polynomial mit der Anzahl der Qubits skalieren. Stattdessen betrachten wir für letztere den Kanal normalerweise als eine Form der Interaktion zwischen fester Systemumgebung, für deren Implementierung kein Rechenaufwand erforderlich ist.

Die Referenzen oben sind:

[33]: V. Giovannetti, S. Lloyd, L. Maccone, Quanten-Direktzugriffsspeicher, Physical Review Letters 100, 160501 (2008) [ PRL-Link , arXiv-Link ]

[34]: AN Soklakov, R. Schack, Effiziente Zustandsvorbereitung für ein Register von Quantenbits, Physical Review A 73, 012307 (2006). [ PRA-Link , arXiv-Link ]


Ohne ins Detail zu gehen, wie, sind beide oben genannten tatsächlich Schemata für die Implementierung eines effizienten qRAM; und effiziente Zustandsvorbereitung, die den Zustand in time .|xO(log2d)

Dies bringt uns jedoch nur so weit: Dies kann verwendet werden, um den Status zu erstellen, während wir eine Summe über alle möglichen wollen .ρ(m)=|x(m)x(m)|m

Entscheidend ist, dass gemischt ist und daher nicht durch einen einzelnen reinen Zustand dargestellt werden kann. Daher gilt die zweite der beiden oben genannten Referenzen zur Neuerstellung reiner Zustände nicht und der erste erfordert, dass sich der Zustand bereits in qRAM befindet.ρ=mρ(m)/M

Daher machen die Autoren eine von drei möglichen Annahmen:

  1. Sie haben ein Gerät, das ihnen zufällig den richtigen Eingangszustand gibt

  2. Sie haben entweder die Zustände in qRAM,ρ(m)

  3. Sie können diese Zustände nach Belieben unter Verwendung der zweiten der obigen Referenzen erstellen. Der gemischte Zustand wird dann unter Verwendung eines Quantenkanals (dh einer vollständig positiven, spurerhaltenden (CPTP) Karte) erzeugt.

Wenn Sie die ersten beiden der oben genannten Optionen für den Moment vergessen (die erste löst das Problem auf magische Weise), könnte der Kanal entweder sein:

  • ein entwickeltes System, indem es für eine bestimmte Instanz in einer Art analoger Simulation erstellt wird. Mit anderen Worten, Sie haben einen physischen Kanal, der eine physische Zeitdauer (im Gegensatz zu einer gewissen Zeitkomplexität). Dies ist die "feste System-Umgebungs-Interaktion, für deren Implementierung kein Rechenaufwand erforderlich ist".t

  • Der Kanal wird selbst simuliert. Es gibt einige Artikel dazu, wie Bény und Oreshkovs ungefähre Simulation von Quantenkanälen ( arXiv-Link - dies sieht aus wie ein gründlicher Artikel , aber ich konnte keine Aussagen zur Zeitkomplexität finden), Lu et. Experimentelle Quantenkanalsimulation von al. (es scheint keine arXiv-Version zu existieren) und arXiv-Preprint von Wei, Xin und Long Effiziente universelle Quantenkanalsimulation in IBMs Cloud-Quantencomputer , die (für die Anzahl der Qubits ) gibt eine zeitliche Komplexität von . Es kann auch eine Stinespring-Dilatation mit einer Komplexität vonn=log2dO((8n3+n+1)42n)O(27n343n).


Betrachtet man nun Option 2 1 , wäre eine mögliche effizientere Methode, die Zustände vom Adressregister in das Datenregister in der üblichen Methode zu übertragen: für Adressen in Register , , dies in das Datenregister übertragen, erhalten Sie den Status im Datenregister als . Es sollte möglich sein, das Adress- und Datenregister einfach zu dekohärieren, um dies in einen gemischten Zustand zu verwandeln, was einen geringen Zeitaufwand ergibt, obwohl kein zusätzlicher Aufwand für die Rechenkomplexität vorliegt , was eine wesentlich verbesserte Komplexität der Erzeugung von ergibt, wenn ein qRAM mit den Zuständen , ofajψj|jadjψj|ja|Djdρ|x(m)O(n) . Dies ist auch die Komplexität der Erstellung der Zustände in erster Linie, was eine potenzielle (stark verbesserte) Komplexität der Erzeugung von von ergibt) .|x(m)ρO(n)

1 Vielen Dank an @glS für den Hinweis auf diese Möglichkeit im Chat


Diese Dichtematrix wird dann in 'qHop' (Quanten-Hopfield) eingespeist, wo sie verwendet wird, um für zu simulieren gemäß dem Unterabschnitt " Effiziente Hamilton-Simulation von A " auf Seite 8.eiAt

A=(WγIdPP0)

Genauso kleine Anmerkung zu Ihrer Bearbeitung: Sie müssen das Adressregister nicht wirklich "entkoppeln" oder überhaupt nichts tun. Die einfache Tatsache , es nicht zu verwenden, macht den Inhalt des Datenregisters nicht von einer Mischung der verschiedenen|Dj
glS
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.