Beim Abrufen von Informationen werden die Informationen zurückgegeben, die für eine bestimmte Abfrage oder ein bestimmtes Interessengebiet relevant sind. Beachten Sie, dass diese Informationen auch in Form allgemeiner Dokumente vorliegen können. Sicherlich sind Suchmaschinen ein bemerkenswertes Beispiel für eine solche Aufgabe. Ich würde sagen, dass die wichtigsten Entitäten, die für das Abrufen von Informationen erkennbar sind, der anfängliche Satz von Dokumenten / Informationen und die Abfrage sind, die angeben, wonach gesucht werden soll.
Andererseits geht es bei der Informationsextraktion eher darum, allgemeines Wissen (oder Beziehungen) aus einer Reihe von Dokumenten oder Informationen zu extrahieren (oder daraus abzuleiten). Beachten Sie, dass hier der gesamte Inhalt der Dokumente als ein ganzes Datenkorpus betrachtet werden kann, aus dem das Wissen extrahiert wird. Natürlich können Sie auch in diesem Fall irgendwie angeben, was Sie extrahieren möchten, aber es geht mehr um Eigenschaften / Beziehungen als um bestimmte Themen / Themen. Eigenschaften sind domänenspezifischer, während Beziehungen im Allgemeinen allgemeinere Szenarien abdecken.
Auch hier möchten Sie bei Suchmaschinen nach Websites suchen, die am wahrscheinlichsten Informationen zu diesem bestimmten Thema enthalten. Dies ist ein Beispiel für das Abrufen von Informationen .
Zur Informationsextraktion können Sie stattdessen beispielsweise alle Namen von Städten oder E-Mail-Adressen extrahieren, die in einem Korpus von Dokumenten enthalten sind. Sie könnten sogar viel allgemeiner vorgehen und einfach darum bitten, Wissen zu extrahieren. Wie Sie sehen, ist dies wirklich allgemein gehalten, aber es kann zum Beispiel erreicht werden, indem für jeden gültigen Satz eines Textes Drillinge der Form Subjekt-Aktions-Objekt erhalten werden (dies ist am besten für Texte in natürlicher Sprache geeignet).
Wenn Sie interessiert sind, werden diese (und andere) Themen im Kapitel Verarbeitung natürlicher Sprache des Buches Künstliche Intelligenz: Ein moderner Ansatz ausführlich erläutert .