Gibt es laufende Projekte, die Stack Exchange für maschinelles Lernen verwenden?


Antworten:


6

Es scheint sicherlich Forschungsprojekte gegeben zu haben, die irgendeine Form von Text Mining / Information Retrieval / etc. und StackExchange-Sites.

Einige Beispiele, die ich über google / google scholar finden konnte (es ist unwahrscheinlich, dass sie in der Nähe einer vollständigen Liste liegen):


Im Allgemeinen scheinen automatisierte Fragebeantwortungssysteme immer noch ein ziemlich aktives Forschungsgebiet zu sein, kein triviales / "gelöstes" Problem. StackExchange kann eine Datenquelle für solche Systeme sein, aber es gibt auch viele andere Datenquellen (Wikipedia, Quora usw.).


3

DuckDuckGo lernt Antworten auf technische Fragen von StackExchange. Geben Sie eine technische Frage wie "Laufende Projekte verwenden Stapelaustausch" in DuckDuckGo ein und es wird eine hervorgehobene Zusammenfassung der Antwort auf der rechten Seite angezeigt . Und die Ente hat eine offene API für viele (100s) Fragen, die Datenquellen beantworten. Oder gehen Sie direkt zur StackExchange API .

Projekte können die Daten aus der SE open API verwenden, sofern sie ihren Anforderungen entsprechen TOU entsprechen . Stellen Sie im Grunde nur sicher, dass Ihre Benutzer erkennen können, dass die Daten von Stack Exchange stammen. Die Urheberrechtslizenz kann auch Ihre Fähigkeit einschränken, den Inhalt des Textes zu ändern, beispielsweise mit einem erfahrenen abstraktiven Zusammenfassungsprogramm. Vielleicht hebt Duck.com deshalb nur Keywords hervor.

Das Datenschutzgesetz ist im Fluss, insbesondere, wenn es um die Daten geht, die Sie an eine Website übermittelt haben, und um die daraus abgeleiteten Modelle für maschinelles Lernen. Mit den neuen europäischen Daten- und Datenschutzbestimmungen können Sie alle Daten herunterladen oder löschen, die Sie an eine Site wie Stack Exchange senden.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.