Ich habe diese Frage auf der Matemathics Stack Exchange-Website gestellt und es wurde empfohlen, sie hier zu stellen.
Ich arbeite an einem Hobbyprojekt und benötige Hilfe bei folgendem Problem.
Ein bisschen Kontext
Angenommen, es gibt eine Sammlung von Artikeln mit einer Beschreibung der Funktionen und einem Preis. Stellen Sie sich eine Liste mit Autos und Preisen vor. Alle Autos verfügen über eine Liste von Merkmalen, z. B. Motorgröße, Farbe, Pferdestärke, Modell, Baujahr usw. Für jede Marke gilt Folgendes:
Ford:
V8, green, manual, 200hp, 2007, $200
V6, red, automatic, 140hp, 2010, $300
V6, blue, manual, 140hp, 2005, $100
...
Darüber hinaus wird die Liste der Autos mit Preisen mit einem gewissen Zeitintervall veröffentlicht, was bedeutet, dass wir auf historische Preisdaten zugreifen können. Enthält möglicherweise nicht immer genau dieselben Autos.
Problem
Ich würde gerne verstehen, wie man die Preise für jedes Auto basierend auf diesen Basisinformationen modelliert, vor allem Autos, die nicht in der anfänglichen Liste enthalten sind.
Ford, v6, red, automatic, 130hp, 2009
Für das obige Auto ist es fast das gleiche wie in der Liste, nur etwas anders in Pferdestärke und Jahr. Was wird zum Preis benötigt?
Was ich suche, ist etwas Praktisches und Einfaches, aber ich würde auch gerne etwas über komplexere Ansätze erfahren, wie man so etwas modelliert.
Was ich versucht habe
Hier ist, womit ich bisher experimentiert habe:
1) Verwenden von historischen Daten zum Nachschlagen von Auto X. Wenn nicht gefunden, kein Preis. Dies ist natürlich sehr begrenzt und man kann dies nur in Kombination mit etwas Zeitverfall verwenden, um die Preise für bekannte Autos im Laufe der Zeit zu ändern.
2) Verwenden eines Auto-Feature-Gewichtungsschemas zusammen mit einem Musterauto zum Preis. Grundsätzlich gilt, dass es einen Grundpreis gibt und die Funktionen dies mit einigem Faktor ändern. Daraus wird der Preis eines Autos abgeleitet.
Das erste hat nicht gereicht und das zweite hat sich nicht immer als richtig erwiesen, und ich hatte möglicherweise nicht den besten Ansatz für die Verwendung der Gewichte. Dies scheint auch ein bisschen schwer zu sein, Gewichte zu pflegen, deshalb dachte ich, dass es vielleicht eine Möglichkeit gibt, die historischen Daten als Statistik zu verwenden, um Gewichte zu erhalten oder um etwas anderes zu erhalten. Ich weiß nur nicht, wo ich anfangen soll.
Andere wichtige Aspekte
- in irgendein Softwareprojekt integrieren, das ich habe. Entweder durch die Verwendung vorhandener Bibliotheken oder durch das Schreiben eines eigenen Algorithmus.
- Schnelle Neuberechnung, wenn neue historische Daten eingehen.
Irgendwelche Vorschläge, wie ein Problem wie dieses angegangen werden könnte? Alle Ideen sind mehr als willkommen.
Vielen Dank im Voraus und freuen uns auf Ihre Anregungen!