Lassen Sie mich meine 2 ¢ hinzufügen, es ist meine Aufgabe, gute und saubere Daten für einen Hedgefonds zu erhalten. Ich habe ziemlich viele Datenfeeds und Anbieter historischer Daten gesehen. Hierbei handelt es sich hauptsächlich um US-Bestandsdaten.
Wenn Sie etwas Geld haben und sich nicht mit dem Herunterladen von Daten von Yahoo beschäftigen, erhalten Sie die Daten zum Tagesende direkt aus den CSI-Daten . Hier erhält Yahoo auch die EOD-Daten von AFAIK. Sie haben eine API, mit der Sie die Daten in ein beliebiges Format extrahieren können. Ich denke, das jährliche Abonnement für Daten beträgt ein paar 100 Dollar.
Das Hauptproblem beim Herunterladen von Daten von einem kostenlosen Dienst besteht darin, dass Sie nur noch vorhandene Bestände erhalten. Dies wird als Survivorship Bias bezeichnet und kann zu falschen Ergebnissen führen, wenn Sie sich viele Bestände ansehen, da Sie nur diejenigen einbeziehen, die dies gemacht haben weit und nicht diejenigen, die von der Liste gestrichen wurden.
Um mit einigen Intraday-Daten herumzuspielen , die ich in IQFeed untersuchen würde , bieten sie mehrere APIs zum Extrahieren historischer Daten, obwohl sie hauptsächlich ein Outfit für Echtzeit-Feeds sind. Aber hier gibt es einige Optionen, einige Broker bieten sogar Downloads historischer Daten über ihre APIs an. Wählen Sie also einfach Ihr Gift aus.
ABER normalerweise sind alle diese Daten nicht sehr sauber. Sobald Sie mit dem erneuten Testen beginnen, werden Sie feststellen, dass bestimmte Bestände fehlen oder als zwei verschiedene Symbole angezeigt werden oder Bestandsaufteilungen nicht ordnungsgemäß berücksichtigt werden usw. Und dann erkennen Sie, dass dies historisch ist Dividendendaten werden ebenfalls benötigt, sodass Sie im Kreis laufen und Daten aus 100 verschiedenen Datenquellen zusammenfügen können. Um mit einem "Rabatt" -Datenfeed zu beginnen, reicht dies aus. Sobald Sie jedoch umfassendere Backtests ausführen, können je nach Ihrer Tätigkeit Probleme auftreten. Wenn Sie sich nur die S & P 500-Aktien ansehen, wird dies jedoch weniger ein Problem sein, und ein "billiger" Intraday-Feed reicht aus.
Was Sie nicht finden, sind kostenlose Intraday-Daten. Ich meine, Sie werden vielleicht einige Beispiele finden. Ich bin sicher, dass irgendwo 5 Jahre MSFT-Tick-Daten herumschwirren, aber das wird Sie nicht sehr weit bringen.
Wenn Sie dann das echte Zeug benötigen (Auftragsbuch der Stufe II, alle Zecken, wie sie an allen Börsen aufgetreten sind), ist Nanex eine "erschwingliche", aber ausgezeichnete Option . Sie liefern Ihnen tatsächlich ein Laufwerk mit Terabyte an Daten. Wenn ich mich recht erinnere, sind es ungefähr 3.000 bis 4.000 US-Dollar pro Jahr an Daten. Aber glauben Sie mir, wenn Sie erst einmal verstanden haben, wie schwierig es ist, gute Intraday-Daten zu erhalten, werden Sie nicht glauben, dass dies überhaupt sehr viel Geld ist.
Es ist schwierig, Sie nicht zu entmutigen, sondern gute Daten zu erhalten. Viele Hedgefonds und Banken geben monatlich Hunderttausende von Dollar aus , um Daten zu erhalten, denen sie vertrauen können. Wieder können Sie irgendwo anfangen und dann von dort aus gehen, aber es ist gut, es ein bisschen im Kontext zu sehen.
Bearbeiten: Die Antwort oben ist aus meiner eigenen Erfahrung. Dieser Artikel von Caltech über verfügbare Daten-Feeds bietet weitere Einblicke und empfiehlt insbesondere QuantQuote .