Gute Bücher / Papiere zur Kreditwürdigkeitsprüfung


11

Ich suche nach Empfehlungen für Bücher über Kredit-Scoring. Ich interessiere mich für alle Aspekte dieses Problems, aber hauptsächlich für: 1) Gute Funktionen. Wie baue ich sie? Welche haben sich als gut erwiesen? 2) Neuronale Netze. Ihre Anwendung auf Kredit-Scoring-Problem. 3) Ich habe neuronale Netze gewählt, interessiere mich aber auch für andere Methoden.


Antworten:


6

Wenn Sie neu in der Scoring-Welt sind, sollte Ihr erstes Buch von naeem siddiqi über Kredit-Scoring mit SAS sein. Wenn Sie nicht am Unterricht teilgenommen haben, machen Sie es. Das Hauptaugenmerk der Klasse liegt auf dem allgemeinen Verständnis der Bewertung und des Verkaufs von SAS Enterprise Miner für Millionen von Dollar.

Wenn Sie Theorie benötigen, benötigen Sie eine kategoriale Datenanalyse- und Data Mining-Klasse von einer nahe gelegenen Universität. Auch nach diesen Kursen benötigen Sie noch Hilfe.

Derzeit werden die beliebtesten Techniken verwendet

  1. logistische Regression
  2. Neuronale Netze
  3. unterstützen Vektormaschinen und
  4. zufällige Wälder

Clustering, Diskriminanzanalyse, Faktoranalyse und Hauptkomponenten sind ebenfalls ein Muss.

Das Kredit-Scoring von Elizabeth Mays gibt Ihnen auch einen guten Überblick.

Ich nahm auch an einem Kreditrisikomodellierungskurs des SAS-Instituts teil, der mir ein wenig half. Es ist ein ständiger Lernprozess und wird nie durchgeführt.

Bayesianische Leute mögen auch ihre Methoden.

Bearbeiten

Ich habe auch vergessen zu erwähnen. Die logistische Regression ist die beliebteste Technik, die es gibt, und wird immer diejenige sein, die Banken weiterhin verwenden werden. Es ist sehr schwierig, andere Methoden an die Mitarbeiter des oberen Managements zu verkaufen, es sei denn, Ihre Bank ist bereit, sich weniger um das Verständnis dieser Methoden zu kümmern, und ihr Fokus bleibt auf Risikobereitschaft und Geldverdienen.


Vielen Dank! Ich werde klarstellen: Ich nehme an einem Online-Wettbewerb teil, bei dem das Ziel darin besteht, die Wahrscheinlichkeit des Ausfalls eines Kreditgebers vorherzusagen. Also 1) Ich kann jede Methode wählen, die ich mag. Der Wettbewerb endet in 2 Wochen. 2) Ich habe nicht viel Zeit, um umfassend zu lernen. und 3) Die bereitgestellten Daten sind Rohantworten von Kreditauskunfteien zu früheren Krediten, daher bin ich wirklich daran interessiert, nicht offensichtliche Merkmale aus diesen Daten zu extrahieren.
Nya

Vielen Dank auch für Ihre Antwort. Ich werde mir auf jeden Fall Ihre Referenzen ansehen.
Nya

1
Was ist das für ein Wettbewerb? Kann ich wissen?
Xiaodai

6

Ich arbeite im Bereich Kredit-Scoring. Obwohl ich gerne verschiedene Ansätze erforsche, finde ich, dass logistische Regression oft gut genug ist, wenn nicht der beste Ansatz. Ich habe die neuesten Artikel zu diesem Thema nicht untersucht, aber aus dem Gedächtnis in den meisten Artikeln werden Sie sehen, dass andere Ansätze wie das Modell neuronaler Netze in der Regel keinen signifikanten Anstieg der Vorhersagekraft bieten (gemessen von GINI und AR). Außerdem sind diese Modelle für Laien in der Regel viel schwieriger zu verstehen (häufig haben die meisten leitenden Angestellten keinen statistischen Hintergrund), und der Scorecard-Ansatz mit logistischer Regression scheint die am einfachsten zu erklärenden Modelle zu bieten. Richtig, die meisten Scorecards berücksichtigen keine Interaktionen.

Allerdings gab es in letzter Zeit einige Interessen daran, Scorecards mithilfe von Überlebensanalysetechniken zu erstellen, da dies einige Vorteile gegenüber der logistischen Regression bietet. Wir können nämlich leichter makroökonomische Faktoren in das Modell einbeziehen, wir können neuere Daten in den Modellaufbau verwenden, anstatt uns auf Daten vor mindestens 12 Monaten verlassen zu müssen (da der binäre Indikator in der Logistik normalerweise als voreingestellt innerhalb des Modells definiert wird nächste 12 Monate). In dieser Hinsicht könnte meine These eine andere Perspektive bieten, indem sie die Erstellung von Kredit-Scorecards mithilfe der Überlebensanalyse untersucht. Ich habe gezeigt, wie Scorecards für die Überlebensanalyse genauso aussehen und sich genauso anfühlen wie Scorecards für die logistische Regression. Daher können sie ohne allzu große Probleme eingeführt werden.

In meiner Arbeit habe ich auch den ABBA-Algorithmus beschrieben, der ein neuartiger Ansatz zum Binning von Variablen ist.

https://www.google.com.sg/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&ved=0CDAQFjAA&url=http%3A%2F%2Fftpmirror.your.org%2Fpub%2Fwik% 2Fwikipedia% 2Fcommons% 2F2% 2F2F% 2FAbout_Time _-_ Building_Credit_Scorecards_with_Survival_Analysis.pdf & ei = 8D8MUorrJs2Trgf56YCwCQ & usg = AFQjCNGxWRH1naJS4UqH_ckwzTx3GsaP8g & sig2 = kcEvjUUcn_wT93igxpYYDA & bvm = bv.50768961, d.bmk

Update: Ich mache keinen Anspruch darauf, ob meine These gut ist. Es ist nur eine andere Perspektive von einem Praktizierenden auf dem Gebiet.


1
Dies scheint nicht auf die Frage konzentriert zu sein. Ihr konkreter Vorschlag lautet "Lesen Sie meine These". Ich habe es nicht gelesen und bin nicht qualifiziert, es zu bewerten, aber es ist nicht als Buch oder sogar als veröffentlichtes Papier qualifiziert.
Nick Cox

4
@Nick Die Frage fragt nach "anderen Methoden", die in dieser Antwort angesprochen werden. Viele Leute finden einen Link zu einem herunterladbaren Text nützlich, vielleicht sogar mehr als nur eine Referenz. Für einen anonymen Flagger: Das Bereitstellen eines Links zur eigenen Arbeit ist kein Spam. Wir begrüßen Forscher und andere Innovatoren hier und möchten ihre Fähigkeit, uns zu helfen, nicht einschränken, indem sie verlangen, dass sie niemals ihre eigenen Beiträge zitieren!
whuber

3
Ich nehme @ whubers Punkt. Ich stimme auch nachdrücklich zu, dass es angebracht ist, die eigene Arbeit zu zitieren. xiaodai: Ich würde das Update entfernen. Der springende Punkt Ihres Beitrags ist, dass Ihre These möglicherweise lesenswert ist. Wenn du das nicht gedacht hättest, würdest du nicht posten. Das Hinzufügen eines Hinweises auf Zurückhaltung oder Bescheidenheit ist nicht erforderlich.
Nick Cox

3
  • Ich habe in der Vergangenheit auf den Leitfaden zur Kreditbewertung in R von D. Sharma verwiesen, und er ist eine gute Einführung in Ansätze wie logistische Regression und baumbasierte Methoden
  • Der obige Leitfaden verwendet die deutschen Kreditdaten, die eine Vielzahl von Funktionen bieten. Wenn Sie nach dem Dataset suchen, finden Sie andere alternative Ansätze, Analysen und Vergleiche, die Ihnen bei der Auswahl von Features und der Modellauswahl für Ihr Dataset helfen können
  • Neuronale Netze sind eine gute Wahl für ein binäres Klassifizierungsproblem wie dieses. In der realen Welt wird erwartet, dass ein Kreditbewertungsmodell auch Gründe dafür liefert, warum ein Kreditantrag (etwa) abgelehnt wurde. Daher ist es hilfreich, ein Modell zu haben, mit dem Sie feststellen können, welche Merkmale in der Bonitätshistorie zu einer niedrigen Kreditwürdigkeit führen und eine Bewerbung abgelehnt wird. Merkmale in Regressions- und baumbasierten Ansätzen sind im Vergleich zu neuronalen Netzen leichter zu interpretieren. Wenn Sie nur nach Passform bewerten, ist NN einen Versuch wert
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.