Statistics.com hat ein Problem der Woche veröffentlicht: Die Rate der Betrugsfälle bei Wohnversicherungen beträgt 10% (jeder zehnte Schadensfall ist betrügerisch). Ein Berater hat ein maschinelles Lernsystem vorgeschlagen, um Ansprüche zu überprüfen und sie als Betrug oder Nichtbetrug zu klassifizieren. Das System erkennt betrügerische Angaben zu 90% und klassifiziert betrugsfreie Angaben nur zu 80% (fälschlicherweise wird jede fünfte Angabe als „Betrug“ bezeichnet). Wenn das System eine Forderung als betrügerisch einstuft, wie hoch ist die Wahrscheinlichkeit, dass sie tatsächlich betrügerisch ist?
https://www.statistics.com/news/231/192/Conditional-Probability/?showtemplate=true
Mein Kollege und ich haben beide unabhängig voneinander dieselbe Antwort gefunden, die nicht mit der veröffentlichten Lösung übereinstimmt.
Unsere Lösung:
(.9 * .1) / (.9 * .1) + (.2 * .9)) = 1/3
Ihre Lösung:
Dies ist ein Problem bei der bedingten Wahrscheinlichkeit. (Es ist auch ein Bayes'sches Problem, aber das Anwenden der Formel in der Bayes'schen Regel hilft nur dabei, die Vorgänge zu verschleiern.) Betrachten Sie 100 Behauptungen. 10 ist betrügerisch, und das System kennzeichnet 9 von ihnen korrekt als "Betrug". 90 Forderungen sind in Ordnung, aber das System klassifiziert fälschlicherweise 72 (80%) als "Betrug". Insgesamt wurden 81 Forderungen gekennzeichnet als betrügerisch, aber nur 9 von ihnen, 11%, sind tatsächlich betrügerisch.
Wer hatte recht?