Wie werden Statistiken in der Informatik angewendet, um die Genauigkeit von Forschungsansprüchen zu bewerten?


8

Ich habe in meinem kurzen akademischen Leben festgestellt, dass viele veröffentlichte Artikel in unserer Region manchmal nicht sehr streng in Bezug auf Statistiken sind. Dies ist nicht nur eine Annahme; Ich habe Professoren dasselbe sagen hören.

In CS-Disziplinen werden beispielsweise Artikel veröffentlicht, in denen behauptet wird, dass die Methodik X als wirksam angesehen wurde, und dies wird von ANOVA und ANCOVA bewiesen. Ich sehe jedoch keine Referenzen für andere Forscher, die bewerten, dass die erforderlichen Einschränkungen eingehalten wurden. Es fühlt sich etwas so an, als ob, sobald eine 'komplexe Funktion und ein komplexer Name' auftauchen, dies zeigt, dass der Forscher eine höchst glaubwürdige Methode und einen glaubwürdigen Ansatz anwendet: "Er muss wissen, was er tut, und es ist in Ordnung, wenn er die Einschränkungen nicht beschreibt." Zum Beispiel für diese gegebene Verteilung oder Herangehensweise, damit die Community sie bewerten kann.

Manchmal gibt es Ausreden, um die Hypothese mit einer so kleinen Stichprobengröße zu rechtfertigen.

Meine Frage hier wird daher als Student von CS-Disziplinen als Aspirant gestellt, um mehr über Statistik zu erfahren: Wie gehen Informatiker mit Statistik um?

Diese Frage scheint zu sein, als würde ich fragen, was ich bereits erklärt habe, aber das ist meine Meinung . Ich könnte mich irren oder mich auf eine Gruppe von Praktikern konzentrieren, während andere Gruppen von CS-Forschern möglicherweise etwas anderes tun, das besseren Praktiken in Bezug auf statistische Strenge folgt.

Ich möchte also konkret sagen: "Unser Bereich befasst sich aufgrund der gegebenen Fakten mit Statistiken (Artikelbeispiele, Bücher oder ein anderer Diskussionsartikel darüber sind in Ordnung)." @ Patrick Antwort ist näher daran.


Bitte lassen Sie mich wissen, wenn meine Antwort nicht ganz das ist, wonach Sie gesucht haben ... Ich kann einige Beispiele finden, wenn Sie möchten, aber es hört sich so an, als hätten Sie selbst schon genug. Wenn Sie keinen Zugang zu den Verfahren haben, kann es außerdem schwierig sein, Links zu den Papieren zu präsentieren.
Patrick87

Ich habe Zugang zu digitalen IEEE- und ACM-Bibliotheken. Beispiele wären auch in Ihrem Beitrag sehr willkommen. Ich könnte sie verwenden, wenn ich später promoviere, um den Studenten zu zeigen, dass ich in diesem Punkt gute und schlechte Beispiele empfehle. Und ja, das ist der Sport der Meinung und Aussage, nach dem ich gesucht habe.
Oeufcoque Penteano

Beachten Sie, dass große Teile der Informatik überhaupt nicht empirisch sind und daher keine (ab) Statistiken verwenden. Snarky Note, Software-Engineering-Leute sind "dafür bekannt", viel zu schreiben und wenig zu sagen (von Relevanz). Schritt eins wäre , Statistiken zu lernen ; Einige der aufstrebenden Softwareentwickler, die ich kenne, haben jemals einen Kurs oder etwas über Statistik belegt.
Raphael

Guter Punkt. Ich bin es auch gewohnt, mir das anzuhören. Was würde es als nächstes in Betracht ziehen?
Oeufcoque Penteano

Antworten:


11

Als Doktorand in Informatik, der in anderen Bereichen als der Informatik forscht und dessen Forschungsgruppe in einem Bereich der Informatik arbeitet, in dem Statistiken fruchtbar angewendet werden können, kann ich meine Erfahrungen anbieten. Ihr Kilometerstand kann variieren.

Im Allgemeinen kann es sein, dass selbst die wohlmeinendste wissenschaftliche Forschung die statistische Analyse nicht konsequent auf die Ergebnisse anwendet, und ich habe die Erfahrung gemacht, dass dies nicht immer ausschließt, dass Artikel, die solche schlecht analysierten Ergebnisse enthalten, zur Veröffentlichung angenommen werden. Der Bereich, in dem meine Gruppe tätig ist, umfasst hauptsächlich verteiltes Rechnen und Hochleistungscomputerarchitektur. Bei der Forschung handelt es sich häufig um experimentelle Entwürfe, deren Leistung nicht ohne weiteres im erforderlichen Detail analytisch verstanden werden kann. Daher werden empirische Ergebnisse häufig als Beweis für Behauptungen verwendet.

Es ist klar, dass Experimente so gestaltet und die Ergebnisse analysiert werden sollten, dass ein gewisses Vertrauen besteht, dass die Ergebnisse statistisch signifikant sind. Meistens wird dies nicht getan, selbst an einigen der wichtigsten Veranstaltungsorte. Wenn statistische Analysen angewendet werden, sind sie in keinem sinnvollen Sinne streng. Das Meiste, was man normalerweise sieht (und man ist froh, es zu sehen!), ist, dass ein Experiment n- mal für einige willkürlich ausgewählte n wiederholt wurde , wobei typischerweise . Die Auswahl der Fehlerbalken (falls vorhanden) scheint hauptsächlich eine Frage der persönlichen Präferenz oder des Geschmacks zu sein.1<n<5

Zusammenfassend gesagt, nein, es sind nicht nur Sie; und es ist nicht nur Software-Engineering. Im Allgemeinen scheinen nach meiner Erfahrung einige Bereiche der Computerforschung auf der Seite zu liegen, nicht genug zu tun. In der Tat könnte es sogar nachteilig für die Lebensfähigkeit eines eingereichten Papiers sein, sich mit statistischen Überlegungen zu befassen. Das heißt nicht, dass ich die Situation zufriedenstellend finde; weit davon entfernt. Aber das sind meine Eindrücke. Sie können sich beispielsweise Abschnitt 5 dieses Dokuments ansehen, die auf der Supercomputing 2011 vorgestellt wurde, einer der bekanntesten Konferenzen im Bereich High Performance Computing. Schauen Sie sich insbesondere einige der Erörterungen der Ergebnisse in Abschnitt 5 an und prüfen Sie, ob Sie zu denselben Schlussfolgerungen gelangen, die ich hinsichtlich der Genauigkeit der statistischen Analyse experimenteller Ergebnisse gezogen habe.

Allgemeiner kann dieses Manko symptomatisch für eine Bedingung in einigen Bereichen des Rechnens sein, mehr als weniger Artikel zu veröffentlichen, eher Konferenzen als Zeitschriften anzusprechen und inkrementelle Fortschritte zu betonen, anstatt signifikante und grundlegende Verbesserungen des Verständnisses. Sie können diesen Artikel konsultieren , der wertvolle Einblicke in diese Richtung bietet.


Vielen Dank für Ihre Meinung. Ich bin froh zu sehen, dass andere Leute so denken. Ich hoffe, dass die Community auch andere Meinungen hat, die sie teilen kann, oder zumindest die Meinung des Staates. :) Schade, dass ich hier noch ein Neuling bin, also kann ich nichts abstimmen.
Oeufcoque Penteano

@OeufcoquePenteano Hey, jeder ist ein Neuling, wenn er anfängt. Dies ist eine gute Frage und wirft einen interessanten Punkt hinsichtlich eines möglichen Mangels an Computerforschungsstandards auf. Ich werde die Antwort in Kürze ergänzen. Beachten Sie auch, dass diese Frage möglicherweise (früher als später) von anderen Mitgliedern geschlossen wird, da Fragen wie diese (bisher) mit Argwohn betrachtet wurden und die Community sich noch in der Beta-Phase befindet Definieren Sie hier, was zum Thema gehört und was nicht.
Patrick87

Aber der ursprüngliche Vorschlag über Informatik und Forschung und dieser erfüllen diese Kriterien, oder? Zu diesem Zeitpunkt gibt es keine anderen verfeinerten Kriterien, die diese Frage aus dem Spiel werfen würden, oder gäbe es? Oder gibt es eine andere Stapelfamilie, die ich zu dieser Frage diskutieren könnte? Vielen Dank für Ihr Kompliment und Ihre Aufmerksamkeit bei der Beantwortung :)
Oeufcoque Penteano

1
Beim Benchmarking von Proof-of-Concept-Implementierungen fällt es mir schwer zu sehen, wie Bedeutung festgestellt werden kann. Es scheint hier nicht möglich zu sein, Statistiken anzuwenden. Messungen allein sind keine Statistiken. Es ist jedoch wichtig, dass die Messungen sorgfältig und perspektivisch interpretiert werden.
Raphael

4
@ Patrick87: Ich möchte nicht befürworten, die statistische Signifikanz zu ignorieren. Es ist jedoch schwer. Ich mache übrigens Benchmarks für meine Masterarbeit. Ich führe meine Sachen (oft) auf zwei bis drei Maschinen aus und achte darauf, relevante Zeiten zu messen. Was kann ich sonst noch tun? Ich kann nicht einmal anfangen, strenge Statistiken anzuwenden, da ich keine Ahnung habe, was für ein stochastisches Modell für die Mehrkernausführung von Algorithmen mit der JVM in der Mitte sein könnte.
Raphael

2

Das Software-Engineering umfasst viele Funktionen. Zwei davon sind menschlicher Faktor und Qualitätsmaß.

Angenommen, ich möchte eine Produktivitätsanalyse durchführen. Die Datenerfassung wäre im Vergleich zur Algorithmusanalyse schwierig, da es sich bei den Daten um die menschliche Produktivität handelt. Auch das objektive Qualitätsmaß ist nicht leicht zu erreichen.

10 Codezeilen pro Tag für ein Avioniksystem im Vergleich zu 150 Codezeilen pro Tag für eine App auf Smartphones, welche hat eine höhere Produktivität und welche eine bessere Qualität? Und wenn beide behaupten, dass sie dieselbe Methodik anwenden? Wenn man sie vergleicht, vergleicht man Äpfel und Orangen.

Manchmal ist es schwierig, ein genaues Maß für die Codeeffizienz zu erreichen. Zum Beispiel habe ich eine Reihe nicht nützlicher Variablen und viele Codezeilen für diese Variablen eingefügt, beispielsweise zum Debuggen. Dies steigert meine Produktivität in der Entwicklungsphase. Am Ende nehme ich alle heraus und sage, ich verbessere meinen Code, um Effizienz zu erreichen.

Später kommt ein Forscher herein und führt eine Effizienzanalyse durch. Er könnte das Obige als Geräusche behandeln und sich nur auf die Endergebnisse konzentrieren. Einige Forscher achten auf die Geräusche. Dann sehen Sie Artikel mit unterschiedlichen Schlussfolgerungen.

Die Statistik soll den Forschern helfen, Ursachen für Probleme zu finden. Viele Forscher verwenden es, um Schlussfolgerungen zu ziehen. Das haben Sie beobachtet.


Einige der obigen Bemerkungen könnten das OP zu der Annahme veranlassen, dass ich gegen die Verwendung von Statistiken in der Softwareentwicklung bin. Wenn ja, möchte ich mich klarstellen.

Ich bin nicht gegen Statistiken. Die Statistikanalyse kann Ihnen sagen, dass X möglicherweise wahr ist. Dies sollte jedoch nicht das Ende der Forschung sein. Die nächste Aufgabe sollte sein, herauszufinden, ob X tatsächlich wahr ist und warum. Ich glaube, darum geht es in der Wissenschaft - darum, die Wahrheit zu finden.

Ob Software Engineering zur Informatik gehört oder nicht, ist ein weiteres Problem.


Hallo danke. Ich denke, Sie können Ihre Frage kommentieren, damit dies funktioniert. Sie meinen, dass Softwareentwickler aufgrund der Unsicherheiten nur informeller in Bezug auf Statistiken sein dürfen? Ich weiß es nicht. Ich habe ein Buch von einem Professor, der Statistik für Sozialforscher lehrt. Ich denke, ihre Seite ist viel schlimmer als unsere, und sie haben sogar gut definierte Beispiele in einem Buch dafür. Warum haben wir sogar statischen Code, um verschiedene Ansätze auszuprobieren, die nicht möglich wären?
Oeufcoque Penteano

Ich frage mich, ob dies die Lücke ist, von der ich normalerweise zwischen Forschung und Menschen höre, die tatsächlich in der Industrie arbeiten. Ich stimme Ihnen zu, dass Sie sich für die Entwicklerseite nicht um Statistiken kümmern, sondern das Programm zum Laufen bringen. Aber ja, der Projektmanager würde es brauchen, um vorherzusagen, ob der Entwickler hinter dem Zeitplan zurückbleibt oder nicht. Glauben Sie, dass Genauigkeit in der Statistik angesichts des Teils der Frage „Forschungsansprüche“ nutzlos wäre, wenn Sie beispielsweise darauf schließen würden, dass wenige Dinge, die Entwickler unbewusst tun, ihre Produktivität und Freude an der Arbeit verringern? Meine Sorge liegt dort.
Oeufcoque Penteano

Sie meinen, experimentelle Forschung würde Menschen als Subjekte betrachten? Ich habe über das Messen von Code gesprochen, um dies zu verstehen, und nicht mit Menschen experimentiert. Entschuldigung, ich bin nur Ihre letzte Aussage verwirrt. Aber danke für deine Erkenntnisse!
Oeufcoque Penteano

Okay, ich verstehe jetzt. Da ich ein Anfänger bin, wusste ich nicht, dass lange Diskussionen über Kommentare eine schlechte Praxis sein würden, also werde ich an dieser Stelle aufhören. Vielen Dank für Ihre Erkenntnisse. Ich werde noch ein paar Tage warten und eine Antwort darauf wählen (falls die Frage nicht für diese Community geeignet ist und geschlossen wird).
Oeufcoque Penteano

Ich frage mich, ob Sie über die gleiche Statistik sprechen. In der Öffentlichkeit besteht eine "Statistik" normalerweise aus einer Reihe von Messungen. In Mathematik und Naturwissenschaften "Statistik" die Schätzung von Modellparametern anhand von Daten / Messungen. Daher ist die Auflistung der LOC-Zählungen nicht einmal eine Statistik im wissenschaftlichen Sinne. Wenn Sie den Parameter "durchschnittlicher Entwicklerkaffeekonsum" aus LOC-Daten (genau) abschätzen können, führen Sie (relevante) Statistiken durch. Sie haben korrelierende Ereignisse gefunden.
Raphael

1

Statistiken sind schwierig und oft nicht intuitiv. Außerdem ist der Drang, "noch ein Experiment durchzuführen", um festzustellen, ob es einen Effekt gibt (und zu stoppen, wenn er auftritt), stark, insbesondere wenn die Experimente kostspielig sind (Zeit, Arbeit, nicht nur Geld). Denken Sie auch daran, dass die Veröffentlichung eines Papiers darüber, wie das sorgfältig eingerichtete, lange und kostspielige Experiment Nein zeigt statistisch signifikante Beziehung in der Regel unmöglich ist.

Insbesondere in der Softwareentwicklung gibt es viele unkontrollierbare Variablen. Um sie zu berücksichtigen, benötigen Sie viele Wiederholungen des Experiments, und Sie erhalten Ressourcen, um eine oder bestenfalls zwei durchzuführen.


-3

Meine Frage hier wird daher als Student von CS-Disziplinen als Aspirant gestellt, um mehr über Statistik zu erfahren: Wie gehen Informatiker mit Statistik um?

Es gibt mehrere Fragen oben und einige sind nicht mit der Titelfrage identisch. In gewisser Weise hat diese Frage eine fehlerhafte Prämisse / ein falsches Missverständnis hinsichtlich eines Mangels an Verbindung zwischen Statistik und CS. Die allgemeine Frage betrifft die Schnittstelle zwischen Informatik und Statistik.

In einigen Bereichen gibt es eine enorme Überschneidung, und es ist ein zunehmender Trend mit dem neuen, stark aufstrebenden Bereich der Big Data . An einigen Schulen (z. B. sogar an Elite-Schulen der "Ivy League") ist der CS-Abschluss eng mit den Abteilungen für Mathematik und Statistik verbunden, und einige haben ein gemeinsames Hauptfach . Im Bereich CS / Statistik des maschinellen Lernens besteht eine sehr starke Verbindung . Auch das relativ neue Gebiet der Bioinformatik hat eine sehr starke statistische Grundlage für CS +.

Es gibt ein ganzes Feld Computerstatistik, die sich auf die Schnittstelle konzentriert!

Computerstatistik oder statistisches Rechnen ist die Schnittstelle zwischen Statistik und Informatik. Es ist der Bereich der Computerwissenschaft (oder des wissenschaftlichen Rechnens), der für die mathematische Wissenschaft der Statistik spezifisch ist. Dieser Bereich entwickelt sich ebenfalls rasant und führt dazu, dass ein breiteres Konzept des Rechnens als Teil der allgemeinen statistischen Ausbildung vermittelt werden sollte. [1]

Ja, stimmte zu, wie in der Frage ausgeführt, gibt es viele CS-Papiere, die keine Statistiken verwenden, einschließlich Situationen (wie die Auswertung empirischer Experimente), in denen sie möglicherweise sogar hoch anwendbar und relevant sind, aber genau dasselbe kann von vielen anderen gesagt werden wissenschaftliche Bereiche, z. B. Mathematik, und noch mehr angewandte Bereiche wie Physik.

Es gibt viele Möglichkeiten, Statistiken zu verwenden / anzuwenden, einige weniger streng als andere, und nicht alle Kontexte erfordern die vollständige Anwendung der sehr fortgeschrittenen Aspekte der Statistik. Das einfache Ausführen mehrerer Experimente und das Zeichnen von Fehlerbalken für statistische Abweichungen (oder sogar nur Durchschnittswerte! ) ist eine grundlegende Verwendung von Statistiken. Strengere Verwendungen umfassen das Testen von Hypothesen, aber es gibt eine allgemeine Beobachtung auf dem Gebiet, dass viele wissenschaftliche Arbeiten keine strengen Hypothesentests durchführen, selbst wenn dies anwendbar sein könnte.

Außerdem ist diese Frage mit . Dies war mein Hauptfach, und ein Statistikkurs war erforderlich , um diesen Abschluss an meiner Schule zu machen und einen Ingenieur-zertifizierten Hauptfach (z. B. ABET ) zu erhalten. Dies ist wahrscheinlich an vielen anderen Universitäten der Fall. Wenn man angewandte und strengere CS-Prinzipien wie die Anwendung von Statistiken wünscht, kann man in der Bildung den Weg des "Software-Engineerings" gehen.


Wie in einem anderen Kommentar ausgeführt, umfassen die Verwendungen von Statistiken selbst in abstrakteren TCS eine Analyse der durchschnittlichen
Fallkomplexität

1
Average-Case Komplexitätsanalyse ist nicht verwenden , um Statistiken. Stochastik natürlich, aber das ist eine andere Sache.
Raphael

entschieden widersprechen! es verwendet eindeutig wichtige / grundlegende statistische Konzepte, aber es wird vielleicht nicht gelehrt, dass dies der Fall ist! Die akademischen Ansichten der Felder sind in der Regel unterteilt und spiegeln sich hier wider! Imho jeder Verweis auf eine Verteilung von Eingaben usw. ist offensichtlich ein Aufruf statistischer Konzepte ...
vzn
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.