Die US-amerikanischen Public Health Data Repositories bewegen sich aufgrund der Auswirkungen der HIPAA-Bestimmungen hinsichtlich der absichtlichen Verblendung und Maskierung von Daten aus Gründen des Datenschutzes auf ein AGE im Fünfjahresformat zu.
In Anbetracht dieser Herausforderung für das, was in der Vergangenheit (vor HIPAA) ein ziemlich skaliertes Messdatenelement war, das auf dem Unterschied zwischen Geburtsdatum und Sterbedatum basiert, müssen wir möglicherweise AGE als mögliche Skalenvariable überdenken Überhaupt parametrisch beschrieben in Public-Health-Datensätzen, zugunsten von Modellen, die AGE nicht parametrisch beschreiben, als ordinale Maßebene. Ich weiß, dass dies vielen Fraktionen in der biomedizinischen Informatikgemeinschaft "übertrieben" vorkommen mag, aber diese Idee mag in Bezug auf die "Interpretation", wie in den obigen Kommentaren beschrieben, einen gewissen Wert haben.
Was ist mit der ganzen analytischen Kraft, die den nicht-parametrischen Ansätzen zur Verfügung steht? Ja, es ist wahr, dass jeder von uns fast universell versuchen wird, GLM-Techniken (General Linear Model) auf eine Variable anzuwenden, die sich uns in Verteilungen präsentiert, die sich wie AGE verhalten.
Gleichzeitig muss die Form dieser Verteilung und die Art und Weise berücksichtigt werden, wie diese Form durch mehrdimensionale Wechselwirkungseffekte auf mehrdimensionale Zentroide und in der Verteilung vorhandene Untergruppen-Zentroide bestimmt wird. Was tun mit diesen sehr komplexen Datensätzen?
Wenn ein Datenelement die "Annahmen des Modells" nicht erfüllt, scannen wir nach und nach die Liste durch (ich sagte "über" und nicht "über"; wir sollten gleichberechtigte Arbeitgeber der Methode sein, jedes Werkzeug stammt aus der Fabrik mit einer Form, die den Funktionsregeln folgt) von anderen möglichen Modellen, um diejenigen zu finden, die die Annahmetests "nicht scheitern".
In dem gegenwärtigen Format in Datensätzen zur öffentlichen Gesundheit müssen wir (als Datenvisualisierungs-Community) wirklich ein Standardmodell für die Behandlung von AGE in Schritten von fünf Jahren (5YI) entwickeln. Meine Stimme für die Datenvisualisierung von AGE (angesichts des neuen 5YI-Formats) sind Histogramme sowie Box- und Whisker-Plots. Ja, das bedeutet der Median. (Kein Wortspiel beabsichtigt!)
Manchmal sagt ein Bild mehr als tausend Worte, und eine Zusammenfassung fasst tausend Worte zusammen. Das Box- und Whisker-Diagramm zeigt die "Form" der Verteilung als aussagekräftige symbolische Darstellung des Histogramms mit einer nahezu ikonischen Auflösung. Ein Vergleich der Verteilung der fünfjährigen Altersstufen anhand von nebeneinander angeordneten Box- und Whisker-Diagrammen, in denen Muster vom 75. bis zum 50. (Median) bis zum 25. Ntil sofort visuell verglichen werden können, wäre ein eleganter "universeller Standard" für den Vergleich des AGE die Welt. Für diejenigen von uns, die weiterhin den Nervenkitzel der Datendarstellung durch die Textmechanik der tabellarischen Anzeige genießen, kann das "Stamm- und Blatt" -Diagramm auch nützlich sein, wenn es als animiertes visuelles Grafikelement in einer "Sparkline" verwendet wird.
Das Alter ist erwachsen geworden. Es muss mit den leistungsfähigeren Berechnungsalgorithmen, die jetzt verfügbar sind, weiter erforscht werden.