Was sind die empfohlenen Mindestübereinstimmungskriterien für eine zuverlässige demografische Patientenübereinstimmung?


30

Gibt es bei der Zuordnung von Patienten anhand demografischer Daten Empfehlungen dazu, welche Felder für den Patienten als "gleichen Patienten" zutreffen sollten?

Ich weiß, dass die Algorithmen für verschiedene Implementierungen unterschiedlich sein werden. Ich bin nur gespannt, ob es Best Practices oder Empfehlungen für diesen Prozess gibt.

First Name
Last Name
Date of Birth
SSN
Address
City
State
Zip

etc?


4
Wahrscheinlich kann sich die Antwort auf diese Frage auch je nach Land oder sogar nach ethnischen und kulturellen Gesichtspunkten ändern. Beispielsweise ist der Name einer Person möglicherweise keine gute Patientenidentifikation für australische Ureinwohner (oder es sollte in ihrem Fall ein geringeres "Gewicht" angegeben werden), da sich der Name im Laufe der Zeit ändern kann. Australische Ureinwohner, die den gleichen Namen wie Verstorbene tragen, geben ihn auf, weil sie es für sehr schlecht halten, den gleichen Namen von jemandem zu tragen, der tot ist. Ähnliches passiert in anderen Kulturen, in denen der Name der Toten tabu ist. link

4
Oder ein anderes Beispiel aus einer noch nicht veröffentlichten Studie: Bei philippinischen Einwanderern in die USA machen die zehn häufigsten Nachnamen etwa 6% aller Menschen aus. Bei vietnamesischen Einwanderern machen sie ~ 60% aus. Namen sind bei den Filipinos eine deutlich bessere Kennung als bei den Vietnamesen. Ich werde diese Studie definitiv veröffentlichen, sobald sie verfügbar ist.

Nur um zu verdeutlichen: Ist es das Hauptziel, zwei Datensätze abzugleichen?

Achten Sie beim Versuch, Datensätze abzugleichen, darauf, zwischen der Stärke einer Übereinstimmung ("Bob" ist "Bob" sehr ähnlich) und der Anzahl der möglichen Übereinstimmungen (es gibt viele Bobs) zu unterscheiden. Wenn zwei Datensätze denselben Namen haben und es keine anderen Datensätze mit diesem Namen gibt , ist es wahrscheinlich dieselbe Person, auch wenn sich die Adressen unterscheiden. Angenommen, Sie haben einen großen Korpus.
Jon of All Trades

Antworten:


20

Es gibt diesen großartigen Aufsatz (auf Spanisch, sorry) von Pablo Pazos, einem CS-Ingenieur aus Uruguay, der seit 2006 in der Gesundheits-IT tätig ist und einige großartige Beiträge in diesem Bereich geleistet hat, in dem er einen Algorithmus dafür beschreibt.

Sie können den Artikel durch einen Übersetzer durchgehen lassen, aber das Wesentliche dabei ist, dass die grundlegenden Informationen zur Bestimmung der Identität einer Person deren Vor- und Familiennamen (sowohl von Vater als auch von Mutter), Geschlecht und Geburtsdatum sind. Interessanterweise schließt er ID-Nummern wie SSN ausdrücklich von seinen Identitätsabstimmungsalgorithmen aus, da "jede Art von Kennung NICHT Teil seiner Identität ist" (ich denke, dieser Punkt könnte jedoch in Frage gestellt werden). Außerdem schließt er Attribute wie Straße, Telefonnummer usw. aus, da sie nicht wirklich mit der Identität von jemandem zusammenhängen und nicht mit "wer jemand ist" assoziiert sind.

Außerdem weist er jedem der früheren Attribute unterschiedliche "Gewichte" zu, wie folgt:

  • Vorname: 17,5%
  • Zweiter Vorname: 17,5%
  • Familienname (Vater): 17,5%
  • Familienname (Mutter): 17,5%
  • Geschlecht: 10%
  • DOB: 20%

Mit den Übereinstimmungen, die für jedes dieser Attribute gefunden wurden, beschreibt er eine Methode, um einen zusammengesetzten "Konkordanz-Übereinstimmungsindex" zu erhalten, mit dem Vergleiche zwischen Datensätzen möglich sein können. Mithilfe von Algorithmen wie Levenshteins Abstand sind auch "teilweise" Übereinstimmungen mit den Namensattributen möglich .

Gut gelesen, IMO. Es tut mir leid, dass es auf Spanisch ist, aber ich hoffe, ich konnte seine wichtigsten Ideen vermitteln.


2
Das ist großartig, danke. +1 auch für die Erwähnung von Entfernungen als Tippfehler sind sehr häufig, insbesondere in Gemeinden mit einer großen Vielfalt an kulturellen Hintergründen, wie dies in Nordamerika häufig der Fall ist. Allerdings sind die meisten Fälle, in denen ich Übereinstimmungen ausführen muss, auf den Bereich der möglichen Werte beschränkt. In diesen Fällen ist also jedes zuverlässige Kriterium (z. B. Krankenversicherungsnummern) ausreichend, das einen einzelnen Treffer in der Datenbank zurückgibt. Wenn mehrere Einträge zurückgegeben werden, neige ich dazu, entweder den Benutzer zu fragen (falls verfügbar) oder mit einem zusätzlichen Kriterium zu filtern.

(... Fortsetzung) Beachten Sie jedoch, dass diese Fälle gut für die lokale Installation einer EMR in einer Klinik oder einem Krankenhaus oder eines RIS in einer radio9logy-Abteilung zutreffen. In diesen Fällen ist der Kunde entweder in der Klinik oder im Krankenhaus registriert oder nicht. In Fällen von MPI ist dies jedoch ein völlig neues Ballspiel.

13

Es gibt keinen einzigen magischen Algorithmus für den Patientenabgleich, und ich bezweifle, dass es jemals einen geben wird.

Für den Anfang gibt es regionale Unterschiede. Wie MMattoli betonte, passt das, was in einem städtischen Krankenhaus der Vereinigten Staaten gut funktioniert, wahrscheinlich nicht gut in eine ländliche australische Klinik, in der Aborigines behandelt werden.

Außerdem haben einzelne Standorte unterschiedliche Ansichten zur Fehlertoleranz. Wenn Sie nur übereinstimmen würden, wenn Sie absolut sicher wären , würden Sie eine Menge verpasster Matches erhalten. Dies führt zu doppelten Patientendatensätzen, was eine ganze Reihe weiterer Probleme verursacht. Die meisten Websites werden sich mit ziemlicher Sicherheit zufrieden geben , aber wie sicher ist das sicher genug? Wenn Sie 10 Personen fragen, erhalten Sie 12 Antworten.

Daher kann der "beste" Algorithmus konfiguriert werden, damit Ihre Kunden ihn an ihre Bedürfnisse anpassen können.

Bei der Prüfung einer Übereinstimmung bieten verschiedene Felder ein unterschiedliches Maß an Vertrauen.

Gesundheitsspezifische Identifikatoren bieten das größte Vertrauen, da sie ausschließlich dazu dienen, die Person im Gesundheitssystem eindeutig zu identifizieren. Krankenhäuser sind in der Regel bemüht, diese nicht zu duplizieren.

Beispiele:

  • National Health ID (z. B. britische NHS-Nummer)
  • Nummer der Krankenakte, die dem Krankenhaus zugewiesen wurde.

Andere Patientenidentifikatoren können je nach System ebenfalls ein hohes Vertrauen bieten. Zum Beispiel ist ein Militärausweis in einem Militärkrankenhaus wahrscheinlich sehr relevant.

Beispiele:

  • Militärausweis
  • Versicherungs-ID
  • Sozialversicherungsnummer (In den USA wird die Sozialversicherungsnummer aufgrund des weit verbreiteten Versicherungsbetrugs im Allgemeinen nicht als vertrauenswürdig eingestuft.)

In Ermangelung eindeutiger Kennungen muss auf demografische Informationen zurückgegriffen werden. Es ist nicht ratsam, auf einem Feld zu spielen, aber je demografischer das Spiel, desto sicherer das Spiel.

Dinge an einer Person, die sich nicht oft ändern, sind gut für das Matching:

  • Name
  • Geschlecht
  • Geburtsdatum

Um das Selbstvertrauen zu stärken, können jedoch noch mehr formbare Informationen in das Spiel einbezogen werden:

  • Adresse
  • Telefonnummer
  • E-Mail-Addresse

3
SSN hat auch einige sehr strenge Einschränkungen, zum Beispiel ist es in Kanada illegal, danach zu fragen, es sei denn, Sie sind Arbeitgeber oder eine Bank (vielleicht auch einige mehr, ich bin kein Anwalt). Andere Orte wie China nutzen sie für fast alles, auch um in verkehrsreichen Ferien Bahntickets zu kaufen.

Namensänderungen sind häufig, wenn Sie weiblich sind. Und zwei Menschen haben oft den gleichen Namen und leben sogar am gleichen Ort (zum Beispiel Vater mit einem nach ihm benannten Sohn).
HLGEM

@HLGEM: Völlig korrekt, daher sollte kein einzelnes demografisches Feld für den Abgleich verwendet werden. Aber wenn Leute darauf zurückgreifen müssen, sind die statischeren Felder (die sich jedoch manchmal ändern) zuverlässiger als die Alternative. Das macht sie aber nicht gut.
Lynn

7

Es lohnt sich auch, frühere Nachnamen zu überprüfen, da sich diese häufig ändern.


+1 "oft" ist eine Untertreibung. :) Dies kann sicherlich der Fall sein für Patienten, die nicht identifizierbar oder unbenannt sind, Neugeborene, falsch identifizierte und so weiter. In einer Umgebung mit vielen Transaktionen sind Namen schwieriger und dennoch bedeutender.

4

Abgesehen von offensichtlichen Kombinationen der folgenden drei in Ihrer Frage

First Name
Last Name
Date of Birth
City
State
ZIP/Pin Code

Ich würde darüber nachdenken phone number (Home and/or Cell), der Liste etwas hinzuzufügen . Heutzutage ist es durchaus üblich, dass jeder eine eindeutige Nummer hat, und selbst wenn die Leute manchmal ihre Telefonnummern ändern, erinnern sich die meisten Leute an ältere Telefonnummern, was praktisch sein kann.

Wir haben festgestellt, dass Adressen häufig unter mehreren Schreibweisen und Darstellungsweisen leiden, insbesondere in Ländern wie Indien, in denen die Benutzer eine Landessprache verwenden und die Patientenverwaltungssoftware weiterhin Englisch verwendet.


3

Das Geschlecht in den Aufzeichnungen scheint häufig vom Vornamen abgeleitet zu sein. Ich habe bei Ausländern eine erhöhte Varianz des Geschlechts festgestellt, wenn wir das Geschlecht nicht aus dem Namen ableiten können.

In Deutschland gibt es einige weitere Abweichungen mit Namen, die das Umlaute wie "äöü" enthalten und manchmal durch "ae oe ue" ersetzt werden.


1

Mein Gedanke ist in der Reihenfolge wie folgt 1). SSN, Nachname und die ersten 5 Zeichen des Vornamens 2). SSN, Geburtsdatum und die ersten 5 Zeichen des Vornamens 3). SSN, Geburtsdatum und Nachname 4). SSN, Geschlecht, Geburtsdatum 5). Nachname, erste 5 Zeichen von Vorname, Ort und Postleitzahl


1

Dies ist ein wirklich schweres Problem in den USA. Namen sind nicht eindeutig und ändern sich häufig im Laufe des Lebens einer Person oder werden unterschiedlich dargestellt (Rob versus Robert zum Beispiel), sodass sie niemals zur Identifizierung des Patienten herangezogen werden können, es sei denn in Verbindung mit etwas zuverlässigeren Informationen. Die Krankenversicherungsnummer und der Leistungserbringer wechseln viel häufiger und können für mehrere Familienmitglieder gleich sein. SSN ist angeblich einzigartig, aber es gibt Betrug. Das Gleiche gilt für die Führerscheinnummer, die natürlich nicht jeder haben wird.

Persönlich würde ich mit der Versicherungspolicennummer, dem Geburtsdatum und der Namenskombination beginnen, dann mit der SSN, dem Geburtsdatum und der Namenskombination. Ich würde Adresse und Telefon überprüfen, um mir zusätzliche Sicherheit zu geben, wenn sie übereinstimmen, aber nicht viel Gewicht, wenn sie nicht übereinstimmen. Außerdem würde ich die Blutgruppe als Ausschlussfaktor verwenden, wenn dies bekannt ist (und wir alle wissen, dass die Krankenhausvampire Blutproben entnehmen werden), da sich dies nicht ändert. Die Namensübereinstimmung müsste aufgrund des Namensvariationsproblems eine Fuzzy-Übereinstimmung sein. Andere Dinge sollten im Allgemeinen zuerst nach einer exakten Übereinstimmung Ausschau halten, wenn die Namenszuverlässigkeit wirklich hoch ist (dies könnte ein Tippfehler bei der Eingabe der SSN gewesen sein).

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.