Sollte ein Primärschlüssel unveränderlich sein?


26

Eine aktuelle Frage zum Stackoverflow löste eine Diskussion über die Unveränderlichkeit von Primärschlüsseln aus. Ich hatte gedacht, dass es eine Art Regel ist, dass Primärschlüssel unveränderlich sein sollten. Wenn die Möglichkeit besteht, dass eines Tages ein Primärschlüssel aktualisiert wird, sollten Sie einen Ersatzschlüssel verwenden. Es ist jedoch nicht im SQL-Standard enthalten, und bei einigen RDBMS-Funktionen zur "Kaskadenaktualisierung" kann ein Primärschlüssel geändert werden.

Meine Frage lautet also: Ist es immer noch eine schlechte Praxis, einen Primärschlüssel zu haben, der sich ändern kann? Was sind die Nachteile eines veränderlichen Primärschlüssels?

Antworten:


25

Sie müssen den Primärschlüssel unveränderlich sein , wenn es zu einem Fremdschlüssel verknüpft ist, oder wenn es als eine Kennung außerhalb der Datenbank (zB in einer URL , die auf einer Seite für das Element) verwendet.

Andererseits benötigen Sie nur dann einen veränderlichen Schlüssel, wenn er Informationen enthält, die sich möglicherweise ändern. Ich verwende immer einen Ersatzschlüssel, wenn der Datensatz keinen einfachen, unveränderlichen Bezeichner hat, der als Schlüssel verwendet werden kann.


7
Warum muss der Primärschlüssel " unveränderlich sein, wenn er mit einem Fremdschlüssel verknüpft ist"? Wie im OP erwähnt, verfügen die meisten RDBMS über die Funktion "Kaskadenaktualisierung".
Thanatos

1
@Thanatos die meisten (in der Tat alles, was ich erlebt habe) RDBMS werden keine veränderlichen Primärschlüssel noch Kaskadenaktualisierungen haben. Ein Primärschlüssel sollte nach allgemein anerkannter dba-Weisheit keine Informationen enthalten, nur eine eindeutige Datensatzkennung sein (also nicht einmal einen Zeitstempel, einen daraus abgeleiteten Datensatzbereich usw.).
17.

5
@jwenting: Reden wir über das Gleiche? "die meisten rdbms erlauben keine veränderlichen Primärschlüssel" beinhaltet was? MySQL und PostgreSQL erlauben beide veränderbare Primärschlüssel und ehren kaskadierende Aktualisierungen ... so wie ich es von Standard-SQL erwartet habe. Auch "allgemein anerkannte dba Weisheit"? Ich habe viele Datenbankadministratoren getroffen, die sich gegen Ersatzschlüssel aussprechen, und viele, die sich gegen natürliche Schlüssel aussprechen.
Thanatos

2
@Thanatos Argumente für "Alle Tabellen müssen einen Ersatz haben" haben keine bibliografischen Verweise, sie zitieren "allgemein akzeptierte dba-Weisheiten", aber sie zitieren niemals ein Buch. Kanonische Bücher sagen, Sie sollten Ersatz verwenden, wenn: A. kein natürlicher Schlüssel vorhanden ist, B. mehrspaltiger Schlüssel mehr als 3 Spalten enthält oder C. Sie den Schlüssel die ganze Zeit ändern. Also: natürlich, wenn sie passen, Ersatz, wenn Naturtöne nicht passen.
Tulains Córdova

4
@ user61852: Was?
Guffa

15

Ein Primärschlüssel sollte alle Tupel enthalten, die zur Bestimmung der Eindeutigkeit erforderlich sind. Ob sich die Daten ändern können oder nicht, ist unerheblich. Nur die Einzigartigkeit der Aufzeichnung ist von Bedeutung. Das ist das konzeptionelle Design der Datenbank.

Wenn wir in den Bereich der Implementierung eintreten, ist es am sichersten, einfach einen Ersatzschlüssel zu verwenden.


15

Ja, meiner Meinung nach sollte ein Primärschlüssel unveränderlich sein.

Auch wenn es offensichtliche Kandidatenschlüssel gibt, verwende ich immer einen Ersatzschlüssel. In den wenigen Fällen, in denen ich das nicht getan habe, habe ich es fast immer bereut. Unabhängig davon, wie unveränderlich der Schlüssel Ihrer Meinung nach ist, können Sie sich nicht vor Fehlern bei der Dateneingabe schützen. Teilen Sie den Benutzern mit, dass sie diese Informationen nicht bearbeiten können, da es sich um einen Primärschlüssel handelt.


Guter Punkt über Dateneingabefehler
Tim Goodman

richeym, es sieht so aus, als würden Sie den Grund dafür nennen, warum Schlüssel NICHT unveränderlich sein dürfen: Benutzer möchten sie möglicherweise ändern.
nvogel

4
@dportas - Ich möchte, dass PKs unveränderlich sind. Verwenden Sie daher immer Ersatzschlüssel, auch wenn ich denke, dass es einen offensichtlichen Schlüssel gibt, der aus den Tabellendaten abgeleitet werden kann (z. B. E-Mail, Benutzername).
Richeym

2

Caching-Mechanismen zwischen Datenbank und Benutzer verlieren an Effektivität, wenn sich Primärschlüssel ändern.


2

Warum nicht? Weil du eine Spalte eliminieren willst?

Nur weil die Anforderungen erfordern, dass drei Spalten eindeutig sind, bedeutet dies nicht, dass es sich um den Primärschlüssel handeln muss. Sie denken vielleicht, dass diese Regel für immer gelten wird (Erinnern Sie sich an diese Besprechung, als der Abteilungsleiter schwor, dass sich das nie ändern würde? Sie wissen, die, die gerade gefeuert wurde.), Aber es wird nicht.

Ich werde nicht für jedes von mir implementierte Kaskadenupdate und einen Bonus bezahlt, wenn ich es selbst codiere.

Der Computer benötigt keine Bedeutung für einen Schlüssel. IMHO, Schlüssel sind für Computer, lassen Sie die Leute den Rest der Daten vermasseln.


1
"Schlüssel sind für Computer, lassen Sie die Leute den Rest der Daten vermasseln." +1, nett.

2

Es ist keine schlechte Praxis, einen Schlüssel zu haben, dessen Werte sich ändern können.

Zu den Eigenschaften eines guten Schlüssels gehört die Stabilität. Unveränderlichkeit ist ideal, aber keine Voraussetzung. Die Einführung eines künstlichen Schlüssels aus Gründen der Unveränderlichkeit ist eine schlechte Praxis.

Nehmen Sie das Beispiel der International Standard Book Number (ISBN) . Es ist sehr stabil, aber nicht unveränderlich: Manchmal machen Buchverlage Fehler und - Horror! - Doppelte ISBN-Nummern können auftreten. Bedeutet dies, dass ISBN nicht als Kandidatenschlüssel in einer Computerdatenbank akzeptiert werden sollte? Natürlich nicht. Einer der Vorteile von ISBN ist, dass es eine vertrauenswürdige Quelle gibt, die Probleme für alle Benutzer weltweit löst.

Es gibt andere Eigenschaften eines guten ISBN-Schlüssels, die ein bedeutungsloser, automatisch inkrementierender Integer-Schlüssel fehlt, der zB Vertrautheit (jeder im Buchhandel kennt oder mit ISBN vertraut ist), überprüfbar (die ISBN ist auf allen modernen Büchern abgedruckt) kann mit Bezug auf das DBMS validiert werden (ISBN ist eine feste Breite und enthält eine Prüfsumme) usw.


3
ISBN ist eine feste Breite, außer wenn dies nicht der Fall ist (siehe ISBN-10 und ISBN-13).
einen Lebenslauf vom

Wie würden Sie also den Umgang mit doppelten ISBNs empfehlen? In allen mir bekannten RDBMS müssten Sie eine UNIQUE-Einschränkung für das Feld haben, um es als Primärschlüssel zu verwenden.
Wildcard

1

Alles, was möglicherweise unveränderlich sein kann, sollte sein. Es hilft dabei, die Korrektheit sicherzustellen, und es hilft, wenn Sie Ihre Anwendung multithreadingfähig machen möchten.


1

Ja, ein Primärschlüssel muss unveränderlich und nicht null und eindeutig sein. Ich habe jedoch noch keine Datenbank gefunden, die die Unveränderlichkeit von Primärschlüsseln erzwingt, sodass Sie wahrscheinlich fortfahren und ihre Werte ändern können, wenn Sie dies wirklich möchten.


0

Wie einige Kommentare bereits sagten, besteht eine Lösung darin, einen neuen Primärschlüssel zu verwenden

Zum Beispiel (nach dem Beispiel von @onedaywhen), nehmen wir an, dass die Tabelle Books existiert, in der eine Liste von Büchern gespeichert ist, und wir "verwendeten", um die ISBN als Primärschlüssel zu bestimmen. Einige Autoren haben jedoch den Fehler begangen, eine falsche ISBN einzugeben, und darum gebeten, die ISBN zu ändern. Dies beinhaltete die folgenden Aufgaben:

  • Erstellen Sie eine neue Registrierung in der Tabelle Bücher
  • Verweisen Sie alle Verweise von der alten ISBN auf die neue ISBN. (*)
  • Und schließlich löschen Sie die alte Registrierung aus der Tabelle Bücher.

(*) Dies kann trivial sein, um alle Referenzen für ein Datenbankmodell zu finden, bei dem Fremdschlüssel verwendet werden, bei einigen Modellen fehlt dies jedoch.

Table Books
ISBN  is the primary key
NAME is a simple field.
etc.

Wir ändern es als

Table Books
InternalBookId as the primary key
ISBN as a simple field or an indexed field.
NAME is a simple field.
etc.

Wobei die neue InternalBookId sogar ein autonumerischer Wert sein könnte.

Die Nachteile davon:

  • Es wird ein neues Feld hinzugefügt, das mehr Speicherplatz / Ressource verwendet.

  • Möglicherweise muss das gesamte Modell neu geschrieben werden.

  • Das neue Modell könnte weniger selbsterklärend sein.

Der Profi

  • Ermöglicht das Mutieren des "Primärschlüssels".
  • Das Löschen oder Umgestalten des "Primärschlüssels", beispielsweise das Ändern von Büchern in ISBN-13, ist so einfach, dass die ältere Spalte gelöscht und eine neue erstellt wird

Neue Tabelle:

Table Books
InternalBookId as the primary key
ISBN13 is a new field.
NAME is a simple field.
etc.
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.