JOIN-Abfragen gegen mehrere Abfragen

178

Sind JOIN-Abfragen schneller als mehrere Abfragen? (Sie führen Ihre Hauptabfrage aus und dann viele andere SELECTs basierend auf den Ergebnissen Ihrer Hauptabfrage.)

Ich frage, weil das Beitreten VIEL das Design meiner Anwendung erschweren würde

Wenn sie schneller sind, kann sich jemand ungefähr wie viel annähern? Wenn es 1,5x ist, ist es mir egal, aber wenn es 10x ist, denke ich, dass ich es tue.

— Thomas Bonini
quelle

Ich gehe davon aus, dass sie schneller wären. Ich weiß, dass ein INSERT im Vergleich zu 10 einzelnen INSERT-Abfragen viel schneller ist.

— Alex

1

Es kann wichtig sein, ob sich Ihre mehreren Abfragen in einer gespeicherten Prozedur befinden oder ob sie aus der Anwendung stammen (bearbeiten Sie Ihre Frage mit diesen Informationen). Ersteres wird viel schneller sein als Letzteres.

— Colithium

dba.stackexchange.com/questions/42998/…

— Ciro Santilli 法轮功冠状病六四事件 19

81

Dies ist viel zu vage, um Ihnen eine Antwort zu geben, die für Ihren speziellen Fall relevant ist. Es hängt von vielen Dingen ab. Jeff Atwood (Gründer dieser Seite) hat tatsächlich darüber geschrieben . Wenn Sie jedoch die richtigen Indizes haben und Ihre JOINs ordnungsgemäß ausführen, ist es in der Regel schneller, eine Fahrt durchzuführen als mehrere.

— Paolo Bergantino
quelle

2

Wenn Sie 3 oder mehr Tabellen mit unterschiedlichen Schlüsseln verbinden, können Datenbanken (z. B. MySQL) häufig nur einen Index pro Tabelle verwenden. Dies bedeutet, dass möglicherweise eine der Verknüpfungen schnell ist (und einen Index verwendet), während die anderen extrem langsam sind. Für mehrere Abfragen können Sie die für jede Abfrage zu verwendenden Indizes optimieren.

— user151975

4

Ich denke, dies hängt von Ihrer Definition von "schneller" ab. Beispielsweise können sich 3 PK-Innenverknüpfungen aufgrund des Netzwerk-Overheads schneller als 4 Roundtrips drehen, und Sie müssen jede Abfrage nach dem stoppen und vorbereiten und senden Die vorherige Abfrage ist abgeschlossen. Wenn Sie einen Server unter Last vergleichen, benötigen Joins in den meisten Fällen mehr CPU-Zeit als PK-Abfragen und verursachen häufig auch mehr Netzwerk-Overhead.

— mindplay.dk

97

Für innere Verknüpfungen ist eine einzelne Abfrage sinnvoll, da Sie nur übereinstimmende Zeilen erhalten. Bei Linksverknüpfungen sind mehrere Abfragen viel besser. Sehen Sie sich den folgenden Benchmark an, den ich durchgeführt habe:

Einzelabfrage mit 5 Joins

Abfrage: 8.074508 Sekunden

Ergebnisgröße: 2268000
5 Abfragen hintereinander

kombinierte Abfragezeit : 0,00262 Sekunden

Ergebnisgröße: 165 (6 + 50 + 7 + 12 + 90)

.

Beachten Sie, dass wir in beiden Fällen die gleichen Ergebnisse erhalten (6 x 50 x 7 x 12 x 90 = 2268000).

Linke Verknüpfungen verbrauchen exponentiell mehr Speicher mit redundanten Daten.

Das Speicherlimit ist möglicherweise nicht so schlecht, wenn Sie nur zwei Tabellen verbinden, im Allgemeinen jedoch drei oder mehr, und es werden unterschiedliche Abfragen wert.

Nebenbei bemerkt, mein MySQL-Server befindet sich direkt neben meinem Anwendungsserver. Die Verbindungszeit ist also vernachlässigbar. Wenn Ihre Verbindungszeit in Sekunden liegt, gibt es möglicherweise einen Vorteil

Frank

— Frank Forte
quelle

31

Wenn wir die ärgerliche kleine Tatsache beiseite werfen, dass niemand, der bei klarem Verstand ist, eine Kreuzverknüpfung zwischen 5 Tabellen durchführt (aus diesem Grund macht es in den meisten Fällen einfach keinen Sinn ), könnte Ihr "Benchmark" einen gewissen Wert haben . Aber linke oder innere Verknüpfungen sind die Norm, normalerweise per Schlüssel (was das Abrufen erheblich beschleunigt), und die Duplizierung von Daten ist normalerweise viel, viel geringer, als Sie es sich vorstellen.

— CHao

12

@cHao sagt wer? Ich habe gerade SMF und phpBB nachgeschlagen und JOINs zwischen 3 Tabellen gesehen - wenn Sie Plugins oder Modifikationen hinzufügen, können diese leicht hinzugefügt werden. Jede Art von großer Anwendung hat das Potenzial für viele JOINs. Möglicherweise könnte ein schlecht geschriebenes / falsch verwendetes ORM Tabellen beitreten, die es nicht wirklich benötigt (vielleicht sogar jede Tabelle).

— Natalie Adams

5

@ NathanAdams: Linke und innere Verbindungen sind überhaupt nicht schlecht. (In der Tat, wenn Sie hier und da keine Tabellen verbinden, machen Sie SQL falsch.) Ich habe über Cross-Joins gesprochen , die selbst zwischen zwei Tabellen fast immer unerwünscht sind, geschweige denn 5 - und welche würden Seien Sie ungefähr der einzige Weg, um die ansonsten völlig falschen "2268000" -Ergebnisse zu erhalten, die oben erwähnt wurden.

— CHao

2

Schauen Sie sich jedoch die Ergebnisse an. "Ergebnisgröße: 2268000" versus "Ergebnisgröße: 165". Ich denke, Ihre Verlangsamung bei JOINs ist darauf zurückzuführen, dass Ihre Datensätze eine Eins-zu-Viele-Beziehung zueinander haben. Wenn sie jedoch eine Eins-zu-Eins-Beziehung hätten, wäre der JOIN absolut viel schneller und hätte sicherlich kein Ergebnis Größe größer als die SELECT.

— HoldOffHunger

3

@cHao Offensichtlich haben Sie Magento zum Zeitpunkt Ihres ersten Kommentars nicht getroffen

— vitoriodachef

25

Diese Frage ist alt, aber es fehlen einige Benchmarks. Ich habe JOIN mit seinen 2 Konkurrenten verglichen:

N + 1 Abfragen
2 Abfragen, die zweite mit einem WHERE IN(...)oder einem gleichwertigen

Das Ergebnis ist klar: Unter MySQL geht JOINes viel schneller. N + 1-Abfragen können die Leistung einer Anwendung drastisch beeinträchtigen:

Das heißt, es sei denn, Sie wählen viele Datensätze aus, die auf eine sehr kleine Anzahl unterschiedlicher ausländischer Datensätze verweisen. Hier ist ein Benchmark für den Extremfall:

Dies ist in einer typischen Anwendung sehr unwahrscheinlich, es sei denn, Sie treten einer-zu-viele-Beziehung bei. In diesem Fall befindet sich der Fremdschlüssel in der anderen Tabelle und Sie duplizieren die Haupttabellendaten häufig.

Wegbringen:

Verwenden Sie für *-zu-eins-Beziehungen immer JOIN
Bei * -zu-vielen-Beziehungen ist eine zweite Abfrage möglicherweise schneller

Weitere Informationen finden Sie in meinem Artikel über Medium .

— Benjamin
quelle

22

Ich bin tatsächlich zu dieser Frage gekommen, um selbst nach einer Antwort zu suchen, und nachdem ich die gegebenen Antworten gelesen habe, kann ich nur zustimmen, dass der beste Weg, die Leistung von DB-Abfragen zu vergleichen, darin besteht, reale Zahlen zu erhalten, da nur zu viele Variablen berücksichtigt werden müssen ABER ich denke auch, dass ein Vergleich der Zahlen zwischen ihnen in fast allen Fällen nicht gut ist. Was ich meine ist, dass die Zahlen immer mit einer akzeptablen Zahl verglichen werden sollten und definitiv nicht miteinander verglichen werden sollten.

Ich kann verstehen, dass eine Abfrage etwa 0,02 Sekunden und die andere 20 Sekunden dauert, das ist ein enormer Unterschied. Was aber, wenn eine Abfragemethode 0,0000000002 Sekunden und die andere 0,0000002 Sekunden dauert? In beiden Fällen ist eine Möglichkeit satte 1000-mal schneller als die andere, aber ist sie im zweiten Fall wirklich immer noch "satte"?

Fazit, wie ich es persönlich sehe: Wenn es gut funktioniert, entscheiden Sie sich für die einfache Lösung.

— Valentin Flachsel
quelle

4

Das hängt natürlich davon ab, ob Sie eine Skalierung planen oder nicht. Denn als Facebook anfing, waren sie sich sicher, dass sie solche Fragen hatten, aber die Skalierung im Auge hatten und sich für die effizientere, wenn auch möglicherweise komplexere Lösung entschieden haben.

— Dudewad

@dudewad Sinnvoll. Am Ende hängt alles davon ab, was Sie brauchen.

— Valentin Flachsel

4

Haha ja ... weil bei Google 1 Nanosekunde verloren geht, entspricht das buchstäblich 10 Milliarden Billionen Dollar ... aber das ist nur ein Gerücht.

— Dudewad

2

@dudewad Als Facebook anfing, garantiere ich, dass sie sich für die einfachere Lösung entschieden haben. Zuckerberg sagte, er habe die erste Version in nur 2 Wochen programmiert. Start-ups müssen sich schnell bewegen, um wettbewerbsfähig zu sein, und diejenigen, die überleben, machen sich normalerweise keine Gedanken über die Skalierung, bis sie sie tatsächlich benötigen. Dann überarbeiten sie Sachen, nachdem sie Millionen von Investitionsdollar haben, und können Rockstar-Programmierer einstellen, die sich auf Leistung spezialisiert haben. Aus Ihrer Sicht würde ich erwarten, dass Facebook jetzt oft die komplexere Lösung für winzige Leistungssteigerungen wählt, aber dann programmieren die meisten von uns Facebook nicht.

— Dallin

15

Habe einen Schnelltest durchgeführt, bei dem eine Zeile aus einer Tabelle mit 50.000 Zeilen ausgewählt und mit einer Zeile aus einer Tabelle mit 100.000 Zeilen verbunden wurde. Im Grunde sah es so aus:

$id = mt_rand(1, 50000);
$row = $db->fetchOne("SELECT * FROM table1 WHERE id = " . $id);
$row = $db->fetchOne("SELECT * FROM table2 WHERE other_id = " . $row['other_id']);

vs.

$id = mt_rand(1, 50000);
$db->fetchOne("SELECT table1.*, table2.*
    FROM table1
    LEFT JOIN table1.other_id = table2.other_id
    WHERE table1.id = " . $id);

Die Zwei-Auswahl-Methode dauerte 3,7 Sekunden für 50.000 Lesevorgänge, während die JOIN-Methode auf meinem langsamen Computer zu Hause 2,0 Sekunden dauerte. INNER JOIN und LEFT JOIN machten keinen Unterschied. Das Abrufen mehrerer Zeilen (z. B. mit IN SET) ergab ähnliche Ergebnisse.

— Levans
quelle

1

Möglicherweise ändert sich der Unterschied anders, wenn Sie eine Seite mit Zeilen (z. B. 20 oder 50) wie für ein typisches Webansichtsraster auswählen und einzelne LEFT JOIN mit zwei Abfragen vergleichen. Wählen Sie zwei oder drei Bezeichner mit einigen WHERE-Kriterien aus und führen Sie dann die andere aus SELECT-Abfrage mit IN ().

— JustAMartin

Sind die Spalten id und other_id indiziert?

— Aarish Ramesh

11

Die eigentliche Frage ist: Haben diese Datensätze eine Eins-zu-Eins-Beziehung oder eine Eins-zu-Viele-Beziehung ?

TLDR Antwort:

Wenn eins zu eins, verwenden Sie eine JOINAnweisung.

Verwenden Sie bei Eins-zu-Viele eine (oder mehrere) SELECTAnweisungen mit serverseitiger Codeoptimierung.

Warum und wie SELECT zur Optimierung verwendet wird

SELECTDas Erstellen (mit mehreren Abfragen anstelle von Verknüpfungen) für eine große Gruppe von Datensätzen, die auf einer Eins-zu-Viele-Beziehung basieren, führt zu einer optimalen Effizienz, da JOINdas Problem mit einem exponentiellen Speicherverlust verbunden ist. Holen Sie sich alle Daten und sortieren Sie sie mit einer serverseitigen Skriptsprache aus:

SELECT * FROM Address WHERE Personid IN(1,2,3);

Ergebnisse:

Address.id : 1            // First person and their address
Address.Personid : 1
Address.City : "Boston"

Address.id : 2            // First person's second address
Address.Personid : 1
Address.City : "New York"

Address.id : 3            // Second person's address
Address.Personid : 2
Address.City : "Barcelona"

Hier erhalte ich alle Datensätze in einer Select-Anweisung. Dies ist besser als JOIN, wenn eine kleine Gruppe dieser Datensätze einzeln als Unterkomponente einer anderen Abfrage abgerufen wird. Dann analysiere ich es mit serverseitigem Code, der ungefähr so aussieht ...

<?php
    foreach($addresses as $address) {
         $persons[$address['Personid']]->Address[] = $address;
    }
?>

Wann sollte JOIN nicht zur Optimierung verwendet werden?

JOINWenn eine große Gruppe von Datensätzen auf der Grundlage einer Eins-zu-Eins-Beziehung zu einem einzelnen Datensatz erstellt wird, ergibt sich eine optimale Effizienz im Vergleich zu mehreren aufeinanderfolgenden SELECTAnweisungen, die einfach den nächsten Datensatztyp erhalten.

Ist JOINaber ineffizient, wenn Datensätze mit einer Eins-zu-Viele-Beziehung abgerufen werden.

Beispiel: Die Datenbank Blogs enthält 3 interessante Tabellen: Blogpost, Tag und Kommentar.

SELECT * from BlogPost
LEFT JOIN Tag ON Tag.BlogPostid = BlogPost.id
LEFT JOIN Comment ON Comment.BlogPostid = BlogPost.id;

Wenn es 1 Blogpost, 2 Tags und 2 Kommentare gibt, erhalten Sie folgende Ergebnisse:

Row1: tag1, comment1,
Row2: tag1, comment2,
Row3: tag2, comment1,
Row4: tag2, comment2,

Beachten Sie, wie jeder Datensatz dupliziert wird. Okay, 2 Kommentare und 2 Tags sind 4 Zeilen. Was ist, wenn wir 4 Kommentare und 4 Tags haben? Sie erhalten nicht 8 Zeilen - Sie erhalten 16 Zeilen:

Row1: tag1, comment1,
Row2: tag1, comment2,
Row3: tag1, comment3,
Row4: tag1, comment4,
Row5: tag2, comment1,
Row6: tag2, comment2,
Row7: tag2, comment3,
Row8: tag2, comment4,
Row9: tag3, comment1,
Row10: tag3, comment2,
Row11: tag3, comment3,
Row12: tag3, comment4,
Row13: tag4, comment1,
Row14: tag4, comment2,
Row15: tag4, comment3,
Row16: tag4, comment4,

Wenn Sie mehr Tabellen, mehr Datensätze usw. hinzufügen, steigt das Problem schnell auf Hunderte von Zeilen an, die alle mit größtenteils redundanten Daten gefüllt sind.

Was kosten Sie diese Duplikate? Speicher (im SQL Server und der Code, der versucht, die Duplikate zu entfernen) und Netzwerkressourcen (zwischen SQL Server und Ihrem Codeserver).

Quelle: https://dev.mysql.com/doc/refman/8.0/en/nested-join-optimization.html ; https://dev.mysql.com/doc/workbench/en/wb-relationship-tools.html

— HoldOffHunger
quelle

Du verfehlst den springenden Punkt. Es geht nicht um eins zu eins (eins | viele). Es geht darum, ob es sinnvoll ist, die Zeilensätze miteinander zu verbinden. Sie fragen nach zwei nur tangential verwandten Datensätzen. Wenn Sie nach Kommentaren und beispielsweise nach den Kontaktinformationen der Autoren gefragt haben, ist dies als Join sinnvoller, obwohl Personen vermutlich mehr als einen Kommentar schreiben können.

— CHA

@cHao: Danke für deinen Kommentar. Meine Antwort oben ist eine Zusammenfassung der MySQL-Dokumentation, die hier zu finden ist: dev.mysql.com/doc/workbench/en/wb-relationship-tools.html

— HoldOffHunger

Das ist keine MySQL-Dokumentation. Es ist eine Dokumentation für ein bestimmtes GUI-Tool für die Arbeit mit MySQL-Datenbanken. Und es gibt keine Anleitung, wann Joins angemessen sind (oder nicht).

— CHA

@cHao: Entschuldigung, ich meinte die MySQL (R) -Dokumentation für MySQL WorkBench (TM), nicht MySQL Server (TM).

— HoldOffHunger

Abgesehen von der Pedanterie ist die Relevanz nicht klar. Beide erwähnen Eins-zu-Eins- und Eins-zu-Viele-Beziehungen, aber hier endet die Gemeinsamkeit. In beiden Fällen geht es um die Beziehung zwischen den Datensätzen. Verbinden Sie zwei nicht verwandte Sets, Sie erhalten jede Kombination der beiden. Teilen Sie verwandte Daten in mehrere Auswahlen auf, und jetzt haben Sie mehrere Abfragen zum zweifelhaften Vorteil durchgeführt und damit begonnen, MySQLs Arbeit dafür zu erledigen.

— CHao

8

Konstruieren Sie sowohl separate Abfragen als auch Verknüpfungen und setzen Sie dann jede Zeit ab - nichts hilft mehr als reale Zahlen.

Dann noch besser - fügen Sie "EXPLAIN" am Anfang jeder Abfrage hinzu. Hier erfahren Sie, wie viele Unterabfragen MySQL verwendet, um Ihre Datenanforderung zu beantworten, und wie viele Zeilen für jede Abfrage gescannt wurden.

— DreadPirateShawn
quelle

7

Abhängig von der Komplexität der Datenbank im Vergleich zur Komplexität der Entwickler kann es einfacher sein, viele SELECT-Aufrufe auszuführen.

Versuchen Sie, einige Datenbankstatistiken sowohl für JOIN als auch für mehrere SELECTS auszuführen. Überprüfen Sie, ob in Ihrer Umgebung der JOIN schneller / langsamer als der SELECT ist.

Andererseits würde ich mich an mehrere SELECTs halten, wenn das Ändern in ein JOIN einen zusätzlichen Tag / eine Woche / einen Monat Entwicklungsarbeit bedeuten würde

Prost,

BLT

— glasnt
quelle

5

Nach meiner Erfahrung ist es normalerweise schneller, mehrere Abfragen auszuführen, insbesondere beim Abrufen großer Datenmengen.

Bei der Interaktion mit der Datenbank von einer anderen Anwendung wie PHP gibt es das Argument einer Reise zum Server über mehrere.

Es gibt andere Möglichkeiten, die Anzahl der Fahrten zum Server zu begrenzen und dennoch mehrere Abfragen auszuführen, die häufig nicht nur schneller sind, sondern auch das Lesen der Anwendung erleichtern - beispielsweise mysqli_multi_query.

Ich bin kein Anfänger, wenn es um SQL geht. Ich denke, es gibt eine Tendenz für Entwickler, insbesondere für Junioren, viel Zeit damit zu verbringen, sehr clevere Joins zu schreiben, weil sie intelligent aussehen, während es tatsächlich intelligente Möglichkeiten gibt, Daten zu extrahieren, die aussehen einfach.

Der letzte Absatz war eine persönliche Meinung, aber ich hoffe, das hilft. Ich stimme jedoch den anderen zu, die sagen, Sie sollten Benchmarks erstellen. Keiner der Ansätze ist eine Silberkugel.

— Ein Junge namens Su
quelle

Ja, wir sollten nicht nur die Abfragen selbst berücksichtigen, sondern auch die Datenverarbeitung innerhalb der Anwendung. Wenn Daten mit äußeren Verknüpfungen abgerufen werden, gibt es eine gewisse Redundanz (manchmal kann sie sehr groß werden), die von der App aussortiert werden muss (normalerweise in einer ORM-Bibliothek). Zusammenfassend kann die einzelne SELECT with JOIN-Abfrage daher mehr CPU und verbrauchen Zeit als zwei einfache SELECTs

— JustAMartin

4

Ob Sie einen Join verwenden sollten, hängt in erster Linie davon ab, ob ein Join sinnvoll ist . Erst zu diesem Zeitpunkt ist die Leistung überhaupt zu berücksichtigen, da fast alle anderen Fälle zu einer deutlich schlechteren Leistung führen.

Leistungsunterschiede hängen weitgehend davon ab, in welchem Zusammenhang die von Ihnen abgefragten Informationen stehen. Joins funktionieren und sind schnell, wenn die Daten in Beziehung stehen und Sie die Daten korrekt indizieren. Sie führen jedoch häufig zu Redundanz und manchmal zu mehr Ergebnissen als erforderlich. Und wenn Ihre Datensätze nicht direkt miteinander verbunden sind, führt das Einfügen in eine einzelne Abfrage zu einem sogenannten kartesischen Produkt (im Grunde alle möglichen Kombinationen von Zeilen), was fast nie das ist, was Sie wollen.

Dies wird häufig durch viele-zu-eins-zu-viele-Beziehungen verursacht. In der Antwort von HoldOffHunger wurde beispielsweise eine einzelne Abfrage nach Posts, Tags und Kommentaren erwähnt. Kommentare beziehen sich auf einen Beitrag, ebenso wie Tags ... aber Tags haben nichts mit Kommentaren zu tun.

+------------+     +---------+     +---------+
|  comment   |     |   post  |     |  tag    |
|------------|*   1|---------|1   *|---------|
| post_id    |-----| post_id |-----| post_id |
| comment_id |     | ...     |     | tag_id  |
| user_id    |     |         |     | ...     |
| ...        |     |         |     | ...     |
+------------+     +---------+     +---------+

In diesem Fall ist es eindeutig besser, wenn dies mindestens zwei separate Abfragen sind. Wenn Sie versuchen, Tags und Kommentare zu verknüpfen, da keine direkte Beziehung zwischen beiden besteht, erhalten Sie jede mögliche Kombination aus Tag und Kommentar. many * many == manymany. Abgesehen davon können Sie diese beiden Abfragen parallel ausführen, da Beiträge und Tags nicht miteinander zusammenhängen, was zu einem potenziellen Gewinn führt.

Betrachten wir jedoch ein anderes Szenario: Sie möchten, dass die Kommentare an einen Beitrag angehängt werden und die Kontaktinformationen der Kommentatoren.

 +----------+     +------------+     +---------+
 |   user   |     |  comment   |     |   post  |
 |----------|1   *|------------|*   1|---------|
 | user_id  |-----| post_id    |-----| post_id |
 | username |     | user_id    |     | ...     |
 | ...      |     | ...        |     +---------+
 +----------+     +------------+

Hier sollten Sie einen Join in Betracht ziehen. Abgesehen davon, dass es sich um eine viel natürlichere Abfrage handelt, haben die meisten Datenbanksysteme (einschließlich MySQL) viele kluge Leute, die viel harte Arbeit in die Optimierung von Abfragen investieren. Bei separaten Abfragen können die Abfragen nicht parallel ausgeführt werden, da jede Abfrage von den Ergebnissen der vorherigen Abfrage abhängt. Die Gesamtzeit wird nicht nur zur tatsächlichen Ausführungszeit der Abfragen, sondern auch zur Zeit, die zum Abrufen der Ergebnisse und zum Sieben aufgewendet wird durch sie nach IDs für die nächste Abfrage, Verknüpfung von Zeilen usw.

— cHao
quelle

Wenn Sie im zweiten Szenario viele Benutzerspalten abrufen (und dieselben Benutzer mehr als einmal kommentieren), bleibt die Frage offen, ob sie am besten in einer separaten Abfrage abgerufen werden können.

— Adrian Baker

@AdrianBaker: Wie ich bereits sagte, viele kluge Leute haben viel harte Arbeit investiert. Wenn ich meinen SQL Server optimieren würde, wäre meine allererste Idee die Komprimierung, die eine große Menge an Redundanz eliminieren würde, ohne den Code zu ändern viel überhaupt. Zu den Optimierungen der nächsten Ebene gehört das Reorganisieren des Ergebnisses in Tabellen und das Senden dieser zusammen mit Tupeln von Zeilen-IDs, die die Client-Bibliothek dann bei Bedarf problemlos auf ihrer Seite zusammenstellen kann.

— CHao

Diese beiden Optimierungen könnten mit einem Join Wunder wirken, um die Redundanz zu verringern oder sogar zu beseitigen, aber es gibt nicht viel, was bei den inhärent seriellen Abfragen helfen könnte, die Sie zum Abrufen verwandter Datensätze tun müssten.

— CHao

3

Wird es in Bezug auf den Durchsatz schneller sein? Wahrscheinlich. Es werden jedoch möglicherweise auch mehr Datenbankobjekte gleichzeitig gesperrt (abhängig von Ihrer Datenbank und Ihrem Schema) und dadurch die Parallelität verringert. Nach meiner Erfahrung werden Menschen häufig durch das Argument "weniger Datenbank-Roundtrips" irregeführt, wenn in der Realität auf den meisten OLTP-Systemen, auf denen sich die Datenbank im selben LAN befindet, der eigentliche Engpass selten das Netzwerk ist.

— Ramon
quelle

2

Hier ist ein Link mit 100 nützlichen Abfragen, die in der Oracle-Datenbank getestet werden. Beachten Sie jedoch, dass SQL ein Standard ist. Was sich zwischen Oracle, MS SQL Server, MySQL und anderen Datenbanken unterscheidet, ist der SQL-Dialekt:

http://javaforlearn.com/100-sql-queries-learn/

— S. Mayol
quelle

1

Es gibt mehrere Faktoren, was bedeutet, dass es keine binäre Antwort gibt. Die Frage, was für die Leistung am besten ist, hängt von Ihrer Umgebung ab. Übrigens, wenn Ihre Einzelauswahl mit einer Kennung nicht unter einer Sekunde liegt, stimmt möglicherweise etwas mit Ihrer Konfiguration nicht.

Die eigentliche Frage ist, wie Sie auf die Daten zugreifen möchten. Einzelauswahl unterstützt die späte Bindung. Wenn Sie beispielsweise nur Mitarbeiterinformationen wünschen, können Sie diese aus der Tabelle Mitarbeiter auswählen. Die Fremdschlüsselbeziehungen können verwendet werden, um verwandte Ressourcen zu einem späteren Zeitpunkt und nach Bedarf abzurufen. Die Auswahlen haben bereits einen Schlüssel, auf den sie verweisen können, sodass sie extrem schnell sein sollten und Sie nur das abrufen müssen, was Sie benötigen. Die Netzwerklatenz muss immer berücksichtigt werden.

Joins rufen alle Daten auf einmal ab. Wenn Sie einen Bericht erstellen oder ein Raster füllen, ist dies möglicherweise genau das, was Sie möchten. Kompilierte und optomisierte Verknüpfungen sind in diesem Szenario einfach schneller als einzelne Auswahlen. Denken Sie daran, dass Ad-hoc-Verknüpfungen möglicherweise nicht so schnell sind - Sie sollten sie kompilieren (in einen gespeicherten Prozess). Die Geschwindigkeitsantwort hängt vom Ausführungsplan ab, in dem genau angegeben ist, welche Schritte das DBMS zum Abrufen der Daten unternimmt.

— Dr. Lockett
quelle

0

Ja, eine Abfrage mit JOINS wäre schneller. Ohne die Beziehungen der von Ihnen abgefragten Tabellen, die Größe Ihres Datasets oder die Position der Primärschlüssel zu kennen, ist es fast unmöglich zu sagen, wie viel schneller.

Testen Sie beide Szenarien, dann wissen Sie sicher ...

— Mathew
quelle