Als «big-data» getaggte Fragen

4
Was ist die Definition von „Big Data“?
Ist dort eines? Alle Definitionen, die ich finden kann, beschreiben die Größe, Komplexität / Vielfalt oder Geschwindigkeit der Daten. Die Wikipedia-Definition ist die einzige, die ich mit einer tatsächlichen Nummer gefunden habe Big Data-Größen sind ein sich ständig änderndes Ziel. Ab 2012 reichen sie von einigen Dutzend Terabyte bis zu …



1
Partielle Namensübereinstimmung in Millionen von Datensätzen
Wir haben eine webbasierte Anwendung für den Namensabgleich entwickelt. Dabei werden Namen in Teile zerlegt, und der Soundex- Wert jedes Teils wird in einer Datenbank gespeichert. Die Levenshtein-Abstandsmetrik wird verwendet, um die prozentuale Anpassung des Tons sowie die Rechtschreibung für einen bestimmten Namen anzuwenden. Zur Laufzeit laden wir alle Datensätze …

3
Wie speichere ich große Mengen strukturierter Daten?
Die Anwendung sammelt kontinuierlich (ungefähr jede Sekunde) den Standort der Benutzer und speichert sie. Diese Daten sind strukturiert. In einer relationalen Datenbank würde es gespeichert als: | user | timestamp | latitude | longitude | Es gibt jedoch zu viele Daten. Täglich werden 60 × 60 × 24 = 86.400 …

4
Warum müssen Big Data funktionsfähig sein?
Ich habe kürzlich angefangen, an einem neuen Projekt für Big Data für mein Praktikum zu arbeiten. Meine Manager empfahlen, mit dem Erlernen der funktionalen Programmierung zu beginnen (sie empfahlen Scala dringend). Ich hatte eine bescheidene Erfahrung mit F #, aber ich konnte nicht erkennen, wie wichtig es ist, dieses Paradigma …

1
quantitativer Vergleich von AST-Formen
Wie könnte man die Form abstrakter Syntaxbäume ähnlicher Quellcode-Programme (C, C ++, Go oder irgendetwas mit GCC kompiliertes ...) vergleichen? Ich denke, dass die Plagiatserkennung im Quellcode solche Techniken verwenden würde, aber ich habe keine Ahnung, wie das heißen würde ... Zum Beispiel könnte die Vereinheitlichung verwendet werden, um AST …
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.