THIS TRY -
Schnittstelle verwendet , um einen Datenrahmen auf externe Speichersysteme (zB Dateisysteme, Schlüssel-Wert - Speicher, etc.) zu schreiben. Verwenden Sie DataFrame.write (), um darauf zuzugreifen.
Neu in Version 1.4.
csv (Pfad, Modus = Keine, Komprimierung = Keine, Sep = Keine, Anführungszeichen = Keine, Escape = Keine, Header = Keine, nullValue = Keine, EscapeQuotes = Keine, QuoteAll = Keine, DateFormat = Keine, TimestampFormat = Keine) Speichert die Inhalt des DataFrame im CSV-Format unter dem angegebenen Pfad.
Parameter: path - Der Pfad in einem von Hadoop unterstützten Dateisystemmodus - gibt das Verhalten des Speichervorgangs an, wenn bereits Daten vorhanden sind.
Anhängen: Hängt den Inhalt dieses DataFrames an vorhandene Daten an. überschreiben: Überschreibt vorhandene Daten. Ignorieren: Ignorieren Sie diesen Vorgang stillschweigend, wenn bereits Daten vorhanden sind. Fehler (Standardfall): Löst eine Ausnahme aus, wenn bereits Daten vorhanden sind. Komprimierung - Komprimierungscodec, der beim Speichern in einer Datei verwendet wird. Dies kann einer der bekannten Kurznamen sein, bei denen die Groß- und Kleinschreibung nicht berücksichtigt wird (keine, bzip2, gzip, lz4, bissig und entleert). sep - Setzt das einzelne Zeichen als Trennzeichen für jedes Feld und jeden Wert. Wenn Keine festgelegt ist, wird der Standardwert ,, verwendet. quote - Legt das einzelne Zeichen fest, das zum Escapezeichen von Anführungszeichen verwendet wird, wobei das Trennzeichen Teil des Werts sein kann. Wenn Keine festgelegt ist, wird der Standardwert "" verwendet. Wenn Sie Anführungszeichen deaktivieren möchten, müssen Sie eine leere Zeichenfolge festlegen. Escape - Legt das einzelne Zeichen fest, das zum Escapezeichen von Anführungszeichen innerhalb eines bereits in Anführungszeichen gesetzten Werts verwendet wird. Wenn Keine festgelegt ist , Es wird der Standardwert \ EscapeQuotes verwendet. Ein Flag, das angibt, ob Werte, die Anführungszeichen enthalten, immer in Anführungszeichen eingeschlossen werden sollen. Wenn Keine festgelegt ist, wird der Standardwert true verwendet, wobei alle Werte, die ein Anführungszeichen enthalten, maskiert werden. quoteAll - Ein Flag, das angibt, ob alle Werte immer in Anführungszeichen gesetzt werden sollen. Wenn Keine festgelegt ist, wird der Standardwert false verwendet, wobei nur Werte maskiert werden, die ein Anführungszeichen enthalten. Header - Schreibt die Namen der Spalten als erste Zeile. Wenn Keine festgelegt ist, wird der Standardwert false verwendet. nullValue - Legt die Zeichenfolgendarstellung eines Nullwerts fest. Wenn Keine festgelegt ist, wird der Standardwert leere Zeichenfolge verwendet. dateFormat - Legt die Zeichenfolge fest, die ein Datumsformat angibt. Benutzerdefinierte Datumsformate folgen den Formaten unter java.text.SimpleDateFormat. Dies gilt für den Datumstyp. Wenn Keine festgelegt ist, wird der Standardwert JJJJ-MM-TT verwendet. timestampFormat - Legt die Zeichenfolge fest, die ein Zeitstempelformat angibt. Benutzerdefinierte Datumsformate folgen den Formaten unter java.text.SimpleDateFormat. Dies gilt für den Zeitstempeltyp. Wenn Keine festgelegt ist, wird der Standardwert yyyy-MM-dd'T'HH: mm: ss.SSSZZ verwendet.
Path
gelten dieselben Optionen.