Ich habe Spark 1.4 vom GH-Entwicklungsmaster erstellt, und der Build lief einwandfrei. Aber wenn ich eine mache, bin/pyspark
bekomme ich die Python 2.7.9 Version. Wie kann ich das ändern?
Ich habe Spark 1.4 vom GH-Entwicklungsmaster erstellt, und der Build lief einwandfrei. Aber wenn ich eine mache, bin/pyspark
bekomme ich die Python 2.7.9 Version. Wie kann ich das ändern?
Antworten:
Stellen Sie einfach die Umgebungsvariable ein:
export PYSPARK_PYTHON=python3
Wenn Sie möchten, dass dies eine dauerhafte Änderung ist, fügen Sie diese Zeile zum pyspark-Skript hinzu.
export PYSPARK_PYTHON=python3.5
für Python 3.5
$SPARK_HOME/conf/spark-env.sh
damit spark-submit
auch derselbe Interpreter verwendet wird.
PYSPARK_PYTHON=python3
./bin/pyspark
Wenn Sie in IPython Notebook ausgeführt werden möchten, schreiben Sie:
PYSPARK_PYTHON=python3
PYSPARK_DRIVER_PYTHON=ipython
PYSPARK_DRIVER_PYTHON_OPTS="notebook"
./bin/pyspark
Wenn python3
nicht zugänglich ist, müssen Sie stattdessen den Pfad dazu übergeben.
Beachten Sie, dass die aktuelle Dokumentation (ab 1.4.1) veraltete Anweisungen enthält. Zum Glück wurde es gepatcht .
Schauen Sie sich die Datei an. Die Shebang-Zeile zeigt wahrscheinlich auf die 'env'-Binärdatei, die den Pfad nach der ersten kompatiblen ausführbaren Datei durchsucht.
Sie können Python in Python3 ändern. Ändern Sie die Umgebung, um die python3-Binärdatei direkt fest zu codieren. Oder führen Sie die Binärdatei direkt mit python3 aus und lassen Sie die Shebang-Zeile weg.
PYSPARK_PYTHON
Umgebungsvariable festzulegen.
Bearbeiten Sie für Jupyter Notebook die spark-env.sh
Datei wie unten gezeigt über die Befehlszeile
$ vi $SPARK_HOME/conf/spark-env.sh
Gehen Sie zum Ende der Datei und kopieren Sie diese Zeilen
export PYSPARK_PYTHON=python3
export PYSPARK_DRIVER_PYTHON=jupyter
export PYSPARK_DRIVER_PYTHON_OPTS="notebook"
Führen Sie dann einfach den folgenden Befehl aus, um pyspark in Notebook zu starten
$ pyspark
PYSPARK_DRIVER_PYTHON=ipython3 PYSPARK_DRIVER_PYTHON_OPTS="notebook" ./bin/pyspark
In diesem Fall wird das IPython 3-Notebook ausgeführt.