【目的】
Windows 10 裸机搭建 Spark 环境,使能运行 PySpark Shell。
【原料】
【安装 JDK】
# 可通过 echo %JAVA_HOME% 检验
JAVA_HOME: C:\Program Files\Java\jdk1.8.0_162
# 可通过 echo %CLASS_PATH% 检验
CLASS_PATH: C:\Program Files\Java\jdk1.8.0_162\lib
# 可通过 echo %PATH% 检验
Path: C:\Program Files\Java\jdk1.8.0_162\bin
【安装 Python3】
# 安装ipython
pip3 install ipython -i https://pypi.doubanio.com/simple/
# 安装pyreadline
pip3 install pyreadline -i https://pypi.doubanio.com/simple/
【安装 Spark】

SPARK_HOME: D:\spark\spark-2.3.2-bin-hadoop2.7
PATH: D:\spark\spark-2.3.2-bin-hadoop2.7\bin
【安装 Hadoop】
HADOOP_HOME: D:\spark\hadoop-2.7.7
PATH: D:\spark\hadoop-2.7.7\bin
# 因为 JAVA_HOME 环境变量有空格,所以做如下修改
set JAVA_HOME=%JAVA_HOME%
# --->>>
set JAVA_HOME=C:\PROGRA~1\Java\\jdk1.8.0_162
Hadoop 2.7.7
Subversion Unknown -r c1aad84bd27cd79c3d1a7dd58202a8c3ee1ed3ac
Compiled by stevel on 2018-07-18T22:47Z
Compiled with protoc 2.5.0
From source with checksum 792e15d20b12c74bd6f19a1fb886490
This command was run using /D:/spark/hadoop-2.7.7/share/hadoop/common/hadoop-common-2.7.7.jar
【winutils.exe】
【Python 脚本测试】
from pyspark import SparkConf, SparkContext
conf = SparkConf().setMaster("local").setAppName("My App")
sc = SparkContext(conf = conf)
print('***************************** %s' % sc.appName)
sc.stop()
***************************** My App
【FAQ】
可能你用的 spark 版本对 Windows 10 太新了,换成 Spark 2.3.2 或以下的版本即可。
【相关阅读】
*** walker ***