术语解释
Executor 多线程的方式运行
每个partirion会被分配一个task
taskset就是stage,一个stage由多个task组成
广播变量类似于hadoop的DistributedCache