Databricks Spark Knowledge Base 简体中文 Introduction 最佳实践 避免使用 GroupByKey 勿在大型 RDD 上直接调用 collect 常规故障处理 Job aborted due to stage failure: Task not serializable 缺失依赖 执行 start-all.sh 错误: Connection refused Spark 组件之间的网络连接问题 性能 & 优化 RDD 分区 数据本地性 Spark Streaming ERROR OneForOneStrategy Copyright 本文翻译自: http://databricks.gitbooks.io/databricks-spark-knowledge-base/ 著作权归原作者所有。