kongxun / bmr-sample-java

BMR服务Java样例

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

百度MapReduce示例

BMR是Apache Hadoop/Spark托管服务,方便您使用MapReduce、Spark、HBase、Hive、Pig、Kafka等进行大数据处理。

功能

  • 灵活设定集群套餐类型、集群规模、服务组件、镜像版本;提供预定义和自定义引导操作服务
  • 完全托管的Hadoop/Spark服务;故障自动恢复,按需调整集群规模,实时监控集群、作业的状态
  • 引入百度定制优化版本镜像,快速修复开源Hadoop/Spark等组件bug
  • 全自动的作业诊断调优;高效的技术支持;专家团队提供优化建议

请访问百度MapReduce了解更多。

索引

  1. MapReduce
  2. Spark

MapReduce

本示例使用MapReduce分析Web日志,统计每天的请求量为例,介绍如何在开放云平台使用MapReduce。

程序包含Mapper、Reducer和Main入口程序。可以克隆并编译后输出jar文件,创建BMR集群并提交Java作业。

提交完成之后可以在作业列表查看作业运行状态,当作业是“已完成”状态时,可以看到如下结果:

03/Oct/2015    139
04/Oct/2015    375
05/Oct/2015    372
06/Oct/2015    114

请访问百度MapReduce在线帮助了解详细操作步骤。

Spark

本示例使用Spark分析Web日志,统计每天的PV和UV。

编译打包后将jar包上传到自己的BOS空间中。

从管理控制台进入对应集群的作业列表页面,然后点击添加作业,最后得到如下输出结果:

------PV------
20151003    139
20151005    372
20151006    114
20151004    375
------UV------
20151003    111
20151005    212
20151006    97
20151004    247

请访问百度MapReduce在线帮助了解详细操作步骤。

About

BMR服务Java样例

License:MIT License


Languages

Language:Java 100.0%