博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《Hadoop与大数据挖掘》——2.7 本章小结
阅读量:7041 次
发布时间:2019-06-28

本文共 594 字,大约阅读时间需要 1 分钟。

本节书摘来自华章计算机《Hadoop与大数据挖掘》一书中的第2章,第2.7节,作者 张良均 樊哲 位文超 刘名军 许国杰 周龙 焦正升,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.7 本章小结

本章首先介绍了Hadoop的基本概念、原理以及Hadoop生态系统各个框架。接着,介绍了Hadoop的安装配置以及开发环境IDE配置。在此基础上介绍了Hadoop常用的集群命令、Hadoop MapReduce编程开发原理,针对MapReduce编程开发,详细介绍了Map-Reduce原理、单词计数源码分析,结合源码分析了MapReduce原理。在本章的最后两个小节,分别介绍了数据挖掘中的经典算法:K-Means算法、TF-IDF算法,并针对其Hadoop MapReduce实现进行了详细分析。同时,本章中包含大量动手实践章节,这些动手实践章节要求读者自行完成(部分有示例代码参考),通过这些动手实践环节,可以加深读者对Hadoop、Hadoop HDFS、Hadoop MapReduce的理解,同时对如何针对经典算法或者单机算法使用Hadoop MapReduce模式来实现肯定会有自己的心得体会。

相信通过本章的学习,读者不仅可以对Hadoop、Hadoop MapReduce的原理有更深入的了解,而且对开发Hadoop MapReduce程序也可以说初窥门径了。

转载地址:http://utaal.baihongyu.com/

你可能感兴趣的文章
【阿里云MVP公益共创项目】服务数万爱心教师支教,推动中国渔业生态保护
查看>>
Linux命令复习和练习_03
查看>>
使用 github pages, 快速部署你的静态网页
查看>>
react 之 state 对象
查看>>
Java中的锁原理、锁优化、CAS、AQS
查看>>
“智能厨电+渠道精耕”,华帝迈出“关键一步”
查看>>
Scrapy爬虫(2)爬取新浪旅游图片
查看>>
Nginx反向代理以及负载均衡配置
查看>>
巨头抢滩视频云 金山云稳坐头把交椅
查看>>
索尼富士康领投,AR显示技术厂商Digilens获得2200万美元融资
查看>>
Qt5 GUI 开发的应用易受远程代码执行漏洞的影响
查看>>
搞懂Java动态代理
查看>>
「镁客·请讲」NXROBO林天麟:我们分三步走,首先要做的就是打通机器人行业的产业链...
查看>>
Zcan无线扫描鼠标,滑哪扫哪
查看>>
NTKO使用说明
查看>>
django实现目录上传(最简单的方法)
查看>>
数组是同类型值的集合
查看>>
看透 : 解密身体语言隐藏的密码
查看>>
单例和原型模式-创建型
查看>>
还在吐槽VR的缺点?这些科技公司已经开始打脸了
查看>>