ISBN/价格: | 978-7-302-59181-8:CNY49.90 |
---|---|
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | 大数据技术入门/.于海浩, 刘志坤主编 |
出版发行项: | 北京:,清华大学出版社:,2022 |
载体形态项: | 194页:;+图:;+26cm |
丛编项: | 大数据与人工智能技术丛书 |
提要文摘: | 本书基础理论、应用开发以及实际案例相结合, 围绕Hadoop、Spark生态圈循序渐进介绍关于大数据技术领域中的基础知识、应用开发技术和基于Spark的常见机器学习算法, 最后以两个实战案例全面、系统地应用了本书介绍的基础知识和应用开发方法。全书共14章, 分别为大数据概述、Hadoop简介及安装部署、HDFS 分布式文件系统、MapReduce计算框架、Hive 数据仓库、HBase分布式数据库、Spark基础、Spark RDD弹性分布式数据集、Spark SQL、Spark Streaming实时计算框架、Spark Streaming与Flume、Kafka的整合、Spark MLlib 机器学习、实战案例-分布式优惠券后台应用系统、实战案例-新闻话题实时统计分析, 书中的每个知识点都有相应的实现代码和实例。 |
题名主题: | 数据处理软件 |
中图分类: | TP274 |
个人名称等同: | 于海浩, 主编 |
个人名称等同: | 刘志坤 主编 |
记录来源: | CN 湖北三新 20211213 |