自助广告
立即入驻
大数据书籍 Big data books

数据算法:Hadoop/Spark大数据处理技巧

Mahmoud Parsian计算机科学博士力作,31个Hadoop与Spark大数据算法,包含基本设计模式、优化技术和数据挖掘及机器学习解决方案,涵盖生物信息学、基因组学、统计和社交网络分析等...

Mahmoud Parsian计算机科学博士力作,31个Hadoop与Spark大数据算法,包含基本设计模式、优化技术和数据挖掘及机器学习解决方案,涵盖生物信息学、基因组学、统计和社交网络分析等领域。

编辑推荐

适读人群 :这本书面向了解Java基础知识并且想使用Hadoop和Spark 开发MapReduce 算法(数据挖掘、机器学习、生物信息技术、基因组和统计领域)和解决方案的软件工程师、软件架构师、数据科学家和应用开发人员。
市面上N0.1本关于Hadoop与Spark大数据处理技巧的教程,提供了丰富的算法和工具。

内容简介

  《数据算法:Hadoop/Spark大数据处理技巧》介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这还概要介绍了MapReduce、Hadoop和Spark。
主要内容包括:
■ 完成超大量交易的购物篮分析。
■ 数据挖掘算法(K-均值、KNN和朴素贝叶斯)。
■ 使用超大基因组数据完成DNA和RNA测序。
■ 朴素贝叶斯定理和马尔可夫链实现数据和市场预测。
■ 推荐算法和成对文档相似性。
■ 线性回归、Cox回归和皮尔逊(Pearson)相关分析。
■ 等位基因频率和DNA挖掘。
■ 社交网络分析(推荐系统、三角形计数和情感分析)。

作者简介

  Mahmoud Parsian,计算机科学博士,是一位热衷于实践的软件专家,作为开发人员、设计人员、架构师和作者,他有30多年的软件开发经验。目前领导着Illumina的大数据团队,在过去15年间,他主要从事Java (服务器端)、数据库、MapReduce和分布式计算的有关工作。Mahmoud还著有《JDBC Recipes》和《JDBC Metadata, MySQL,and Oracle Recipes》等书(均由Apress出版)。

 

相关图书

Spark大数据分析实战
基于Spark2.4.x新版本编撰,通俗易懂,无痛上手结合丰富案例详解Spark生态系统主流的大数据处理技术
自己动手做大数据系统(第2版)
大数据平台架构选型及最佳实践案例、大数据治理、流计算开发、大数据运维部署之法宝!
大数据平台架构与原型实现:数据中台建设实战
14年从业经验+2万行源代码原型项目构筑/涵盖数据平台建设各个环节架构方案、技术选型及实现细节/数据中台建设实战首著/架构原理融于工程原型搭建让你的工作事半功倍.
离线和实时大数据开发实战
从整体上给出数据大图和数据平台大图,介绍离线数据开发的主要技术,集中介绍实时数据处理的各项技术。
大数据技术体系详解:原理、架构与实践
企业部署大数据必备的专业知识和经验,包括大数据的原理、架构及实战的详解
移动通信大数据分析——数据挖掘与机器学习实战
全彩印刷,4G/5G无线技术、机器学习和数据挖掘的新研究和新应用。亚信科技董事长田溯宁博士,AT&T(美国电话电报)公司首席科学家大卫·贝兰格博士联袂推荐

暂无评论

暂无评论...