东南大学图书馆微信

东南大学图书馆微博

外文电子书集萃

第二十八期:数据挖掘

1Data Mining and Predictive Analytics

【作者】Daniel Larose

【出版社】Wiley

【简介】本书提供了从数据准备到探索性数据分析、数据建模及模型评估等整个数据分析过程的内容。不仅提供了理解软件底层算法的“白盒”方法,而且提供了能够使读者利用现实世界数据集开展数据挖掘与预测分析的应用方法。第2版新增了多元分类模型、BIRCH聚类、集成学习(bagging及boosting)、模型投票与趋向平均等前沿主题,介绍了数据挖掘方法和模型,包括关联规则,聚类,神经网络,逻辑回归和多元分析。同时增加了R语言开发园地,帮助读者利用R语言开展实际设计和开发工作。


【电子书来源】https://www.itextbook.cn/f/book/bookDetail?status=1&bookId=9e6d7582b28f4d4891de624c05dfa88e


2Data Mining and Analysis : Fundamental Concepts and Algorithms

【作者】Mohammed J. Zaki

【出版社】Cambridge University Press

       【简介】本教材面向高年级本科生和研究生数据挖掘课程,融合了机器学习和统计学的相关概念,对数据挖掘进行了广泛而深入的概述。全书内容分为数据分析基础、频繁模式挖掘、聚类和分类四个部分,每一部分兼顾基础知识和前沿主题,例如核方法、高维数据分析、复杂图形和网络等。每章均有丰富的示例和练习,为学生,研究人员和从业人员提供了可靠的数据挖掘指南。


【电子书来源】https://www.itextbook.cn/f/book/bookDetail?status=1&bookId=4e1060701101467b8240e223eafae377


3Data Mining : Theories, Algorithms, and Examples

【作者】Ye, Nong

【出版社】CRC Press

【简介】新技术使我们能够在许多领域收集大量的数据。然而,我们从这些数据中发现有用信息和知识的速度远远落后于收集数据的速度。《数据挖掘:理论、算法和实例》介绍和解释了来自各个数据挖掘领域的一套全面的数据挖掘算法。这本书回顾了数据挖掘算法的理论原理和过程细节,包括那些在文献中常见的和那些呈现相当大的困难,使用小的数据示例来解释和走过算法。本书涵盖了广泛的数据挖掘算法,包括那些在数据挖掘文献中常见的算法,以及那些由于其相当大的难度而在大多数现有文献中没有完全覆盖的算法。本书提供了一系列支持数据挖掘算法的软件包,数据挖掘算法的应用程序,参考资料,练习,以及解决方案手册和讲座的PPT。作者对数据挖掘算法采用了一种实用的方法,使生成的数据模式能够得到充分的解释。这种方法使学生能够理解数据挖掘算法的理论和操作方面,并手动执行算法以彻底理解算法产生的数据模式。

      

【电子书来源】https://www.itextbook.cn/f/book/bookDetail?status=1&bookId=b74dd1aec1b64aaeb452d47922cba440


4Data Mining and Data Warehousing

【作者】Parteek Bhatia

【出版社】Cambridge University Press

【简介】本文对信息论、决策树、Naïve贝叶斯分类器、距离度量、分区聚类、关联挖掘、数据集市和操作数据存储等重要主题进行了全面讨论。该教材是为满足计算机科学、工程和信息技术专业本科生对数据挖掘和数据仓库课程的需求而编写的。本文通过练习和实例简化了对概念的理解。详细讨论了分类、关联挖掘和聚类分析等章节,以及它们在Weka和R语言数据挖掘工具中的实际实现。本文将详细讨论大数据分析、关系数据模型和NoSQL等高级主题。

     

【电子书来源】https://www.itextbook.cn/f/book/bookDetail?status=1&bookId=9b7b574972344b919137d84276e85f7a


5Data Mining and Machine Learning

【作者】Mohammed J. Zaki

【出版社】Cambridge University Press

【简介】数据挖掘和机器学习中的基本算法构成了数据科学的基础,利用自动化方法分析从科学发现到商业分析等各种应用程序中各种数据的模式和模型。本教材为高级本科和研究生课程提供了全面、深入的数据挖掘、机器学习和统计概述,为学生、研究人员和从业者提供了坚实的指导。本书奠定了数据分析、模式挖掘、聚类、分类和回归的基础,重点是算法和基本的代数、几何和概率概念。第二版的新内容是回归方法的完整部分,包括神经网络和深度学习。

       

【电子书来源】https://www.itextbook.cn/f/book/bookDetail?status=1&bookId=e5a57ef515cf4001aeefb47e75860c4f