过去的数十年中,产生和收集数据的能力已经迅速提高,存在大且数据可以被广泛利用。数据的丰富带来了对强有力的数据分析工具的需求,决策者迫切需要从海量数据中提取有价值的信息和知识。数据和信息之间的鸿沟要求系统地开发知识发现工具,将数据“坟墓”转换成知识“金块”。数据挖掘就是为满足从数据中挖掘知识的需要而发展起来的一门交叉学科。
数据挖掘也是信息技术自然演化的结果。信息技术的发展历程可归结为数据收集和数据库创建、数据管理,以及数据分析与理解。数据收集和数据库创建机制的早期开发已成为以后数据存储和检索、查询和事务处理有效机制开发的必备基础。随着提供查询和事务处理的大量数据库系统的广泛应用,数据分析和理解自然成为下一个目标。数据挖掘工具进行数据分析,可以发现重要的数据模式,对商务决策、知识库、科学和医学等研究做出贡献。
数据挖掘就是从数据当中发现趋势或模式的过程,其目的就是通过对大量数据的分析从而发现人们先前不知道的但又非常有用的新的信息。数据挖掘是数据库、机器学习、人工智能、数理统计、可视化和并行计算及其他学科相结合的产物。它不仅被许多研究人员看作是数据库系统和机器学习方面一个重要的研究课题,而且被许多工商界人士看做是一个可以带来巨大回报的重要领域。
从20世纪80年代中期的兴起到如今的蓬勃发展,数据挖掘已经成为科学界和企业开始关注的热点。事实上,世界500强企业中80%都涉足数据挖掘的前瞻性研究。它帮助企业进行CRM,减少不必要的投资,提高资金周转和回报,迅速获取所需的知识和信息,以悟空CRM为例,可以有效对系统数据库中的所有的数据进行全面统计分析,形成报表或者图表形式,让企业用户更加直观了解客户及其员工的相关统计分析,醒目的数据报告,多层次的交叉分析,可以更好的提高工作效率,改进服务质量。
数据挖掘与OLAP(联机分析处理)的区别
1.OLAP是对当前事务进行处理,一般采取多“维度一事实”的库表结构,可以对当前的事务数据进行直观的分析和呈现,用户需求中经常提到的多维报表就是这个意思,市场上应用较广的数据报表工具:BO、BRIO等就是OLAP工具。
2.数据挖掘应该说不是某个具体的工具和产品,而是一整套解决方案,如首先需要有数据仓库的支持,即有海量的数据仓库,一般对实时性没有具体要求,主要是对历史数据进行分析,从中发现用以支撑决策的规律性东西(知识)。
3.OLAP可以理解为是“数据一信息”的升华,而数据挖掘是“数据一信息一知识”的升华,显然二者之间的区别还是很明显,OLAP处理后的一些结果甚至是数据挖掘的数据源之一。
4.数据挖掘需要用到更为复杂的算法和工具。一些启发式学习算法,如神经网络、遗传算法、SVM等都会应用到数据挖掘中,而OLAP一般用到常规的统计学算法,如均值、一元回归、二元回归等。
5.二者的实施和项目结果输出都不同,OLAP一般是当前事务型项目的辅助和补充(经常一个项目中需要用到报表工具就是OLAP),而数据挖掘一般是一个独立的,较为大型的IT项目,独立于当前的事务型应用。
悟空CRM产品更多介绍:www.5kcrm.com