价格¥99.00元 /份
销量浏览人数248
地区暂无
交付方式站内下载
友情提醒:为保障您的利益,请网上成交,贵重物品,请将付款托管到平台进行交易。
免责声明:本网所展示的论文与服务信息由买卖双方自行提供,其真实性、准确性和合法性由信息发布人负责。本网不提供任何保证,并不承担法律责任。
毕业设计-一个基于网格和密度的聚类算法的实现,正文共24页,13762字。
【摘要】
权威的Gartner调查组报告显示,数据挖掘将是今后几年全球范围内重点投资研究的十大新技术之一,它引起了学术界和工业界的广泛关注,是当今数据库系统研究和应用领域内的一个热点问题。本文讨论数据挖掘中聚类的相关概念、技术和算法。在已提出的聚类算法中,一大类都是基于“距离”的概念,不管是传统的欧氏几何距离还是其它意义上的距离,如常见的k-means、k-medoids算法,这类算法的缺点在于处理大数据集和高维数据集时不够有效,另一方面它能发现的聚类个数常常依赖于用户参数的指定,而这对用户来说经常是很困难的。这里要讨论的算法与此有根本的不同,既它抛弃了距离的概念,而采取一种新的思路,我们称之为基于网格和密度的算法,它的优点在于能够自动发现包含有趣知识的子空间,并将里面存在的所有聚类挖掘出来;另一方面它能很好的处理高维数据和大数据集的数据表格。算法将最后的结果用DNF的形式表示出来。
【关键词】
数据挖掘、聚类规则/分析、网格、密度、高维数据、字空间、最大区域、DNF表达式
1 索引 2
2 摘要 3
3 关键词 3
4 正文 4
4.1 数据挖掘 4
4.2 聚类分析 8
4.3 算法实现及其应用背景 10
4.3.1 背景 10
4.3.2 问题描述 12
4.3.3 算法实现 15
4.3.3.1.1 找出包含聚类的子空间 15
4.3.3.1.2 找出给定子空间中的聚类 17
4.3.3.1.3 生成对聚类的一个描述 19
4.3.4 算法运行的一个实例 20
5 结束语 22
6 参考文献 23
7 致谢 23
论文大小:6.64MB
论文格式:word
论文专业:计算机网络
论文编号:201761
论文文件预览:
共1文件夹,1个文件,文件总大小:6.64MB,打包后大小:528.61KB