筛选: 论文毕业设计题目 管理毕业论文 语言学及应用语言学论文 关于楼梯设计的论文 中国硕博论文免费下载 电算化论文序言 长输管道焊接论文 阻燃纤维论文 校车的论文 概率论起源论文

【技师论文】试探一种基于相关系数的模糊C-均值聚类算法(论文范文标题)

星级: ★★★★★ 期刊: 著名作者:钟毅浏览量:5395 论文级别:经典本章主题:算法和样本原创论文: 5156论文网更新时间:10-29审核稿件编辑:Ward本文版权归属:www.5156chinese.cn 分享次数:4489 评论次数: 3149

导读:现在请大家一起欣赏本篇文章算法和样本专业方面的毕业论文范文,为广大学生们写作毕业论文是提供参考帮助。

钟毅

(中国银联股份有限公司 上海201201)

摘要针对传统模糊C-均值聚类算法同等对待每个属性的局限性和初始聚类中心选择的随机性,提出了一种基于相关系数优化的模糊C-均值聚类算法.首先,该算法通过计算离散系数和信息熵来确定每个属性的权重,从而强化了重要属性对聚类过程的影响,削弱了冗余属性的作用,改善了聚类效果;其次,采用相关系数和密度函数来确定样本点的密度,从而突出了样本点在同一类别中的作用;再次,将归一化后的样本点密度作为每个样本的权值;最后,由相关系数及样本点密度确定初始聚类中心.实验结果表明,该算法比传统的FCM算法具有更好的聚类效果.

关键词模糊C均值算法,离散系数,信息熵,属性权重,相关系数,密度函数

doi:10。3969/j。issn。1674-7933。2016。06。15

0引言

模糊聚类分析是一种无监督的机器学习技术,它将模糊理论和方法应用于对数据的分析和建模,从而得到数据之间的模糊关系,并由此对数据集合进行划分,使得相似度较高的数据归为一类,而相似度较低的数据划分到不同的类中.在众多的模糊聚类分析算法中,模糊C-均值聚类算法(FCM)应用最为广泛和成功,它由Dunn提出,并于1 981年被Bezdek等

算法专业技师论文如何撰写
观看次数:3140 点评人数:1875

人【1】推广.该算法首先通过随机初始化聚类中心或者隶属矩阵的方法来开启聚类分析过程,随后通过不断优化目标函数的方法来更新聚类中心以及每个数据对所有类中心的隶属度,最后根据隶属度大小来确定数据所属的类别.由于模糊c-均值聚类算法实现起来简单,聚类效果也较好,因此被广泛应用于解决各种实际问题:模式识别【2】、图像分割【3】、客户关系维护【4】、故障判断、企业EPR系统设计与维护[6】、城市交通拥挤状态划分等

原创出处:

等.但是,FCM算法也存在很多问题:①目标函数没有充分考虑到数据分布不均匀的问题,致使该算法具有对数据集进行等划分的趋势;当数据非均衡分布时,得到的聚类精度较差;②随机选择初始聚类中心,造成聚类结果不稳定,如果初始聚类中心选在孤立点上,则聚类误差很大;③采用基于欧氏距离的相似度度量方式,忽略了数据的不同属性在聚类过程中所起的作用是不一样的事实;实际上,对于那些波动幅度较大的属性,它们有助于区分数据是否属于同一类别,而那些波动幅度较小的属性对聚类的贡献比较小.

针对FCM算法存在的这些问题,学者们分别从不同的角度对该算法进行了改进,提出了新的模糊聚类算法,它们都在一定程度上克服了传统FCM算法的不足之处.刘小芳等人[8-9]提出将样本点之间欧氏距离的倒数之和作为密度函数为样本点加权,从而解决了数据分布不均匀的问题,然而它的精度随着距离限定值e的变化而波动,而文献中并没有给出最佳距离限定值的详细计算公式;孟海东、马娜娜等人提出了基于高斯函数的加权模糊C均值算法,在计算样本点的密度时考虑了全体样本点的影响,这样会放大处于两个类交界处样本点的密度;黄卫春、刘建林等人通过为每个样本赋予高斯密度权重以及在聚类过程中动态调整样本属性特征权重系数的方法来解决FCM存在的问题,然而该算法需要将原始样本空间映射到高维空间,同时需要预设的参数众多,因此实现起来很不方便;王丽娟、关守义等人提出了基于属性权重的FCM算法,该算法突出了不同属性对聚类的影响是不一样的,取得了_定效果,但是计算复杂度较大;王海起、朱锦等人采用信息熵方法为样本各属性进行加权,信息熵越小对应的权重越大,然而当信息熵很小的时候很有可能是全体样本点在该属性上取值很接近,从而无法区分所属类别,显然此时该属性的作用被夸大了;ZB Wang和BZ Qiuc14]提出了基于变异系数的特征属性加权聚类算法,变异系数越大反映出该属性波动越大,因此有助于区分不同的类别,然而当样本空间的孤立点在某一属性上表现的极为突出时,它的变异系数会突然迅速增大,因此该算法会增强孤立点的

一种基于相关系数的模糊C-均值聚类算法
算法和样本论文的范文

干扰作用;为了克服FCM算法随机选择初始聚类中心的缺点,裴继红等人提出了聚类中心的初始化方法,该算法通过不断迭代更新样本点的密度函数来挑选聚类中心,取得了一定成绩,缺点是计算样本点的密度时考虑了全体样本的影响
本篇试探一种基于相关系数的模糊C-均值聚类算法论文范文综合参考评定如下
有关论文范文主题研究:算法方面的论文的范文大学生适用:留学生论文
相关参考文献下载数量:1875写作解决问题:撰写论文的范文
毕业论文开题报告:怎样写目录职称论文适用:职称发表论文
所属大学生专业类别:算法专业论文的范文论文题目推荐度:优质标题
,这样会放大不同类别交界处样本点的密度;在裴继红等人的基础上,李鑫、张继福等人提出了一种基于大密度区域的模糊聚类算法,该算法比较适用于不同类别的密度分布大小都差不多的情形,如果某一类别的样本点分布及其稀疏,则很可能该类别根本无法进入大密度区域中,因此初始化中心点也不会落入该类别中;熊拥军、刘卫国等人通过事先设定样本点之间密度函数比值的阈值来挑选聚类中心,然而阈值的取值依赖于人为经验;周世波等人提出了基于核心样本集的初始聚类中心挑选方法,该算法的本质在于从样本点密度大于平均密度所组成的集合中挑选聚类中心,然而跟大密度区域方法类似,如果不同类别的样本密度分布差别巨大.则有些类别的样本点根本无法选人核心样本集合中;人们还提出了基于遗传算法、模拟退火算法、粒子群优化算法的初始聚类中心选择方法,这些方法都有—定的效果,复杂度却大幅提升.本文提出了_一种基于相关系数的模糊C-均值聚类算法,在不显著增加复杂度的同时还能够大幅度改进FCM算法的缺点.

1 FCM算法简介

4结束语

本文对传统的FCM算法进行了改进,提出了基于相关系数的模糊C-均值算法(FCMBCC).实验结果表明,FCMBCC算法比FCM算法有更好的聚类效果.

[ 参考文献 ]

1、对实施“算法多样化”的几点看法 “应重视口算,加强估算,提倡并鼓励算法多样化”,新课标中提出这样的要求,说明算法多样化已成为课程标准教材的具体要求,它是新的教学理念。但算法多样化也不能盲目,有的时候教师要尊重不同层次学

2、基于内容的文本分类算法综述大庆职业学院计算机应用工程系随着信息技术的发展,人们已经从信息缺乏的时代过渡到信息极为丰富的数字化时代,可以获得越来越多的数字化信息,而这些信息大都是半结构化或非结构化数据,为了从中快速有效地

3、水文学中的模糊聚类问题的讨论与研究 李晓伟 重庆交通大学 重庆 400016 对模糊聚类分析的产生,发展概况进行说明,简要介绍了进行模糊聚类分析的一般方法,以及目标函数法的基本过程,同时也对水文学中模糊聚类研

本篇论文阅读总结:为有关撰写算法和样本方向的论文的范文与课程研究的学生们在完成技师毕业论文算法论文开题报告范文以及相关论文格式模版起到一定的帮助。

本篇有关算法和样本毕业论文范文免费供大学生阅读参考-点击更多447980篇算法和样本相关论文开题报告格式范文模版供阅读下载
延伸阅读: 关于科教兴国的论文 怎样写初中生物小论文 教育论文写作 音乐论文绪论 政治有效教学论文 关于教育学专业论文题目 遥感的应用论文 关于船舶机电论文 初二数学论文1000 查看论文的网站
室内设计专业导论论文 健美操论文健美操论文 山水画论文 康乐经营论文 金融改革创新论文 经济论文数据处理 我的思品课论文 海南方言的论文 海关简政放权论文 关于师生沟通的论文