10.3969/j.issn.1673-629X.2011.02.057
Kmeans聚类分析在形音字表音度中的应用
文章通过分析现代汉语拼音的组成结构,总结出汉语拼音对于汉字发音的影响因素.利用计算机对现代汉语中3500个常用字进行汉字拼音表GB2312版录入,提出了基于K均值聚类分析的分级模型.此模型通过建立形声字声符的表音特征向量,利用Kmeans聚类分析的方法,将形声字按表音程度的高低分为6级,使得每一级内形声字的表音度更为相似和紧密,并通过每一个分级(聚类中的簇)中特征向量的模的大小对聚类结果按表音度高低进行排序.提出了新的形音字分级模型,对形音字声符表音度分析提供了新的视角.
拼音、特征向量、Kmeans聚类分析、平方误差法则
21
TP39(计算技术、计算机技术)
全国教育科学"十一五"规划教育部重点课题DCA060097
2011-06-14(万方平台首次上网日期,不代表论文的发表时间)
共4页
223-225,233