10.3969/j.issn.1000-3428.2016.05.034
基于符号熵的序列相似性度量方法
现有序列相似性度量算法在子序列相似性度量中仅考虑其局部相似度,忽略了其所属序列的整体结构信息.为此,提出一种以单个符号的熵为基础的序列相似性度量方法,根据同一序列中相同符号的位置及个数信息得出符号熵.通过凝聚型层次聚类结果验证序列相似性度量方法,在多个领域的符号序列数据集上的实验结果表明,与现有的基于子序列局部相似性方法相比,该相似性度量方法有效提高了聚类结果质量.
符号序列、相似度、熵、层次聚类、序列聚类
42
TP18(自动化基础理论)
国家自然科学面上基金资助项目“面向软件行为鉴别的事件序列挖掘方法研究”61175123;福建师范大学创新团队基金资助项目IRTL1207
2016-07-13(万方平台首次上网日期,不代表论文的发表时间)
共7页
201-206,212