10.16208/j.issn1000-7024.2021.12.034
基于并行关联规则的话题演化跟踪方法
目前,话题的演化跟踪方法大部分基于不同时间片对应数据集的特征关键词之间语义相似度与语义距离的计算,忽略话题的不同动态演变阶段各个特征关键词之间关联关系的作用.为此提出一种基于并行关联规则的话题演化跟踪方法.引入时间窗口的概念,对数据集按照时序进行划分,在每个时间窗口获取大规模频繁关键词集;对每个时间窗口的频繁关键词集,应用并行关联规则算法获取关联规则集;筛选并组合所有关联规则集形成话题的相关关键词信息,发现相邻时间窗口的数据集之间的关联关系并实现话题演化跟踪.实验结果表明,与OLDA算法相比,该方法能够更加完整有效地深入分析话题的动态演化细节.
话题演化;话题跟踪;并行关联规则;时间窗口;关联规则集
42
TP3(计算技术、计算机技术)
山东省自然科学基金项目;中央高校基本科研业务费专项资金基金项目;上海工业控制系统安全创新功能型平台开放课题基金项目
2021-12-30(万方平台首次上网日期,不代表论文的发表时间)
共7页
3555-3561