10.3969/j.issn.1003-0077.2010.05.012
基于三维文档向量的自适应话题追踪器模型
话题追踪(TT)是研究自动追踪事件动态发展过程的一种信息智能获取技术,是话题检测与追踪(TDT)技术的一个子任务,其目标在于自动发现新闻报道信息流中与某一已知话题有关的新报道.该文通过分析传统文档向量空间模型的不足,结合新闻报道的特征,提出了一种三维文档向量模型,在此基础上建立了一种符合新闻报道特征的话题模型.该话题模型在追踪过程中能够根据事件的动态发展进行自我学习和自我修正.结合话题模型,该文还设计了一种自适应的KNN新闻话题追踪器,从而形成了一种完整的中文话题追踪器模型.实验数据表明该方法在描述新闻话题、避免话题漂移方面具有一定优势,在中文话题追踪领域取得了较好效果.
话题追踪、话题模型、三维文档向量模型、自适应KNN追踪器
24
TP391(计算技术、计算机技术)
国家科技基础条件平台建设基金2005DKA63901
2010-11-09(万方平台首次上网日期,不代表论文的发表时间)
共7页
70-76