基于分层狄利克雷过程模型的文本分割
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.16337/j.1004-9037.2017.02.023

基于分层狄利克雷过程模型的文本分割

引用
文本分割在文本摘要、信息检索等诸多领域都有重要的应用.主题模型是该领域研究中的重要方法,但目前基于主题模型的方法普遍依赖于主题个数的人工设置.针对此问题,本文提出了一种基于分层狄利克雷过程(Hierarchical Dirichlet process,HDP)模型的文本分割方法.首先使用HDP模型获取文本在主题空间的向量表示,然后将主题向量用于C99分割算法实现文本分割,最后使用两种优化策略对结果进行优化.实验结果表明,基于HDP模型的方法能够摆脱对人工设置主题个数的依赖,有效提高了文本分割的性能.

主题模型、文本分割、分层狄利克雷过程、CRF构造

32

TP391(计算技术、计算机技术)

国家高技术研究发展计划“八六三”计划2011AA7032030D;全军军事研究生课题2011JY002-158

2017-06-12(万方平台首次上网日期,不代表论文的发表时间)

共9页

408-416

相关文献
评论
暂无封面信息
查看本期封面目录

数据采集与处理

1004-9037

32-1367/TN

32

2017,32(2)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn