融合语义知识的藏文网页关键词提取方法研究
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

融合语义知识的藏文网页关键词提取方法研究

引用
文章归纳整理了藏文网页的结构特征,在借鉴中英文关键词抽取方法的基础上,设计实现了融合语义知识的藏文网页关键词抽取算法.该算法利用藏文文本特征实现了网页内容模块的智能识别,在对识别的文本块进行自动分词后,采用改进的TF-IDF算法得到基础词集,然后根据词向量特征进行基础词的语义扩展构建候选关键词集,最后利用候选关键词之间的语义相关度值,确立藏文网页的关键词.藏文网页的实验测试结果表明该方法提取的藏文网页关键词具有较高的准确率.

藏文网页、TF-IDF、语义扩展、关键词抽取

TP3;H08

西藏自治区高校青年教师创新支持计划项目“基于藏文Web文本的关联知识挖掘方法研究”QCZ2016-44;西藏自治区自然科学基金项目“基于语义的藏文百科知识问答系统关键技术的研究”2016ZR-MY-04

2017-04-17(万方平台首次上网日期,不代表论文的发表时间)

共7页

59-64,77

相关文献
评论
暂无封面信息
查看本期封面目录

图书馆学研究

1001-0424

22-1052/G2

2017,(3)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn