文献中的词型分区规律与高频特征词的发现
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

文献中的词型分区规律与高频特征词的发现

引用
为了发现文献中的词型分布规律,找出能够代表文献主题内容和语言风格的高频特征词,本文对语料中的词型按出现频次降序排列,再均分成几个词例数目相等的分区,分析其中的词型数量规律.研究发现,按这种方法把词型分成三个、四个、五个分区时,分区之间的词型数量关系是有规律的.增加同质语料的规模,对于词型序列前几个分区的词型数量变化影响微小,而对于最后一个分区的词型数量变化影响较大.本文提出按照“二八定律”来区分高频词与其他词,并提出通过比较高频词型在特定文献与其他多个文献中的等级差异,得到词型的特征系数,自动发现特定文献中的高频特征词.

词型、布拉德福定律、二八定律、齐普夫定律

H087(应用语言学)

江苏省社科基金项目“语料库通用技术研究”15YYC001

2018-09-28(万方平台首次上网日期,不代表论文的发表时间)

共10页

124-133

相关文献
评论
暂无封面信息
查看本期封面目录

语言文字应用

1003-5397

11-2888/H

2018,(3)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn