汉语文本文采的特征体系构建及自动评估研究
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

汉语文本文采的特征体系构建及自动评估研究

引用
文采是文本的重要属性,在写作实践与阅读体验中都发挥着重要的作用,但目前对汉语文本文采属性的量化研究仍存有不足.本文基于已有研究,构建了一个适用于评价汉语文本文采的语言特征体系,并基于机器学习模型考察了该体系在不同来源、粒度以及文采混合程度语料上的文采自动评估效果.实验结果表明:(1)本文所建立的特征体系对不同类型的文本具有普遍适应性,能够有效地对汉语文本文采进行评估与判断(在不同语料中的加权F1值可达89.94%与78.25%);(2)形体、语义层面的语言特征能够显著影响文采自动评估的效果,而语音层面的语言特征影响则较小,其中影响最大的特征维度为语言多样性、语言熟悉度、语言复杂度、语义具象性与语篇辞格,关键性特征为平均对数字频、平均词汇习得等级、辞格平均使用数、平均词义具体值、未登录词比例、人称代词比例、语义分布与感官形容词比例8项语言指标.

汉语文本文采、语言特征、机器学习、文采自动评估

H087(应用语言学)

教育部人文社会科学研究项目;北京语言大学梧桐创新平台;研究生创新基金项目

2023-06-08(万方平台首次上网日期,不代表论文的发表时间)

共15页

130-144

相关文献
评论
暂无封面信息
查看本期封面目录

语言文字应用

1003-5397

11-2888/H

2023,(1)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn