10.12339/j.issn.1673-8578.2022.01.004
英语网络非正规语言表达的自动识别与术语库构建
网络非正规语言表达(Network Informal Language Expression,NILE)具有的创新性强、超常规化、表达方式口语化等特点,为许多自然语言处理任务带来了挑战.在使用网络语言进行交流的过程中,部分网络非正规语言表达逐渐标准化和规范化,形成网络非正规语言表达术语.通过对46万余条Twitter数据的收集、处理和分析,英语网络非正规语言表达可以在音、形、义层面划分为13类,并对其特征进行分析和总结.结合统计方法和规则方法的优点,设计了统计和规则融合的英语网络非正规语言表达自动识别方法.最终构建规模为7000余条的网络非正规语言表达术语库.
网络非正规语言表达;自动识别;术语库
24
N04;H083(术语规范及交流)
国家自然科学基金;教育部首批新文科研究与改革实践项目
2022-01-10(万方平台首次上网日期,不代表论文的发表时间)
共9页
36-44