利用URL-Key领域术语识别方法
首次提出利用 URL-Key 进行领域术语识别的方法.以 URL 作为媒介, 借助已知 URL-Key 的领域性来判断未知领域候选术语的领域性.首先, 借助互联网中已有的人工分类领域 URL, 根据 URL-Key 在各领域汇总使用的频度, 采用基于方差的领域 URL-Key 识别方法, 构建领域 URL-Key 词表; 然后, 利用伪反馈技术, 收集候选领域词检索得到的 URL 结果集, 根据 URL 结果集构建候选领域术语的 URL-Key 特征向量;最后, 利用 SVM 对候选领域术语进行提取.在 4 个领域进行实验, 都取得不错的效果.新提出的方法可以有效地解决低频术语识别问题, 为低频术语的识别提供新的思路.
URL、URL-Key、领域术语、低频术语、SVM
54
TP391(计算技术、计算机技术)
国家自然科学基金61671070;国家语言文字工作委员会重点项目ZDI135-53
2018-05-11(万方平台首次上网日期,不代表论文的发表时间)
共9页
262-270