10.3969/j.issn.1005-8095.2019.12.001
基于专家主页的专家信息抽取方法研究
[目的/意义]旨在为企业建立自己的专家信息库提供参考.[方法/过程]构建一个统一的专家信息元数据框架,对专家信息进行了规范化描述;对专家主页的网页标题、网页URL和网页内容等进行了分析,并从中提取特征进行专家主页的识别;构建一个自适应多种主页类型的Bi-LSTM-CRF专家信息抽取模型,并对模型性能进行了实验分析.[结果/结论]基于专家主页的专家信息抽取方法能够利用机器学习技术从海量的Web页面中有效识别专家主页,并且通过改进的信息抽取模型从专家主页中自动抽取企业所需要的专家信息.本文提出的方法是有效的.
专家资源、元数据框架、专家主页识别、专家信息抽取
G203(信息与传播理论)
国家重点研发计划课题"科技资源分享模型与开放分享理论"2017YFB1400302
2020-01-16(万方平台首次上网日期,不代表论文的发表时间)
共9页
1-9