10.11772/j.issn.1001-9081.2015.07.1945
服装类商品属性实体识别
针对服装类商品标题中的商品属性实体识别问题,提出了一种边界探测规则与条件随机场(CRF)相结合的混合方法.首先,使用统计方法挖掘隐蔽的实体提示字信息;然后,以字为粒度对三种统计成词指标及其内涵进行了阐释;接着,基于统计成词指标和提示字信息设计了实体边界探测规则;最后,基于经验风险最小化给出了规则中阈值的确定方法.在与字标注的CRF模型的对比实验中,总体准确率、召回率、F1值分别提升了1.61%、2.54%和2.08%,验证了对于实体边界探测规则的有效性.所提方法可用于电子商务信息检索(IR)、电子商务信息抽取(IE)、查询意图识别等任务.
命名实体识别、服装类商品、条件随机场、电子商务
35
TP391.1(计算技术、计算机技术)
国家科技支撑计划项目2012BAF12B14;国家自然科学基金资助项目51475097
2015-10-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
1945-1949