10.3969/j.issn.1673-629X.2022.07.037
短文本聚合在元器件供方匹配中的应用与研究
航天采购部门采购合格供方的元器件是保证航天用元器件可靠性的方法之一.确定供方是否在合格供方目录中,是航天元器件采购流程中的一个重要步骤.但由于航天各院所系统中对供方定义标准不一致,常以供方公司的别称、简称代替供方名称,这导致同一供方出现多种不同名称,这给如何匹配合格供方带来了挑战.针对航天各院所系统中的供方数据的特征,提出了一种结合Jaro-Winkle算法和Levenshtein算法的融合算法.该算法通过引入调整阈值及系数,将字符的位序、字符替换、添加、删除操作等因素纳入到供方名称的短文本相似度计算中,提高供方名称的短文本匹配准确率.通过在航天元器件合格供方匹配流程中的应用,该算法有效提高了供方的匹配准确率.
Jaro-Winkler算法、Levenshtein距离、短文本聚合模型、数据特征、供方匹配
32
TP315(计算技术、计算机技术)
国防科工局基础科研项目JSZL20191201ZL0002
2022-08-01(万方平台首次上网日期,不代表论文的发表时间)
共5页
216-220