10.11925/infotech.2096-3467.2018.1388
关于实体解析基本方法的研究和述评
[目的]探讨实体解析理论中经典的实体解析方法及逻辑思路.[文献范围]在Google Scholar和CNKI中分别以检索词“Entity Resolution”、“Collective Analysis”、“Crowdsourced”、“Active Learning”、“Privacy-Preserving”和“实体解析”进行文献检索,再结合主题筛选,精读并使用追溯法获得实体解析研究的代表性文献共86篇.[方法]针对每种实体解析方法,归纳分析该方法的基本思想,并通过图示直观地呈现其中的解析过程;重点分析梳理方法实现过程中,现有研究所采用的关键策略、算法或技术等.[结果]实体解析是数据质量管理的基本操作,也是发现数据价值的关键步骤.[局限]未深入分析各实体解析方法的评价指标和应用情况.[结论]尽管现有实体解析方法能在一定程度上满足大部分应用的需求,但在大数据环境下其仍然面临着数据混杂性、隐私保护和分布式环境等方面的挑战.
实体解析、协同分析、众包、主动学习、隐私保护
3
TP393(计算技术、计算机技术)
国家自然科学基金项目“面向数据演化的增量实体解析方法研究”71761008;广西高校人文社会科学重点研究基地基金项目“面向企业数据治理的数据质量改善研究”项目16YB010的研究成果之一
2019-08-12(万方平台首次上网日期,不代表论文的发表时间)
共14页
27-40