10.7544/issn.1000-1239.2015.20131342
基于开放网络知识的信息检索与数据挖掘
网络大数据是指“人、机、物”三元世界在网络空间(cyberspace)中交互、融合所产生并在互联网上可获得的大数据.这些数据具有多源异构、交互性、时效性、社会性、突发性和高噪声等特点,不但非结构化数据多,而且数据的实时性强.网络大数据背后蕴含着丰富的、复杂关联的知识.建立面向开放网络的知识库是获取网络大数据中的丰富知识的有效手段.对当前国内外主要的开放网络库进行了比较,分析了相应的构建方法、多源知识的融合以及知识库的更新等关键技术.进一步从用户意图理解、查询扩展、语义问答、线索挖据、关系推理以及关系和属性预测等方面出发,总结了基于开放网络知识库的信息检索、数据挖掘与系统应用的研究现状和主要问题.最后,对开放网络知识库的发展趋势和面临的主要挑战进行了展望.
网络大数据、开放网络知识、本体、信息检索、数据挖掘
52
TP182(自动化基础理论)
国家“九七三”重点基础研究发展计划基金项目2014CB340401,2013CB329601;国家自然科学基金项目61173008,61100175,61232010,60933005,61402442;北京市科技新星计划项目Z121101002512063;北京市自然科学基金青年基金项目4154086
2015-04-27(万方平台首次上网日期,不代表论文的发表时间)
共19页
456-474