10.3969/j.issn.1009-3044.2010.30.001
从文献中获取数据及判据知识资源的方法研究
资源获取是构建故障诊断分布式资源环境的重要前提,获取分散的诊断资源可以实现资源共享从而挖掘出更利于决策的知识.目前已有大量研究成果在科研文献中进行了报导.但文献大多是PDF文件格式,为此研究从文献中提取数据的方法有重要意义.利用像素比例法来计算曲线采样点的数据值,采用随机扫描法快速分割表格中的单元格,并研究基于像素点数和百分比值的字符识别方法,最终实现了趋势曲线图的数据提取以及数据表格的识别.实验结果表明,该方法能有效实现从文献中提取数据信息资源,为分布式资源环境的建立奠定了坚实的基础.同时也可应用于其它领域的数据资源获取.
资源获取、曲线数据提取、单元格划分、字符识别
6
TP311(计算技术、计算机技术)
2011-01-27(万方平台首次上网日期,不代表论文的发表时间)
共4页
8417-8419,8450