利用Hadoop/HBase的药物基因组数据云存储实践研究
[目的]探索在导入、保存、检索、批量导出生物医学大数据方面的新思路和新方法,积累第一手经验.[方法]分析生物医学大数据的特点,从理论方面和数据查询对比实验两个方面,对比分析以Oracle为代表的传统关系数据库和以HBase为代表的NoSQL数据库在解决大数据问题时各自采用的技术以及各自的优势与不足.以一个药物基因组数据存储系统为例,进行云存储实践和初步的对比实验.[结果]HBase在处理大量数据的实际应用中,比Oracle更具优势.[局限]没有对药物基因组学数据进行深入挖掘分析,同时需要对Hadoop/HBase做深入的技术优化.[结论]HBase在本文实验的应用场景中能够满足生物医学大数据存储的要求.
生物医学、大数据、关系数据库、NoSQL、Hadoop、HBase
G352(情报学、情报工作)
本文系中央级公益性科研院所基本科研业务费专项资金项目“面向大数据的医学科研支撑环境建设初步研究”项目编号:13R0102和国家社会科学基金项目“关联数据中潜在知识关联的发现方法研究”项目编号:11CTQ016的研究成果之一.
2015-05-28(万方平台首次上网日期,不代表论文的发表时间)
73-79