10.3969/j.issn.1672-5565.201709003
Unix文本比对分析高通量RNA?Seq测序基因表达
从RNA?Seq高通量测序短序列进行比对及拼接获得较长转录本并确定基因表达量的方法随着转录组测序的广泛开展仍在不断改进,本文利用类Unix系统的文本处理命令组合对山茶花开花期叶片及花瓣的转录组序列进行比对、序列拼接及其表达量分析.首先对测序序列进行每1万条准随机排序,选取10万条序列分别与100万条序列进行比对,从每个查询序列随机选取9组20 mer比对100万条序列去重后获得该序列的转录数量.利用查询序列首尾20 mer从匹配的比对重叠群进行拼接,初次拼接最长为410 mer,超过两个及以上拼接序列的再次进行相互比对及再拼接,最长1174 mer.用查询序列的比对匹配数表示其拼接前后的表达量,与用互补链进行比对得到的负链表达量相当.用拼接序列进行NCBI联网blast比对获得了其基因注释.本文得到的结果表明,利用类Unix系统文本比对可以有效用于高通量测序基因表达量及进行序列从头组装等分析.
RNA?Seq、文本比对、基因表达量、重叠群拼接、类Unix系统
16
Q344+.13(遗传学分支学科)
2018-08-14(万方平台首次上网日期,不代表论文的发表时间)
共11页
119-129