研究目的
介绍一种新的RNA-seq比对算法SNAPR,该算法简化了从原始RNA测序数据到可解释结果的转换过程,使其更快、更准确且更易于使用,尤其适用于大型数据集或需要进行标准比对之外额外分析的情况。
研究成果
SNAPR提供了一套快速、精准且集成化的解决方案,可简化大规模RNA测序数据的比对与分析流程。该工具使研究人员能轻松处理数百至数千个样本,精准识别基因表达或其他转录组扰动的统计学罕见模式,同时还能自动检测污染物及融合事件。
研究不足
当前版本的SNAPR专为具有注释基因组设计,不尝试发现新的剪接位点。其索引创建和对齐过程均需超过40GB的RAM内存。
1:实验设计与方法选择:
SNAPR采用哈希表方法进行RNA测序比对,利用高内存机器。它同时将读段与基因组和转录组比对,以确??悸撬锌赡艿谋榷晕恢谩?
2:样本选择与数据来源:
使用Mason和Venter基因组生成模拟RNA测序数据。真实RNA测序样本来自TCGA等来源用于测试。
3:实验设备与材料清单:
运行SNAPR使用了Amazon EC2 cr1.8xlarge实例。
4:8xlarge实例。
实验流程与操作步骤:
4. 实验流程与操作步骤:SNAPR处理压缩或未压缩的FASTQ和BAM文件,输出排序后的BAM文件、单个读段计数、基因融合,并识别外源RNA种类。它对读段执行原生Phred分数过滤。
5:数据分析方法:
使用模拟和真实RNA测序数据,将SNAPR的性能和准确性与其他比对工具进行比较。使用基因组分析工具包进行变异检测,以估计读段映射准确性。
独家科研数据包,助您复现前沿成果,加速创新突破
获取完整内容