使用ProkSeq玛蒂尔达

概述

ProkSeq是一个自动化RNA-seq为原核生物数据分析软件包,用户可以执行所有必要的步骤RNA-seq数据分析的质量控制通路富集分析。

ProkSeq适合使用在玛蒂尔达从原始图像和Conda码头工人文件。有限的变化做了一些脚本,以促进应用程序路径被发现在用户的工作空间。本文简要介绍如何使用ProkSeq玛蒂尔达。

开始

首先加载ProkSeq modulefile:

模块加载ProkSeq

modulefile将负载ProkSeq所需的所有必要的包,并将相应的环境变量。

为了ProkSeq运行,您将需要设置一个参数文件和一个示例文件使用在命令行作为输入参数。为了您的方便,加载modulefile将安装目录的设置环境变量PROKSEQ_HOME美元。参数和样本文件的例子,请参考的内容:

$ PROKSEQ_HOME /例子

类似地,可以使用注释文件的一个示例中可以发现:

美元PROKSEQ_HOME /数据

参数文件

你必须改变至少一行ProkSeq参数文件作为输入。下面是文件的摘录PROKSEQ_HOME美元/ / param.bowtie.yaml例子:

# #工作目录下面的* *输入路径根路径:/道路/ /工作/目录中#如果上述环境(靠,脚本、数据)是真的,以下#注释多行。#默认路径:“真正的”#指定geneBody_coverage之路路径geneBody_coverage: /厘米/共享/应用程序/ ProkSeq / 2.0 -py368 / / RSeQC-2.6.2 /脚本/#指定FEATURECOUNTS之路路径FEATURECOUNTS: / 2.0厘米/共享/应用程序/ ProkSeq / -py368 /依赖/ subread-1.4.6-p5-Linux-i386 / bin /#指定fastqc之路路径FASTQC: / 2.0厘米/共享/应用程序/ ProkSeq / -py368 /依赖/ FASTQC#指定路径领结路径领结:/厘米/共享/应用程序/ ProkSeq / 2.0 -py368 / / bowtie2 / bowtie2-2.3.5.1-linux-x86_64依赖#指定的路径如果鲑鱼鲑鱼是必需的路径鲑鱼:/ 2.0厘米/共享/应用程序/ ProkSeq / -py368 /依赖/ salmon-latest_linux_x86_64 / bin#指定路径pypy afterqc运行所必需的....

请改变线”路径的根:“以匹配您的当前工作目录的路径!

你应该改变的任何可执行文件的路径否则你会打破ProkSeq。您可能希望更改某些参数输入国旗领结,鲑鱼,或AFTERQC。你也希望改变某些文件的名称,比如Featurecounts输入GTF文件。请参考ProkSeq文档的更多信息。

运行一个例子

您可能希望运行几个例子来感受如何ProkSeq的工作原理。让我们开始通过改变你的工作目录,加载modulefile,和复制文件的例子:

cd /划痕/用户/ <用户名>模块加载ProkSeqrsync avon PROKSEQ_HOME美元/ / *示例。

现在正如前面指示,改变的“根”,“param.bowtie。yaml”和“param.salmon。yaml文件”。例如:

# #工作目录下面的* *输入路径根路径:/划痕/用户/ <用户名>

现在,让我们来运行paired-end领结的例子:

prokseq。py - s samples.bowtie。PEsample - p param.bowtie。yaml - n 4

这将产生一个目录称为“输出”和不应该抛出任何异常或者错误。现在重命名输出目录保存结果,然后运行鲑鱼的例子:

mv输出Output.bowtieprokseq。py - s samples.salmon。PEsample - p param.salmon。yaml - n 4

再次,你应该有一个新的“输出”文件夹中。检查的内容“输出”和“Output.bowtie”。

互动与批处理作业

当交互运行上面的例子,你会注意到,你将被要求回答一个问题来进行分析:

用包检查。似乎所有必需的包是可用的。你想要继续吗?(Y / N):

通常你会提供一个答案(通常“Y”)和分析将继续。然而,在一批集群工作需要提供“回答”的命令行。例如:

回声“Y”| prokseq。py - s samples.salmon。PEsample - p param.salmon。yaml - n 4

这是很重要的,因为你不能“回答”的问题批处理作业运行时,它会失败,无需修改命令行如上所示

额外的信息

依靠文档上ProkSeq github页面——我们发现在撰写本文时,它是过时的,是指在某些情况下弃用的命令。

用专用的ProkSeq文档页面获取更多信息。


CategoryHPC