RNA-seq

概要

このRNA-seqワークフローは、ペアエンドの異なる2つのターゲットを比較します。
転写産物のシークエンス量から遺伝子の発現量を定量化し、配列情報から選択的スプライシングの検出や未知の転写産物を発見する解析手法です。

ワークフロー図

RNA-seq_workflow

入力ファイル

  • FASTQ File: 塩基配列とクオリティスコアのテキストファイル(fastqファイル)
    • FASTQ File 1(フォワード側)
    • FASTQ File 1(リバース側)
    • FASTQ File 2(フォワード側)
    • FASTQ File 2(リバース側)
  • Annotation File: アノテーションファイル(gtfファイル)

出力ファイル

  • FASTQCのレポート(html)
  • TopHat2のマッピング情報(txt, bed)
  • TopHat2のマップ済みリード(bam)
  • CufflinksのFPKM(txt, tsv)
  • Cufflinksのトランスクリプト(gtf)
  • Cuffmergeでマージされたトランスクリプト(gtf)
  • Cuffdiffの発現量の統計情報(tsv)

テスト方法

上記の各入力に対して、以下のファイルをダウンロードしてワークフローを実行します。
  • Bowtie2のインデックスを入手します。
    • 例)ピタゴラギャラクシーのトップページ(VM版の場合は http://192.168.56.10/galaxy )にある [hg19_bowtie2] をクリックします。
  • ファイルをヒストリーにダウンロードするためには Get Data > Upload File を選択し、URLテキストボックスに以下のURLを入力して実行します。
    1. http://download.pitagora-galaxy.org/data/workflows/RNA-seq_01/adrenal_1.fastq
    2. http://download.pitagora-galaxy.org/data/workflows/RNA-seq_01/adrenal_2.fastq
    3. http://download.pitagora-galaxy.org/data/workflows/RNA-seq_01/brain_1.fastq
    4. http://download.pitagora-galaxy.org/data/workflows/RNA-seq_01/brain_2.fastq
    5. http://download.pitagora-galaxy.org/data/workflows/RNA-seq_01/gene_annotation.gtf
  • FASTQファイルのファイルフォーマットを fastqsangar に変更します。
  • ワークフローを実行します。
    • [Workflow] -> [RNA-seq 01] -> [run] をクリックします。