シーケンスリードのカバレッジ(被覆率)を計算する

インストール

$ curl -O https://bedtools.googlecode.com/files/BEDTools.v2.17.0.tar.gz
$ tar zxvf BEDTools.v2.17.0.tar.gz
$ cd bedtools-2.17.0/
$ make
$ cd ..
$ sudo cp -a bedtools-2.17.0 /opt
$ cd /opt
$ sudo ln -s bedtools-2.17.0  bedtools

設定

$ emacs -nw ~/.zshenv
export PATH=$PATH:/opt/bedtools/bin
$ source ~/.zshenv

ここでは、bed ファイル (Pou5f1.bed) に記述された座標にマップされたリードのカバレッジを bam ファイルから(hoge.bam) 計算する。

$ coverageBed -d -abam hoge.bam -b Pou5f1.bed > Pou5f1.TruRNA-Seq01.coverage.bed

bam を wig に変換する

wig file はカバレッジのデータを保存するためによく使われるファイル形式である。ここでは、bam から wig を計算する方法を述べる。

bam2wig.py -t 1000000000 -i hoge.bam -o hoge.wig -s mm10.info

wig を bigwig へ変換する

wig 形式はテキスト形式になっているが、このままではファイルサイズが巨大になる。そこで、バイナリ形式である、bigwig へ変換する。

$ wigToBigWig hoge.wig mm10.info hoge.bw