Custom link name
ngstips2
はじめに
1.
品質管理・前処理・ファイル操作
1.1.
FASTQ format
1.2.
FASTQCによるシーケンス実験の品質管理
1.3.
余分な配列の除去
1.4.
シーケンスクオリティが低いのリードを除く
1.5.
なぜアダプタやプライマー配列を除く必要があるのか
1.6.
ゲノムのリピート領域にマッピングされたリードを除く
1.7.
FASTA/FASTQ/SAM/BAMの詳しいステータスを得る
1.8.
FASTA/BAMからランダムにリードを取り出す
1.9.
シーケンスリードのカバレッジを計算する
1.10.
DNA配列のGC%を計算する
1.11.
異なるバージョンのゲノム座標を変換する: liftover
1.12.
異なる生物間のゲノム座標を変換する: liftover
1.13.
samファイルを bam ファイルに変換する
1.14.
bed file の重複領域をマージして行数を減らす
1.15.
bed file を染色体ごとのファイルへ分割する
2.
RNA-Seq
2.1.
TopHatでRNA-seq のデータをリファレンスゲノムへマッピングする
2.2.
Bowtie2でRNA-seqデータをトランスクリプトームへマッピングする
2.3.
RNA-seqのリードをHISAT2でゲノムへ高速にマッピングする
2.4.
RNA-seqのリードをSTARでゲノムへ高速にマッピングする
2.5.
RNA-seq データからの rRNA除去
2.6.
RNA-Seqのトランスクリプトへのリードカバレッジを確認する
2.7.
遺伝子発現量(FPKM)を計算する
2.8.
eXpress で発現量を計算する
2.9.
発現が有意に異なる遺伝子を探す
3.
ChIP-Seq
3.1.
Bowtie2でChIP-Seqデータをゲノムへマッピングする
3.2.
MACS2による結合サイトの予測
3.3.
GPSによる結合サイトの予測
3.4.
結合領域を近傍の遺伝子に割り当てる
3.5.
ピークがゲノムのどのような場所に存在しているのかを円グラフにする
3.6.
2つのTF ChIP-seq の共通結合領域を探す
3.7.
Peakを近傍に持つ遺伝子によく観察されるGene Ontolgyを挙げる
3.8.
ピーク内のゲノム配列をFASTA形式で得る
3.9.
ピーク内に頻出するDNAモチーフ配列を発見する
3.10.
Position weight matrix から Sequence Logo を描く
3.11.
Position weight matrix を既知モチーフデータベースに対して検索する
3.12.
ピーク内の配列のなかから既知のDNAモチーフ配列を発見する
3.13.
summit からのモチーフまでの距離分布を描く
3.14.
モチーフ間距離分布を描く
3.15.
既知のモチーフ配列/PWMのデータを得る: JASPAR
3.16.
deepToolsのセットアップ
4.
Visualization
4.1.
Rで遺伝子構造を描く
4.2.
orenogb2 を使って、複数の bam を可視化する
4.3.
Rでマゼンタ-黒-緑になるバリアフリーなカラーパレットを生成する
4.4.
R でソートできるテーブルを作成する
4.5.
R でアニメーションするグラフを描く
4.6.
R で家系図を書く
5.
その他
5.1.
NGSの情報の集めかた
5.2.
大量の計算を高速化するには
5.3.
バイオインフォマティクス解析のためのSQLite入門
5.4.
UCSCとEnsemblの染色体番号の表記の違いについて
5.5.
R/Bioconductor
5.5.1.
DNA配列をRで操作する
5.5.2.
Rから Refseq や UniProt-KBの情報を高速に検索する
5.5.3.
R で EnsEMBL Gene ID を NCBI Entrez Gene ID へ変換する
5.5.4.
Bioconductor 日本ミラーを利用する
5.5.5.
Bioconductor のソースコードを検索する
5.5.6.
Vagrant を使って Bioconductor Devel の解析・開発環境をAWSに構築する
5.6.
[Python環境の構築]
5.6.1.
SciPyをセットアップする
5.6.2.
matplotlibをセットアップする
5.7.
FPKMとは
5.8.
ID変換: org.Mm.eg.db
5.9.
EMBOSS
5.10.
ジョブスケジューラによるによる分散計算
5.11.
執筆環境
Powered by
GitBook
ngstips2
その他
雑多なこと書く