非常に良い講義資料およびその講義ビデオを見つけたので紹介する.これはハーバードの大学院およびハーバード公衆衛生大学院のComputational Biologyの講義で,マイクロアレイ/次世代シーケンサの発現解析に始まり,ChIP-Seqやモチーフ検索,GWAやSNP解析に至るまで,Computational Biologyにおける様々な研究対象に関する講義が行われている.
STAT115 Introduction to Computational Biology
This course is an introduction to state-of-the-arts concepts, methodologies and practices in computational biology. After taking this course, you should be able to:
Use appropriate commands or write your own scripts to manipulate your own genomic data
Exploit appropriate pipeline or software to analyze your own high-throughput gene expression microarray and/or RNA-Seq data and high-throughput sequencing transcriptional regulation data
Apply statistical or mathematical models to your own population/human genetics data
Criticize and/or extend the computational analysis or statistical models in the literature
Use R, Python, and/or Shell scripts and basic concepts in genomics and genetics to perform your own bioinformatics and computational biology research
このなかで,Cole TrapnellがRNA-Seqの遺伝子発現解析に関してレクチャーしている.Cole Trapnellといえば,TopHatやCufflinksの開発者の中心人物のひとりだ.これらのツールに関する論文の第一著者でもある.その彼が,RNA-Seqの定量化や発現量推定などの一連の流れを,自身が開発に参加した”Tuxedo Tools”(Bowtie, Tophat, Cufflinks, CummeRbundの総称)を例に紹介しているのがこの動画だ.主にマッピング後の発現量推定に関して,基本的なFPKMの求め方であったり,Cufflinksのisoformの取り扱いであったりを,少し数式も交えながら詳しく解説している.
講義資料:http://www.stat115.org/lectures/stat115_rnaseq.pdf
lecture9-I from stat115 on Vimeo.
lecture9-II from stat115 on Vimeo.