前回は,ALLPATHS-LGの入力データの制約についてFragment LibraryとJumping Libraryの2つが最低でも必要ということを書いたが,今回は実際にALLPATHS-LGを動かすところを見ていく.ただし,複雑で込み入った細かい部分は分からないので,最小構成でとにかくアセンブル結果を得るということだけを解説していこうと思う.
前回は,ALLPATHS-LGの入力データの制約についてFragment LibraryとJumping Libraryの2つが最低でも必要ということを書いたが,今回は実際にALLPATHS-LGを動かすところを見ていく.ただし,複雑で込み入った細かい部分は分からないので,最小構成でとにかくアセンブル結果を得るということだけを解説していこうと思う.
「せめぎ合う遺伝子」(Genes in Conflicts)を先週あたりから少しずつ読み進めている.元々の動機としては,生物学を勉強するにあたり「○○学」なんて大層な名前の分厚い「辞書」を読み進めるのに飽きたのがきっかけで,実例を学びながら時々辞書を引きつつ勉強しようと思ってこの本を選んだのが始まりだった.当初の目的通りこの本をさらっと読み進めながら辞書の方の読解を並行して進められるかと思いきや,これが思いの外キツい本で今は必死になって読み進めている.ある意味計画通りな反面,辞書が示す範疇を超えるのではないかと思うような濃厚さで,半ば辞書を放り出して本に齧り付いている感じがある.
そんなこんなで,無いも同然な生物学の知識を総動員して読み進めているわだが,読み進めるにあたり原書を読まれた方の読書記録が大いに理解の手助けになり参考にさせてもらっている.ということで,自分も実際に書きだして理解を深めようと思い,自分の理解の範囲内で纏めを作って見ることにした.間違ったことを書いていたり理解が浅い部分は多々あると思うので,そのあたり「生物学初学者が書いている」ことを念頭に置いてもらえればと思う.
1章はガイダンス的な内容で,この本のメインテーマである利己的な遺伝因子の定義や,その戦略,研究の歴史が紹介されている.そして最後に,利己的な遺伝因子がいかに広範囲に及ぶ分野をまたぐテーマであり,本書はそれらを包括的に扱い体系化させようとしていることが述べられている.
ALLPATHS-LGは複数のライブラリで読まれたショートリードを組み合わせてゲノムアセンブルをするソフトウェア(パイプライン)である.比較的新しいゲノムアセンブラで性能もかなり良いらしく,公式ブログのアセンブル履歴を見ると非モデル生物を中心にかなり使われている印象がある.ただ,その反面かなり癖のあるソフトウェアで,インストールが鬼門・動かすのが難しい・インターネットに資料が少ないという三重苦で,初心者にはかなりハードルの高いソフトウェアと言わざるを得ない.その中でも個人的に一番やっかいだと思うポイントはパイプライン入力に使うデータセットの準備で,折角苦労してALLPATHS-LGが使える環境を整えたとしても,使えるデータが無いとそもそも動かないということになりかねない.
ということで,今回はALLPATHS-LGを動かすために必要なライブラリについて見ていく.私自身も厳密に調べたわけではないので間違い等あるかもしれないが,もし詳しい方がいらっしゃればご指摘頂ければ幸い.
お久しぶりです,yag_aysです.
さくらVPSの解約に伴い,Wordpressで立てていたblogをGithub Pagesで立て直すことにしました.
ということで,また懲りずに技術系記事をひっそりと書いていく予定です.よろしくお願いします.
1 2 3 4 5 6 7 8 |
|
まだMarkdownがよくわかってない…