前回SOAPdenovo2の話を書いたが,そういえばSOAPdenovo2といえばインストールまわりが不親切だったので,ちょっと解説みたいなものを書いてみる.
ダウンロード
SOAPdenovoのパッケージがおかれているSourceForgeにアクセスする
まずここで注意しなければいけないのは,緑のアイコンででかでかと表示されている「Download」をクリックしてはいけないということだ.よくよく見ると「GapCloser」と書いてあり,これは本体とは別のプログラムファイルである.欲しいのはSOAPdenovo2の実行ファイルなので,「Browse All File」をクリックしてアップロードされているファイルの中から欲しいものを探す.なお,上部の「File」をクリックしても同じ.
「bin」をクリックする.
これでSOAPdenovo2の一連のファイルが表示される.この中で必要なのは「SOAPdenovo2_revision210.tgz」というファイル.
そして「SOAPdenovo2_revision210.tgz」クリックすると,ページが遷移したあと自動でダウンロードが開始される.もしサーバなどにダウンロードしたい場合は,画面上部にある「Direct link」のリンクURLを使って以下のようにwgetなどでダウンロードする.
1
|
|
解凍およびインストール
あとは,ダウンロードしたSOAPdenovo2_revision210.tgzを解凍するだけでSOAPdenovo2のバイナリが得られる.SOAPdenovo2はまだソースコードの公開をしておらず,プログラムはすべて実行可能なバイナリ形式で配布されている.
1
|
|
なお,上記のコマンドでは,カレントディレクトリに全てのファイルが展開されるので,もし特定のディレクトリに展開したい場合には,以下のように-C
オプションを付ける.展開先のディレクトリが無いとエラーになるので,実行前にmkdir
などで作っておく.
1
|
|
展開すると,以下のようになる.
1 2 3 4 5 6 7 |
|
SOAPdenovo-63merとSOAPdenovo-127merがSOAPdenovo2の本体になる.ここで少し注意が必要なのだが,SOAPdenovo2なのに実行ファイル名がSOAPdenovoとなっていてややこしいのに加えて,SOAPdenovoは「SOAPdenovo63mer」なのに対し,今回はK-merの値の前にハイフンが入っていて余計混乱を招きそうな名前になっている.パイプラインで処理させている人は,名前の変更に注意しよう.
また,SOAPdenovo2では新たにpregraph_sparceというモジュールが追加されている.これは,SOAPdenovo2のアセンブル第1段階で行われるpregraphというコマンドの改良版で,コンティグとしてグラフをつなげていく前段階で候補を減らしておき,後々の処理の無駄を省くというもののようだ.基本的にSOAPdenovo2を実行するだけならpregraph_sparseは必要ないが,高速化をしたいといった場合には試してみてもいいと思われる.pregraph_sparseの詳しい使い方はMANUALに書かれているので,そちらを参考していただきたい.ちなみに,MANUALでは”consumption”の綴りが間違っている.
実行の確認
ファイルを展開したディレクトリでSOAPdenovo2を実行して,以下のようにバージョンとヘルプが表示されれば,インストールは成功している.なお,いまのところLinuxにしか対応してないようで,Mac OS Xでは実行できないので注意.
1 2 3 4 5 6 7 8 9 10 11 |
|
最後に愚痴
そもそも,SourceForgeは様々なプログラムが配布場所として使用しているが,そもそも色々と不便で分かりにくい.広告が多い上に画面がごちゃごちゃしていて構造を把握しづらいし,ファイルを自動ダウンロードにしてるのもいい迷惑だし,慣れていないとなかなかに辛いものがある.元のプロジェクトの概要を機械翻訳で日本語にしただけの有りもしない日本語版のページなど,Google検索などでのノイズも非常に多い.まあ結論としては,今回はこれが言いたかっただけです,はい.