前回SOAPdenovo2の話を書いたが,そういえばSOAPdenovo2といえばインストールまわりが不親切だったので,ちょっと解説みたいなものを書いてみる.

ダウンロード

SOAPdenovoのパッケージがおかれているSourceForgeにアクセスする

まずここで注意しなければいけないのは,緑のアイコンででかでかと表示されている「Download」をクリックしてはいけないということだ.よくよく見ると「GapCloser」と書いてあり,これは本体とは別のプログラムファイルである.欲しいのはSOAPdenovo2の実行ファイルなので,「Browse All File」をクリックしてアップロードされているファイルの中から欲しいものを探す.なお,上部の「File」をクリックしても同じ.

「bin」をクリックする.

これでSOAPdenovo2の一連のファイルが表示される.この中で必要なのは「SOAPdenovo2_revision210.tgz」というファイル.

そして「SOAPdenovo2_revision210.tgz」クリックすると,ページが遷移したあと自動でダウンロードが開始される.もしサーバなどにダウンロードしたい場合は,画面上部にある「Direct link」のリンクURLを使って以下のようにwgetなどでダウンロードする.

1
$ wget http://downloads.sourceforge.net/project/soapdenovo2/bin/SOAPdenovo2_revision210.tgz

解凍およびインストール

あとは,ダウンロードしたSOAPdenovo2_revision210.tgzを解凍するだけでSOAPdenovo2のバイナリが得られる.SOAPdenovo2はまだソースコードの公開をしておらず,プログラムはすべて実行可能なバイナリ形式で配布されている.

1
$ tar zxvf SOAPdenovo2_revision210.tgz

なお,上記のコマンドでは,カレントディレクトリに全てのファイルが展開されるので,もし特定のディレクトリに展開したい場合には,以下のように-Cオプションを付ける.展開先のディレクトリが無いとエラーになるので,実行前にmkdirなどで作っておく.

1
$ tar zxvf SOAPdenovo2_revision210.tgz -C path/to/SOAPdenovo2_revision210

展開すると,以下のようになる.

1
2
3
4
5
6
7
$ ls -l
total 7040
-rw-r--r-- 1 yag_ays users   16199 Sep 13 15:54 MANUAL
-rwxr-xr-x 1 yag_ays users 1958292 Sep 13 13:50 pregraph_sparse_127mer.v1.0.3*
-rwxr-xr-x 1 yag_ays users 1941908 Sep 13 13:50 pregraph_sparse_63mer.v1.0.3*
-rwxr-xr-x 1 yag_ays users 1718828 Sep 13 13:49 SOAPdenovo-127mer*
-rwxr-xr-x 1 yag_ays users 1562546 Sep 13 13:49 SOAPdenovo-63mer*

SOAPdenovo-63merSOAPdenovo-127merがSOAPdenovo2の本体になる.ここで少し注意が必要なのだが,SOAPdenovo2なのに実行ファイル名がSOAPdenovoとなっていてややこしいのに加えて,SOAPdenovoは「SOAPdenovo63mer」なのに対し,今回はK-merの値の前にハイフンが入っていて余計混乱を招きそうな名前になっている.パイプラインで処理させている人は,名前の変更に注意しよう.

また,SOAPdenovo2では新たにpregraph_sparceというモジュールが追加されている.これは,SOAPdenovo2のアセンブル第1段階で行われるpregraphというコマンドの改良版で,コンティグとしてグラフをつなげていく前段階で候補を減らしておき,後々の処理の無駄を省くというもののようだ.基本的にSOAPdenovo2を実行するだけならpregraph_sparseは必要ないが,高速化をしたいといった場合には試してみてもいいと思われる.pregraph_sparseの詳しい使い方はMANUALに書かれているので,そちらを参考していただきたい.ちなみに,MANUALでは”consumption”の綴りが間違っている.

実行の確認

ファイルを展開したディレクトリでSOAPdenovo2を実行して,以下のようにバージョンとヘルプが表示されれば,インストールは成功している.なお,いまのところLinuxにしか対応してないようで,Mac OS Xでは実行できないので注意.

1
2
3
4
5
6
7
8
9
10
11
$ ./SOAPdenovo-63mer

Version 2.04: released on July 13th, 2012
Compile Sep 13 2012     12:48:54

Usage: SOAPdenovo <command> [option]
    pregraph     construct kmer-graph
    contig       eliminate errors and output contigs
    map          map reads to contigs
    scaff        construct scaffolds
    all          do all the above in turn

最後に愚痴

そもそも,SourceForgeは様々なプログラムが配布場所として使用しているが,そもそも色々と不便で分かりにくい.広告が多い上に画面がごちゃごちゃしていて構造を把握しづらいし,ファイルを自動ダウンロードにしてるのもいい迷惑だし,慣れていないとなかなかに辛いものがある.元のプロジェクトの概要を機械翻訳で日本語にしただけの有りもしない日本語版のページなど,Google検索などでのノイズも非常に多い.まあ結論としては,今回はこれが言いたかっただけです,はい.

参考