知り合いから教えてもらったウェブページで気になるプロジェクトがあったのでメモ.「Solve」と呼ばれるこのプロジェクトはまだ開発中のようで,ググっても詳細はよく分からない.現状では,ローンチしたら登録したメールアドレスに連絡するよというくらいしか活動が無い.

Solve | Rebuild Bioinformatics

The Solve API gives you instant access to TCGA, ENCODE, 1000 Genomes, HapMap, PolyPhen, RefSeq, UCSC, OMIM, UniProt, dbSNP. We worry about downloading and parsing flat files with confusing formats so you don’t have to.

https://www.solvebio.com/

基本的にはPythonを拡張するパッケージで,バイオインフォマティクス系のデータベースに簡単にアクセスして解析できるようにするのが目的のようだ.上記のリストアップされているデータベースの並びを見ると「お前それよく使われてそうなやつリストアップしてるだけだろ」と思わざるをえないが,まあそこら辺は気にしない.ウェブページに代表例として載っているコードを見てみると,やろうとしていることは基本的に様々なデータベースのAPIらしい.それに加えて,データベースのドキュメントやメタデータも含めてSolveで取り扱えるようにするとのこと.これがBioPythonのプロジェクトの一つとしてならある程度納得行くのだけれども,これがスタートアップの一つとして立ち上がりつつあるのはどうなんだという感じがしないでもない.

とりあえずローンチのメールを待とう.



Open Science Award presented by DBCLS

突然ですがお祭りのお知らせです!!!

オープン・サイエンス・アワードは「論文として発表されていない/されにくい」けど日々ありがたく使っている(国内の)データベース・ソフトウェア・ウェブサイト(ブログやWikiなど)をコミュニティで表彰しよう!という企画です。自薦/他薦を問わずノミネートされた作品に対してみなさんで投票し,得票の多い作品をJSBi年会で表彰,作者に発表を依頼します。学生/研究者,ウェット/ドライ,アカデミック/ビジネス,JSBi会員/非会員を問わずにどなたでも投票できます。利用したことがないノミネート作品もぜひチェックしてみてください。

Open Science Award presented by DBCLS

投票期限は9/27までとのことなので,皆さんぜひぜひ上記ウェブサイトから投票してみてください.今まで知らなかった素敵なツールやウェブサイトが発見できるかもしれませんよ!

Open Science Awardのリンクからこのサイトに来られた方へ

最近はあんまりバイオインフォっぽいことをBlogに書けてないのですが,過去にはこんな記事とか書いてます.主に個人的な勉強記録として次世代シーケンサー(NGS)関係の解析をメインにバイオインフォマティクスに関する話題など,その他にも色々と書いているので,サイトのアーカイブや右カラムにあるカテゴリーから気になる記事を見てみて下さい.

参考



何というか…

これはひどい(褒め言葉)

という感じで,楽しく読ませていただいた.

内容的にはPRMLというよりかはエントロピーなどの情報理論なのだが,そのあたりに突っ込むのは無粋というもの.文芸部のツインテール女子高生が黄色い表紙を持っているだけで100点満点,むしろ点数はカンストですよ.「もしドラ」と「数学ガール」という2つの共通認識があってこそ成立するこの異次元な設定,そして機械学習ブームに後押しされてバイブルと化したPRMLの持て囃されっぷり.まさに現在の潮流を象徴する1冊といえるだろう.最近ではビジネスやマーケティングと組み合わさって何やら胡散臭い感じが出てきた機械学習界隈だけれども,アカデミアやエンジニア側としては上手く折り合いを付けて堅実に発展していって欲しいトコロ.まあそのあたり,変に商業主義を敵視したりExcelに突っかかっていったりせず,本書のように何でもアリで楽しめたらなぁと思う今日この頃.

ただ本書でひとつ惜しむらくは,分量が少ないこと.薄い本といえどあれこれ設定やら背景を入れて,PRMLのごとく色んな話題を詰め込んで欲しかった.まあ本業のある中での執筆活動ということで大変だとは思うが,またストックの溜まった頃にまとめて放出してもらいたい.こういう小説系で書かれた数学分野の啓蒙書では,例えば野矢茂樹氏の無限論の教室 (講談社現代新書)が個人で書きためていた原稿の新書化だった気がするので,結城浩氏の数学ガールくらいの大作とまではいかなくても,新書くらいの分量なら書籍としての出版は期待できるかも….

という感じで,機械学習系の勉強会での活動やgihyo.comで連載中の「機械学習 はじめよう」など,これからも多方面で活躍されることを楽しみにしております.



翻訳家の青木薫氏による書き下ろしの新書.この著者はサイモン・シンの数多くの著作の翻訳を手がけていることで有名だが,今回は翻訳ではなく本人が温めていた企画を科学書としてまとめ上げた形になる.そもそも翻訳業に進む以前に京都大学で理論物理の博士号を取得した氏だが,手がける作品の中で本書の軸となる概念に影響されたのが最初らしい.このあたりは本書の前書きや後書きに詳しく書かれている.そういったところで,自身の専門と関係した分野で翻訳書にまつわる内容を,わかりやすく分量もそこそこに書き上げたのがこの本書「宇宙はなぜこのような宇宙なのか」である.

この題名はトートロジー的な表現をしていて少し分かりにくいが,中身を読めばこのタイトルはまさに本書を一言で言い表していることがわかる.本書のキーワードは,副題にある通り「人間原理」である.この人間原理という物の見方を通して宇宙というものを理解しようとする流れが,最近の宇宙論や理論物理学における潮流となっている.人間原理は一言で言えば

宇宙がなぜこのような宇宙であるのかを理解するためには,われわれ人間が現に存在しているという事実を考慮にいれなければならない

(P.3)

とされる.ここで言う宇宙の理解というのは,具体的には宇宙の性質を決めている物理定数のことであり,実験や観測によって求められる定数の根拠や制約に人間が存在しているという事実を組み込むことで,この宇宙をより正確に理解しようということである.この一見して非科学的で奇妙な原理はそもそもどこから出てきたのか,なんでそのようなことを考えるのかに至ったのかを,これまでの人類の宇宙論/宇宙観を辿りつつ紐解いていく.

本書の中で特に興味深く語られるのは,やはり人間原理の発想というものが,天動説から地動説への転換と非常に類似しているということだろう.これはすなわち人間を中心に考えるか否かの問題である.人間の住む地球を系の中心としていた天動説から,地球も太陽を中心として公転しているする惑星の一つにすぎないとする地動説への転換は,一般に知られるように非常に大きな意味を持っていた.これは人間原理にも同様に当てはまる.われわれが観測している宇宙は唯一の絶対的な世界そのものではなく,観測者である人間が観測できうるようなあまたある多元宇宙の一つにすぎず,なんら特別なものではないかもしれないということである.そういった意味で,人間という存在を中心から引きずり下ろすということは,天動説から地動説への概念的な移り変わりと非常に似通っているといえる.

ただし,だからといって天動説を信じてきた人々や人間原理以前の人々が傲慢であったかといえば,もちろんそうではない.人間の認識は,そして科学は,ものの考え方であるモデルを立ててそれを実験や観測によって確認することで,現象を理解につなげる.天動説はその当時の天体の観測技術ではある程度妥当であり,天体の運行を予測するということでは一定の成果を上げていたとされる.現代から考えると想像しづらい世界だが,そこは否定しようのない事実であり,それを無知という言葉で片付けることはできない.科学においては,常にモデルは理論を補強する実験データを求め,観測はその背後にある統一されたモデルを求める.人間原理はその繰り返しの中で出てきた新しい考え方であり,それが妥当であるかどうかはこれからの科学の発展により受理または棄却されていくのだろう.「巨人の肩の上に立つ」という言葉があるが,現代において人間原理は紛れもなくその巨人の肩の一部となっている.



今回初めてポスターを作るにあたって知ったこと・気付いたこと・考えたことなどをまとめておく.次にポスターを作る時の自分,これを見て前回のことを思い出して頑張ってくれ.

心得その1:ポスターにフォーマットは無い

ポスターは与えられた制約のもとで自由に作ってよい.どのようにレイアウトをしようが,どんな内容を書こうが,ポスターを貼れるボードの大きさの範囲内で好き勝手に作ることができる.掲載する研究内容だって自由.テキストのフォントや大きさだって自由.PowerPointで作ったってKeynoteで作ったって手書きで作ったって自由.すべて好きなように作れる.ポスターという形でなくても,プレゼンテーションのスライドをA4に印刷して並べて掲示することもできるし,何ならiPadを飾ったって良い.コンビニによくある商品のポップをポスターに貼ることで内容を強調することもできるし,ポストイットに意見を書き込んで貼っていけばポスターはブレインストーミングの場にもなる.先輩の使いふるしのテンプレートを貰ってただ埋めていくのではなく,まず自分の研究のことを深く理解して,その成果や魅力を人に伝えるのに最も適した方法を考える.

心得その2:作っては壊しを繰り返す

画面に映し出される白紙のポスター原稿を前に呆然としてあれこれ思い悩む前に,とにかく何でもいいから書き込む.ポスターはどうしても1枚絵だから全体の構成や要素間の兼ね合いに注意が向かいやすいが,どうせ後々綺麗に整えるのだから気にしない.画面全体が埋まるまでは,適当に必要そうなことをひたすら詰め込む.研究内容に関して要旨などの文章が既にあるなら全部貼り付けておく.図ができていれば全部コピーして画面端にでも表示させておく.外見だけでも文字と図の詰まった状態にしておけば,取り敢えずは何とかなるんじゃないかと少し自信と余裕が出てくる.ただし,ここまではまだポスター作成の準備段階.

次に,ポスターのクオリティを上げる行程に入る.ここから如何に内容をブラッシュアップしていくかが大変で,修正しては全体を見直すということをひたすら繰り返す必要がある.要らない部分を削りまくり,足りないものを付け足しまくる.ある程度できたと思ったらA4に印刷し,PCと画面から離れて紙と赤ペンに持ち替える.直すべきトコロを一通り列挙したら修正を加える作業に戻る.全体のレイアウトを見たければ,ポスターサイズの原稿をA4サイズに分割して印刷し,セロテープで貼りあわせて原寸大のサイズで確認する.これらの行程を繰り返せば繰り返すほどクオリティが高くなると思ったほうが良い.また,ある程度の段階で先生や先輩・後輩に意見を聞くのも大切で,パッと見たときの印象や論理構成,誤字脱字をチェックしてもらえると格段にクオリティが上がる.

心得その3:ポスターにすべて詰め込まなくても口頭説明で何とかなる

簡単に言えば,ポスターに不備があっても実際は何とかなる.一方的に説明をするプレゼンテーションとは違い,ポスターは相手とやり取りしながら内容を伝えることができる.ポスターに書いてないことは,覚えている範囲内で自分の口から説明すればよい.決められた発表時間も存在しないから,状況に合わせて説明の細かさや配分を変えることも可能になる.ポスターは往々にして端から端までじっくり見てもらうことが難しいものだから,ポスターの出来栄えや内容の充実度合いにこだわるのではなく,ある程度割り切った上で議論の叩き台として役に立てることを重要視する.そういった意味で,研究概要を漠然と書くのではなく,具体的な方法や数字を織り込んで作っておいた方が実際に役に立つ.


具体的なポスターの作り方 (リンク)

ポスターの基本的な考え方やレイアウト

MacでA4分割したポスターを印刷するとき

豊富な具体例

こんなポスターだってアリ

良いデザインの背後にある理論を解説した良書