スパコン事業仕分けに参加された東京大学情報基盤センター教授の金田先生によるスパコンの総括的な解説書.仕分けの焦点となった処理能力のランキングの問題から,スパコンの基本的な仕組み,スパコンがどのような分野に活用されているのかといった実用面,そして日本の企業が独立して開発を行なってきた歴史とこれからの行く末について書かれている.

本書の主張は一貫して,スパコン開発というものは事業仕分けで論点となった世界一位かどうかが問題なのではなく,国や企業のプロジェクトとして明確な方向性を持たなければ意味がないというものだ.本書の中では,日本のスパコン開発の歴史に触れ,黎明期のアメリカとの開発競争であったり,地球シミュレーターという一世代前のスパコンがどのような目標を持って開発が行われ実際に稼働したかといった経緯が紹介される.そして,現在開発が完了し実際に稼働している京コンピューターが,いかに処理能力のランキング云々よりも重要な課題を孕んだまま進行したプロジェクトであるかといった問題点が指摘される.その中で繰り返し述べられるのが,「目標」と「ハード・ソフト」について長期的な視点が欠如しているということであり,実際にスパコンを使って解くべき問題が明確ではなく,その目標のために必要なハードウェアとソフトウェア両者の環境開発整備であったり人材育成体制が一番の問題であると,著者の金田氏は主張する.

金田氏はあくまで事業仕分けに参加した有識者として,そしてスパコンの一研究者として,日本のスパコンの現状に対する見解を述べている.その中にはもちろん外部からはあまり知ることのできない政治的な部分も多く含まれてはいるものの,NECや日立製作所の脱落などの中核の部分に関してはあまり触れられていない.個人的にはその辺りに関して興味があったものの,あまり直接的な表現をされていなかったので少し残念ではあった.一方で,スパコンを取り囲む大規模なプロジェクト全体に関して,何が重要でどういったところを役人や有識者が見ているのかといったポイントは非常に参考になった.計画を立てるというただそれだけのことが,いかにして不確実な未来を予測し確実な案へと落としこみ,それを様々な立場の人間に納得させるかという難しさを持っているということが,本書からはひしひしと伝わってきた.



「私は逸話が大好きだ」という言葉から始まる本書は,著者であるコリン・パウエルが国務長官などの数々の職歴のなかで経験してきた逸話を通して,リーダーシップや人生の教訓について語った著作である.タイトルからは自己啓発系のハウツー本のような印象を受けるが,実際に読んでみると,登場する逸話はどれも彼の豊かな人間性を表すようなものばかりで,まるで自伝の一部を読んでるかのような感覚に陥る.文章の端々に見られる責任感の強さや謙虚さ,そしていかに細かなことも見逃さず上司や部下に注意を払うかといった繊細さと思慮深さは,まさに指導者の鑑といって過言ではないだろう.

登場する逸話は,陸軍の軍人であったり国務長官などの役人としての体験が多い.軍部や政府に関する話は普通の人からはかなり縁遠い存在でありながらも,その中で語られる会話や出来事は,そういった特殊な環境であることを忘れさせるほどに人間味あふれている.また,コリン・パウエル自身のリーダーとしての指導経験も数多く紹介され,自分がどのように考えどのように組織を動かすのかといったテクニックも興味深い.特に,彼が新しいスタッフの元で働くときに配るという「べからず集」は,部下に何を期待して成果を挙げるべくチームを動かすかといったエッセンスが含まれている.そこで色々と列挙されるやってはいけない事というのは,ほとんどがコミュニケーションに関することだ.口頭での会話から公式文書まで,いかに効率よく個人が能力を発揮するかについて考えられている.とにかく彼自身,組織が円滑に回ることは車を修理して動かすことと似ていて非常に喜びを覚えるとも書いていることからも,彼の性格を考慮しても,組織のまとめ方に並々ならぬ努力を割いていたことがわかる.



前々から小説自体も断片的に読んでいたし,流れてくるネット評もちらほら流れてきて,特徴的な言い回しがネットスラングとしても着実に勢力を伸ばしていることも感じていた.今回はそれらの確認という意味でも,書籍化され複数の物語がひとつにまとめられた本書を読んだのだが,何と表現していいのか…ただ,とにかく色んな意味で凄い,そして面白い.これを単純なプロットで構成された似非日本語のSFと言うなかれ,これは文化の融合なのだ.

世の中には,日本というローカルな視点から抜けだせずに,やれ外国でもてはやされているのは間違った日本文化だとか,ちゃんとした日本文化を伝えないといけないだとかいった貧しい考えの人がある程度存在する.そういう人たちは自身の日本の見方に何の疑問も抱かずに外部を批判するわけだけれども,その自分たちの日本文化をそっくりそのまま異文化の人間に理解し受け入れてもらう難しさというのを,全くもって理解していない.異文化は自分たちとは違うからこそ異文化なのだ.インド料理屋にいけばインド人がインド料理食べてるし,トルコ料理屋にいけばトルコ人がトルコ料理食べているわけで,そういった異文化の認識から一歩踏み込んで,自分たちの文化の一つとしてカレーなりケバブなりの食文化であったり,宗教などを含む独自の文化が認識されるには,非常に繊細な文化のすり合わせが必要になる.外国人だって日本料理が食べたければ日本料理屋に行くだろう.じゃあそれで日本文化が認知されて,よく分からない生魚とライスを食べる文化として理解されたら,それで満足だろうか.本当に知ってもらいたいことはそんな事実の羅列ではないだろう.自分たちの様式を変えてまでも,相手の文化の懐に潜り込んで,日本文化の本質を相手に理解してもらいと思わないだろうか.そして相手に自分たちの文化のエッセンスを取り込んでもらい,より新しい文化というものを作って欲しくはないだろうか.

とまあ気が付けば変な講釈を垂れ流してしまったが,結論としてはニンジャスレイヤーは日本人が読んでもエンターテイメント性に優れていて面白いということで.というか,逆に日本人の英語への理解が必要な部分がある.あまり馴染みのない英語のカタカナ表記があって,lesserやgreaterみたいな何となく分かりそうなものから,shrineやcoffinみたいな意味を知らないと理解できない単語もちらほら見られるので,そのあたりはどっちかというと日本人の理解が試されている感がある.



今回は特に図を再現するわけでもなくコードを動かすわけでもないのだが,自学のために10章の階層ベイズモデルの生成過程を丁寧に追ってみて,グラフィカルモデルを描いてみた.

10章の階層ベイズモデルで用いる実験条件


まずは実験条件の確認.今回は,植物から得られる種子数と施肥処理の有無の関係を調べる.対象となる植物100個体はそれぞれ10個体ずつ植木鉢に植えられており,その植木鉢のうち半分は施肥処理がされている.つまり,植物50個体は無処理で,もう半分の50個体は施肥処理がされた個体である.その植物個体からそれぞれ種子を採取し,施肥処理の有無による種子数の変化をみる.

これだけ見ると無処理と施肥処理の植物個体の種子数の平均を見れば何となく分かりそうだが,今回はしっかりとモデルを組んで,どの要因がどれだけ影響するのかといったことまでも含めて解析を行なう.今回の話の筋としては,単純に平均で考えたりGLMで調べると施肥処理の効果はありそうという結果が出るけれども,場所差・個体差などの擬似反復の要素を取り入れたモデルを組めば施肥処理の効果は無いという結論を導くといった流れになっている.

潜在変数モデルと生成過程,グラフィカルモデル

ここからは,本書の内容に自分の知識や人から教わった内容を組み合わせて解釈した内容となっている.そのため,本書に書いていない内容を扱ったり著者の意向に沿わない書き方をしているかもしれないので,その辺りはご注意を.

今回考慮する個体差r_i や場所差r_j という要素は,本書7章でも定義しているように「人間が測定出来無い・測定できなかった」数量や因子である.こういった要素というのは一般に「潜在変数」と言い,これを組み込んだモデルは「潜在変数モデル」と呼ばれる.ベイズモデルにおいてはパラメータはある真の値を持つ数学的な変数ではなく,何らかの分布をもつ確率変数として扱う.そのため,非ベイズで考えていたパラメータ自体を,潜在変数とハイパーパラメータのような組み合わせで表現することができる.

また,観測データがどのような確率モデルによって生成されたかをモデルとして表現することを,生成モデルまたは生成過程と呼ぶ.そして,モデルを図式的に記述するために用いるのがグラフィカルモデルである.特に今回の場合では確率分布を表すので,確率的グラフィカルモデルとも呼ばれる.

10章の階層ベイズモデルを生成過程やグラフィカルモデルで記述してみる

それでは実際に,上で説明した実験条件を生成過程やグラフィカルモデルで表してみる.といっても本書とかけ離れた難しいことをやりたいわけではなくて,下で示す生成過程はBUGS言語を数式に直しただけだし,グラフィカルモデルは基本的に本書P.238の図10.8とほぼ同じような内容となっている.

生成過程

グラフィカルモデル

グラフィカルモデルの表記について

四角で囲っている部分はプレートと呼ばれ,複数のノードをひとつにまとめたものである.今回は例で言えば,r_i = {r_1,r_2,\dots,r_{100}} の100個のノードを横一列に並べて全て描き表すかわりに,プレートを使って一つのノードを代表させている.また,y_i y_{ji} と書いているのは,生成過程での2つのイテレーションの内側にあるということを強調するためである.その割には場所差をr_{j(i)} と表記しているが,こちらは本書に準拠した書き方をしている.なお,ここでは施肥処理の有無であるf_i は観測値なので一応入れていない

あと,変数やパラメータの書き方に色々と流儀はあるようだが,今回はあまり気にしていない.PRML風に書くならば,\beta_1,\beta_2,s,s_p を塗りつぶされた小さな点で表現して,y_{ji} のノードを影付けする感じだろうか.

グラフィカルモデルから数式への変換

グラフィカルモデルの何が嬉しいかといえば条件付き独立性が云々という話など色々とあるようだが,個人的な感覚としては,グラフィカルモデルをぱっと見るだけでモデルで考慮すべき事前分布がy_{ji} にかかるすべての確率変数の積p(\beta_1)p(\beta_2)p(s)p(s_p)\prod_i\prod_j p(r_i|s)p(r_j|s_p) で書けるということがわかるというのは結構大きい気がする.ちなみに,グラフィカルモデルのプレートで表している部分が\prod と対応している.

イテレーションの階層構造について

本書では個体番号i により植木鉢j が決まるとしているため,個体番号i のイテレーションの中にj が入る形となっている.個人的には「個体番号1の植木鉢Aの個体」よりかは「植木鉢Aの個体番号1の個体」のような階層構造にしたほうがイメージしやすいと思うが,今回は場所差と個体差は独立ということなので,どちらにせよ結果は変わらないはず.

おまけ

カフェでsyou6162にグラフィカルモデルについて教えを乞う図.ケーキを食べながら必死にお絵かきしてました.

参考



久々に,眺めるだけで楽しく好奇心を刺激される本に出会った.まさに大人の図鑑といった趣で,とにかく見ているだけで楽しい.もちろん系統樹の歴史であったり掲載されている図版の説明もしっかりと書かれているので,文章を読んで楽しい本でもある.しかしながら,次々と目に飛び込んでくる古今東西ありとあらゆる種類の系統樹たるや,早く色んな絵を見たいと文字を追うのを忘れてページをめくりたいと思わせるほどである.

本書は「系統樹思考の世界 (講談社現代新書)」や「分類思考の世界 (講談社現代新書)」などの著作で知られる三中信宏氏の著作である.図版に関しては杉山久仁彦氏が別にクレジットされているが,「進化が語る 現在・過去・未来(別冊日経サイエンス185) (別冊日経サイエンス 185)」にある茂木健一郎氏との対談を読む限りでは,三中氏本人も相当のコレクターであると思われる.本書では,三中氏の専門に深いつながりがある系統樹のみならず,人間がこれまで生み出してきた分類にまつわるありとあらゆる図形に焦点をあてることによって,人間がオブジェクトを分類するという行為について体系化しようといった内容となっている.この中で紹介される図版は,大昔にかかれた家系図から始まり,宗教画などのモチーフ,ヘッケルの分類体系以降の科学的な記述,そして現代の複雑ネットワークなどの可視化にまで及ぶ.これはまさに「図形言語」と呼ぶに相応しい自然言語と並ぶ人類の発明であり,人間がどのように考える道具として図形を扱ってきたのかといった歴史を辿るものでもある.そういった系統樹に代表される図形を通して,図形が何を示しているのかといった基本的な読み方から,様々な工夫が加えられていく図形の変移の過程,そして副題にもあるチェイン・ツリー・ネットワークという概念の構築が考察される.

本書はタイトルに系統樹とあって生物学としてのイメージが強いものの,ある程度知識があればどんな分野の人でも楽しく読める内容だと思われる.個人的には,特に統計や情報系の人間であればベン図の表記に慣れ親しんでいるし,デンドログラムはどの段階で見るかでクラスタリング結果が違ってくるといったことはよく知られているわけで,もしかしたら生物学の人間以上に楽しめるんじゃないかと思う.ノードとエッジを基本にしたグラフ理論に繋がる話題でもあるし,最近のインフォグラフィックとしても興味深く見ることができる.そういった意味でも,生物系と情報系の中間にいる私にとっては,非常に満足度の高い1冊だった.