Home > Archives > 2008-12

2008-12

2008年まとめ

年末は時間が取れないので、もうまとめてしまいます。

今年は色々とアウトプット出来た年だったかなと。

まずコーディング。コミット数は目標としてた1000を突破して、合計1100ぐらいでした。去年は783です。意識的にコーディング時間を増やしていたので、増えるとは思っていたけど思ったより増えた。このペースを維持して行きたいですね。解析の結果、3月・6月・9月にバーストする事が判明しました。気候に左右されすぎ。

今年もあのsscmの時の経験が色々と生きたなあと本当に思った。YamaKenさんとjun0さん元気かなあ。

ネットワークの設定はPFIでDC借りたので、それに乗じてかなり色々覚えれた。L3 switchで色々遊んでみた。思えば去年はvlanとか名前しか知らん状態だったからなあ…。ひどい。LVSとかもついでに覚えた。今年はVMを覚えないと。

次は論文。卒論で英語論文を書くのに悪戦苦闘。その後国際学会に2回チャレンジして順当に敗北。内容を削ったポスター論文がCluster08に通って、英語論文が出せたのはそれだけになってしまいました。でも、自分のDBLPが出来てたりして、これは結構感動しました。修士の内に国際学会で発表したいのですけど、既にスケジュールが厳しい感じ。頑張ります。

また、Webメディア・雑誌に記事を書かせて頂きました (CodeZine, WEB+DB PRESS)。Hadoop周りを色々と紹介できて良かったのでは無いかと思います。hBaseの記事書かないとですね。

その分ちょっと本を読む時間が減ったのが残念かなあ。論文は結構読んだ (入れてない奴も合わせると100ぐらい?)んですが、まあやっぱりもっと本を読むべきですね。色々な技術が廃れてはまた復活して、また廃れては復活するというのは良く有ることだというのは論文を読んで身に染みたので、やっぱり根底の知識を押さえておきたいです。ああ、でも経営とかマネジメントとかその辺は10冊ぐらいは読んだ気もしてきました。

後はとにかく進路について色々悩みまくりました。自分は何をしたいのか、将来どうなりたいのか、そのためには何をすればいいのか、周りを気にするべきなのか、しないべきなのか、それをずっと考えていました。

意図的に年上の人(2~3個上の人, 30前後ぐらいの人)と色々話をしたり、その人がどういう決断をして今どうなっているのか、みたいなのを聞きこんでました。あと何気にTwitterやってると色々な人の日常が見えたりして参考になったので、インターネット凄えと思いましたね。

3, 4月ぐらいは正直精神的にかなり厳しかったのですが、最近は大分ましになってきて、良かった。話を聞かせて頂いた方々、相談にのってくれた方々、ありがとうございます。そして迷惑をかけて心労を溜めてしまった方々、すいません。

来年の目標は、、、、年末酒をがぶ飲みしながら考えます!

SC08 参加記

2週間ほど前になりますが、スーパーコンピューティング系で最高峰の学会であるSCに参加してきました。既にいくつか記事を挙げられている方々がいらっしゃいます。

まず驚いたのは、SCは学会等いうよりはさしずめ展示会という雰囲気だったことです。幕張メッセみたいな会場をイメージして頂けると良いです。そこで各企業が色々な出展をしています。

またSCはTop500が発表される事でも有名です。今回はRoadRunnerというCellを積んだクラスターが1位でした。世界で初めて1ペタフロップスを達成したシステムです。展示フロアではラックが展示されていたので説明を聞いてきました。

RRはブレードサーバー群で構成されており、4ブレードで1ノードというシステムです ()。合計約6000ノードです。4ブレードのうち、1つがOpteronを搭載したもの、2つがCellを搭載したもの、1つがネットワークを搭載したものです。このようにヘテロな構成になっているため、当然ですがアプリケーションを書くときもMPIプログラムからCellの機能を呼び出すような形で並列アプリケーションを書く必要があります。当然アプリケーションは相当複雑になり、使いこなすにはプログラミングスキルが相当に要求されるシステムになっているみたいです。

BlueGeneというシステムは逆に完全にホモジーニアスなシステムです。とにかく演算能力を持ったプロセッサー(700MHz~800MHz)を何個も並べまくる、でもそれだと壊れてしまうので、全ての機能を1つのチップに凝縮して故障率を下げるというアプローチを取っています (写真)。アルゴンヌのBlue Gene/Pは163840プロセッサーを搭載したシステムです。

個人的にはなんというかついにヘテロなシステムの時代が来たかあという印象でした。この辺の構成を吸収しつつ高性能を出せるようなプログラミングモデルを構築する必要のある時代が来たのかなあ。NUMAもそうですけど、どんどんコンピューターが階層化されて、かつヘテロな構成になって、もはや人間には良く分からない事になっているので、とりあえずコードをいくつか生成して早いものを取るとか(FFTWみたいに)、そういうアプローチも必要なのかなあ。

耐障害性の話も有ったのが面白かったです。MPIは1つのプロセスが落ちてしまうとジョブが終了しないモデルなんですが、流石にこの規模になると走らせている間にも故障する確率が高く、そのあたりをどうやって解決するかというのがこれからの課題になりそうです(例:CIFTS)。今までこんな議論をHPC系の論文であまり見かけたことが無かったので、意外といえば意外な話でした。MapReduceは馬鹿でも並列プログラムが書けるようなモデルなんですけど、あまりにもオーバーヘッドがでかいし、適用できない問題も多いので単純にはいかない (密行列計算とか)。

まとめると、耐障害性を確保しつつ、GPU・マルチコア・クラスタを上手く隠蔽して性能を出すような計算モデルが理想的には欲しいという事かな。ここからどこを切って捨てて、実際に使えるシステムをデザインするかが腕の見せ所という感じか・・・。

他にも色々面白い話題が有ったので適宜吐き出していきます。論文の方は公開されたら適当にピックアップ予定。

Home > Archives > 2008-12

お薦め本
広告
Archives
Categories

Return to page top