2008年08月27日

Hadoop + Luceneで分散インデクシング

Hadoop (0.17系) + Lucene (2.3系) で検索用インデックスを分散インデクシングするコードを公開してみます。HDDに眠らせてるのはちょっともったいない。

Hadoop + Luceneで分散インデクシングの続きを読む

2008年08月25日

Hadoopの解析資料

PFIの方からHadoopの解析資料を公開しました。

- オープンソース分散システム「Hadoop」解析資料

Googleの論文に書かれている機能を列挙し、それがHadoopに実装されているかどうかを比較しています。それに加えてソースコード解析、簡単なベンチマークなどを記述しました。これでHadoopを実際のシステムに使ってみようという人が増えてくれると非常に嬉しいです。

この資料はNTTレゾナントの金田有二さんと共同で作成しました。いろいろと手伝って頂いて有難うございました > 金田さん

2008年08月13日

Cluster 2008

今年はBossがGeneral Chair。

- Cluster 2008

僕はポスターの前で突っ立ってる予定です。

2008年08月07日

SWoPP 2008

- プログラム

発表おわた。

P.S.
佐賀は日本酒旨いです。蛍川が気に入りました!

2008年08月05日

blogeyeの実装に学ぶ、Amazon EC2/S3でのHadoop活用術

- blogeyeの実装に学ぶ、Amazon EC2/S3でのHadoop活用術

大倉さんによるHadoop記事第4回が公開されました!Hadoopを使用したサービスの具体的な構成方法・Amazon EC2/S3上でHadoopを動かすための具体的な方法が解説された貴重な記事です。是非お楽しみ下さい!

過去記事はこちらになります。

次回は連載最終回で、BigTableのクローン「hBase」の紹介を行う予定です。

2008年08月04日

PLM勉強会

id:ichii386さんが主催されているPLM勉強会で岡野原先生に話して貰おうと盛り上がって、今日話して頂きました。

- 機械学習による自然言語処理チュートリアル

なんだかCRFが分かった気になる貴重な3時間の講義でした。おかだいさんの説明/発表はいつ聞いても良いですね。物凄く分かった気になるw

あとは色々知り合いの方がかけつけて下さり、飲み会も非常に楽しかったです。tabateeさんが幸せそうだったのが僕はとりわけ印象的でしたw また適当にやりましょうー > いちーさん