Waseda.Lに参加してきました(本番)

疲れて全然日記を書く気力が起こらない。そんな自分を癒してくれるTwitterのせいで更に日記を書く気力が減ったり。しかし久々に何もすることがなくぼーっとしている日が出来たので、休みがてらWaseda.L参加報告でも書こうかと思います。

発表内容

研究用途の検索エンジンがあると良いなーという、実りのない話をしました。非常に話が発散して、分かりづらくなってしまったんですが、要約すると、

  1. 色んなところをもの凄く細かくカスタマイズ出来て
  2. 勝手に分散もしてくれて
  3. 実用的な速度で動いて
  4. 百億単位の文書の検索に対応してくれて
  5. 自分で(or他人が)作った評価対象のプログラムが使い回せて
  6. 気軽に(2,3時間程度で)機能追加ができる

研究者向けの検索エンジンを作りたいなーという話でした。作りたいなーというのがポイントで、まだ全然着手してません。しょぼくてすいません。

今僕は実用的で汎用的な検索エンジンを作っているのですが、それはまた研究用とはちょっと違うなーと思っています。Solrもかなり実用向けで優れた検索エンジンなのですが、それをそのまま研究用に使うのはちょっと微妙だと思います。逆に、研究用の検索エンジンは、実用的にはならないと思っています。そう言われると研究用の検索エンジンは無駄じゃないかと思われるかも知れませんが、研究用の検索エンジンで得られた成果を実用的な検索エンジンに反映する、というのが想定している研究用検索エンジンの使われ方です。

研究用途で使われるべき検索エンジンは実用的な検索エンジンと何が違うというのは、まだはっきり言えません。ただ、実用的な検索エンジンだと実装を固定出来る(カスタマイズ出来るようにする必要がない)機能が多いのですが、研究用だとその辺も抽象化しておく必要がありそうだということが、大きな違いではないかなと思っています。

とは言え、正直どの程度まで抽象化すべきか、というのもまだ良く分かってません。抽象化しすぎると理解不能なカオスコードが出来上がりますし、抽象化が足りないと研究によってはもの凄く大きな変更を加える必要が出てきてしまいます。本来なら相当特殊なケースには対応すべきではないのですが、研究というのは新しいものを生み出すことだと思っているので、そういう相当特殊なケースが頻繁に出てくるんじゃないかと思っています。そんな研究者が必死に考え出した新しいアイディアを素直に実装できないような検索エンジンは、研究用途の検索エンジンとしては失格だと思います。精々お勉強用の検索エンジン止まりです。ただ、それはあくまで理想であり、何かしらの妥協点は必要だと思うので、そこを見極めるのが現在の課題です・・・。

実現までには数年かかりそうな予感・・・。まだまだ知識が足りません。少なくともSIGIRの論文が問題なく読めるようになってから実装しようかなと思ってます。似たようなことを考えている人は沢山いると思うので、そう言う人達と協力して何かを作れたら楽しそうです。とりあえず最終的にはサクサク研究が進むようになるような検索エンジンが作れると嬉しいです。

Waseda.Lでは自分のモヤモヤを解消するために無理矢理発表してみたんですが、発表する前よりは頭の中で整理できたので良かったです。事情を何も知らない人に向かって話すというのは、かなり自分にとっても良いことだと思えました。現場のノリを激しく読み間違えてしまったせいで、スライドはちょっと公的な場に恒久的に晒すにはいささか問題がありすぎるので公開しませんサーセンwww

全体的に

色んな分野の人の話を聞けて良かったなーと思いました。ただ、たぶん約1名を除く全員(自分含む)が、発表対象は理系という仮定をしていたんじゃないかなとw 正直、他分野の人に伝わっているかどうかと言われれば、伝わってなかったと思います。俺も数学物理全然分からんしね。かといって、浅すぎると分かりやすいけど面白くないので、その辺の調整が難しいですよね。

疲れてて結構しんどかったんですが、Waseda.Lに参加して得たものは色々ありました。首謀者の方々本当にありがとうございました。また次回も何か話せたら良いなー。今度はノリをもう少しCS的じゃなくして行こうと思います。あと某研究室の誰かを釣って連れて行きます。

おまけ

  • tkfとsalamannはあっぷる
  • 情報系は理工の底辺
  • iPhoneを持っていない奴は情弱