あおのたすのブログ

Deep Learningと自然言語処理と機械学習に興味がある大学院生のブログ。最近は強化学習・Semi-Supervisedなどに興味が出てきた。

自然言語処理がやりたくて大学院を休学した話

はじめまして。@aonotas(あおのたす)です。
現在NAIST(奈良先端科学技術大学院大学)の松本研究室の修士1年の学生です。


自分がなぜNAISTに入学したのか、をブログに残しておこうと思う。
(4月に入学して2ヶ月が経とうとしていて生活にも慣れてきたので)

学部→大学院→大学院休学→NAIST受験→入学の流れを書こうと思う。
自分は学部は名古屋工業大学という大学に通っていた。
情報系の学部で学部時代は授業とかは普通に出ながら、ウェブ系のプログラムを書くのが好きでiOSアプリやウェブサービスを1人で作って学部を過ごしていた。

決してプログラミングが好きという訳ではなく、何か作ることが好きな性格なので、情弱PHPerみたいな学生である。

さて、学部の研究室配属の時に「どうせやるなら自然言語処理っぽいことやりたいな〜」と思ったが、残念ながら自然言語処理だけを専門にしている研究室は自分の大学には無かった。なので、修士の先輩を見て研究室を選んで研究自体は独学で自然言語処理を勉強した。

独学で自然言語処理を勉強したと言っても、興味のある論文を読んで、当時流行っていたParagraph Vectorを使った研究(といっても大きい新規性があるわけではない)を卒論でやった。

1年間周りには自然言語処理の話をできる同期は居ないので、研究の相談をしたい時は結構辛かった。
(先輩に相談すれば相談にのってくれるが、自然言語処理に詳しい訳ではないので指導してもらえる、とまではいかなかった)


そんな中、大学院は外部の大学院を受けるべきかとも思ったが、
学部4年の夏くらいに同じ大学の大学院の推薦が貰えることになり、
推薦を断って外部に行く勇気は出なかったので、ズルズルと進学してしまった。

卒論が終わり3月くらいにYANSに参加した。

yans.anlp.jp

YANSに参加して自然言語処理を好きな学生さんや、企業の人と話してみて、めちゃくちゃ楽しかった。
今まで自然言語処理の話をできる人が研究室に居なかったので、自分としては新鮮であったし、こんなNLPerな人たちの環境で修士取るなら取るべきだな、とも思った。

それからは、推薦で合格していた大学院に4月に入学はしたが、
すぐ休学させていただき、自然言語処理の研究室を受験した。

受験する時に考えた研究室の候補は、

を考えていた。
結局NAISTのみを受験した。
理由としては、鶴岡研究室はとても優秀な先生&Doctorの学生さんが多いが、東京大学の大学院の入試をパスできても
研究室配属の希望で倍率がとても高くなるらしく、諦めてしまった。
(受験の項目が電気系の問題を勉強する必要があるのも諦めてしまった理由としてある)

首都大の小町研究室も先生が有名であるし、学生の方も優秀で何よりもやる気に満ち溢れる人が多いイメージだったが、
NAISTと比べた時に生活の金銭的問題と、周りに何も無いNAISTは何となく修行感が出てカッコイイのでは、という中二病でNAISTにした。
(ちゃんと吟味するべき)
今となっては東北大の乾研にも見学に行けばよかったな、、、とも思います。(NAISTがダメという意味ではなく見学に行かずに決めてしまったので)

NAISTに入学して研究室の環境にとても満足している。
ざっと魅力的に感じた点をまとめてみようと思う。

  • NLPの研究室である
  • 博士課程の学生からアドバイスを貰える
  • Deep LearningとNLPの研究をしている先輩が意外と多かった
  • 教授1名、准教授1名、助教授2名と先生が沢山いる(学部時代は先生1人だったので)
  • 学生寮の生活費が安い(寮は月1万程度)

NAISTには中村研究室もあるので合同の勉強会があったりして、色々勉強させてもらっている。
やっぱり研究は1人でやるものといえども、周りの仲間や先輩や先生は大事だと思っているので、
結果的にNAISTに入学して良かった。

もしも自然言語処理の研究をやりたい方、悩んでる方はYANSに参加したり、
自然言語処理界隈の人に相談してみると幸せになれるかもしれない。


今後ブログでも論文紹介とかしていけたらいいな…

Deep LearningとNLPの最新論文の情報を集める方法

(5/29 追記:Deep Learning のGoogleグループコミュニティを追加)
(6/8 追記:松尾研究室の勉強会ページを追加)
(6/13 追記:neural language notesを追加)

はじめまして。@aonotas(あおのたす)です。
Deep Learningと自然言語処理に興味があります。
好きなフレームワークはChainerです。


さて、Deep Learningが自然言語処理のタスクでも応用されています。
ACLやEMNLPなど国際会議でもタイトルに「Neural」が入ったものが多いですが、arxivにも査読前の論文がよくアップロードされています。
(スピードが早くて追いつくの大変ですよねorz)
そこで最新のDeep Learningの論文の集め方を紹介したいと思います。(あくまで私個人の方法です。皆さんどうしてるか教えてもらえると嬉しいです。)

  1. 面白い論文を紹介しているページを見る
  2. arxivをアンテナサイトに追加しておく
  3. Twitterで論文情報を集める

以下具体的な内容です。

面白い論文を紹介しているページを見る

arxivのDeep関連の論文を月別にまとめてくれている人がいます。
このページを眺めておくと最新のトピックも扱えるかもしれません。
とてもおすすめ。
github.com


arxivをアンテナサイトに追加しておく

arxivで有名な研究者(Deep MindやBengio先生, Hinton先生)がアップロードしたら通知を受け取れるようにしています。
ACL, EMNLP, NAACL, ICML, ICRLの国際会議はチェックしていますが、
arxivにも面白い論文が定期的に上がるので、有名な研究者さんが共著者に入っている論文はチェックしておくと良いかもしれません。
方法としては、「はてなアンテナ」にarxivを追加するだけです。
ちなみにPFNの岡野原さんに最新の論文のチェックの方法は?と聞いたらarxivで有名な人の論文一覧をチェックしているということでした。

チェックするURLは以下がおすすめです。
(好きな研究者の個人ホームページも良いと思います。)

他にもアンテナには追加していますが、個人的に気に入った論文の共著者の人をアンテナサイトに追加しておいて、
新しい論文が上がったらメールで通知を受け取っています。
※Google ScholarでBengio先生やHinton先生の論文チェックもしています。

Twitterで集める

Twitterで最近話題の論文を紹介している人が多いので、個人的には、
Twitterのアプリの通知をオンにしてiPhoneにその人がツイートすると通知が飛ぶようにしています(ストーカーっぽい)

twitter.com

twitter.com

以下は通知はオンにはしてませんが、フォローしておくと幸せになれるかもしれない。
twitter.com

twitter.com



以上、個人的な方法でした。
こんな方法で集めてます!!という口コミもお待ちしています。

05/29 追記

Google+のDeep Learningコミュニティで集める

id:tam5917 さんにコメントしていただき、Google+のコミュニティを教えてもらいました。
コメントありがとうございました!

Bengio先生が投稿していたり有用な情報源かもしれません。おすすめです。

plus.google.com

06/08 追記

東京大学の松尾研究室の勉強会ページも参考になります。

deeplearning.jp

06/08 追記

Deep Learningの有名な論文を引用数が多いものを主にまとめてあります。

github.com

06/13 追記

Deep Learningの論文のうちNLPに関するものがまとまっています。

github.com