あおのたすのブログ

Deep Learningと自然言語処理と機械学習に興味がある大学院生のブログ。最近は強化学習・Semi-Supervisedなどに興味が出てきた。

mecab-ipadic-neologdを使ってみた

MeCab用の辞書、mecab-ipadic-neologdが凄いという話を聞いたので、使ってみる。

github.com

基本的にREADMEを読めば分かる。すんなりインストールできた。

# インストール
git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
cd mecab-ipadic-neologd


# 更新
git pull
./bin/install-mecab-ipadic-neologd -y


# 辞書の場所をチェックする
echo `mecab-config --dicdir`"/mecab-ipadic-neologd"


# 実行
mecab -d `mecab-config --dicdir`"/mecab-ipadic-neologd"

10日放送の「中居正広のミになる図書館」(テレビ朝日系)で、SMAPの中居正広が、篠原信一の過去の勘違いを明かす一幕があった。
10日	名詞,固有名詞,一般,*,*,*,10日,トオカ,トオカ
放送	名詞,サ変接続,*,*,*,*,放送,ホウソウ,ホーソー
の	助詞,連体化,*,*,*,*,の,ノ,ノ
「	記号,括弧開,*,*,*,*,「,「,「
中居正広のミになる図書館	名詞,一般,*,*,*,*,中居正広のミになる図書館,*,*,wikipedia_keyword,
」	記号,括弧閉,*,*,*,*,」,」,」
(	記号,括弧開,*,*,*,*,(,(,(
テレビ朝日系	名詞,固有名詞,*,*,*,*,テレビ朝日系,*,*,wikipedia,
)	記号,括弧閉,*,*,*,*,),),)
で	助詞,格助詞,一般,*,*,*,で,デ,デ
、	記号,読点,*,*,*,*,、,、,、
SMAP	名詞,固有名詞,一般,*,*,*,SMAP,スマップ,スマップ
の	助詞,連体化,*,*,*,*,の,ノ,ノ
中居正広	名詞,固有名詞,人名,一般,*,*,中居正広,ナカイマサヒロ,ナカイマサヒロ
が	助詞,格助詞,一般,*,*,*,が,ガ,ガ
、	記号,読点,*,*,*,*,、,、,、
篠原信一	名詞,固有名詞,人名,一般,*,*,篠原信一,シノハラシンイチ,シノハラシンイチ
の	助詞,連体化,*,*,*,*,の,ノ,ノ
過去	名詞,副詞可能,*,*,*,*,過去,カコ,カコ
の	助詞,連体化,*,*,*,*,の,ノ,ノ
勘違い	名詞,サ変接続,*,*,*,*,勘違い,カンチガイ,カンチガイ
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
明かす	動詞,自立,*,*,五段・サ行,基本形,明かす,アカス,アカス
一幕	名詞,一般,*,*,*,*,一幕,ヒトマク,ヒトマク
が	助詞,格助詞,一般,*,*,*,が,ガ,ガ
あっ	動詞,自立,*,*,五段・ラ行,連用タ接続,ある,アッ,アッ
た	助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
。	記号,句点,*,*,*,*,。,。,。
EOS