Pythonからmecabで形態素解析やってみる
前回、mecab-pythonをインストールしてみましたが、
今回はpythonから実行してみることに。
#!/usr/bin/env python # -*- coding: utf-8 -*- import MeCab import sys import string tagger = MeCab.Tagger (" ".join(sys.argv)) text = u'MeCabで遊んでみよう!' encoded_text = text.encode('utf-8') node = tagger.parseToNode(encoded_text) # 変数に入れる! while node: print node.surface + '\t' + node.feature node = node.next
これを実行すると...
BOS/EOS,*,*,*,*,*,*,*,* MeCab 名詞,一般,*,*,*,*,* で 助詞,格助詞,一般,*,*,*,で,デ,デ 遊ん 動詞,自立,*,*,五段・バ行,連用タ接続,遊ぶ,アソン,アソン で 助詞,接続助詞,*,*,*,*,で,デ,デ みよ 動詞,非自立,*,*,一段,未然ウ接続,みる,ミヨ,ミヨ う 助動詞,*,*,*,不変化型,基本形,う,ウ,ウ ! 記号,一般,*,*,*,*,!,!,! BOS/EOS,*,*,*,*,*,*,*,*
できたー。