あおのたすのブログ

Deep Learningと自然言語処理と機械学習に興味がある大学院生のブログ。最近は強化学習・Semi-Supervisedなどに興味が出てきた。

Pythonからmecabで形態素解析やってみる

前回、mecab-pythonをインストールしてみましたが、

今回はpythonから実行してみることに。

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import MeCab
import sys
import string

tagger = MeCab.Tagger (" ".join(sys.argv))
text = u'MeCabで遊んでみよう!'

encoded_text = text.encode('utf-8')
node = tagger.parseToNode(encoded_text) # 変数に入れる!
while node:
    print node.surface + '\t' + node.feature
    node = node.next


これを実行すると...

	BOS/EOS,*,*,*,*,*,*,*,*
MeCab	名詞,一般,*,*,*,*,*
で	助詞,格助詞,一般,*,*,*,で,デ,デ
遊ん	動詞,自立,*,*,五段・バ行,連用タ接続,遊ぶ,アソン,アソン
で	助詞,接続助詞,*,*,*,*,で,デ,デ
みよ	動詞,非自立,*,*,一段,未然ウ接続,みる,ミヨ,ミヨ
う	助動詞,*,*,*,不変化型,基本形,う,ウ,ウ
!	記号,一般,*,*,*,*,!,!,!
	BOS/EOS,*,*,*,*,*,*,*,*

できたー。