import MeCab
m = MeCab.Tagger()
print m.parse(text)
実装②必要な品詞のみ抽出
'''
文や文章を渡すと、MeCabで必要な品詞だけ抽出する関数。
'''
def getTokenlistFromline(text,hinshi):
token_list = []
m = MeCab.Tagger('-Ochasen')
m.parse(text)
node = m.parseToNode(text)
while node:
feats = node.feature.split(',')
if feats[0] in hinshi:
token_list.append(node.surface)
node = node.next
return token_list
実行例
text = '大きな力で空に浮かべたらルララ宇宙の風に乗る'
hinshi = ['名詞','形容詞','動詞']
print (tdata.getTokenlistFromline(text,hinshi))
['力', '空', '浮かべ', 'ルララ', '宇宙', '風', '乗る']