$ mecab –version
mecab of 0.996
$ pip3 install install natto-py
### 全体フロー
1. 評価用のデータ作成
2. 評価テキストが入ってくる
3. 1文毎に分解してmecabを使って品詞分解
4. 用意してあった用語、名詞別リストと照らし合わせ、それぞれの点数を足し合わす
5. 上記の4を文の数だけ繰り返す
### コード
1. 設定コード
2. データを読み込むコード
3. 読み込んだデータを処理
4. 処理したデータを出力
import codecs, csv
import re
from natto import MeCab
import os
def nlp(data): nm = MeCab()
negaposi_dic = getNegaPosiDic()
sentenses = re.split("[。!!♪♫★☆>??()w]", data)
try: for sentense in sentenses:
negaposi = 0 result_all = nm.parse(sentense)
for word in result_words: try: word_toarray = re.split('[\t,]', word) if word_toarray[7] in negaposi_dic: negaposi = int(negaposi_dic[word_toarray[7]])
except Exception as e: print('%r' % e, flush=True) print(data, flush=True) return points
csvデータセットの中身

$ python3 app.py
美味しく炊けます。 安定の象印! 保温も良く臭くならないので良いです。 食べ過ぎ注意ですね
ERROR:natto.environment:MeCab dictionary charset not found
$ mecab -D
param.cpp(69) [ifs] no such file or directory: /usr/local/lib/mecab/dic/mecab-ipadic-neologd/dicrc