& 演算子で取得
l1 = ['今日', '形態素', '解析', '研究'] l2 = ['明日', '研究', '麦芽', '形態素'] l1l2 = set(l1) & set(l2) print(l1l2)
$ python3 app.py
{‘研究’, ‘形態素’}
lenを使って重複率を調べて分岐処理を行う
l1 = ['今日','の','形態素', '解析', '研究'] l2 = ['明日', '研究', '麦芽', '形態素', '研究'] l1l2 = set(l1) & set(l2) if(len(l1l2) / len(l1) > 0.2): print('重複した文章です') else: print('異なる文章です')
$ python3 app.py
重複した文章です
OK、意外と直ぐに行けた