import urllib2 from bs4 import BeautifulSoup html = urllib2.urlopen("https://www.monex.co.jp/") soup = BeautifulSoup(html, "html.parser") tag =soup.title.string print(tag)
エンコードできないと表示された。
[vagrant@localhost python]$ python app.py
Traceback (most recent call last):
File “app.py”, line 9, in
print(tag)
UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 0-6: ordinal not in range(128)
こうなったら、タグを正規表現でreplaceしようと試したが上手くいかず、イライラMaxで数時間就寝。
改めて、試したら
import urllib2 from bs4 import BeautifulSoup html = urllib2.urlopen("https://www.monex.co.jp/") soup = BeautifulSoup(html, "html.parser") tag =soup.title.string print(tag.encode("utf-8"))
なんだ、エンコードを指定するのね♪
[vagrant@localhost python]$ python app.py
マネックス証券 | ネット証券(株・アメリカ株・投資信託)
大体気分転換すると上手くいくね。