免許証画像は以下を使用する

tesseract_layoutの値を1から10まで変更して検証する
### tesseract_layout=1
$ python3 main.py
(mm| 日 本 花 子     軌和61年 5月
]1 日生
人誠| 東京都生代田区霞が関2ー 1一2
け| 令和01年05807H 12345
### tesseract_layout=2
$ python3 main.py
Traceback (most recent call last):
  File “main.py”, line 9, in 
    txt = tools[0].image_to_string(
  File “/home/vagrant/.local/lib/python3.8/site-packages/pyocr/tesseract.py”, line 386, in image_to_string
    raise TesseractError(
pyocr.error.TesseractError: (-1, “Unable to find output file (tested [‘/tmp/tmpuiijvfgx/output.txt’])”)
### tesseract_layout=3
$ python3 main.py
(mm| 日 本 花 子     軌和61年 5月
]1 日生
人誠| 東京都生代田区霞が関2ー 1一2
信和01年05』07H 12345
### tesseract_layout=4
$ python3 main.py
(名| 日  本  花  子   昭和61年 5月 1日生
人誠| 東京都生代田区霞が関2ー 1一2
交付| 令和O1年05』07H 12345
2024箇(06$06有O1Hまで勧
%の 眼鏡等
条件等
     見 本
き引第 012345678900 号
0
を人                ト民捧人構誠還| 〇〇OOO
=層衣2908』018導笛にに回較固 ま中
### tesseract_layout=5
$ python3 main.py
| |
に        5
中        M
加        9
9
避        Ok
ら     呈較っ
守 CN       OS
| 較 抽| |睦旧旧計員
   ー|。居    則遇|
   |    mp
– 還 RE     逢遇
| | 国~園 必g式還
   玲|上    O、 は半較|
陸中 8
|   錠      [壮 加|
| 略叶RS sss
是 陸中
|   還|二 地
| 層間   ら5 8さき
  EE   ーーベ
[es  =  絆|還> 証庄計
首日 EHP
### tesseract_layout=6
$ python3 main.py
(信所| 東京都寺代田区霞が関2-1一2
$和01キ05』07B 12345
天の 眼鏡等 に
条件等
見本 *
*引012345678900 呈 叶
に天上1 5404』01H話司にに放還    ま
に17108801間 汗天市生天    )
にafW29*08801 只間四時間 Sgms 583
### tesseract_layout=7
$ python3 main.py
で 敵  ーー  an
### tesseract_layout=8
$ python3 main.py
で 敵
### tesseract_layout=9
$ python3 main.py
|
### tesseract_layout=10
$ python3 main.py
er
### 結論
tesseract_layout=4, lang=’jpn’ が一番まともな気がするけど、
なんでだろう?
きちんと精度高く読み取るにはGoogleのVison APIで実装するっぽいな… 
 
					 
