UbuntuにOCRツールをインストールして、文字認識を試してみました。
Tesseractと言うツールを使います。とても読みづらいツール名ですね。このツールがコマンド一発でインストールできたので、使うのはとても簡単です。
今回はUbuntuでやってみましたが、MacやWindowsでもできるみたいです。
今回やってみたことは以下の通り。
- UbuntuにTesseractをインストール
- パワポで文字を書いて画像として保存
- Tesseractで文字認識できるかテスト
順番に見ていきましょう。
目次
Tesseractのインストール
Ubuntu18.04 にツールをインストールしました。
sudo apt-get install tesseract-ocr
これだけです。
バージョンを確認してみると、
matsu@gpu-server:~$ tesseract --version tesseract 4.0.0-beta.1 leptonica-1.75.3 libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.2) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.3.0
4.0.0-beta.1のようです。
パワポで文字を書く
適当に文字を書いてみました。
sample_1.png

図のようにある程度枠を取ってからその上に文字を書いた方が認識されやすいです。
sample_2.png

数字も試してみます。
sample_3.png

大文字と小文字も試して見ましょう。
テスト
matsu@gpu-server:~$ tesseract ocr-test/sample_1.png stdout yamagablog matsu@gpu-server:~$ tesseract ocr-test/sample_2.png stdout dwa93849015 matsu@gpu-server:~$ tesseract ocr-test/sample_3.png stdout YamagaBlog
ちゃんと認識されていますね。
このツールはPythonでも使えるようなのでその辺も試していきたいと思います。
おわり。
参考
Installing Tesseract for OCR:
https://www.pyimagesearch.com/2017/07/03/installing-tesseract-for-ocr/