【Tesseract】OCRツールで文字認識ができるか試してみた

UbuntuにOCRツールをインストールして、文字認識を試してみました。

Tesseractと言うツールを使います。とても読みづらいツール名ですね。このツールがコマンド一発でインストールできたので、使うのはとても簡単です。

今回はUbuntuでやってみましたが、MacやWindowsでもできるみたいです。

今回やってみたことは以下の通り。

UbuntuにTesseractをインストール
パワポで文字を書いて画像として保存
Tesseractで文字認識できるかテスト

順番に見ていきましょう。

[toc]

Tesseractのインストール

Ubuntu18.04 にツールをインストールしました。

sudo apt-get install tesseract-ocr

これだけです。

バージョンを確認してみると、

matsu@gpu-server:~$ tesseract --version
tesseract 4.0.0-beta.1
 leptonica-1.75.3
  libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.2) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.3.0

4.0.0-beta.1のようです。

パワポで文字を書く

適当に文字を書いてみました。

sample_1.png

図のようにある程度枠を取ってからその上に文字を書いた方が認識されやすいです。

sample_2.png

数字も試してみます。

sample_3.png

大文字と小文字も試して見ましょう。

テスト

matsu@gpu-server:~$ tesseract ocr-test/sample_1.png stdout
yamagablog

matsu@gpu-server:~$ tesseract ocr-test/sample_2.png stdout
dwa93849015

matsu@gpu-server:~$ tesseract ocr-test/sample_3.png stdout
YamagaBlog

ちゃんと認識されていますね。

このツールはPythonでも使えるようなのでその辺も試していきたいと思います。

おわり。

参考

Installing Tesseract for OCR:

https://www.pyimagesearch.com/2017/07/03/installing-tesseract-for-ocr/

【Tesseract】OCRツールで文字認識ができるか試してみた

Tesseractのインストール

パワポで文字を書く

テスト

参考

ABOUTこの記事をかいた人

NEW POSTこのライターの最新記事

安全確保支援士にやっと受かった

楽しいことだけやる

フリーな1日

CoreDataのエンティティーをプレビューで渡す

プロフィール

サイト内検索

Twitter

Tesseractのインストール

パワポで文字を書く

テスト

参考

RECOMMENDこちらの記事も人気です。

【Python】サッカーのランキング表をスクレイピングする

【Python】機械学習でワインの品質を判定する

【Unity】GameCenterのLeaderBoardを利用する方法

【PyTorch】転移学習やってみた【マラリア細胞】

Unityのプロジェクトを複製する方法

【SpriteKit】スタート画面を作ってみた

【Swift】クロージャを使った非同期処理の解説

会社で働きながらプログラミングを勉強する３つのメリット

ABOUTこの記事をかいた人

NEW POSTこのライターの最新記事

安全確保支援士にやっと受かった

楽しいことだけやる

フリーな1日

CoreDataのエンティティーをプレビューで渡す

プロフィール

サイト内検索

Twitter

タグクラウド