Intelligent OCR の補正設定は4種類あり、本記事では「画像補正設定」について解説します。
補正設定をすることで、読取精度を向上させることが期待できます。
なお、作成したワークフローの種類によって、ご利用できる補正設定は異なります。
読取範囲の指定 | 全文読取 | 項目抽出 | 項目選択 | |
画像補正設定 |
◯ | × | × | × |
OCR補正設定 | ◯ | × | ◯ | ◯ |
回転補正設定 | × | × | ◯ | × |
Few-shot学習 | × | × | ◯ | × |
本記事で分かること
- 画像補正設定を使うシーン、事例、使い方
画像補正設定を使うシーン
例えば、以下のようなシーンで画像補正設定を行うと、読取精度の向上が期待できます。
- 例1)赤色の文字だけを読み取りたい
- 例2)赤色の文字を読み取りたくない
- 例3)帳票の背景色や、あらかじめ印刷されている赤色の文字を読取りたくない
- 例4)文字と重なる印鑑やハンコの赤色を消したい
- 例5)帳票背景の模様・地紋を消したい
- 例6)FAXのノイズを除去したい
画像補正設定の仕組み
DX Suite の画像補正設定では、以下の流れで補正処理を行います。
1.前処理として、カラー画像をグレー画像に変換する(任意)
前処理として、帳票を「グレーの濃淡がついた画像」に変換します。
以下2種類の処理方法があり、「どの色をどのくらいの薄さで残すか」によってどちらかを選択します。
2.画像のノイズを軽減する処理を行う(任意)
任意で、画像のノイズを軽減する前処理を行うことができます。
3種類あり、軽減させる方法によって種類が異なります。
3.グレー画像を白黒画像(二値画像)に変換し、読み取りたい文字色のみを残す
読み取りたい文字は黒色に、読み取りたくない文字は白色に変換することで、最終的な補正を行います。
以下の3種類の処理方法があり、「どこまでの色を白に寄せるか」「どこまでの色を黒に寄せるか」によって種類が異なります。
画像補正設定の使い方
画像補正設定バナーの右上にある「適用」ボタンを「ON」にすると、画像補正の設定ができます。
「画像補正設定へ」ボタンをクリックすると、設定画面に進みます。
設定画面には、「カラー画像」の補正と「グレー画像」の補正があります。
数値を設定したら「画像プレビュー」>「この画像でプレビューする」にて、補正後の画像を確認することができます。
設定方法について、具体例を解説します。
画像補正設定の例
よく行われる画像補正の例をご紹介します。
※注意事項※
|
例1)赤色の文字だけを読取りたい
赤色の文字だけを読み取りたい場合、「赤色はそのままにし、その他の色の文字を白色にする補正設定」を行います。
詳細は、特定の色の文字だけを読み取りたい場合をご参照ください。
例2)赤色の文字を読取りたくない
赤色の文字を読み取りたくない場合、「赤色を白色に変換する補正設定」を行います。
詳細は、特定の色の文字を除去したい場合をご参照ください。
例3)帳票の背景色や、あらかじめ印刷されている赤色の文字を読取りたくない
以下のような、赤字で「年月日」や「証券番号」などの文字が記載されている場合、読取りたい文字以外を、白色に変換します。
例えば以下の図では、以下の変換を行い、赤色を読み取らないようにします。
- 黒色:読取りたいのでそのままにする
- 黒色以外(赤色など):白色に変換する
この帳票の場合、「フィルタ設定」にて以下のように設定をすることで、黒色以外の文字(赤色など)を白色に変換することができます。
- フィルタ:色背景除去(HSVモデル)
- HueMin:0 (Hue は色相を意味します)
- HueMax:225(Hue は色相を意味します)
- 彩度:Min 0 ~ Max 80
- 明度:Min 0 ~ Max 180
※帳票の特徴によって適切な値が異なります。お試しいただきながら調整を行ってください。
※色背景除去(HSVモデル)とは
指定した読取項目に対してフィルタをかけて、読取りたい文字の色だけを黒に変換し、読取り精度を向上させる機能です。
読取りたくない文字は、白やグレーに変換します。詳細はこちらをご参照ください。
例4)文字と重なる印鑑やハンコの赤色を消したい
読み取りたい文字に印鑑やハンコが重なっている場合、赤色を白色に変換して読み取らない状態にすることで、読取精度が向上するケースがあります。
帳票の特徴によって適切な値は異なります。お試しいただきながら調整を行ってください。
例5)帳票背景の模様・地紋を消したい
帳票の背景に模様・地紋が印刷されているケースは、読取精度が低下するケースがあります。
模様・地紋を白色に変換して読み取らない状態にすることで、読取精度が向上する可能性があります。
帳票の特徴によって適切な値は異なります。お試しいただきながら調整を行ってください。
例6)FAXのノイズを除去したい
FAXで受信した帳票にノイズがある場合、読取精度が低下するケースがあります。
以下のようにノイズを除去することで、読取精度が向上する可能性があります。
帳票の特徴によって適切な値は異なります。お試しいただきながら調整を行ってください。
画像補正設定の注意事項
画像補正によって、逆に読取精度が落ちてしまう場合もあります。
人間は背景画像との差を見て文字を認識していますが、二値化の場合、薄い文字は白に、濃い文字は黒に、はっきり寄せてしまいます。
文字が薄い画像の場合、人間が「グレーの文字」として読めていた部分も「白」に変換されてしまい、逆に読みにくくなることがあります。
画像補正を行うことで、必ずしも読取精度が向上するとは限らないため、お試しいただきながら設定を行ってください。
例)画像補正によって読取精度が落ちてしまった帳票
補足:画像補正を適用する範囲について(項目設定)
画像補正を適用する範囲には、以下2種類の設定があります。
デフォルトでは、「項目毎に適用」設定となります。
-
項目毎に適用
- 読取精度を向上させたい項目だけを選択します。
- 「項目設定」>「項目毎に適用」をクリックし、対象の項目にチェックを入れてください。
-
全項目に適用
- 全ての読取項目に画像補正を適用します。
補足:RGB係数とは
RGB係数とは、画像の色の強さを「Red」「Green」「Blue」の3要素で表現する方法です。
上記3色の度合い(係数)を設定することにより、赤色・緑色・青色のうち、いずれかの色を白色に変換することができます。
白色に変換された文字は、DX Suite で読取りません。
<設定方法>
- 除去したい色の数値を1に設定し、他の2種類の色の数値を0に設定します。
- Red、Green、Blueの3つの値の合計が、必ず1になるように調整してください。
例
赤色を読取らない状態にしたい場合(赤色を白色に変換)
- Redを1、Blueを0、Greenを0に設定します。
緑色を読取らない状態にしたい場合(緑色を白色に変換)
- Redを0、Blueを0、Greenを1に設定
青色を読取らない状態にしたい場合(青色を白色に変換)
- Redを0、Blueを1、Greenを0に設定
赤色・緑色・青色以外を除去したい場合は、より詳細な設定ができる「色背景除去(HSVモデル)」をご利用ください。
補足:色背景除去(HSVモデル)とは
色背景除去(HSVモデル)とは、指定した読取項目に対してフィルタをかけて、色をグレー・白・黒に変換したり、色を薄くする機能です。
色相・彩度・明度という項目にて、フィルタをかける上限と下限を設定することができるため、RGB係数よりも詳細な調整が可能なモデルです。
例えば、色の濃さにグラデーションがある押印(インクが濃い部分と薄い部分がある状態)を除去したい(白色に変換したい)場合は、RGB係数よりも色背景除去(HSVモデル)を使った補正が有効です。
デフォルトの設定では、「項目設定」にて指定した読取項目以外の色を白色に変換することができます。
白色に変換した文字はIntelligent OCR にて読み取れなくなるため、指定した読取項目の読取精度が向上します。
<デフォルトの設定値>
「項目設定」にて指定した読取項目以外の色を白色に変換します。
(指定した読取項目の読取精度が向上します)
- HueMin:0 (Hue は色相を意味します)
- HueMax:225 (Hue は色相を意味します)
- 彩度:Min 0 ~ Max 200
- 明度:Min 0 ~ Max 180
<詳細な解説>
色背景除去(HSVモデル)では、「色相(Hue)」「彩度」「明度」の3つの要素を調整します。
※色を鮮やかにする調整ではなく、色をグレー・白・黒に変換したり、色を薄くする機能です。
色相とは(Hue):
「HueMin」「HueMax」にて設定します。Hueとは「色相」を意味します。
色相とは、左の円錐を真上から見た部分を指しており 、赤、青、緑のような色味の違いを表す要素です。
一般的には値は0~225まで指定することができ、値が大きいほど文字の色が黒く、小さいと白くなります。
ただし、帳票によって大きく異なりますので、プレビューにてご確認いただきながら調整してください。
彩度とは:
色相で定義された色の「鮮やかさ」を表す要素です(左の円錐の、円の半径の部分を指しています)。
数値が高いほど鮮やかで、彩度の減少に合わせて色味がくすみ、0%はグレー、黒など、色味を持たない無彩色になります。
明度とは:
色相で定義された色の「明るさ・暗さ」を表す要素です(左の円錐の、高さの部分を指しています)。
高いほど明るく、明度の減少に合わせて暗くなり、0%で黒色になります。
補足:グレー画像の補正設定
何を行うか
- カラー画像(RGB係数/色背景除去(HSVモデル))にてグレーに変換した画像を、白黒画像に変換するために行います。
メリット
- 文字と背景の境界が明確になり、はっきりとした画像になります。
帳票の特徴に合わせて、以下のメニューから適切な設定を選びます。
フィルタとは(任意)
周りの画素の濃淡に合わせて色を濃く、または薄くすることができる、任意の機能です。
これにより、画像のノイズを軽減させることができます。
軽減させる方法によって種類が異なります。
-
平滑化(ガウシアン)処理
- 画像をぼかして滑らかにすることで、ノイズを除去します。
- 元々の画像に近い形を維持することができます。
-
平滑化(中間値)処理
- 「ごま塩ノイズ」と呼ばれる、小さな点々が表示されてしまうノイズを除去します。
- コントラストの差が大きい輪郭部分が、ぼやけにくい特徴があります。
-
平滑化(平均値)処理
- 画像をぼかして滑らかにします。
- 画素ごとの輝度値(画素が持つ明るさの値。値が小さいと暗く、大きいと明るい)の差を抑えることで、画像の粗さが目立ちません。
※上記フィルタ機能は単体で設定するものではなく、次項の「変換」と組み合わせて設定する機能です。
「フィルタ」で前処理を行った後、「変換」にて画像の白黒化(二値化)を行います。
変換とは
画像を白黒化(二値化)させる変換を行います。
「どこまでの色を白に寄せるか」「どこまでの色を黒に寄せるか」によって、3種類の方法があります。
- マトリックス単位二値化
- 薄い文字を、はっきり読み取れる効果が期待できます。
- 自動二値化
- 自動で閾値を計算して、自動的に白黒の画像にします。
- 閾値二値化
- 閾値を任意で指定して白黒の画像にします。
- 設定が簡単で微調整を行いやすいため、まずは閾値二値化からお試しください。
マトリックス単位二値化について
周りの色に比べて暗い場合に「黒」、明るい場合に「白」に変換する処理です。
薄い文字をはっきり読み取れる効果が期待できます。
以下の例のように、濃淡がはっきりしている画像の補正に適しています。
詳細な説明 マトリックス単位二値化には、「計算単位サイズ(NxN)」と「計算除外の白黒色」の設定項目があります。 計算単位サイズ(NxN)とは
<選び方>
計算除外の白黒色・AbsoluteBlack: 100 / AbsoluteWhite: 200 とは
|
自動二値化について
画像を白黒化(二値化)させる際に、「どこまでの色を白に寄せるか」「どこまでの色を黒に寄せるか」という閾値を計算して補正をする処理です。
白にする、黒にする線引きは帳票によって変わらず、自動的に決まります。
一律で自動補正をおこなうため、以下の例のように、文字がかすれてしまう場合もあります。
閾値二値化について
「計算除外の白黒色」という閾値を、任意で指定して補正を行う処理です。
設定が簡単で微調整ができるため、一番よく使われる設定です。まずは閾値二値化からお試しください。
※計算除外の白黒色とは
帳票全体における、白色と黒色の割合を調整するためのパラメータです。
5に近いほど帳票全体が白色になります。250に近いほど黒色になります。
フィルタ・変換の組み合わせの例
各方法で平滑化を行った後、閾値二値を行った場合、以下のような画像に変換されます。
なお、帳票によって適切な設定値は大きく異なるため、あくまでイメージとしてご参照ください。
※上記画像は、あくまで例題の帳票で設定を行った際の結果となります。
帳票によって適切な設定・組み合わせは大きく異なります。
参考記事
AI inside Academy にて、画像補正の使い方を動画で解説しています。
※AI inside Academy のご利用には会員登録が必要です。
※with DX Suite/with AI inside 製品をご契約の場合は、AI inside Academy はご利用いただけません。