補正設定の適用
ワークフロー編集画面の左側の[補正設定]をクリックすると、「画像補正設定」と「OCR補正設定」を適用できます。
【画像補正設定】
画像補正設定バナーの右上にある「適用」ボタンを「ON」にすると、画像補正の設定ができます。 カラー画像の帳票から特定の色(例:文字と重なる印鑑の赤)を消したい場合や、背景の地紋を消したい場合、FAXのノイズを除去したい場合などに画像補正設定を使用して調整できます。
画像補正の基本設定フロー
- 「画像補正設定へ」ボタンをクリックします。
- 画像補正設定には大きく分けて2種類(カラー画像、グレー画像)の処理があり、それぞれで設定を調整することができます。
1. カラー画像をグレー画像に変換する
カラー画像からグレー画像に変換する段階で使う処理が「カラー画像」です。《 RGB係数 》
RGB係数とは名前の通り、Red、Green、Blueの3要素で1画素を表現しています。Red、Green、Blueの数値を調整して設定します。
- Redを除去したい場合
Redを1、 Green、Blueを0に設定 - Greenを除去する場合 Greenを1、 RedとBlueを0に設定
- Blueを除去する場合
Blueを1、 RedとGreenを0に設定 ※数値は、Red、Green、Blueの値3つを足して1になるように調整します。
<設定値による変化イメージ>
印鑑の赤色を除去したい場合、Redを1、 Green、Blueを0に設定します。
また「フィルタ」のプルダウンメニューから「色背景除去(HSVモデル)」を選択すると、設定した領域以外の色を白色に変換することができます。
HSVモデルは、設定した領域以外の色を白色に変換することが目的で、RGB係数よりも細かい色の調整が必要な場合に使用します。
<設定値による変化イメージ>
「フィルタ設定」で指定した色「以外」 を全て白色に変えています。 下画像の数値は「黒」を指す数値なので、黒以外が白く変換されています。
このように画像補正をすると 、そもそも文字以外がなくなるので誤読をすることなく読取の精度をあげることができます。
2.グレー画像を二値画像に変換する
二値化には方法が全部で3つあります。
- マトリックス単位二値化(薄い文字でも周りより暗い場合、黒で変換)
周りの色に比べて暗い場合に「黒」、明るい場合に「白」に変換をします。 薄い文字が、はっきり読み取れる効果が期待できます。 - 自動二値化(パラメータがなく閾値を自動的に内部で計算)
二値化する際に、自動で閾値を計算して補正をする処理です。 白にする、黒にする線引きは帳票によって変わらず、自動的に決まります。 - 閾値二値化(直感的に設定が可能)
二値化する際に閾値を任意で指定して補正をかけることができる処理です。 微調整ができるので、変換処理で一番使われているのがこの閾値二値化になります。
また「フィルタ」のプルダウンメニューから平滑化の種類を選択することで、まわりの画素の濃淡に合わせて色を濃くしたり、薄くしたりすることができます。
ノイズを軽減するために有効な機能です。
平滑化には方法が全部で3つあります。
- ガウシアン
細かいノイズを除去したいとき
- 中間値 中ぐらいのノイズを除去したいとき
- 平均値 大きいノイズを除去したいとき
「画像プレビュー」を押すと上述の1.2.の処理を反映させた画像プレビューを確認することができます。ワークフロー設定で使用している画像を基にプレビューするか、新規画像(これからアップロードしようとしている画像)を基にプレビューするか、選択することができます。
「新規画像を選択してプレビューする」を選択すると、以下の画面が表示されます。
プレビューに使う画像を選択してください。
【OCR補正設定】
ユーザ辞書を利用してOCR結果を他の文字列に置換したり、誤読を補正する設定ができます。
- 文字列置換の例:ABC銀行 → 7777
- 誤読の補正の例:永愛精工株式会社社 → 永愛精巧株式会社(置換時の文字一致率を調整することで、AI-OCR時の誤読に限らず、元々の書き損じや入力ミスなどを辞書の値に置換可能)
- 設定済みのOCR補正の設定は、後でOCR補正をオフにしても、設定内容は保持されます。
OCR補正はOCR処理の直後に実行されるため、ユーザ辞書による文字列の置換・補正の結果がデータチェック画面に表示されます。(元々のOCR結果は表示されません) なお、読取結果の文字列が128文字を超える場合は辞書置換は動作しません。これはユーザ辞書の参照キー、値ともに登録でできる文字数が最大128文字であるからです。 |
OCR補正の基本設定フロー
[OCR補正設定へ]をクリックすると、OCR補正設定画面に進み、左に帳票イメージ(下の例では非定型帳票の請求書)が表示されます。
- 右上の[OCR補正設定を追加]をクリックして、OCR補正を行いたい[読取項目]をプルダウンメニューから選択します。
ここでの手順の説明例では以下の辞書をサンプルとして使用します。 - [辞書選択]のプルダウンメニューから使用する辞書を選択します。(例では請求書用辞書)
- 置換する値を[値1]、[値2]、[値3]のいずれかを選択します。
- ABC銀行 → 7777に置換したい場合は、[値1]を選びます。
- 永愛精工株式会社社 → 永愛精巧株式会社 に誤読補正したい場合は、[値2]を選びます。
- 文字一致率を調整します。
- ABC銀行 → 7777に置換したい場合は、100%のままにすると完全一致時のみ置換されます。
- 永愛精工株式会社社(誤) → 永愛精巧株式会社(正)に誤読補正したい場合は、部分一致を許可する必要がありますので、例の場合では50%に設定すると誤読補正が実行されます。(全体の文字列長や差異に依存しますので、何回か試して適正な文字一致率を設定します)
- 他の読取項目にもOCR補正が必要な場合は[OCR補正設定を追加]をクリックして追加します。
- 必要なOCR補正が完了したら[保存して閉じる]をクリックします。