補正設定の適用
ワークフロー編集画面の左側の[補正設定]をクリックすると、「画像補正設定」と「OCR補正設定」を適用できます。
※補正設定にて良い結果に結びつかないと感じる場合は、「重点補正(オプション)」に「On」を選択すると改善される場合があります(通常は変更する必要はありません)。
画像補正設定 | OCR補正設定 |
【画像補正設定】
画像補正設定バナーの右上にある「適用」ボタンを「ON」にすると、画像補正の設定ができます。 カラー画像の帳票から特定の色(例:文字と重なる印鑑の赤)を消したい場合や、背景の地紋を消したい場合、FAXのノイズを除去したい場合などに画像補正設定を使用して調整できます。
画像補正の基本設定フロー
- 「画像補正設定へ」ボタンをクリックします。
- 画像補正設定には大きく分けて2種類(カラー画像、グレー画像)の処理があり、それぞれで設定を調整することができます。
1. カラー画像をグレー画像に変換する
カラー画像からグレー画像に変換する段階で使う処理が「カラー画像」です。《 RGB係数 》
RGB係数とは名前の通り、Red、Green、Blueの3要素で1画素を表現しています。Red、Green、Blueの数値を調整して設定します。
<設定値による変化イメージ>Red、Green、Blue、の数値をデフォルト設定のまま、画像補正を適用すると、文字のあかいろや背景の黄色に補正がかかり、濃淡でグレーの画像に変換されます。
Red、Green、Blue、それぞれ除去する設定を行うと、このようなグレーの画像に変換されます。
また「フィルタ」のプルダウンメニューから「色背景除去(HSVモデル)」を選択すると、設定した領域以外の色を白色に変換することができます。
HSVモデルは、設定した領域以外の色を白色に変換することが目的で、RGB係数よりも細かい色の調整が必要な場合に使用します。
色を「色相」「彩度」「明度」という3要素で表現するという考え方です。
HSVモデルでは色を「鮮やかさ」「明るさ」といったような直感的にわかりやすい表現をしているので、「この色を明るくしたい・暗くしたい」「色を 薄くしたい・濃くしたい」といった感覚的な調整ができます。
色相とは、左の円錐を真上から見た部分を指しており 、赤、青、緑のような色味の違いを表す要素です。
彩度とは、左の円錐の、円の半径の部分を指しており、色相で定義された色の「鮮やかさ」を表す要素です。数値が高いほど鮮やかで、彩度の減少に合わせて色味がくすみ、0%はグレー、黒など、色味を持たないむさいしょくになります。
明度とは、左の円錐の、高さの部分を指しており、色相で定義された色の「明るさ・暗さ」を表す要素です。高いほど明るく、明度の減少に合わせて暗くなり、0%で黒色になります。
<設定値による変化イメージ>
「フィルタ設定」で指定した色「以外」 を全て白色に変えています。 下画像の数値は「黒」を指す数値なので、黒以外が白く変換されています。
このように画像補正をすると 、そもそも文字以外がなくなるので誤読をすることなく読取の精度をあげることができます。
2.グレー画像を二値画像に変換する
二値化には方法が全部で3つあります。
- マトリックス単位二値化(薄い文字でも周りより暗い場合、黒で変換)
周りの色に比べて暗い場合に「黒」、明るい場合に「白」に変換をします。 薄い文字が、はっきり読み取れる効果が期待できます。 - 自動二値化(パラメータがなく閾値を自動的に内部で計算)
二値化する際に、自動で閾値を計算して補正をする処理です。 白にする、黒にする線引きは帳票によって変わらず、自動的に決まります。 - 閾値二値化(直感的に設定が可能)
二値化する際に閾値を任意で指定して補正をかけることができる処理です。 微調整ができるので、変換処理で一番使われているのがこの閾値二値化になります。
また「フィルタ」のプルダウンメニューから平滑化の種類を選択することで、まわりの画素の濃淡に合わせて色を濃くしたり、薄くしたりすることができます。
ノイズを軽減するために有効な機能です。
平滑化には方法が全部で3つあります。
- 平均値
画素間の平均値をとるフィルタで、画像をぼかして滑らかにします。画素ごとの輝度値の差を抑えて、画像の粗さを目立たなくすることができます。 - ガウシアン
平均値フィルタと同様に、画像をぼかして滑らかにするフィルタですが、ガウス分布に従って重み付けがされます。そのため、平均値フィルタよりも元々の画像に近い形を維持することができます。 - 中間値
画素間の中央値を取るフィルタです。ごま塩ノイズと呼ばれる小さな点々のノイズを除去するために有効です。コントラストの差が大きい輪郭部分がぼやけにくいという特徴があります。
<設定値による変化イメージ>
こちらはそれぞれ平滑化後、二値化した変化のイメージです。
<二値化の注意事項>
画像補正をすると読取精度がよくなるとは限らず、逆に精度が落ちてしまう場合もあります。人は背景画像との差を見て文字を認識していますが、二値化は、補ってた部分を白か黒かに変えてしまうため、薄い文字は白に、濃い文字は よりはっきり黒に、と寄せてしまいます。
そのため文字が薄い画像だと、人だとグレーだから文字として読み取れていた部分も白に変換されてしまい、逆に読みにくくなってしまうことがあります 。
画像補正を入れても、読みやすくなるとは限らないので 、どういう調整を入れるべきかの判断が大切になります。
<画像プレビュー>
「画像プレビュー」を押すと上述のカラー画像とグレー画像の処理を反映させた画像プレビューを確認することができます。ワークフロー設定で使用している画像を基にプレビューするか、新規画像(これからアップロードしようとしている画像)を基にプレビューするか、選択することができます。
「新規画像を選択してプレビューする」を選択すると、以下の画面が表示されます。
プレビューに使う画像を選択してください。
【OCR補正設定】
ユーザ辞書を利用してOCR結果を他の文字列に置換したり、誤読を補正する設定ができます。
- 文字列置換の例:ABC銀行 → 7777
- 誤読の補正の例:永愛精工株式会社社 → 永愛精巧株式会社(置換時の文字一致率を調整することで、AI-OCR時の誤読に限らず、元々の書き損じや入力ミスなどを辞書の値に置換可能)
- 設定済みのOCR補正の設定は、後でOCR補正をオフにしても、設定内容は保持されます。
OCR補正はOCR処理の直後に実行されるため、ユーザ辞書による文字列の置換・補正の結果がデータチェック画面に表示されます。(元々のOCR結果は表示されません) なお、読取結果の文字列が128文字を超える場合は辞書置換は動作しません。これはユーザ辞書の参照キー、値ともに登録でできる文字数が最大128文字であるからです。 |
OCR補正の基本設定フロー
- ユーザ辞書の登録
ユーザ辞書は、マスタデータのようなもののことで、元となるデータを、DX Suite 上に登録していただく必要があります。ユーザ辞書の登録方法は2種類あります。
方法1:1つずつ手動でデータを登録していく方法です。
方法2:マスタを使用して一括でデータを登録する方法です。 - ワークフロー画面での設定
ワークフロー画面で、OCR補正設定か、データ加工設定を行っていただきます。
<設定例>
- ここでの手順の説明例では以下の辞書をサンプルとして使用します。
- [辞書選択]のプルダウンメニューから使用する辞書を選択します。(例では請求書用辞書)
- 置換する値を[値1]、[値2]、[値3]のいずれかを選択します。
- ABC銀行 → 7777に置換したい場合は、[値1]を選びます。
- 永愛精工株式会社 → 永愛精巧株式会社 に誤読補正したい場合は、[値2]を選びます。
- 文字一致率を調整します。
- ABC銀行 → 7777に置換したい場合は、100%のままにすると完全一致時のみ置換されます。
- 永愛精工株式会社(誤) → 永愛精巧株式会社(正)に誤読補正したい場合は、部分一致を許可する必要がありますので、例の場合では50%に設定すると誤読補正が実行されます。(全体の文字列の長さや差異に依存しますので、何回か試して適正な文字一致率を設定します)
- 他の読取項目にもOCR補正が必要な場合は[OCR補正設定を追加]をクリックして追加します。
- 必要なOCR補正が完了したら[保存して閉じる]をクリックします。