本記事で分かること
- 「読取範囲の指定」にて作成したワークフローにて、読取精度を上げる方法
解説
「読取範囲の指定」にて作成したワークフローの読取精度を上げる方法としては、以下があります。
1.読取条件の指定を変更する
読取条件は26種類ありますが、以下2つは特に、AIによる学習データ量が多い読取条件です。
- 全ての文字、全ての文字(1行)
- 手書き文字を読み取る場合に利用
- 活字、活字(1行)
- 印字を読み取る場合に利用
そのため、まずは上記にてお試しいただき、読取結果が悪い場合には、別の読取条件に変更してお試しください。
※「読取テスト」を使うと、帳票定義画面で読み取りをテストすることができます。
(ご利用にはリクエスト課金が発生します)
2.「郵便番号」「住所」「銀行名」などの読取条件を試す
特定の記載が想定される場合には、以下の読取条件が有効な場合があります。
「全ての文字、全ての文字(1行)」や「活字、活字(1行)」にて精度が向上しない場合は、以下をお試しください。
<読取条件の一例>
- 数値
- マスあり数値
- カタカナ
- 日付
- 郵便番号
- 住所
- 銀行名
- 支店名
- 氏名
- 金額
- 電話番号
- English など
※詳細な条件は「読取範囲指定の種類」をご参照ください。
例)読取条件「数値」を使う場合
読取結果は「0123456789」を組み合わせた数字となります。仮に「あいうえお」を読み取った場合でも、近しい形の数字として出力されます。
※注意事項
[全ての文字]や[活字]モデルの方が読取精度が高いケースもあるため、[数値」など文字種限定モデルを選ぶ際は、[全ての文字]や[活字]での出力結果と比較したうえで、より平均的な精度が高い方を選んで利用してください。
3.手書き文字の記入を工夫する
帳票に文字を記入する際に、文字の書き方などに気を付けていただくことで、読取精度が向上した例があります。
詳細は「手書き文字の読み取り精度が向上する記入方法はありますか?」をご参照ください。
4.読取項目の作成方法を工夫する
- 帳票上の罫線などを範囲に含める
読取範囲枠を作成する際に、あえて罫線などを範囲に含めることで文字が際立ち、精度が向上するケースがあります。
設定の例
- 読取範囲枠を小さくする
読み取る文字に対して余白が大きいと、文字を正しく認識できない場合があります。読取範囲を小さくすることで、読取精度が改善する可能性があります。
設定の例
5.画像補正設定でノイズの除去を行う
以下のような帳票を読み取りたい場合、画像補正設定を行うことで精度が向上するケースがあります。
なお、以下ケースも画像補正設定にて調整することが可能ですので、お試しください。
- 帳票の背景色や、あらかじめ印刷されている赤色の文字を読み取りたくない
- 文字と重なる印鑑やハンコの赤色を消したい
- 読み取り精度が低下するため、帳票背景の模様・地紋を消したい
- FAXのノイズを除去したい
6.帳票ファイルは、300dpi 程度の画像ファイルを推奨
解像度が低すぎると認識精度が低下してしまいます。
そのため、アップロードする帳票ファイルは300dpi 程度を推奨します。
低解像度の場合、解像度を調整することで読取精度が向上できるケースがあります。
※帳票の状態によって結果が異なるため、確実に精度向上を保証するものではございません。予めご了承ください。
※アップロードする帳票ファイルの仕様は「DX Suite にアップロードできるファイルの仕様について」もご参照ください。
7.誤読しやすい文字をデータ加工で変換する
DX Suiteでは「/」と「1」、「0」(ゼロ)と「O」(オー)や、「×」(バツ)と「x」(エックス)などのように、人の目で見ても判断が難しい文字は、帳票の状態によっては誤読するケースがあります。
その場合は、データ加工「文字列変換(部分一致)」や「ユーザ辞書置換」などを利用して、誤読した文字を出力したい文字に変換してください。
8.押印の読取精度を向上させる場合
読取範囲指定「マークシート・押印」では、「帳票定義に使用した帳票」と「ユニット作成にてアップロードした帳票」の読取範囲の黒ピクセルの量を比較して判定を出します。
そのため、押印がある帳票を帳票定義に設定している場合は、押印がない帳票に差し替えて、読取精度が改善されるかどうかお試しください。
もし改善されない場合は、比較率を上げると改善する可能性があります。
9.マークシートの読取精度を向上させる場合
読取範囲の大きさ調整(拡大縮小)や、画像補正で黒ピクセルの量を調整することで、読取精度が改善するケースがあります。
また、「チェックボックス」や「チェックボックス・マークシート・押印」でも、塗りつぶしを認識できるケースもありますのでお試しください。