本記事で分かること
- 「読取範囲の指定」にて作成したワークフローにて、読取精度を上げる方法
解説
「読取範囲の指定」にて作成したワークフローの読取精度を上げる方法としては、以下があります。
1.読取条件の指定を変更する
読取条件は26種類ありますが、以下2つは特に、AIによる学習データ量が多い読取条件です。
- 全ての文字、全ての文字(1行)
- 手書き文字を読み取る場合に利用
- 活字、活字(1行)
- 印字を読み取る場合に利用
そのため、まずは上記にてお試しいただき、読取結果が悪い場合には、別の読取条件に変更してお試しください。
※「読取テスト」を使うと、帳票定義画面で読み取りをテストすることができます。
(ご利用にはリクエスト課金が発生します)
2.手書き文字の記入を工夫する
帳票に文字を記入する際に、文字の書き方などに気を付けていただくことで、読取精度が向上した例があります。
詳細は「手書き文字の読み取り精度が向上する記入方法はありますか?」をご参照ください。
3.読取項目の作成方法を工夫する
読取範囲枠を作成する際に、あえて帳票上の罫線などを範囲に含めることで文字が際立ち、精度が向上するケースがあります。
4.画像補正設定でノイズの除去を行う
以下のような帳票を読み取りたい場合、画像補正設定を行うことで精度が向上するケースがあります。
なお、以下ケースも画像補正設定にて調整することが可能ですので、お試しください。
- 帳票の背景色や、あらかじめ印刷されている赤色の文字を読み取りたくない
- 文字と重なる印鑑やハンコの赤色を消したい
- 読み取り精度が低下するため、帳票背景の模様・地紋を消したい
- FAXのノイズを除去したい
5.帳票ファイルは、300dpi 程度の画像ファイルを推奨
解像度が低すぎると認識精度が低下してしまいます。
そのため、アップロードする帳票ファイルは300dpi 程度を推奨します。
低解像度の場合、解像度を調整することで読取精度が向上できるケースがあります。
※帳票の状態によって結果が異なるため、確実に精度向上を保証するものではございません。予めご了承ください。
※アップロードする帳票ファイルの仕様は「DX Suite にアップロードできるファイルの仕様について」もご参照ください。
6.誤読しやすい文字をデータ加工で変換する
DX Suiteでは「/」と「1」、「0」(ゼロ)と「O」(オー)や、「×」(バツ)と「x」(エックス)などのように、人の目で見ても判断が難しい文字は、帳票の状態によっては誤読するケースがあります。
その場合は、データ加工「文字列変換(部分一致)」や「ユーザ辞書置換」などを利用して、誤読した文字を出力したい文字に変換してください。
7.押印の読取精度を向上させる場合
読取範囲指定「マークシート・押印」では、「帳票定義に使用した帳票」と「ユニット作成にてアップロードした帳票」の読取範囲の黒ピクセルの量を比較して判定を出します。
そのため、押印がない帳票を帳票定義に設定している場合は、押印がある帳票に差し替えて、読取精度が改善されるかどうかお試しください。
もし改善されない場合は、比較率を上げると改善する可能性があります。
8.マークシートの読取精度を向上させる場合
読取範囲の大きさ調整(拡大縮小)や、画像補正で黒ピクセルの量を調整することで、読取精度が改善するケースがあります。
また、「チェックボックス」や「チェックボックス・マークシート・押印」でも、塗りつぶしを認識できるケースもありますのでお試しください。