読取条件とはAIによるOCRを実行する際に使用するAIモデルの種類を指します。読取条件の選択方法は読取範囲指定をご参照ください。
- 手書き文字の場合は[全ての文字]、印字の場合は[活字]をまずは選び、読取精度結果によっては他の条件を選び調整をします。
- [全ての文字]や[活字」以外のモデルでは、出力する文字種を限定しています。[数値]なら0~9の数字、[カタカナ]ならカタカナ・数字・一部記号と一定の範囲の文字種に限定されます。
- 例えば[数値]を選ぶと、読取結果(出力)は0123456789の文字を組み合わせた数字となります。[数値]を選ぶと、仮に「あいうえお」であっても、数字が出力されます。ただし、書かれている文字が数値であっても[全ての文字]や[活字]モデルの方が読取精度が高い場合もありますので、[数値」など文字種限定モデルを選ぶ際は、[全ての文字]や[活字]での出力結果と比較したうえで、より平均的な精度が高い方を選んで利用してください。
- 中国語のCSV出力が文字化けをする際は、ワークフロー編集画面のアウトプットで、文字コードをUTF-8に変更して再度読取をお試しください。
現在利用できる読取条件は以下となります。
読取条件名 | 用途・備考 |
全ての文字 | ひらがな、カタカナ、漢字、数字、アルファベット、記号などが混在した記載が想定される場合 |
全ての文字(1行) | ひらがな、カタカナ、漢字、数字、アルファベット、記号などが混在した1行記載が想定される場合 |
全ての文字(縦書き) | ひらがな、カタカナ、漢字、数字、アルファベット、記号などが混在した縦書きが想定される場合 |
数値 | 数字のみの記載が想定される場合 |
マスあり数値 |
マス内への数値の記載が想定される場合(枠線が「❘」や「1」と誤読されないために使用します) ※読取り上限は50桁まで設定可能です。 |
カタカナ | カタカナのみの記載が想定される場合 |
日付 | 日付の記載が想定される場合 (「平成」などの年号が入っている場合も読取ができます。) |
活字 | 活字の記載が想定される場合 (半角英数文字の前後のスペースが認識できる場合は半角スペースとして出力されます。) |
活字(1行) | 活字の1行記載が想定される場合 (半角英数文字の前後のスペースが認識できる場合は半角スペースとして出力されます。) |
郵便番号 | 「数字3桁+数字4桁」のみの記載が想定される場合 |
住所 | 住所の記載が想定される場合 |
銀行名 | 銀行名の記載が想定される場合 |
支店名 | 支店名の記載が想定される場合 |
氏名 | 氏名の記載が想定される場合
|
金額 | 数字と「-」(マイナス)の記載が想定される場合 (¥や「,」(桁区切り文字)が入っている場合は、削除されて数字のみ出力されます。) |
電話番号 | 数字とハイフンの記載が想定される場合 |
English | アルファベットを使う言語の記載が予想される場合 |
Thai Single Line | タイ語の1行記載が想定される場合 |
Thai Multiline | タイ語の複数行記載が想定される場合 |
Vietnamese | ベトナム語の記載が想定される場合 |
Simplified Chinese | 中国語簡体字の記載が想定される場合 |
Traditional Chinese | 中国語繁体字の記載が想定される場合 |
チェックボックス | チェックボックスにレ点(✔)または丸(〇)が記載が想定される場合 (チェックボックス1つに対して1つの範囲を指定します。複数をまとめて範囲指定をすると、正しい結果が出ません。) |
マークシート・押印 |
マークシート(塗りつぶし)または押印が想定されるの場合 |
バーコード・QRコード | バーコードや QR コードの記載が想定される場合 |
読取対象外 (手入力) | OCRをせずに読取チェック画面で手入力をする場合 |
※各読取条件が出力できる文字種についての詳細は「DX Suite クラウド AI-OCRモデル仕様書」に記載しております。