本記事では、「読取範囲の指定」でワークフローを作成する方法について解説します。
読取範囲の指定とは
読取範囲の指定とは、帳票上で読み取りたい範囲を指定して、必要な部分のみデータ化をするOCR方法です。
読取位置や、読み取る方法を正確に指定することができます。
※他のワークフロー作成方法との違いや、選び方についてはこちらをご参照ください。
設定の流れ
以下の流れで設定を行います。
手順1)データ化
- 読み取る箇所や、読み取る方法を設定します。
- 詳細な手順は本記事の「データ化の手順」にて解説します。
手順2)補正設定(任意)
必要に応じて以下2つの設定をご活用ください。
-
画像補正設定
- 帳票のノイズ除去や、特定の色の除去などの補正ができます。
- 読取精度の改善は帳票の状態に左右されるため、調整しながらお試しください。
(「読取範囲の指定」のみご利用可能)
-
OCR補正設定
- あらかじめ登録したユーザ辞書を使用して、読み取ったデータを補正します。
(「読取範囲の指定」「項目抽出」「項目選択」にてご利用可能)
- あらかじめ登録したユーザ辞書を使用して、読み取ったデータを補正します。
手順3)データチェック(任意)
- 読み取ったデータを目視で確認し、誤っていた場合は手入力で修正をします。
- データチェックを行う回数・チェックを行う項目などを設定します。
手順4)データ加工(任意)
- 読み取ったデータを、特定のルールに基づいて変換します。
手順5)アウトプット設定
- 出力ファイル名の設定
- 出力するファイル名を設定します。
- 文字コードの指定
- 出力するファイルの文字コードを設定します(Shift-JIS / UTF-8)。
- CSVヘッダーの設定
- CSVヘッダーを出力するかどうかを設定します。
データ化の手順
1. 帳票定義で使用する画像のアップロード
ワークフロー作成で[読取範囲の指定]を選んだら、テンプレートに使用する画像をPCからアップロードします。
1-1. ファイルを選択して、[作成]をクリックします。
1-2. ファイルを選択して、[作成]をクリックするとアップロードされた画像が表示されます。
アップロードした画像を変更したい場合は、画面左下の[画像差し替え]をクリックして、ファイルを選択しなおしてください。
2. 読取範囲の指定
ベースとする画像が取り込んだら、読取範囲の指定をします。左側のメニューの「範囲を追加」をクリックします。
2-1. マウスのカーソルが赤い点に切り替わりますので、赤い点を読取りたい読取範囲の左上(始点)に移動し、クリックします。
*ドラッグをせず、始点を1度だけクリックして、マウスから指を離します。
2-2. フィールドを囲うようにマウスカーソルを読取範囲の右下に移動させ、終点でもう一度クリックします。読取範囲が作成されると枠が青色になります。
読取範囲を作成せずにマウスカーソルを元に戻すには、画面左上の「範囲の選択」をクリックします。
【補足】チェックボックスを読み取りたい場合
チェックボックスの場合はレ点(✔)または丸(〇)が書かれる範囲を指定します。チェックボックスの数だけ読取範囲を作成します。読取条件の「チェックボックス」をご利用ください。
レ点(✔)や丸(〇)でチェックされると「1」が出力され、チェックがないと「0」が出力されます。判定結果(1、0)からチェックされた項目を指定した文字列として出力したい場合はデータ加工設定のチェックボックス変換を使用します。
【補足】マークシート・押印を読み取りたい場合
マークシートや塗りつぶされるようなチェックボックス は、読取条件の「マークシート・押印」をご利用ください。また印鑑の押印有無の判定にも利用できます。塗りつぶし箇所の数だけ読取範囲を作成します。
塗りつぶされていると「1」が出力され、塗りつぶされていないと「0」が出力されます。
3. 読取範囲の設定
範囲指定した項目に名前と読取条件を設定します。
3-1. 読取範囲タイトルを入力する
画面右側に読取範囲の設定情報が表示されますので、項目に名前(読取範囲タイトル)を付けます。
入力した名称がCSV出力時に1行目に表示されるヘッダー名となりますが、「データ加工」画面にて、CSV出力時のヘッダ名を変更することもできます。
3-2. 読取範囲指定と読取条件を選択する
読取範囲指定とはAIによるOCRを実行する際に使用するAIモデルの種類を指します。
読み取りたい文字の特徴によって、最適な種類が異なります。
詳しくは「読取範囲指定の種類」を参照ください。
すべての読取範囲に対して「読取範囲タイトル」「読取範囲指定」「読取条件」を設定してください。
- 作成した読取範囲が不要な場合はゴミ箱ボタンをクリックすると削除できます。
- ドラッグ&ドロップで並び順を変更することができます。
3-3. 保存する
作業中の操作結果は自動保存されませんので、読取範囲を設定したら画面右上の[保存]をクリックしてください。
【参考】読取範囲の並び順を変更する方法
- ドラッグ&ドロップで読取範囲の並び順を変更することができます。
本操作は、データチェックで読取結果が表示される順番と連動しています。
【参考】読取結果をテストする方法
- [読取テスト開始]をクリックすると対象の読取範囲の読取結果が数秒後に表示されます。
※ 読取テスト開始をクリックするごとに課金されます。
読取テストの失敗の場合、課金されません。
【参考】読取範囲の位置を調整する方法
- 作成済の読取範囲を移動するには、読取範囲を選択した状態でドラッグして動かします。
- 読取範囲の四隅の青い四角をマウスでドラッグすることで範囲の位置調整をできます。
【参考】読取範囲を複製する方法
- 作成済の読取範囲を複製するには、読取範囲を選択した状態で「ctrlキー+C」を押すと、読取範囲がコピーでき、「ctrlキー+V」を押すと直下にペーストができます。(Macの場合は「controlキー+C」でコピー、「controlキー+V」でペーストができます。)
【参考】データ化に関する機能
以下リンクもご参照ください。