Intelligent OCR の補正設定は4種類あり、本記事では「OCR補正設定」について解説します。
OCR補正設定を使うと、事前に登録した「ユーザ辞書」を活用して誤読を補正したり、OCR結果を他の文字列に置換することができます。
なお、作成したワークフローの種類によって、ご利用できる補正設定は異なります。
読取範囲の指定 | 全文読取 | 項目抽出 | 項目選択 | |
OCR補正設定 |
◯ | × | ◯ | ◯ |
◯ | × | × | × | |
回転補正設定 | × | × | ◯ | × |
Few-shot学習 | × | × | ◯ | × |
本記事で分かること
- OCR補正設定を使うシーン、使い方
OCR補正設定とは
事前に登録した「ユーザ辞書」を活用してOCR結果を他の文字列に置換したり、誤読を補正します。
具体的には、以下4つを行うことができます。
補足:「OCR補正設定」とデータ加工「ユーザー辞書変換」との違い
以下の「補完」と「置換」は、どちらもユーザ辞書を活用したご利用方法です。
できることが異なるため、業務に合わせてご活用ください。
補完 | 置換 | ||
使う機能 |
OCR補正 |
OCR補正 |
データ加工「ユーザー辞書変換」 |
仕組み | 読取った文字が、ユーザ辞書に登録した「参照キー」と部分一致する場合、ユーザ辞書に登録した「参照キー」や「値」を出力する。 | 読取った文字が、ユーザ辞書に登録した「参照キー」と完全一致する場合、ユーザ辞書に登録した「値」を出力する。 | |
例 |
誤読した文字を、自動で変換する。 例)「A1 inside 株式会社」と誤読した文字を「AI inside 株式会社」に変換する。 |
あらかじめ登録した単語に自動で変換できる。 例)商品マスタをあらかじめユーザ辞書に登録し、読み取った「商品名」を「商品コード」に置換する。 |
|
データチェック画面に表示される文字 | 変換後の文字 | 変換後の文字 | 変換前の文字 |
データチェックで修正した内容をユーザ辞書に自動追加できるか |
〇 「辞書データ自動設定」を「自動追加する」を選択 ※詳細は「「ユーザ辞書自動追加」の設定をするにはどうすればいいですか?」もご参照ください |
× | |
設定方法 | 本記事の以下をご参照ください。 |
※補完をする際の「文字一致率」は、全体の文字列の長さや差異に依存します。
何回か試して適当な文字一致率を設定してください。
OCR補正設定の設定方法
1.[OCR補正設定]をクリックします。
2.右上の[OCR補正設定を追加]をクリックして、OCR補正を行いたい[読取項目]をプルダウンメニューから選択します。
OCR補正設定の具体例
以下4つの方法について、設定を解説します。
1.補完(部分一致で変換する)
2.置換(完全一致で変換する)
3.補完と置換を合わせて行う
4.辞書データ自動設定
1.補完(部分一致で変換する)
以下の例にて、設定を解説します。
例)「A1 inside 株式会社」と誤読した文字を、「AI inside 株式会社」に補完したい。
なお、ユーザ辞書にはあらかじめ、以下の内容が登録されているものとします。
(ユーザ辞書の登録方法はこちら)
ユーザ辞書名:会社名マスタ ※値1の「A001」は取引コードを意味しています。 |
OCR補正設定にて、以下を設定します。
1.OCR補正設定画面にて、補完したい読取項目を選択
本例では「会社名」を選択します。
2.活用したいユーザ辞書を選択
ユーザ辞書はあらかじめ登録しておく必要があります。
本例では「会社名マスタ」というユーザ辞書を選択します。
3.置換する値を設定
ここでは「読取った文字が参照キーと部分一致している場合、何の値に置換するか」を設定します。
本例では「参照キー」を選択することで、「読取った文字が参照キーと部分一致している場合、参照キーの値に変換する」という設定になります。
これにより、誤読した「A1 inside 株式会社社」を「AI inside 株式会社」に変換することができます。
※部分一致に関する指定は5にて行います。
4.辞書データ自動設定では、以下2つのどちらかを選択
- 自動追加しない
- データチェック画面で誤読を修正しても、修正した値をユーザ辞書に自動追加しない
- 自動追加する
- データチェック画面で誤読を修正した場合、修正した値をユーザ辞書に自動追加する
5.文字一致率を指定
本例では部分一致をしている場合に変換したいため、50%を指定します。
※ただし、文字一致率は必ずしも50%とは限りません。
全体の文字列の長さや差異に依存します。何回か試して適当な文字一致率を設定してください。
<参照>
AI inside Academy にて、設定方法を動画で解説しています。
※AI inside Academy のご利用には会員登録が必要です。
※with DX Suite/with AI inside 製品をご契約の場合は、AI inside Academy はご利用いただけません。
2.置換(完全一致で変換する)
以下の例にて、設定を解説します。
例)「AI inside 株式会社」を、取引コード「A0001」に置換したい。
なお、ユーザ辞書にはあらかじめ、以下の内容が登録されているものとします。
(ユーザ辞書の登録方法はこちら)
ユーザ辞書名:取引マスタ ※値1の「A001」は取引コードを意味しています。 |
OCR補正設定にて、以下を設定します。
1.補完の対象にしたい読取項目を選択します。
本例では「会社名」を選択します。
2.活用したいユーザ辞書を選択します。
ユーザ辞書はあらかじめ登録しておく必要があります。
本例では「取引マスタ」というユーザ辞書を選択します。
3.置換する値を設定します。
ここでは「読取った文字が参照キーと完全一致している場合、何の値に置換するか」を設定します。
本例では「値1」を選択することで、「読取った文字が参照キーと完全一致している場合、値1に変換する」という設定になります。
これにより、読取った「AI inside 株式会社」を「A001」に変換することができます。
※注意※
完全一致で変換する本例の場合、「参照キー」は選択しません。
読取った文字が参照キーと完全一致している場合、参照キーに変換する」という指示になり、意味を成さないためです。
※完全一致に関する指定は5にて行います。
4.辞書データ自動設定では、以下2つのどちらかを選択します。
- 自動追加しない
- データチェック画面で誤読を修正したとしても、修正した値をユーザ辞書に自動追加しない
- 自動追加する
- データチェック画面で誤読を修正した場合、修正した値をユーザ辞書に自動追加する
本例では、誤読があったとしても「取引マスタ」を上書きをしたくないため、「自動追加しない」を選択します。
5.文字一致率を指定します。
本例では完全一致をしている場合に変換したいため、100%を指定します。
<参照>
AI inside Academy にて、設定方法を動画で解説しています。
【動画】OCR補正の設定例_置換
※AI inside Academy のご利用には会員登録が必要です。
※with DX Suite/with AI inside 製品をご契約の場合は、AI inside Academy はご利用いただけません。
3.補完と置換を合わせて行う
以下の例にて、設定を解説します。
例)「A1 inside 株式会社」と誤読した文字を、「AI inside 株式会社」に補完したい。
同時に、「AI inside 株式会社」に対する取引コード「A-0001」を出力したい。
なお、ユーザ辞書にはあらかじめ、以下の内容が登録されているものとします。
(ユーザ辞書の登録方法はこちら)
ユーザ辞書名:会社名マスタ ※値1の「A001」は取引コードを意味しています。 |
<補完>
「1.文字の補完(部分一致で変換する)」をご参照ください。
<置換>
データ加工画面にて「ユーザ辞書置換」を設定します。
本例では、A列で読み取った会社名に対して、ユーザ辞書「会社名マスタ」を使い、B列に取引コード「A001」を出力したいため、以下のように設定します。
<参照>
AI inside Academy にて、設定方法を動画で解説しています。
※AI inside Academy のご利用には会員登録が必要です。
※with DX Suite/with AI inside 製品をご契約の場合は、AI inside Academy はご利用いただけません。
4.自動追加(辞書データ自動設定)
OCR補正の「辞書データ自動設定」には、「自動追加する」「自動追加しない」という2つの選択肢があります。
<自動追加する>
データチェックで修正した内容を、指定したユーザ辞書に自動登録します。
- 参照キー:読取った結果(誤読した文字)を自動登録
- 値:データチェックで修正した文字を自動登録
上記により、次回から誤読が発生した際に、自動で正しい値に辞書変換することができます。
<自動追加しない>
データチェックで修正を行っても、ユーザ辞書には自動登録しません。