本記事では、ユーザ辞書について解説します。
この記事を読むことで、以下について把握することができます。
- ユーザ辞書を使ってできること
- ユーザ辞書の登録方法
- ユーザ辞書の活用方法
1. ユーザ辞書とは
ユーザ辞書は、「商品名と商品コード」や「会社名と取引番号」などの、特定の用語やマスタなどを登録する機能です。
Intelligent OCR にて帳票を読み取る前に、あらかじめユーザ辞書を登録する必要があります。
ユーザ辞書と合わせて「OCR補正」やデータ加工「ユーザ辞書置換」を活用することで、読み取った結果に対して、誤読を補完したり、他の文字列に置換したりすることが可能になります。
また、誤読した文字をユーザ辞書に登録することも可能です。
これにより、読取精度が向上し、データチェックにて読取結果を修正する手間が減ります。
2. ユーザ辞書を登録する
DX Suite にログインし、画面右上のユーザ名をクリックして「設定」をクリックします。
設定画面にて、「ユーザ辞書設定」>「新規登録」をクリックします。
登録する辞書の名前を付けて「登録」をクリックします。
以降の手順は、以下2つのパターンがあります。
A. 1件ずつ値を登録する方法
B. CSVアップロードにて一括で値を登録する方法
A. 辞書データの登録方法(1件ずつ登録する方法)
ユーザ辞書に1件ずつ値を登録する方法を解説します。
1.ユーザー辞書設定画面にて、名称を登録した辞書をクリックします。
2.「新規登録」をクリックします。
3.「辞書データを登録」画面にて、辞書データを入力します。
-
参照キー
- キーとなる文字を入力してください。
- 「参照キー」と「Intelligent OCR にて読み取った文字」が完全一致(もしくは部分一致)しているかを比較するために使います。
-
値1、値2、値3
- 「参照キー」と「Intelligent OCR にて読み取った文字」が完全一致(もしくは類似一致)した際に、置換する値を入力してください。
- 値を3つすべて埋める必要はありません。
例1)
- 参照キー:商品コード
- 値1:商品名
- 値2:単価
- 値3:サイズ
例2)
- ユーザ辞書名:会社名マスタ
- 参照キー:AI inside 株式会社
- 値1:A001
- 値2:登録なし
- 値3:登録なし
※値1の「A001」は取引コードを意味しています。
例3)
- ユーザ辞書名:銀行名マスタ
- 参照キー:ABC銀行
- 値1:111223
- 値2:登録なし
- 値3:登録なし
※値1の「111223」は取引コードを意味しています。
上記を入力したら、「登録」をクリックします。
4.登録内容の確認
画面下部に登録した内容が表示されます。
参照キーの各項目をクリックすると、一度登録した項目の値を編集して更新したり、項目を削除することができます。
ユーザー辞書への1件ずつのデータ登録の方法は以上となります。
B. CSVアップロードによる辞書データの一括登録
ユーザ辞書への辞書データの登録は、CSVファイルで一括アップロードすることもできます。
※1つのユーザ辞書における「参照キー」の数は、推奨値・上限値があります。
上限値を上回るご利用、上限値内でも短期間での大量投入などを行った場合、システムに過大な負荷がかかります。上限値を上回る設定値・投入量でのご利用はお控えください。
詳細は「4. 参照キーの推奨値・上限値」をご参照ください。
1.以下のようなCSVファイルをご用意ください。
以下は、実際に作成したCSVファイルの例です。
- 1行目にヘッダー名を入力してください(2行目以降はアップロードするデータです)。
- 新規で値を追加する際は、A列は「追加」、B列は空欄となります。
- A列とC列には必ず値を入れてください。
2.ユーザー辞書設定画面にて、CSVファイルをアップロードしたい辞書名をクリックします。
3.「一括登録(CSV)」をクリックします。
4.アップロードするCSVの仕様についての説明画面が表示されます。
「ファイルを選択」をクリックしてCSVファイルを選択します。
5.ファイル選択後に表示される「登録開始」をクリックすると一括で登録されます。
【補足】辞書データの追加・修正・削除について
辞書データは画面上で1件ずつ追加・修正・削除できますが、CSVファイルをダウンロードして、内容を書き換えた後に再度一括アップロードする方法もあります。
1.対象の辞書を開いて、「一覧DL(CSV)」をクリックします。
2.ダウンロードの確認メッセージが表示されますので「OK」をクリックします。PCのダウンロードフォルダなどに保存されます。
3.開いたファイルにて、必要な項目を編集してください。
A列には、ユーザ辞書への操作指示として、「変更」、「追加」、「削除」のいずれかを入力してください。
- 追加:新たな項目を追加したい場合
- 変更:既存の項目の値1~3を変更したい場合(参照キーは変更できません)
- 削除:削除したい項目
B列のData#は変更や削除をしないでください。
4.CSVファイルのアップロード
「CSVアップロードによる辞書データの一括登録」を参考に、アップロードしてください。
3. CSVアップロード時のエラー
タイムアウトが発生した場合でも、内部では登録処理が進んでおります。
充分に時間をおいてから再ログインし、登録内容を確認してください。
登録処理中にブラウザの更新ボタンを押さないでください。登録内容が重複する可能性があります。
4. 参照キーの推奨値・上限値
1つのユーザ辞書内の「参照キー」の数は、以下が推奨値・上限値です。
- 推奨値:2,000以下
- 推奨値は、最も高い処理性能が見込める設定値・投入量を指します。
- 上限値:40,000
- 上限値は、ご利用における上限の設定値・投入量を指します。
上限値を上回るご利用、上限値内でも短期間での大量投入などを行った場合、システムに過大な負荷がかかります。
上限値を上回る設定値・投入量でのご利用はお控えください。
5. ユーザ辞書の活用方法
設定したユーザ辞書を個別の読取範囲へ適用する方法を説明します。
補完
OCRの読取結果が間違っていた場合に、修正する機能です。
対象の文字列の読取結果が安定していない文字列に使用することができます。
例)「AI inside株株式会社」が「A1 inside株式会社」と読み取られてしまう場合、ユーザ辞書に正しい表記「AI inside株式会社」を登録しておくことで、手入力による修正の手間を削減することができます。
<参照>
詳しい操作方法は「OCR補正設定の詳細>補完」をご参照ください。
また、AI inside Academy にて、設定方法を動画で解説しています。
※AI inside Academy のご利用には会員登録が必要です。
※with DX Suite/with AI inside 製品をご契約の場合は、AI inside Academy はご利用いただけません。
置換
データ集計や管理の観点から、帳票に記載のある文字列を、コード番号や社内通称などの文字列に変換してデータ化したい場合に使用します。
例)帳票上に記載のある会社名AI inside株株式会社をデータベース上では、対応する取引コードとして、データ化したい場合。
<参照>
詳しい操作方法は「OCR補正設定の詳細>置換」をご参照ください。
また、AI inside Academy にて、設定方法を動画で解説しています。
※AI inside Academy のご利用には会員登録が必要です。
※with DX Suite/with AI inside 製品をご契約の場合は、AI inside Academy はご利用いただけません。
補完と置換
補完と置換を同時に行い、読取結果の修正と社内での最適なデータ活用に整えた文字列や番号等に変換してでデータ化を行うことができます。
<参照>
詳しい操作方法は「OCR補正設定の詳細>補完と置換」をご参照ください。
また、AI inside Academy にて、設定方法を動画で解説しています
※AI inside Academy のご利用には会員登録が必要です。
※with DX Suite/with AI inside 製品をご契約の場合は、AI inside Academy はご利用いただけません。
自動追加(辞書データ自動設定)
OCR補正の「辞書データ自動設定」には、「自動追加する」「自動追加しない」という2つの選択肢があります。
<自動追加する>
データチェックで修正した内容を、指定したユーザ辞書に自動登録します。
- 参照キー:読取った結果(誤読した文字)を自動登録
- 値:データチェックで修正した文字を自動登録
上記により、次回から誤読が発生した際に、自動で正しい値に辞書変換することができます。
<自動追加しない>
データチェックで修正を行っても、ユーザ辞書には自動登録しません。