活字/手書き/FAXなどあらゆる帳票を高精度でデジタルデータ化するAI-OCRです。
- Elastic Sorter
まとめてアップロードした複数の帳票を種類ごとに自動で仕分けを行う機能です。
- 定型帳票
フォーマットが固定の帳票です。
- 非定型帳票
請求書、領収書、注文書といったフォーマットが異なる帳票のことです。
- 全文読取
文字項目設定不要でページを丸ごと読み取りすることができます。読取範囲の指定をせずにページ内の全ての文字列を一括で読み取れる機能です。
必要な項目を抽出するルールを設定してCSVダウンロードすることや、読み取った文字列が反映されたサーチャブルPDFをダウンロードすることもできます。
- ワークフロー
どんな帳票のどの項目をOCRするのか、目視チェックの有無・回数、文字列の置換などのデータ加工、出力するCSVの設定など、一連の処理内容を設定することです。設定して名前を付けて保存したものが個々のワークフローとなります。
- データ化
読み取りたい帳票画像の設定を行います。
- 読取範囲指定
読み取りたい範囲を設定することができます。
- 範囲の選択
一度作成した読取範囲を移動したい時などに使います。
読取範囲を作成せずにマウスカーソルを元に戻すには、画面左上の「範囲の選択」をクリックします。
- 範囲分割
作成した読取範囲を分割する設定です。見積書や請求書などで表形式の明細部分の読取範囲を指定する際に、表形式エリアをまとめて範囲指定することができます。読取結果はデータ加工設定の「表データへ変換」を設定することで、そのまま表形式でCSV出力することができます。データ加工設定を使わない場合は、1つのセルに縦棒 ( | ) で区切られてCSV出力されます。
- 読取条件の指定
AIによるOCRを実行する際に使用するAIモデルを選ぶことを意味します。デフォルトでは「全ての文字」となります。指定なしで誤読が発生してしまった場合、他の条件を選び調整をしてみてください。
- 読取除外設定
読取をする必要がない項目の場合に使用する設定です。読取範囲内に元々印字されている文字を読み取りたくない場合に利用できます。
- 補正設定
「画像補正設定」と「OCR補正設定」を適用できます。画像補正設定はカラー画像の帳票から特定の色(例:文字と重なる印鑑の赤)を消したい場合や、背景の地紋を消したい場合、FAXのノイズを除去したい場合などに画像補正設定を使用して調整できます。
OCR補正設定はユーザ辞書を利用してOCR結果を他の文字列に置換したり、誤読を補正する設定ができます。
- データチェック
ワークフロー編集画面の左側の[データチェック]の[適用]をクリックすると、データチェック方法を選択できます。適用しない場合はOCR結果の目視チェックをしないワークフローとなります。
- データ加工設定
OCRで読み取った文字列をそのままCSVに出力するだけでなく、特定の処理ルールにもとづいて変換させてCSV出力をさせるための設定です。
- CSV出力先設定
CSVのどの列に配置したいかを指定することができます。各項目のヘッダー名と列の位置を変えられます。また、列を追加することも可能です。(データ加工用などに利用します)
- アウトプット
アウトプットではOCR後にダウンロードする出力ファイル名と文字コードを指定できます。
- ユニット
設定した帳票定義に対して、画像ファイルを読取する度に作成されるものです。
複数ファイルを一度にアップロードしても1つの読取ユニットで管理され、エントリーやCSVダウンロードをまとめて行えます。
- 読取チェック
帳票のデータ化完了後、CSVデータをダウンロードする前に読取結果を目視で確認・修正することです。
- コンペア
ワークフロー作成時にデータチェックで[ダブルチェック]を選ぶか、詳細設定で2回以上を項目に設定しておくと、各回のチェック結果に差異がある場合にコンペア機能により比較結果が表示されます。
- 設定ファイル(XML)
読取範囲の設定をした帳票を定義ファイル(XML形式)としてダウンロード/インポートすることができます。