本記事で分かること
- 「読取範囲の指定」にて帳票定義を作成する際の帳票ファイルや、読取ユニットにてアップロードする帳票ファイルに関して、お客様に守っていただきたい仕様
解説
DX Suite にファイルをアップロードする際は、以下の仕様を守ってご利用ください。
画像形式
- JPEG、PNG、TIFF、PDF に対応しています
- JPEG2000には対応していません
用紙サイズ(紙の帳票をスキャンする場合)
- 制限なし
ピクセルサイズ
- 200~600 dpi を推奨
ファイルサイズ
- 1ファイルにつき20 MB以下を推奨
ページ数
- 全文読取の場合は1ユニットにつき、100ページ以下を推奨
- 全文読取以外の場合は、1回のアップロード(1読取ユニット)において、3000ページ以内(1ファイルあたり100ページ以内)を推奨
PDFファイルについて
- 各 1 ページを 1 帳票画像として処理します。
- PDF 上のテキストデータはラスタライズ(画像化)して読み込みを行うため、抽出可能テキストであっても精度はビットマップ OCR レベルとなります。
- テキストデータはフォントの埋め込みを行ってください。なお、フォントの相違等により読み込めないことがあるため、入力画像は画像を推奨します。
- PDFに埋め込まれている画像がJPEG2000形式で圧縮されている場合は取込ができません。
- 内容の抽出が不許可のものや、セキュリティパスワードにより保護されたファイルは取り込めません。
※上記内容は、DX Suite クラウドサービス仕様書と同様の記載となります。
補足:RPAをご利用の場合
DX Suite をRPAと連携して利用している場合は、RPAでアップロードの前にPDFを画像に自動変換するステップを入れることで、DX Suite で取り込みができないタイプのPDFのアップロード時のエラーを回避できます。
※推奨するXPathの設定方法は「XPathの設定方法について」をご参照ください。
注意事項
アップロードの所要時間は30分が上限です。
30分を超える場合は1ユニットに投入するファイル数、ページ数を少なくして、再度投入してください。
上記推奨値や出力列設定数が多くなったり短期間での大量投入などを行うと、結果がダウンロードできなくなったり、システムに過大な負荷がかかってしまうことでDXSuite をお使いの他のユーザーへ影響が出てしまうことがございます。
その際、AI inside 側で判断のもと処理を止めさせていただく場合がございます。
また、その場合に生じた課金についての返金対応は致しかねます。
※現在はシステムでの制限はおこなっていない場合でも、今後は上限設定や、課金形態の変更をおこなう可能性があります。