Q. 通常項目と明細項目の違いを教えてください。(設定する際の考え方)
注文書でも取引先によって明細がないものもありますが、その場合でも項目抽出では問題ないという認識でよろしいでしょうか。
A. 通常項目と明細項目の違いは以下のとおりです。
通常項目:項目名と値が一対一の項目
明細項目:表形式の項目
明細のない注文書の場合、通常項目の情報のみ取得ができます。
==============================================================
Q. 明細ページが複数ページにわたって続く場合、「項目抽出」ではどのように処理されますか。
A. 明細ページが複数ページにわたる場合につきましても、明細ページを読み取ることが可能です。
明細行の分だけCSVの行が出力されるイメージです。
==============================================================
Q. 項目抽出は、ユーザ辞書変換に対応していますでしょうか。
A. ユーザ辞書機能については、以下2通りのご利用方法がございます。
(1)OCR補正設定
→ OCR時にユーザ辞書を参照して置換します。
(2)データ加工設定の「ユーザ辞書置換」
→ OCR後、CSV出力時に辞書変換を行います。
==============================================================
Q. 「項目抽出」する帳票に得意、不得意なものはありますでしょうか。
例えば、一般的にOCRは帳票に色がついていたり、網掛けがあると読み取りにくいと思うが、項目抽出する様式で苦手なレイアウト等あれば、教えてほしいです。
A. 通常項目において以下の条件の場合は設定した項目との関係性が掴めず抽出が難しいです。
・項目名と値が離れすぎている
・項目が存在しない
帳票にない項目を設定すると、ユニット作成をし、ファイルをアップロードすると「一部データ化失敗」のエラーが発生することがあります。
明細項目において以下の条件の場合は値が正しく抽出されない事象が多く発生します。
・明細表の罫線がない
・複雑な明細
・項目がセル内で複数行に跨って記載されている
・セル内で項目が縦に分かれている
==============================================================
Q. 追加指示でできること、できないことを教えてください。
A. 項目抽出全般の設定方法のコツにつきましては、こちらのAcademyというコミュニティサイトの記事で詳細をご案内しております。
■Academy 項目抽出「追加指示」のコツ
■Academy 追加指示のユースケース
==============================================================
Q. 項目抽出で様々なフォーマットの各項目を読み取ることができますか。
A. 基本的には可能です。
項目名と値が一対一のものでしたら、読み取り精度も高いです。
==============================================================
Q. 「項目抽出」は全文読取からのAI抽出とのことですが、プロンプトによる追加指示で読取自体の精度は上がるのでしょうか。
A. 現状、項目抽出では、項目ごとに読み取りモデルを指定することはできませんが、「項目」欄や「追加指示」の書き方で読み取り箇所の検出精度を上げることは可能です。
==============================================================
Q. 「項目抽出」でマークシート形式やチェックボックス形式の読取を設定する方法を教えてください。
A. 現時点では、項目抽出では「チェックボックス・マークシート・押印」の項目に対応をしておりません。今後検討してまいります。
==============================================================
Q. 枠のない帳票にも「項目抽出」は有効と考えてよいでしょうか。
(例えばExcelで作成していると思われるが罫線が出力されていないもの)
A. 罫線がない帳票の読み取りにつきましては、現時点ですと読み取りの難易度が高いかと思いますが、フォーマットによっては対応できるものもございます。
==============================================================
Q. 項目抽出を使って、CSV出力時に空欄のカラムを作って出力することができますか。
A. CSV出力列に関する指示は、データ加工の「列を追加」で行うことを推奨いたします。
==============================================================
Q. 項目抽出のプリセット(通常)に項目の追加をする場合、APIで連携しても問題なく読み取れる認識で合っていますか。
A. ご認識の通りです。項目抽出のプリセットは、DX Suite 上にあらかじめ項目名を設定しておりますが、お客様の用途に合わせて読取項目の追加や削除、また追加指示などで調整をしていただけますと幸いです。
なお、項目名の追加や削除、追加指示を行ってもAPI連携に影響はありませんので、ご安心ください。
==============================================================
Q. 項目名に使用できない記号がありますか。
A. 次の記号は、項目名として使用することができません。
\/:*?"<>|
==============================================================
Q. 項目抽出は英語版の帳票にも対応していますか。
A. 汎用読取では、英語で記載されている帳票の読取にも対応しております。日本語特化読取でもアルファベットは読める場合が多いですが、スペースは読めないため、英語帳票の読取は汎用読取でのご利用をご検討ください。
また読み取りたい項目を設定する際に、英語で設定できますが、日本語でも項目や追加指示を設定し、読み取ることは可能です。
==============================================================
Q. 項目抽出に搭載しているAIのモデルを教えてください。
A. 搭載している具体的な生成AIの名前は非公開となります。
==============================================================