RPAとセット活用でよく紹介されるAI-OCRのDX Suiteですが、設定の仕方についていろんなところから同じような設定に関する質問を受けることが多いなと思ったので紹介してみる。
?読取条件の指定で「チェックボックス」を選ぶ
ここは基本操作なのでみんなわかってるトコだよね。
「チェックボックス」で0 or 1でチェック状況が取得できる。
なんだけど、これをそのまま使っちゃうと例えばこんな項目の場合↓↓↓
何も知らずにそれぞれ設定入れると、こんなCSVになりますよね。
項目の無駄が多い。これは良くないネ?
?選択項目をひとかたまりにして「読取範囲の設定」する
まずは読取範囲をまとめて選択するようにする。
そして、読取範囲の詳細設定で横:2を設定する
で、それぞれの読取条件の指定を「チェックボックス」にすると
0|0
みたいな感じで「|(パイプ)」で区切った形でデータが取れるようになります。
?ユーザ辞書設定を追加する
右上のアカウントメニューから「設定」-「ユーザ辞書設定」を選択。
ユーザ辞書設定の「新規登録」から辞書を作成していく。
ユーザ辞書は、「参照キー」に合致する読取結果だった場合に値1~3で定義した値にデータを置き換えしてくれる機能です。
参照キー | 値1 | 値2 | 値3 |
---|---|---|---|
0|0 | |||
1|0 | 新規 | ||
0|1 | 変更 |
こんな風に定義すれば、さっき作ったひとかたまりの読取項目の設定で0 or 1の読取結果を新規 or 変更という文字で出力されるように変換できそうですね。
?辞書設定を項目に設定する
ユーザ辞書を読取項目に設定する箇所って、2か所あります。
?[読取範囲の詳細設定] - [辞書設定]から行う方法
読取範囲の詳細設定から設定を行うと、エントリーの画面に進むときにはすでに辞書変換された状態で出力内容が確認できます。
また、エントリーで修正した内容を辞書に自動追加するオプションもあったりします。
?[データ加工設定] - [ユーザ辞書一致処理]を使う方法
データ加工設定は画像解析による読取処理が終わった後、CSVダウンロードする直前に処理が行われます。
過去の読取ユニットでも、定義を編集してデータ加工設定いじっちゃうとCSVダウンロードした時のファイルの取れ方変わってしまうので要注意です。
今回は、2項目を結合した結果を使って変換したいので[データ加工設定]を使うわけですね。
?おまけ
この設定でユーザ辞書作るのは結構便利なんですが、0|0とか0|0|0ってすぐ参照キー被りしちゃいますよね。
そんな時は、値2、値3の設定項目を使ってユーザ辞書の変換値を切り替えてあげましょう?
こんな感じで、よくある「都・道・府・県」とか「当座・普通」とか「昭和・平成・令和」とかも変換してしまいましょう?