
レシートOCRを使ったキャンペーンの現状と課題
今回は、最近お問い合わせの多いレシートOCRを使ったキャンペーンの現状と課題についてご紹介します。レシートOCRについて興味関心の高い方、キャンペーンで利用してみたいと思われる方も多いかと思われます、ぜひ参考にしてもらえれば幸いです。
レシートOCRとは?
レシートOCRとは、レシートに記載された文字や数字をデータとして読み取る技術のことです。
OCRは「Optical Character Recognition」(光学文字認識)の略で、カメラなどで撮影した画像を解析して文字を認識します。
レシートOCRは、このOCR技術をレシートに特化させたものです。
レシートOCRの3つのステップ
レシートOCRの基本的な仕組みは、以下の3つのステップから成り立っています。
- 前処理
スマートフォンのカメラなどでレシートを撮影します。この画像を解析し、傾きを補正したり、明るさを調整したりして、文字がはっきり見えるように画像を整えます。 - 文字認識(OCR)
整えられた画像に対して、OCR技術を使って文字を認識します。この際、「日付」「合計金額」「商品名」といった意味も同時に認識しようとします。 - 情報の抽出と構造化
認識された文字情報から、AI(人工知能)が店舗名、日付、合計金額、購入品目などの必要な情報を抽出します。抽出した情報は、データベースなどで扱いやすい形式に変換されます。
レシートOCRを利用した購入キャンペーンの例
レシートOCRを利用したキャンペーンの例をいくつかご紹介いたします。
例1:特定ジャンルの商品まとめ買いキャンペーン
「飲料メーカーAの清涼飲料水を3本以上購入して応募すると、抽選で●●が当たる」といったキャンペーンです。レシートOCRは、レシート画像から「飲料メーカーA」の製品名を認識し、購入した品目数を自動でカウントします。また、購入日や店舗名も自動で読み取ります。
■ポイント
- 商品特定の手間が少ない
「大手メーカーA 製品ブランド名」など、ブランド名や商品名が比較的統一されている商品ジャンルは、OCRが認識しやすい傾向にありますが、各POS側の問題で難しいのが現状です、こちらは後で詳しく解説します。 - 正確な数量把握が行いやすい
OCRは、同じ商品が複数回記載されていても、その数量をカウントできます。これにより、消費者が手動で入力する手間や、入力ミスによるトラブルを減らすことができます。 - 不正防止対策
複数回応募を防ぐために、OCRでレシートのユニークな情報(例:取引番号、時刻)を読み取り、同じレシートが再利用されていないかチェックできます。
例2:一定金額以上の購入で応募できるキャンペーン
「スーパーBで1,000円(税込)以上購入したレシートで応募すると、全員に100円のクーポンをプレゼント」といったキャンペーンです。レシートOCRは、レシート画像から合計金額(税込)を自動で読み取り、応募条件を満たしているか瞬時に判定します。
■ポイント
- 合計金額の認識精度が高い
レシートの合計金額は、多くのレシートで「合計」「総合計」「TOTAL」などの文字と一緒に、太字や大きな文字で記載されていることが多く、OCRが認識しやすい情報です。 - 製品の特定が不要
このキャンペーンの場合では、購入した商品ジャンルを問わないため、個々の商品名を細かく認識する必要がありません。これにより、製品名の表記揺れによる誤認識のリスクを回避できます。 - 応募のハードルが低い
応募者は、金額を満たしていれば、どの商品を買っても応募できるため、キャンペーンへの参加が促進されます。OCRが自動で金額を読み取ることで、手動入力の手間が完全に省けます。
このようなキャンペーンにレシートOCRは活用できますが、実際に行う際にはまだまだ問題が多いのが現状です。それらについて詳しく解説いたします。
レシートOCRの主な問題点
レシートOCRは非常に便利な技術で、以前に比べ格段に読取制度は高くなっております、ベンダーによっては読取率9割以上を謳うところサービスもあるくらいです。一方で購入店舗の特定と製品情報の特定には、いくつかの大きな課題を抱えています。
1.購入店舗の特定が難しい
理由1:店舗名の表記揺れがあると特定できない
レシートに記載される店舗名は、チェーン店であっても表記が一定ではない場合が多いです。「●●スーパーAAA店」と書かれていたり、「スーパー●● AAA店」と書かれていたり、POS・レジスターによっては「●●-スーパー」とハイフンが入ることもあります。AIがこれらを同じ「●●スーパーAAA店」と認識するには、複雑な学習が必要です。
理由2:ロゴ画像からの特定はできない
レシート上部に印刷された店舗のロゴは、文字ではなく画像ですのでOCRで文字認識ができません。このため、ロゴから店舗を特定する技術はまだ発展途上であり、店舗名を特定する事が出来ません。
理由3:電話番号が確実な情報
そのため、レシートに記載される情報の中で、店舗を一意に特定できる最も確実な情報の一つが電話番号です。多くのレシートOCRサービスは、レシートOCRで読み取った電話番号を、レシートOCRサービスの持つ店舗データベースと照合することで、正確な店舗名を特定しています。
つまり、電話番号があれば、店舗名が不正確でも、正確な店舗名を特定できる可能性が高くなります。逆に、電話番号の記載がないレシートや、読み取りエラーで電話番号が認識できない場合、正確な店舗を特定することは非常に困難になります。
2.製品情報の特定が難しい
理由1:製品名の表記の揺れがあると特定できない
レシートに記載される製品名は、多くの場合、製造企業の正しい製品名とは異なる略称で印字される事が多いです。例えば、「●●食品 和菓子」が「●●ショクヒン ワガシ」とカタカナで表記されたり、「菓子類 和菓子」「菓子類」「カシルイ」と一般名称や略称で記載されたりします。この表記揺れが、製品を正確に特定する上で大きな障害となります。
理由2:販売価格からの特定も難しい
表示製品名と価格の組み合わせで製品を特定しようとすると、同じ価格で複数の商品が販売されている場合に誤認識のリスクが高まります。例えば、100円のパンが複数種類ある場合、レシートOCRは「100円のパン」としか認識できず、どの種類のパンかまでは特定できません。
理由3:JANコードの数値の記載が重要
製品を一意に特定できる「製品JANコード(バーコード)」は、レシートに数値として記載されている場合があります。レシートOCRは、このJANコードの数値を文字として読み取り、対象製品データベースと照合することで、正確な製品情報を特定することができます。したがって、レシートOCRが読み取るJANコードの数値が、製品特定において最も信頼性の高い情報となります。
しかしここで起こる問題は、多くのレシートにJANコードの数値が記載されていない事です。大手チェーン店さまのレシートには記載がある事が多いですが、中小企業さまや個人商店さまの発行するレシートにはJANコードが含まれていない場合が大変多いです。JANコードが数値として記載されていなければ、OCRでは製品をJANコードから特定することは原理的に不可能です。
このように現在各社より提供されているレシートOCRサービスには、読取精度そのものではなく情報の構造化の部分でまだ多くの課題が残されているのが現状です。
解決策と今後の展望
これらの問題を解決するためには、以下のようなアプローチが考えられます。
AIとデータベースとの連携、構造化の強化
レシートOCRで読み取った情報を、あらかじめ用意された店舗名や商品名のデータベースと照合する精度を高める必要があります。例えば、AIが「●●ショクヒン ワガシ」と読み取ったら、データベース内の「●●食品 和菓子」と自動で紐づける仕組みを構築します。これらはサービスベンダーの今後のアップデートで実現可能かと思われます。
JANコードの記載ができないかを確認する
店舗側がレシートにJANコードの数値を印字する仕組みを導入すれば、製品の特定精度は劇的に向上します。ただし、これには小売店さまの協力が必要となりますので実現のハードルは高くなります。
レシートOCRを使いやすいキャンペーンの設計を行う
レシートOCRを使うキャンペーンの応募条件を「購入金額」「日付」のみに限定し、店舗名や商品名を厳密に特定する必要のない設計にする、または「特定の店舗のみ」や「電話番号とJANコードが含まれているレシートのみ受け付け」に制限することも一つの解決策です。
そもそもレシートOCRでないといけないのか?
本ブログのテーマと矛盾するようですが、レシートOCRは確かに便利な機能ですが、読み取りの成否に関わらず、認識処理を実行する毎に費用が発生する場合もございます。また締め切り後に抽選で景品を後日郵送しなければならないなど、行程上に必ず人の手が介入するようなキャンペーン設計の場合は、人間で目視確認を行う方が現状では文字の読取精度やデータの構造化処理が高いため無駄な応募処理が発生しない、またトータルで見ると費用が安い場合もあります。
これらで解決できるようご提案いたしますが、実際のキャンペーンとして実施するにはハードルが難しい場合もございますのでまずはご相談いただければ幸いです。
まとめ
レシートOCRは、私たちの生活を便利にする革新的な技術ですが、購入店舗の特定や、製品情報のJANコードからの特定といった点で、まだまだ多くの課題を抱えています。しかしキャンペーンの設計次第で十分活用いただける技術でもあります。
でもどういうキャンペーン設計にすればよいのか判らないなど、お困りごとがあるかと思います。
キャンフォームでは、外部ベンダーさまと協力して行ったレシートOCRを使ったキャンペーンの事例等も複数ございます。経験豊富なスタッフがキャンペーンに合ったフォームの設定をご提案します。より質が高く応募数の多いキャンペーンのために、キャンパケ・キャンフォームを是非ご活用ください。
今回はレシートOCRを使ったキャンペーンの現状と課題についてご紹介いたしました。
今後とも、“キャンパケ””キャンフォーム”をよろしくお願いいたします!