30. 核ボタン握るボケプー[38] imqDe4Neg5OIrILpg3uDUIN2gVs 2024年2月03日 23:00:28 : IpfRCDUvts : SUF5NTdJYXNoRlU=[1]
>技術は進歩しますのでね。
その通りですね。97〜98%は、私の5年前の書物から引いた数字でしたが今検索してみると、
(おそらく平均的に)「AI OCRの手書き文字認識率は 99.91 %とかなり高い識字率を誇っており・・・」
のようです。具体的には、
・AnyFormOCR の特徴: 株式会社ハンモックが提供する、99.97 %の文字認識度を誇る AI OCRです。
・eas の特徴: 文字認識精度が驚異の 99.98 %
・egaki の特徴: 文字認識率 99.2 %とトップクラス
出典(各社の特徴をまとめたサイト)
https://gozal.cc/basics/ss-aiocr-comparison
※ NTT東日本、キャノン、東芝・・・ など国内有力メーカーの機種の識字率は今回は探れませんでした。
>一文字で98%ならば、4文字の票に対しては、0.98^4=0.92、つまり92%ですね。
確かに論理的にはその通りだと思いますが、AI での処理は、バッチ(例えば 10文字とか 100文字の単位)で行うので、10文字とか 100文字とかのインプットに対するアウトプットの正答率が「99.97%」あるのだと思います。人名が5文字とすると、投票用紙の5文字を一気にOCRで読み込んで、ニューラルネットワークで処理します。
人名 入力層 中間層 出力層(認識した人名)
〇 ─→ □ …… □ …… □ ┐
〇 ─→ □ …… □ …… □ |
〇 ─→ □ …… □ …… □ ├ この正答率が 99.97 %
〇 ─→ □ …… □ …… □ |
〇 ─→ □ …… □ …… □ ┘
例えば数字なら、1文字に 28 × 28 = 784 pixel の1つの画像を割り当てます。5文字なら、これを5枚並べて 3,920 pixelの1画像として扱う訳です。投票用紙の読取りの場合、予め5人の候補者の氏名を手書きした画像を OCR に読み込ませて、AIニューラルネットワークを動かして正しく識別できるように学習させます。つまり、その出力パターンと正解パターンを突き合わせ、そのズレが最小となるように各ピクセルの出力値(0, 1)を反復調節してネットワーク係数を決定する訳です(最適化)。この反復学習は何十万回に及びます。
それで 99.97%の高い正答率を引き出しているのだと思います。(ディープラーニング)
http://www.asyura2.com/24/senkyo293/msg/195.html#c30