OCR演算法識別率怎麼評估？

1樓：易道博識

我解釋的簡單一點吧。

同一OCR演算法對於不同質量的樣本的識別率是不一樣的，影象清晰的印刷掃瞄件的識別率絕對比手寫體的識別率要高，這是肯定的，在不說明樣本的前提下評估單個OCR演算法識別率沒有實質意義。所以要評估OCR演算法應該是要做幾種演算法之間的對比。

那麼這個對比怎麼做呢？從實際應用的角度來說，通常是採用這樣的步驟。

首先，要準備好一批足夠有區分度的樣本，就是樣本質量的偏差要大一些，有好有壞，這樣才能檢測出不同演算法的優劣。

然後，看可識別字元的比例。如果有質量過低的樣本，OCR識別可能是不輸出結果的，所以要考慮哪些演算法對影象的寬容度更高。

接下來才是統計準確率。在準確率的統計上也有幾種不同的標準。

第一種是字元準確率，單字識別率，就是按單字算，一百個字裡錯5個字，識別率95%。

第二種是字段準確率，整行識別率，乙個欄位算乙個整體，假如100個字分為20個字段，裡面錯了5個字，分布在4個字段裡，那麼識別率是16/20=80%。

第三種是整張準確率。通常在票據證件裡面有這種計算方式，假設一張票據上有20字，4個字段，5張票上100個字，20欄位，錯了5個字，分布在4個字段裡，分布在3張票據上。那麼識別率只有2/5=40%。

而且票據欄位越多，容易出錯的概率越高，整張識別率這個要求就越嚴苛。實測過程中也會有一些特別約定，說整張識別裡錯一兩個字可以忽略的，這種再另說。

同樣是錯5個，用字元、字段、整張準確率來測算的結果是完全不同的，所以對比不同OCR演算法時候一定要看清描述的是單字識別率、整行識別率還是整張識別率。一樣的識別率99%，整張識別率可比單字識別率的含金量要大得多。