OCR演算法識別率怎麼評估?

時間 2021-06-09 19:22:12

1樓:易道博識

我解釋的簡單一點吧。

同一OCR演算法對於不同質量的樣本的識別率是不一樣的,影象清晰的印刷掃瞄件的識別率絕對比手寫體的識別率要高,這是肯定的,在不說明樣本的前提下評估單個OCR演算法識別率沒有實質意義。所以要評估OCR演算法應該是要做幾種演算法之間的對比。

那麼這個對比怎麼做呢?從實際應用的角度來說,通常是採用這樣的步驟。

首先,要準備好一批足夠有區分度的樣本,就是樣本質量的偏差要大一些,有好有壞,這樣才能檢測出不同演算法的優劣。

然後,看可識別字元的比例。如果有質量過低的樣本,OCR識別可能是不輸出結果的,所以要考慮哪些演算法對影象的寬容度更高。

接下來才是統計準確率。在準確率的統計上也有幾種不同的標準。

第一種是字元準確率,單字識別率,就是按單字算,一百個字裡錯5個字,識別率95%。

第二種是字段準確率,整行識別率,乙個欄位算乙個整體,假如100個字分為20個字段,裡面錯了5個字,分布在4個字段裡,那麼識別率是16/20=80%。

第三種是整張準確率。通常在票據證件裡面有這種計算方式,假設一張票據上有20字,4個字段,5張票上100個字,20欄位,錯了5個字,分布在4個字段裡,分布在3張票據上。那麼識別率只有2/5=40%。

而且票據欄位越多,容易出錯的概率越高,整張識別率這個要求就越嚴苛。實測過程中也會有一些特別約定,說整張識別裡錯一兩個字可以忽略的,這種再另說。

同樣是錯5個,用字元、字段、整張準確率來測算的結果是完全不同的,所以對比不同OCR演算法時候一定要看清描述的是單字識別率、整行識別率還是整張識別率。一樣的識別率99%,整張識別率可比單字識別率的含金量要大得多。

OCR文字識別用的是什麼演算法?

鳳舞九天 之前做過兩年多的ocr,這裡簡單寫一下,主要講進入深度學習時代的演算法方案。純粹的OCR主要分兩種,一種是檢測 識別兩階段,還有一種是檢測識別一起端到端來做。據我了解,穩定演算法大多還是基於檢測識別兩階段來做的。鳳舞九天 Ocr 檢測入門演算法 之前兩年多主要是做識別,目前識別,特別是中文...

深度學習ocr識別準確率高的演算法是哪些

學而時習 baseline可以是crnn ctc stn酌情加 高階可以global attention ce再高階可以local attention 再高階可以dynamically refine kernel再高階可以multi loss 再高階可以nas 再高階可以gan 以上還只是說的模型結...

圓的識別演算法有哪些?

圓的識別在影象處理裡面屬於比較基礎的問題,有很多的演算法都可以用來進行圓的識別,其中比較常用的主要有 Circular Hough Transform CHT CHT屬於圓的檢測裡面最基本一類演算法,已經存在了好幾十年了,它基於的理論就是任何乙個圓都必須滿足 x a 2 y b 2 r 2這個基本公...