手寫數(shù)字識別的原理及應用
一、引言
手寫數(shù)字識別是“光學字符識別技術”(簡稱OCR)的一個分支,它研究的對象是:如何利用電子計算機自動辨認人手寫在紙張上的阿拉伯數(shù)字。
在整個OCR領域中,最為困難的就是脫機手寫字符的識別。到目前為止,盡管人們在脫機手寫英文、漢字識別的研究中已取得很多可喜成就,但距實用還有一定距離。而在手寫數(shù)字識別這個方向上,經(jīng)過多年研究,研究工作者已經(jīng)開始把它向各種實際應用推廣,為手寫數(shù)據(jù)的高速自動輸入提供了一種解決方案。
二、研究的實際背景
字符識別處理的信息可分為兩大類:一類是文字信息,處理的主要是用各國家、各民族的文字(如:漢字、英文等)書寫或印刷的文本信息,目前在印刷體和聯(lián)機手寫方面技術已趨向成熟,并推出了很多應用系統(tǒng);另一類是數(shù)據(jù)信息,主要是由阿拉伯數(shù)字及少量特殊符號組成的各種編號和統(tǒng)計數(shù)據(jù),如:郵政編碼、統(tǒng)計報表、財務報表、銀行票據(jù)等等,處理這類信息的核心技術是手寫數(shù)字識別。這幾年來我國開始大力推廣的“三金”工程在很大程度上要依賴數(shù)據(jù)信息的輸入,如果能通過手寫數(shù)字識別技術實現(xiàn)信息的自動錄入,無疑會促進這一事業(yè)的進展。因此,手寫數(shù)字的識別研究有著重大的現(xiàn)實意義,一旦研究成功并投入應用,將產(chǎn)生巨大的社會和經(jīng)濟效益。
三、研究的理論意義
手寫數(shù)字識別作為模式識別領域的一個重要問題,也有著重要的理論價值:
1、阿拉伯數(shù)字是唯一的被世界各國通用的符號,對手寫數(shù)字識別的研究基本上與文化背景無關,這樣就為各國、各地區(qū)的研究工作者提供了一個施展才智的大舞臺。在這一領域大家可以探討,比較各種研究方法。
2、由于數(shù)字識別的類別數(shù)較小,有助于做深入分析及驗證一些新的理論。這方面最明顯的例子就是人工神經(jīng)網(wǎng)絡,相當一部分的人工神經(jīng)網(wǎng)絡模型都以手寫數(shù)字識別作為具體的實驗平臺,驗證理論的有效性,評價各種方法的優(yōu)缺點。
3、盡管人們對手寫數(shù)字的識別已從事了很長時間的研究,并已取得了很多成果,但到目前為止機器的識別本領還無法與人的認知能力相比,這仍是一個有難度的開放問題。
4、手寫數(shù)字的識別方法很容易推廣到其它一些相關問題,一個直接的應用是對英文這樣的拼音文字的識別。事實上,很多學者就是把數(shù)字和英文字母的識別放在一塊兒研究的。
四、基于手寫數(shù)字識別的典型應用
手寫數(shù)字識別有著極為廣泛的應用前景,這也正是它受到世界各國的研究工作者重視的一個主要原因。下面我們將介紹基于手寫數(shù)字識別的應用系統(tǒng)的特殊要求,以及一些以手寫數(shù)字識別技術為基礎的典型應用。
(一) 手寫數(shù)字識別在大規(guī)模數(shù)據(jù)統(tǒng)計中的應用
在大規(guī)模的數(shù)據(jù)統(tǒng)計(如:行業(yè)年鑒、人口普查等)中,需要輸入大量的數(shù)據(jù),以前完全要手工輸入,則需要耗費大量的人力和物力。近年來在這類工作中采用OCR技術已成為一種趨勢。
因為在這種應用中,數(shù)據(jù)的錄入是集中組織的,所以往往可以通過專門設計表格和對書寫施加限制以便于機器的自動識別。目前國內的大多數(shù)實用系統(tǒng)都要求用戶按指定規(guī)范在方格內填寫。另外,這些系統(tǒng)往往采用合適的用戶界面對識別結果做全面的檢查,最終保證結果正確無誤。可以看出,這是一類相對容易的應用,對識別核心算法的要求比較低,是目前國內很多單位應用開發(fā)的熱點。
(二) 手寫數(shù)字識別在財務、稅務、金融領域中的應用
財務、稅務、金融是手寫數(shù)字識別大有可為的又一領域。隨著我國經(jīng)濟的迅速發(fā)展,每天等待處理的財務、稅務報表、支票、付款單等越來越多。如果能把它們用計算機自動處理,無疑可以節(jié)約大量的時間、金錢和勞力。與上面提到的統(tǒng)計報表處理相比,在這個領域的應用難度更大,原因有:1、對識別的精度要求更高;2、處理的表格往往不止一種,一個系統(tǒng)應能智能地同時處理若干種表格;3、由于處理貫穿于整個日常工作之中,書寫應盡量按一般習慣(如:不對書寫者的寫法做限定,書寫時允許寫連續(xù)的字串,而不是在固定的方格內書寫),這樣對識別及預處理的核心算法要求也提高了。
(三) 手寫數(shù)字識別在郵件分揀中的應用
隨著人們生活水平的提高,經(jīng)濟活動的發(fā)展,通信聯(lián)系的需求使信函的互換量大幅度增加,我國函件業(yè)務量也在不斷增長,預計到2000年,一些大城市的中心郵局每天處理量將高達幾百萬件,業(yè)務量的急劇上升使得郵件的分揀自動化成為大勢所趨。在郵件的自動分揀中,手寫數(shù)字識別(OCR)往往與光學條碼識別、人工輔助識別等手段相結合,完成郵政編碼的閱讀。目前使用量最大的OVCS分揀機的性能指標:OCR拒分率30%,OCR分揀差錯率1.1%。
五、手寫數(shù)字識別技術展望
隨著國家信息化進程的加快,手寫數(shù)字識別的應用需求將越來越廣泛,因此應當加強這方面的研究工作。作者認為,應用系統(tǒng)的性能的關鍵與瓶頸仍然在于手寫數(shù)字識別核心算法性能上,最終目標是研究零誤識率和低拒識率的高速識別算法。此外,盡早建立反映中國人書寫習慣的、具有國家標準性質的手寫數(shù)字樣本庫也是當務之急。
[上一頁] [下一頁]
|