Resources

教學資源

書寫的方式

"無論是將書本內容掃描並輸入文字處理軟體中、將個人數位助理(PDA)螢幕上的手寫文字儲存到試算表內,以及解讀字跡潦草的表格或信封上的郵遞區號等,都是以軟體將印刷或手寫字跡轉換成數位文件…… "


撰文╱菲謝蒂〈Mark Fischtti〉
翻譯/王怡文

 

  無論是將書本內容掃描並輸入文字處理軟體中、將個人數位助理(PDA)螢幕上的手寫文字儲存到試算表內,以及解讀字跡潦草的表格或信封上的郵遞區號等,都是以軟體將印刷或手寫字跡轉換成數位文件,以便加以編輯、儲存、寄送電子郵件,或讓高速機器決定信件目的地。

 

  這種軟體最初名為光學文字辨識(OCR),如今此用詞專門指印刷頁面的辨識,而手寫印刷體或草書的分析技術則稱為智慧型文字辨識。無論程式被貼上什麼標籤,它們都是用類似的演算法來計算字跡特徵(見右圖),然後比對字跡特徵和數學模型,以判斷該字跡最近似哪個字母或數字。

 

  用筆在PDA上手寫的文字,也許最容易判別,因為數位筆或螢幕可以追蹤筆尖的移動。分析紙上的印刷或手寫字跡就困難多了,原因正如美國馬里蘭大學語言與媒體處理實驗室共同主任多爾曼(David Doermann)所言:「因為你必須從靜態影像裡粹取出資訊、清除雜訊,然後辨識出字母。」其中最難解讀的,仍然是有無限可能性的草書,多爾曼說:「目前還沒有商業成果。」

 

  數年前,文字辨識技術只有一、兩種比對簡單樣式的演算法可用;現在的軟體則運用多種演算法,並針對得到的結果進行評分或投票,以做出最後決定。此外,美國麻州柏林頓的紐昂斯溝通公司(Nuance Communications)技術主任史崔頓(Allan Stratton)表示:「舊的軟體轉換一頁要花上數分鐘,新軟體只須花幾秒鐘。」紐昂斯公司就是文件轉換程式OmniPage的生產廠商。

 

  為阿拉伯文、日文與中文設計辨識系統的廣泛研究也已經上路,這些語文的筆畫能代表完整的字,而非只是字母。數位相機和手機也開始採用辨識軟體,如此便能像史崔頓所想像的:「只要為文件拍張照片,然後就能用電子郵件或簡訊傳送其中的文字。」

 

【本文轉載自《科學人雜誌》2007年7月號】