書寫的方式

"無論是將書本內容掃描並輸入文字處理軟體中、將個人數位助理（PDA）螢幕上的手寫文字儲存到試算表內，以及解讀字跡潦草的表格或信封上的郵遞區號等，都是以軟體將印刷或手寫字跡轉換成數位文件…… "

撰文╱菲謝蒂〈Mark Fischtti〉
翻譯／王怡文

　　無論是將書本內容掃描並輸入文字處理軟體中、將個人數位助理（PDA）螢幕上的手寫文字儲存到試算表內，以及解讀字跡潦草的表格或信封上的郵遞區號等，都是以軟體將印刷或手寫字跡轉換成數位文件，以便加以編輯、儲存、寄送電子郵件，或讓高速機器決定信件目的地。

　　這種軟體最初名為光學文字辨識（OCR），如今此用詞專門指印刷頁面的辨識，而手寫印刷體或草書的分析技術則稱為智慧型文字辨識。無論程式被貼上什麼標籤，它們都是用類似的演算法來計算字跡特徵（見右圖），然後比對字跡特徵和數學模型，以判斷該字跡最近似哪個字母或數字。

　　用筆在PDA上手寫的文字，也許最容易判別，因為數位筆或螢幕可以追蹤筆尖的移動。分析紙上的印刷或手寫字跡就困難多了，原因正如美國馬里蘭大學語言與媒體處理實驗室共同主任多爾曼（David Doermann）所言：「因為你必須從靜態影像裡粹取出資訊、清除雜訊，然後辨識出字母。」其中最難解讀的，仍然是有無限可能性的草書，多爾曼說：「目前還沒有商業成果。」

　　數年前，文字辨識技術只有一、兩種比對簡單樣式的演算法可用；現在的軟體則運用多種演算法，並針對得到的結果進行評分或投票，以做出最後決定。此外，美國麻州柏林頓的紐昂斯溝通公司（Nuance Communications）技術主任史崔頓（Allan Stratton）表示：「舊的軟體轉換一頁要花上數分鐘，新軟體只須花幾秒鐘。」紐昂斯公司就是文件轉換程式OmniPage的生產廠商。

　　為阿拉伯文、日文與中文設計辨識系統的廣泛研究也已經上路，這些語文的筆畫能代表完整的字，而非只是字母。數位相機和手機也開始採用辨識軟體，如此便能像史崔頓所想像的：「只要為文件拍張照片，然後就能用電子郵件或簡訊傳送其中的文字。」

【本文轉載自《科學人雜誌》2007年7月號】

本期精彩推薦

普高龍騰

技高龍騰

數位產品

App

Resources

教學資源

書寫的方式