《趙城藏》校編啓示
我們清楚地意識到,《趙城藏》電子文本的製作不僅是一項功德無量的宏大工程,同時也是一項涉及計算機技術、軟件開發、文字處理、傳統校對、組織聯絡、項目管理等多方面的系統工程。可以這樣說,在我們啓動工作至今叁年多的時間裏,我們是在不斷地克服困難、不斷地學習中摸索著前進。
電子版《趙城藏》的製作包含著叁個不可缺少的環節,一是錄文,二是校對和斷句,叁是檢索系統的設置。第叁個方面因工作剛開始啓動,還沒有成爲工作的重心。
我們遇到的第一個問題就是錄文。我們原以爲對慧海中心來說這不應該成爲問題,因爲慧海在這方面已經有十余年的經驗,我們擁有十幾位在電腦錄文崗位上工作了近10年的操作員,但實際情況卻出乎我們的意外,《趙城藏》原本中出現的大量手寫字、異體字、通假字、生僻字等都打不出來,因而使我們的錄文工作舉步維艱。
我們提出的第一個解決方案是:將錄文過程中打不出來的字一律檢出存檔,製作成字表,然後轉換爲規範體繁體字;無法轉換的生僻字則采用造字或組字法處理。但這種辦法不僅給錄入人員,也給之後的校對工作帶來麻煩。在這種情況下,校對人員要求我們製定統一的校對標准。2006年10月,經過反複研究之後,在慧海中心召開的一次專家研討會上統一了認識,最終確定了以原藏字形爲標准的校對原則,錄文和修改也都遵循這一原則。這樣,又回到了起點,所有的難題又集中在如何處理電腦無法錄入的那些字的問題上。這時,我們得到了中華佛典寶庫網站在軟件技術方面的指點與幫助,在他們的指導和幫助下,我們采用了Unicode字庫及寶庫專爲佛典電子化錄入研發的菩提五筆輸入法。
製作《趙城藏》電子文本,疑難字問題給我們帶來很大困擾,同時也給我們帶來不小的收獲。製作過程中遇到無法輸出的字形,我們會隨時記錄該字在原稿中的具體位置(如出自哪部經書,具體位于第幾卷、第幾頁、第幾欄、第幾個字等),便于日後查核。同時,我們會查閱各種辭典與工具書,盡量找到與該字對應的通用字,也一起記錄下來,並製成電子表格。最重要的是,每個字在原藏中的不同字形都能集中反映出來。暫時無法輸入的字形,截取原藏圖形記錄下來,避免了抄寫時的錯誤和變形,而且更能反映字形原貌。經過叁年多的積累,我們的疑難字表內容已經相當豐富,其中包括疑難字的截圖,在原藏中的位置,以及它所對應的通用字等。這份字表可以按讀音或輸入法排序。目前我們已經收錄2270個疑難字。
五個校次的工作分別由不同的校對者承擔。承擔初校者中有招聘的專門校對人員,但多數是在網上結交的熱心于弘傳佛法的志工,他們分布于全國各地,已經形成北京、上海、沈陽、長春、大連等志工校對小組。文字叁個校次的任務是校出錄文中打錯的字詞及一切與掃描本不相符合的地方。標點斷句二個校次請具有一定古文基礎和佛教知識的人士參加,校對人員多爲北京高校佛教及文科專業的研究生及佛學業余愛好者。他們的任務是給經文加句讀,即用“。”這一個標點符號對經文進行標點。這是電子版《趙城藏》新增加的內容,也是一種大膽的嘗試。最後的定稿,我們邀請佛教專業的學者來承擔任務。
確立了以原藏字形爲標准的校對原則後,我們還製定了更爲嚴謹的質量管理措施:
一、抽校。五個校次均有抽校跟蹤,不合要求者退回重校,或請他人再校。
二、核紅與抽核。修改人員要改正紅樣中的每個錯誤,原稿不清之處要找資料查證核實。在發放校樣修改時,負責人員先在工作記錄表中進行經名、操作方式、發放時間、修改人登記,並交代、督促修改人認真收集、總結疑難字形,製成表格,作爲該經的文字信息資料存檔。同時,在修改中發現原藏有錯、脫、倒、衍等問題時,及時集中在加注信息表中,以備需要時摘用。文稿修改好後,連同文字信息表、加注信息表交與負責人員以備抽核。文字叁個校次修改稿,一般按稿件的十分之一進行抽核,錯改率不得超過萬分之一,字形漏改不得超過萬分之叁,否則,即返給修改人重改;終審稿要全篇核紅,確保每一個標紅處都准確無誤地修改過。有了這些管理措施,校對文稿的質量也就有了保證。
除了校對文字,還有一個問題,就是斷句,斷句工作難度很大。日本《大正藏》開大藏經斷句之先河,給讀者讀經提供了極大的方便,影響很大,但《大正藏》的錯斷之多也曾帶來學界朋友的批評。
爲了保證電子版《趙城藏》的斷句質量,我們對參與斷句的校對人員和志工提出一些具體的要求,爲了防止錯斷,我們提出“甯粗勿錯”的原則,即在斷與不斷無法確定的情況下甯可不斷等。
電子版《趙城藏》工程已走過了叁年多的路程,我們是在克服重重困難中走到了今天。我們知道,在今後的幾年裏,還有更多新的難題需要我們去解決,比如即將面臨的經文中悉曇字的錄入問題,我們還沒有找到解決方法,雖然已經有了悉曇字庫,但卻沒有相應的輸入法;我們還面臨著檢索系統的設置等許多問題。就是說,我們要學習的東西還很多,但我們有信心,在佛教界和學術界朋友們的支持下,在預定的時間裏完成全部工程,向佛教界和學術界展示一份可以在電腦上兼容並國際通行的電子版《趙城藏》的成果,以追趕國際佛典電子化的潮流。