本站小編為你精心準(zhǔn)備了古籍?dāng)?shù)字化發(fā)展趨勢(shì)參考范文,愿這些范文能點(diǎn)燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。
編者按:本文主要從現(xiàn)狀,存在的問題,“我”需要什么:《四庫(kù)》全文檢索案例分析,趨勢(shì),對(duì)古籍數(shù)字化發(fā)展趨勢(shì)進(jìn)行講述,其中包括:豐富多樣的文件格式,便捷靈活的傳播途徑,網(wǎng)絡(luò)傳播,專用電子書閱讀器,北京大學(xué)劉俊文先生主持的“中國(guó)基本古籍庫(kù)”光盤工程(-/default.htm"TARGET=_blank>-/default.htm),漢文化聯(lián)盟的“漢文化資料庫(kù)”(/"TARGET=_blank>/),內(nèi)容涵蓋歷代重要古籍,按照經(jīng)、史、子、集進(jìn)行分類,精選底本勘校而成,與單純的全文檢索不同,中國(guó)中醫(yī)藥文獻(xiàn)數(shù)字化,“中國(guó)教育科技數(shù)字圖書館”(ChinaEducationandResearchDigitalLibrary,簡(jiǎn)稱CERDLIB)工程,“國(guó)際敦煌學(xué)項(xiàng)目”(TheInternationalDunhuangProject,簡(jiǎn)稱IDP)(idp.bl.uk"TARGET=_blank>idp.bl.uk),選題內(nèi)容重復(fù),分散了數(shù)字化資源開發(fā)的力量,文件格式繁多,造成了閱讀和資料提取的麻煩,隊(duì)伍組織、項(xiàng)目規(guī)劃單調(diào),導(dǎo)致了產(chǎn)品開發(fā)缺乏連續(xù)性,信息容量,顯示模式,檢索模式,進(jìn)行講述,等。具體材料請(qǐng)?jiān)斠姡?/p>
題記:這是我2002年9月參加“漢文化聯(lián)盟”第二屆漢文化資料庫(kù)國(guó)際學(xué)術(shù)研討會(huì)提交的論文。近因人索要,網(wǎng)上未見下載,故刊于此。
原文寫作之時(shí),正值google被封,隨后又逢“七一”,搜羅資料頗為不便,故文章最后一部分沒有最后完成。特別抬出羅先生一文,實(shí)行文需要,非謂筆者對(duì)此無有所思也。事過境遷,目今焦頭爛額,已無心再去“遐想”當(dāng)年了。載文網(wǎng)上,聊示紀(jì)念而已
數(shù)字圖書館(電子圖書館、虛擬圖書館)和大型電子文獻(xiàn)資料庫(kù)的開發(fā)和建設(shè),近年來業(yè)已成為學(xué)術(shù)界和相關(guān)技術(shù)部門的一個(gè)熱門話題。在這個(gè)話題中,古籍的數(shù)字化也得到了高度重視。并且,伴隨著一些重要產(chǎn)品的發(fā)行,數(shù)字化的古籍在學(xué)術(shù)研究中的利用率也在不斷提高。而古籍?dāng)?shù)字化的價(jià)值,也正是在這樣的使用中一點(diǎn)一點(diǎn)體現(xiàn)出來。
然而,僅就筆者個(gè)人的專業(yè)應(yīng)用來看,古籍?dāng)?shù)字化在技術(shù)處理和用戶的使用需求之間仍然有一些距離。即擬對(duì)此談一點(diǎn)粗淺的看法,供有興趣者參考。因筆者對(duì)中國(guó)大陸以外地區(qū)的相關(guān)產(chǎn)品了解很少,取例有所偏重,尚祈讀者諒之。
一、現(xiàn)狀一瞥
目前古籍的數(shù)字化可謂“繁花似錦”,除專門的制作公司外,一些單位和個(gè)人也投放了不少注意力,并且也確實(shí)在各自的工作領(lǐng)域取得了一些重要成果。茲據(jù)筆者涉獵所及,將相關(guān)情況略述如下:
(一)豐富多樣的文件格式
從文件格式上來看,目前的數(shù)字化古籍除常見的txt、doc、html格式外,還有exe、pdf、wdl、pdg、ebk、edb等。
1.exe格式。所見有秦昌榮(秦堤居士)的“家庭百寶箱”系列(含諸子百家、二十五史、資治通鑒三種)(中華文史軟件網(wǎng)/"TARGET=_blank>/)。另外,北京天安億友公司(/html/index.htm"TARGET=_blank>/html/index.htm)出品的《二十五史》、《資治通鑒》也包含了這種格式,詳見2688阿里巴巴網(wǎng)站(/product/zmkmdefault.asp"TARGET=_blank>/product/zmkmdefault.asp)的“芝麻開門”圖書系列。
2.pdf格式。所見有紅旗出版社(5051.peoplespace./"TARGET=_blank>5051.peoplespace./)的“家庭藏書集錦”所包含的部分古籍。博庫(kù)(/default.asp"TARGET=_blank>/default.asp)圖書也采用了這種格式。需要pdf格式文件專用瀏覽器,如Adobe公司的AdobeReader、北大方正的ApabiReader。
3.wdl格式。北京華康信息技術(shù)有限公司("TARGET=_blank>)開發(fā)的電子讀物文件格式。所見有博庫(kù)圖書采用了這種格式。它保留了原來的版面設(shè)計(jì),可以在線閱讀,也可以將下載到本地機(jī)閱讀。需要該公司的專用閱讀器DynaDocFreeReader。
4.ebk格式。所見有深圳市百博電子商務(wù)網(wǎng)絡(luò)技術(shù)有限公司的“百博書城”(www.bbook./gb/default.asp"TARGET=_blank>www.bbook./gb/default.asp)圖書使用。書籍可在線閱讀,也可下載到本地。需要百博專用的圖書閱讀器。
5.edb格式。北京天安億友公司開發(fā)的圖書格式(EyousoftDigitalBook)。
6.oeb格式(OpeneBook)。所見有遼寧省出版集團(tuán)開發(fā)的掌上書房(/bottom/aboutus.htm"TARGET=_blank>/bottom/aboutus.htm)使用,有專用閱讀器,也可使用北大方正的ApabiReader閱讀器閱讀。
7.sep、ifr格式。由書生之家(www.21dmedia..cn/zhtsw.asp"TARGET=_blank>www.21dmedia..cn/zhtsw.asp)開發(fā)的電子圖書格式,需要其專用閱讀器來閱讀。
8.xeb格式。以oeb(OpeneBook)為基礎(chǔ),以xml(eXtensibleMarkupLanguage,可擴(kuò)展標(biāo)記語(yǔ)言)技術(shù)為核心的中文電子圖書格式。北大方正的ApabiReader等瀏覽器支持閱讀。
9.pdg格式。超星公司(/"TARGET=_blank>/)開發(fā)的圖書格式。需通過超星專用的圖書瀏覽器閱讀。
10.nlc格式。中國(guó)數(shù)字圖書館(www.d-/index.php"TARGET=_blank>www.d-/index.php)采用的圖書格式,需要其專用瀏覽器NLCReader閱讀。
11.基于unicode(通用多于8位編碼字符集)、倉(cāng)頡碼、Big5碼或其他字符集,以html、xml、sgml等為核心的全方位電子文獻(xiàn)全文檢索格式。這是目前勢(shì)頭最盛、也顯然是更有發(fā)展前途、更具實(shí)用價(jià)值的一種古籍?dāng)?shù)字化形式。臺(tái)灣中央研究院的《漢籍電子文獻(xiàn)資料庫(kù)》(www.sinica.edu.tw/ftms-bin/ftmsw3"TARGET=_blank>www.sinica.edu.tw/ftms-bin/ftmsw3)、香港迪志文化出版公司與上海人民出版社等合作開發(fā)的《四庫(kù)全書》標(biāo)題檢索版和全文檢索版(/"TARGET=_blank>/、"TARGET=_blank>)、北京書同文數(shù)字化技術(shù)有限公司(/html/index.htm"TARGET=_blank>/html/index.htm)開發(fā)的《四部叢刊》等全文檢索版均屬于這種形式。漢文化聯(lián)盟開發(fā)的《漢文化資料庫(kù)》和目前北京大學(xué)正在開發(fā)的《中國(guó)古籍基本庫(kù)》也應(yīng)屬于這種形式。
此外,筆者還見到有位圖形式和多媒體格式的數(shù)字化古籍。前者如濟(jì)南開發(fā)區(qū)匯文科技開發(fā)中心研制、武漢大學(xué)出版社出版發(fā)行的《四庫(kù)全書》原文電子版。后者如方圓電子出版社出版的《中國(guó)古典文學(xué)精品書庫(kù)》(見2688阿里巴巴網(wǎng)站/product/zmkmdefault.asp"TARGET=_blank>/product/zmkmdefault.asp的“芝麻開門”圖書系列),包含了《紅樓夢(mèng)》、《三國(guó)演義》、《西游記》、《初刻拍案驚奇》、《二刻后案驚奇》、《儒林外史》、《醒世名言》、《喻世通言》及《警世恒言》10部古典名著全文,還包含由北京廣播電臺(tái)的播音員配音的唐詩(shī)三百首和中小學(xué)語(yǔ)文教材中的古詩(shī)文,帶聯(lián)機(jī)字典及語(yǔ)音。另外,人民郵電出版社出版("TARGET=_blank>)的《二十五史多媒體全文檢索閱讀系統(tǒng)》也利用了多媒體形式,該產(chǎn)品除收錄百衲本二十四史和關(guān)外二次本《清史稿》的全部?jī)?nèi)容外,還配置了簡(jiǎn)繁字異體字對(duì)照表、古代年表等,附錄了《歷代輿地圖》近2000幅大比例歷史地圖和張?jiān)獫?jì)校輯百衲本二十四史時(shí)所撰《校史隨筆》以及《左傳》、《戰(zhàn)國(guó)策》等多部史學(xué)名著、清至當(dāng)代學(xué)者的部分輯佚與校勘成果。
顯而易見,如此眾多的圖書格式,顯示出中國(guó)古籍?dāng)?shù)字化的途徑非常多樣。而且,也正是通過這些途徑,數(shù)字化了的古籍才快速地進(jìn)入了人們的視野,并為廣大愛好者和專業(yè)學(xué)術(shù)研究人員所注意。
(二)便捷靈活的傳播途徑
從傳播方式上看,除通過磁盤或光盤等介質(zhì)進(jìn)行傳播外,最值得一提的是網(wǎng)絡(luò)方式和正在引起人們關(guān)注的專用電子書閱讀器。
1.網(wǎng)絡(luò)傳播
數(shù)字化的古籍大范圍進(jìn)入研究者的視域,應(yīng)該歸功于網(wǎng)絡(luò)。網(wǎng)上書庫(kù)、網(wǎng)絡(luò)全文檢索、網(wǎng)上圖書館和相對(duì)專業(yè)的個(gè)人網(wǎng)站相得益彰,為專業(yè)研究者提供了古籍電子文獻(xiàn)的不同的使用路徑。
網(wǎng)上書庫(kù)多數(shù)屬于個(gè)人網(wǎng)站。從內(nèi)容不限于古籍的黃金書屋(現(xiàn)地址/"TARGET=_blank>/)、新語(yǔ)絲網(wǎng)上書庫(kù)(/library.html"TARGET=_blank>/library.html)、陳清書齋(/"TARGET=_blank>/)、亦凡公益圖書館(sousuo.shuku./"TARGET=_blank>sousuo.shuku./)、中華古籍(/"TARGET=_blank>/)等等到相對(duì)專門的國(guó)學(xué)網(wǎng)站(/"TARGET=_blank>/),一大批中國(guó)文化的愛好者將一些常用古籍搬上了網(wǎng)絡(luò),對(duì)滿足普通讀者的閱讀和使用需求發(fā)揮了極其重要的作用。此外,一些專業(yè)研究者、學(xué)人集體和研究機(jī)構(gòu)也利用網(wǎng)頁(yè)提供了一些專門的書籍。比如簡(jiǎn)帛研究(/index.htm"TARGET=_blank>/index.htm)上提供的部分簡(jiǎn)帛資料、孔子2000(/"TARGET=_blank>/)上所提供的部分儒學(xué)原著、《象牙塔》(www.xiangyata./history"TARGET=_blank>www.xiangyata./history)提供的幾種史籍資料、中華佛典寶庫(kù)(ccbs.ntu.edu.tw/DBLM/cindex.htm"TARGET=_blank>ccbs.ntu.edu.tw/DBLM/cindex.htm)提供的《大藏經(jīng)》的免費(fèi)閱讀和下載,等等。這些資料因多數(shù)為研究者個(gè)人積累或?qū)iT機(jī)構(gòu)特別提供,所以常常起到補(bǔ)現(xiàn)有一些大型數(shù)字化圖書之不足的作用。
與網(wǎng)上書庫(kù)、個(gè)人網(wǎng)站的單純網(wǎng)頁(yè)瀏覽不同,網(wǎng)絡(luò)全文檢索提供了古籍資源利用的更為便捷的手段。除近年來陸續(xù)開發(fā)的《四庫(kù)全書》、《四部叢刊》等大型數(shù)字化產(chǎn)品均在單機(jī)板之外開發(fā)有網(wǎng)絡(luò)版外,網(wǎng)上目前已有的讓讀者免費(fèi)或有條件檢索的相關(guān)資源大體集中在臺(tái)灣。這方面,臺(tái)灣中央研究院的《漢籍電子文獻(xiàn)》系列(www.sinica.edu.tw/ftms-bin/ftmsw3"TARGET=_blank>www.sinica.edu.tw/ftms-bin/ftmsw3)、臺(tái)灣故宮寒泉檢索系統(tǒng)(libnt.npm.gov.tw/s25/index.htm"TARGET=_blank>libnt.npm.gov.tw/s25/index.htm)、臺(tái)灣元智大學(xué)工學(xué)院的“網(wǎng)絡(luò)展書讀”(cls.admin.yzu.edu.tw"TARGET=_blank>cls.admin.yzu.edu.tw)、臺(tái)灣中華電子佛典協(xié)會(huì)“線上藏經(jīng)閣”(/result/index.htm"TARGET=_blank>/result/index.htm)《大正新修大藏經(jīng)》全文檢索等可為代表。相反,在中國(guó)大陸,目前可提供網(wǎng)上全文檢索的古籍資料寥寥無幾,所見僅有北京大學(xué)中文系的《全唐詩(shī)線上全文檢索系統(tǒng)》(注冊(cè)后使用,/cgi-bin/tanglibrary.exe"TARGET=_blank>/cgi-bin/tanglibrary.exe)。此外,北京中醫(yī)藥大學(xué)開發(fā)的中藥方劑數(shù)據(jù)庫(kù)(收錄公元960年至今的24種古籍中的全部方劑)也可以通過網(wǎng)絡(luò)進(jìn)行有償檢索(/webdkrh1/"TARGET=_blank>/webdkrh1/)。
在中國(guó)大陸,目前利用率最高的當(dāng)屬一些網(wǎng)上圖書館。這方面,超星數(shù)字圖書館和中國(guó)國(guó)家圖書館特別值得提起。尤其是超星數(shù)字圖書館,是目前中國(guó)最大的數(shù)字化圖書館。它在2000年1月由北京時(shí)代超星公司與廣東中山圖書館合作開通,現(xiàn)已成為一個(gè)由全國(guó)各大圖書館支持的龐大數(shù)字圖書展示推廣平臺(tái),并已將其數(shù)字化方案成功應(yīng)用于中央檔案館、中山圖書館、深圳圖書館、解放軍醫(yī)學(xué)圖書館、溫州圖書館、美國(guó)加州大學(xué)圣地亞哥分校圖書館等國(guó)內(nèi)外500多家單位。其“館藏”的古籍,集中于“專題圖書館”中的“北大圖書館古籍”,以及“古代文獻(xiàn)圖書館”、“國(guó)家檔案文獻(xiàn)庫(kù)”、“地方志圖書館”等圖書館。而其數(shù)量之多,已經(jīng)可以在很大程度上滿足專業(yè)研究者的閱讀需求。此外,超星公司目前還在開發(fā)自己的e_Book。
2.專用電子書閱讀器
專用電子書閱讀器(ElectronicReader,簡(jiǎn)稱eReader)是一種手持離線閱讀電子書的專用設(shè)備,它的開發(fā)也是近年一個(gè)值得關(guān)注的事情。目前已見到一些產(chǎn)品面世。如朱邦復(fù)先生主導(dǎo)推出的“文昌電子書”Ⅰ號(hào)和Ⅱ號(hào),臺(tái)灣廣杰科技股份有限公司開發(fā)的“EB-2100”,遼寧出版集團(tuán)推出的“掌上書房”,天津南開津科公司(/ebook/ebook.asp"TARGET=_blank>/ebook/ebook.asp)開發(fā)的翰林Ⅰ、Ⅱ、Ⅲ號(hào),北京青創(chuàng)投資管理有限公司(/"TARGET=_blank>/)出品的“金博覽掌上讀”(電子書下載地址/jbl818/docc/libery.htm"TARGET=_blank>/jbl818/docc/libery.htm),等等。
專用電子書閱讀器雖然并非專為古籍?dāng)?shù)字化開發(fā),但因其體積小、容量大以及攜帶方便、無特殊閱讀條件的限制,而相應(yīng)的電子書籍中又包括不少古籍,其對(duì)一些古代經(jīng)典著作的傳播無疑會(huì)發(fā)生積極作用。
盡管在這些傳播方式中,有些并不需要太高的技術(shù)(如網(wǎng)上書庫(kù)、個(gè)人網(wǎng)站的建設(shè)),但它們?cè)谕七M(jìn)中國(guó)古籍?dāng)?shù)字化上的作用還是不應(yīng)被忽視。就廣大的中國(guó)文化愛好者甚至是專業(yè)研究者而言,其對(duì)古籍?dāng)?shù)字化之價(jià)值的認(rèn)識(shí),并非靠專門制作的大型數(shù)字化系列圖書,而恰恰來自他們簡(jiǎn)單的網(wǎng)頁(yè)瀏覽。
(三)恢宏闊大的開發(fā)規(guī)模
從上面的羅列中可以看出,中國(guó)古籍的數(shù)字化主要依賴于學(xué)術(shù)研究機(jī)構(gòu)(如臺(tái)灣中央研究院)和學(xué)校(如北京大學(xué)),專門技術(shù)公司(如超星、北京書同文)和出版社(如迪志、漢文化聯(lián)盟),圖書館(如北京圖書館、上海圖書館),并且已經(jīng)有了不少優(yōu)秀的成果問世。此外,就筆者瀏覽所及,目前正在開發(fā)的古籍?dāng)?shù)字化相關(guān)工程還有:
1.北京大學(xué)劉俊文先生主持的“中國(guó)基本古籍庫(kù)”光盤工程(-/default.htm"TARGET=_blank>-/default.htm)。這是中國(guó)目前最大的一個(gè)古籍?dāng)?shù)字化工程了。該工程1998年正式啟動(dòng),全套光盤庫(kù)共500張,分哲學(xué)、史地、藝文、綜合4個(gè)子庫(kù)20個(gè)大類,范圍涉及先秦至民國(guó)的重要典籍1萬(wàn)余種并提供多重檢索功能,每種典籍有1個(gè)通行版本的全文信息,另附1-2個(gè)珍貴版本的圖像數(shù)據(jù),預(yù)計(jì)全文20億字,版本圖像2千萬(wàn)頁(yè)。應(yīng)該說,這個(gè)項(xiàng)目具有很好的前瞻性,一旦開發(fā)成功,將基本上可以滿足文史和其他方面研究者的研究需求。
2.漢文化聯(lián)盟的“漢文化資料庫(kù)”(/"TARGET=_blank>/),內(nèi)容涵蓋歷代重要古籍,按照經(jīng)、史、子、集進(jìn)行分類,精選底本勘校而成,與單純的全文檢索不同。資料庫(kù)中包含《龍藏》(部分)、《歷代書法全集》(圖、文)和“漢文化考證檢索系統(tǒng)”,極富特色。
3.中國(guó)中醫(yī)藥文獻(xiàn)數(shù)字化。國(guó)家科技部基礎(chǔ)工作項(xiàng)目。該項(xiàng)目由中國(guó)中醫(yī)研究院中國(guó)醫(yī)史文獻(xiàn)研究所(/catcm/ys/yssjj.htm"TARGET=_blank>/catcm/ys/yssjj.htm)承擔(dān),山東中醫(yī)藥大學(xué)、南京中醫(yī)藥大學(xué)、上海中醫(yī)藥大學(xué)以及浙江省中醫(yī)研究院、天津中醫(yī)研究院等十四家中醫(yī)藥教育、科研單位協(xié)作。
4.《歷代石刻史料匯編》、《永樂大典》全文檢索。北京書同文數(shù)字化有限公司開發(fā),預(yù)計(jì)不久即可見成果。該公司亦將地方志的數(shù)字化列入了規(guī)劃。
5.中國(guó)數(shù)字圖書館工程(/dloff/"TARGET=_blank>/dloff/)。該工程由中國(guó)國(guó)家國(guó)家圖書館倡議于1998年,2001年10月正式國(guó)務(wù)院批準(zhǔn)立項(xiàng)。目前已成立了“中國(guó)數(shù)字圖書館聯(lián)盟”,聯(lián)絡(luò)了41家公共圖書館、30家高校圖書館、8家科研機(jī)構(gòu)圖書館、7家其他類型的圖書館和14家技術(shù)公司。該工程的總體目標(biāo)是在寬帶IP網(wǎng)上形成超大規(guī)模的、高質(zhì)量的中文資源群,支持國(guó)家整體創(chuàng)新體系的形成與發(fā)展,通過國(guó)家骨干通信網(wǎng)絡(luò)系統(tǒng)向全國(guó)乃至全球提供服務(wù)。其工程的重要內(nèi)容之一,就是發(fā)掘歷史遺產(chǎn)。
6.“中國(guó)教育科技數(shù)字圖書館”(ChinaEducationandResearchDigitalLibrary,簡(jiǎn)稱CERDLIB)工程。該項(xiàng)目由美國(guó)卡內(nèi)基-梅隆大學(xué)教授Dr.RajReddy和西蒙學(xué)院陳劉欽智博士、中國(guó)科學(xué)院研究生院常務(wù)副院長(zhǎng)高文博士共同發(fā)起,旨在建設(shè)面向教育和科研的包含100萬(wàn)冊(cè)(中、英文書籍各50萬(wàn)冊(cè))圖書的數(shù)字圖書館,由教育部“211”工程建設(shè)辦公室歸口管理,浙江大學(xué)和中國(guó)科學(xué)院研究生院等單位共同承擔(dān)建設(shè)任務(wù)和運(yùn)行管理。計(jì)劃通過4年的時(shí)間,建成2個(gè)數(shù)字圖書館技術(shù)中心(浙江大學(xué),中國(guó)科學(xué)院研究生院)和12個(gè)數(shù)字資源中心(北京大學(xué)、清華大學(xué)、吉林大學(xué)、武漢大學(xué)、西安交通大學(xué)、中國(guó)科學(xué)院研究生院、浙江大學(xué)、復(fù)旦大學(xué)、南京大學(xué)、中山大學(xué)、四川大學(xué)、上海交通大學(xué)),開發(fā)出30個(gè)左右的大型特色數(shù)字資源庫(kù)。項(xiàng)目中包含了古籍?dāng)?shù)字化的內(nèi)容。
7.臺(tái)灣典藏?cái)?shù)位化計(jì)劃。2001年啟動(dòng),參加機(jī)構(gòu)有臺(tái)灣中央研究院、臺(tái)灣故宮博物院、臺(tái)灣歷史博物館、臺(tái)灣大學(xué)等。
8.中國(guó)歷史地理信息系統(tǒng)(CHGIS)。復(fù)旦大學(xué)歷史地理研究中心(/chinesegb.asp#"TARGET=_blank>/chinesegb.asp#)、美國(guó)哈佛大學(xué)、哈佛燕京學(xué)社、澳大利亞格林菲斯大學(xué)亞洲空間數(shù)據(jù)中心等機(jī)構(gòu)合作開發(fā),主要資助單位是美國(guó)羅斯基金。項(xiàng)目目標(biāo)是建立中國(guó)歷史時(shí)期基礎(chǔ)地理信息系統(tǒng)數(shù)據(jù)庫(kù),使其成為中國(guó)歷史GIS數(shù)據(jù)的基礎(chǔ)平臺(tái)。這是一種研究性、工具實(shí)用性都很強(qiáng)的開發(fā)項(xiàng)目,與單純的把古籍轉(zhuǎn)化成圖片或檢索文本的數(shù)字化不同,也顯示出古籍?dāng)?shù)字化的另外的發(fā)展方向。
9.“國(guó)際敦煌學(xué)項(xiàng)目”(TheInternationalDunhuangProject,簡(jiǎn)稱IDP)(idp.bl.uk"TARGET=_blank>idp.bl.uk)。英國(guó)圖書館開發(fā),開始于1993年。項(xiàng)目中包括了英國(guó)(并計(jì)劃擴(kuò)展到世界范圍內(nèi))的敦煌文獻(xiàn)數(shù)字化。目前可線上查看英國(guó)圖書館收藏的3萬(wàn)余件中亞寫本和印件,以及15000余件殘片的高質(zhì)量彩色圖片(idp.bl.uk/IDP/idpdatabase.html"TARGET=_blank>idp.bl.uk/IDP/idpdatabase.html)。
10.“古藤堡計(jì)劃”(ProjectGutenberg,簡(jiǎn)稱PG)(promo./pg/"TARGET=_blank>promo./pg/),美國(guó)伊林諾斯大學(xué)文理學(xué)院米歇爾·哈特(MichaelS.Hartpromo./hart/"TARGET=_blank>promo./hart/)倡始于1971年。計(jì)劃對(duì)世界上的一些經(jīng)典古籍進(jìn)行數(shù)字化,其中包含了中國(guó)經(jīng)典、文學(xué)、歷史和地圖等方面書籍和資料的數(shù)字化內(nèi)容(主要為英文),如《論語(yǔ)》、《桃花源記》、《三國(guó)演義》等。現(xiàn)可在網(wǎng)絡(luò)上進(jìn)行目錄檢索(可使用中文,promo./cgi-promo/pg/t9.cgi"TARGET=_blank>promo./cgi-promo/pg/t9.cgi)。相關(guān)信息可通過在北京大學(xué)哲學(xué)系網(wǎng)站下載(ftp:///pub/gutenberg/"TARGET=_blank>ftp:///pub/gutenberg/),另有它還在中國(guó)設(shè)立了一個(gè)限中國(guó)境內(nèi)訪問的鏡像站(ftp:///mirrors/gutenberg/"TARGET=_blank>ftp:///mirrors/gutenberg/)。
此外,像超星數(shù)字化圖書館和地方上一些公共圖書館等也在其數(shù)字化圖書中不斷增添新的古籍,一些古籍研究機(jī)構(gòu)和個(gè)人也在工作中將相關(guān)文獻(xiàn)變成電子文本,也是古籍?dāng)?shù)字化隊(duì)伍中的不可小視的力量。
合現(xiàn)在已有的成果而觀之,中國(guó)古籍?dāng)?shù)字化規(guī)模之宏,形式之夥,數(shù)量之多,范圍之廣,都標(biāo)示出其良好的發(fā)展路向。這些產(chǎn)品的開發(fā),不僅更加有效地保護(hù)了古籍,而且在豐富人們的學(xué)習(xí)資源、提高學(xué)術(shù)研究的質(zhì)量以及擴(kuò)大中國(guó)文化的影響上,無疑也會(huì)發(fā)揮積極的作用。
二、存在的問題
毫無疑問,古籍?dāng)?shù)字化的最終目的是更大范圍、更便捷、更有效地使這些文獻(xiàn)為人們所利用。而由于用戶群體及其需求的差異,這個(gè)“用”也顯示出不同的層次。因此,滿足這些用戶群體的需求,也應(yīng)該是古籍?dāng)?shù)字化所需要考慮的問題。從這方面看,目前的古籍?dāng)?shù)字化產(chǎn)品還有不少可以完善的地方。
(一)選題內(nèi)容重復(fù),分散了數(shù)字化資源開發(fā)的力量
選題的好壞直接關(guān)乎一個(gè)產(chǎn)品的成功與否。在這方面,《四庫(kù)全書》的原文電子版(圖像,濟(jì)南)、《四庫(kù)全書》的全文檢索版、《四部叢刊》全文檢索版,以及超星圖書館中的北大古籍等“館藏”(pdg圖像格式),等等,從解決用戶的迫切需求上而言,都是成功的。但也無庸諱言,在今天的各種數(shù)字化產(chǎn)品中,內(nèi)容的大量重復(fù)也是一個(gè)不爭(zhēng)的事實(shí)。這種重復(fù)不僅存在于一些小規(guī)模帶有普及性的電子書制作上,而且也同樣存在于一些大型的數(shù)字化工程中。最明顯的例子是《二十五史》,幾乎現(xiàn)在稱得上數(shù)字化項(xiàng)目的產(chǎn)品都全部或部分包含了它們。這種重復(fù)在人力和財(cái)力上都是一種浪費(fèi),它提高了開發(fā)成本,相應(yīng)減少了對(duì)其他可開發(fā)項(xiàng)目的投入。
造成這種重復(fù)的原因,除了有些文獻(xiàn)本身屬于基本之基本的典籍,制作單位需要利用它們以獲得基本的用戶外,資源共享上的隔膜恐怕也是一個(gè)重要原因。特別是在電子文獻(xiàn)資源、技術(shù)資源和信息資源上的共享上,這種隔膜對(duì)更多更好項(xiàng)目的開發(fā)是相當(dāng)不利的。這方面的例子可以列出許多,其大而又大者如《四庫(kù)全書》原文圖像版就有兩種,超星圖書館和國(guó)家圖書館及其他公共圖書館在圖書內(nèi)內(nèi)容上的大量重復(fù)。特別是對(duì)后者擁有的數(shù)字化資源在互利互惠的前提下進(jìn)行合理合法的利用,使致力于OCR、全文檢索引擎等數(shù)字化技術(shù)和實(shí)用工具開發(fā)的公司將更多的精力投向相關(guān)技術(shù)開發(fā),對(duì)產(chǎn)品質(zhì)量的提高無疑是有重要作用的。
(二)文件格式繁多,造成了閱讀和資料提取的麻煩
數(shù)字化圖書格式之繁多,從上文的相關(guān)羅列中就可以看出。由于不同的圖書閱讀器互相難以兼容,因而給讀者帶來了許多麻煩。頗為有趣的是,有一個(gè)數(shù)字圖書館采取pdf文件存儲(chǔ)格式,卻只能使用acrobatreader去閱讀,連adobeacrobat也不支持。事實(shí)上,沒有一個(gè)讀者會(huì)愿意在自己的電腦上安裝七八個(gè)不同的閱讀器去閱讀圖書。以筆者個(gè)人為例,筆者曾經(jīng)是許多網(wǎng)上圖書館或書庫(kù)的注冊(cè)用戶,但因?yàn)闊┎粍贌F(xiàn)在常常光顧的只剩下超星數(shù)字圖書館了。
不僅如此,由于許多圖書采用了圖片格式,也給使用者提取資料帶來了許多困難。這當(dāng)中,超星因其巨大的影響而常常成為批評(píng)的對(duì)象。筆者無意于否認(rèn)超星保護(hù)版權(quán)之努力的必要性和合法性,但因其相關(guān)技術(shù)開發(fā)不同步,其本應(yīng)發(fā)揮更大作用的大量圖書資源并未得到很好的利用。限制打印頁(yè)數(shù)(每次10頁(yè))、瀏覽器所帶的截圖工具每次只能截取頁(yè)面的1/4(最新版本已經(jīng)改成可整頁(yè)截圖)徒自給合法用戶(讀書卡注冊(cè)用戶)增添麻煩(因?yàn)槠錇g覽器的破解版本完全可以破除這些限制),而且其所提供的OCR工具,對(duì)當(dāng)代標(biāo)準(zhǔn)印刷的直排繁體圖書的文字識(shí)別已經(jīng)無能為力,更談不上識(shí)別古寫作、刻、鈔、稿本的文字了。在這一點(diǎn)上,超星以及類似的數(shù)字圖書館似乎僅僅把自己定位在為讀者提供普通的圖書閱讀,而對(duì)專業(yè)研究者所需要的快速檢索、并將檢索結(jié)果直接轉(zhuǎn)換成編輯文本方面還關(guān)注不夠(超星提供的全文檢索工具頗差)。
(三)隊(duì)伍組織、項(xiàng)目規(guī)劃單調(diào),導(dǎo)致了產(chǎn)品開發(fā)缺乏連續(xù)性
在隊(duì)伍組織方面,多數(shù)項(xiàng)目的開發(fā)以計(jì)算機(jī)技術(shù)和圖書館人員為主,技術(shù)公司和圖書館之間的合作,更多的是因?yàn)閳D書館擁有原始文獻(xiàn)資源。而圖書館本身對(duì)館藏圖書的數(shù)字化,又常常拘泥于傳統(tǒng)圖書館的圖書借閱形式,而只是將過去的人工手段轉(zhuǎn)化成計(jì)算機(jī)通訊(這可能也是現(xiàn)在的數(shù)字圖書館多數(shù)采取圖片存儲(chǔ)格式的一個(gè)原因)。在這一點(diǎn)上,現(xiàn)在的一些項(xiàng)目的開發(fā)與用戶的需求之間還有相當(dāng)?shù)木嚯x。
應(yīng)該說,在隊(duì)伍組織和項(xiàng)目規(guī)劃方面,目前并非沒有比較成功的范例可以借鑒。臺(tái)灣中央研究院的系列電子化項(xiàng)目、元智大學(xué)的“網(wǎng)路展書讀”、漢文化聯(lián)盟的《漢文化資料庫(kù)》采取的都是專業(yè)研究專家與技術(shù)人員、圖書館三方合作的方式,使得開發(fā)的項(xiàng)目與用戶(尤其是專業(yè)研究者)的實(shí)際需求相切合。北京大學(xué)的《中國(guó)基本古籍庫(kù)》在設(shè)計(jì)思路上也采取了這種方式。而超星數(shù)字圖書館目前在其瀏覽器設(shè)計(jì)中已加入了可由用戶編輯專題的虛擬圖書館,使資源開發(fā)者與用戶之間建立起一種動(dòng)態(tài)合作關(guān)系,也顯示出一種可喜的變化。
在項(xiàng)目的整體規(guī)劃方面,也有不少可以挑剔的地方。按照我個(gè)人的理解,一個(gè)項(xiàng)目的開發(fā)至少應(yīng)該包含這樣的一些步驟:
開發(fā)者對(duì)自身開發(fā)能力的合理評(píng)估和發(fā)展目標(biāo)的合理定位-根據(jù)前者選擇選題方式、進(jìn)行市場(chǎng)調(diào)查和確定選題-選題可開發(fā)內(nèi)容的信息搜集-確定開發(fā)的具體目標(biāo)(主產(chǎn)品和副產(chǎn)品)-采樣-技術(shù)處理過程-測(cè)試-修改與完善--市場(chǎng)反饋-補(bǔ)丁。
可以看出,從選題開始,項(xiàng)目開發(fā)就是一種多方互動(dòng)的活動(dòng)。從選題方式上看,單純依賴開發(fā)者自己的想像,或者依賴文獻(xiàn)資源擁有者的倡導(dǎo),或者依賴部分學(xué)者的評(píng)議,甚至依賴權(quán)威的一兩句斷言,顯然都是不合適的。最根本的一點(diǎn),就是項(xiàng)目開發(fā)應(yīng)該根據(jù)“什么最需要”而非“是否有價(jià)值”(如果考慮到開發(fā)公司自身的生存問題,還應(yīng)該加上“是否能夠盈利或具有盈利的希望”)的原則去選定,而專家學(xué)者的看法通常著眼于“價(jià)值”,這種價(jià)值認(rèn)定又往往因其專業(yè)限制而難免有局限。
選題確定以后,對(duì)選題可開發(fā)內(nèi)容的信息搜集直接關(guān)乎項(xiàng)目開發(fā)的連續(xù)性。尤其是一些具有“原創(chuàng)”性質(zhì)的開發(fā)項(xiàng)目,其本身所具有的系列開發(fā)內(nèi)容就很豐富。僅我個(gè)人所思及,就有這樣一些方面:
其一,版本信息(版本類型、年代、版式、字體、刊刻地點(diǎn)、刻工姓名等)。這部分內(nèi)容可以通過掃描而得到影象資料而進(jìn)一步開發(fā)。
其二,全部書籍的詳細(xì)目錄匯總(用以滿足不能購(gòu)買整套軟件但希望掌握相關(guān)信息的用戶的需求)。
其三,最常用或極具價(jià)值的書籍資料(單行或選編進(jìn)一類專用書籍中,以滿足一般用戶的需求)。
其四,項(xiàng)目中所包含的各類專題資料(用以滿足專題研究者需求,或引導(dǎo)一般用戶進(jìn)行相關(guān)查詢)。
反觀現(xiàn)在的一些開發(fā)項(xiàng)目(特別是全文檢索項(xiàng)目),除了所謂“單機(jī)板”、“網(wǎng)絡(luò)版”之類的“系列”外,在其他方面的開發(fā)幾乎為零。項(xiàng)目開發(fā)者常常抱怨開發(fā)出的好產(chǎn)品沒有更多的用戶使用,卻往往忽略了另外一個(gè)問題:為什么不利用已有的開發(fā)成果,而再開發(fā)出能適應(yīng)不同用戶群體需求的產(chǎn)品來?
除以上三方面外,技術(shù)處理上的缺陷、成果推廣上的遲緩、開發(fā)成本過高導(dǎo)致產(chǎn)品價(jià)格過高等,也都對(duì)成果的更大范圍的應(yīng)用有著一些影響。
三、“我”需要什么:《四庫(kù)》全文檢索案例分析
選擇《四庫(kù)全書》全文檢索版作為案例,是因?yàn)樗悄壳肮偶當(dāng)?shù)字化的一個(gè)非常突出的代表。而對(duì)它進(jìn)行分析,只是想根據(jù)我自己的使用感受回答這樣一個(gè)問題:用戶究竟需要什么?
(一)信息容量
包含3400余種書的《四庫(kù)全書》全文檢索,無疑是現(xiàn)在容量最大的一個(gè)古籍?dāng)?shù)字化工程了。雖然《四庫(kù)》本身因編纂、版本等方面的問題而為學(xué)者所詬病,但因其文獻(xiàn)集中,而影印本又可以很快解決掃描底本問題,選擇它進(jìn)行數(shù)字化在目前無疑是非常正確的。比較一下它和《中國(guó)基本古籍庫(kù)》的工作進(jìn)度,就可以發(fā)現(xiàn)《四庫(kù)》全文檢索在解決用戶的最迫切需求上厥功甚偉。《中國(guó)古籍基本庫(kù)》自1998年啟動(dòng),至今將近四年,尚未見到成型的產(chǎn)品面世。而《四庫(kù)》前后僅三年就完全開發(fā)成功。甚至當(dāng)初極力反對(duì)這項(xiàng)工程的學(xué)者,現(xiàn)在也成為它的積極的使用者,這本身就說明了這項(xiàng)工程的價(jià)值所在。
《四庫(kù)》全文檢索之受到歡迎的一個(gè)重要原因,就是其信息量的巨大。這種情形,也反映出另外一個(gè)問題:倘若在版本與信息容量上不能兼顧,是選擇版本好但容量少,還是選擇版本稍差但信息容量大的圖書進(jìn)行數(shù)字化?據(jù)筆者本身以及所知的一些情況來看,恐怕多數(shù)人還是選擇后者。舉例說來,筆者的一位學(xué)友想搜集歷史上蝗災(zāi)的資料,每日前往圖書館翻閱圖書(逐頁(yè)翻查,苦不堪言),猶恐遺漏,后通過筆者檢索《四庫(kù)》“蝗”字,即刻得4535卷、11329個(gè)匹配。由此把節(jié)省的大量時(shí)間轉(zhuǎn)入資料的考訂和搜集《四庫(kù)》所無之書中的資料,較之其先前的工作方式,優(yōu)劣判然。
也因?yàn)槿绱耍P者深感已經(jīng)大大超越同類數(shù)字化工程容量的《四庫(kù)》全文檢索,在容量上仍然不能滿足要求。比如筆者目前正在進(jìn)行《明儒學(xué)案》的文獻(xiàn)學(xué)研究,想查證其中的傳記資料和黃宗羲摘編的學(xué)術(shù)資料的原始來源,《四庫(kù)》全文檢索對(duì)多數(shù)人物無能為力。《四庫(kù)》中宗教類資料很少,明代著作未收者頗多,而清代因修書時(shí)代限制幾乎無法利用,這些缺憾都還需要其他數(shù)字化項(xiàng)目來補(bǔ)充。
(二)顯示模式
《四庫(kù)》電子版采取了檢索結(jié)果、原文圖像、全文閱讀三種顯示模式并可快速切換,亦屬獨(dú)創(chuàng)。這種顯示模式的確有它的好處。原文圖像和全文閱讀的精確對(duì)應(yīng),在兩者之間建立起了直接的勘校關(guān)系,可以解決全文閱讀時(shí)的部分文字錯(cuò)誤。特別是對(duì)古今字、異體字、避諱字等的關(guān)聯(lián)檢索沒有達(dá)到完善匹配的時(shí)候,原文圖像在補(bǔ)字和校正錯(cuò)字方面就有重要作用。
但是,這種方式也存在諸多問題,匯總?cè)缦隆?/p>
1.檢索結(jié)果方面
1)單機(jī)版的檢索結(jié)果能打印但不能復(fù)制(網(wǎng)絡(luò)版可以通過網(wǎng)頁(yè)拷貝方式復(fù)制),有卷數(shù)、書名而無其他可顯示該條資料的內(nèi)容,使得在缺乏隨身攜帶全文檢索的情況下無法與其他的書籍內(nèi)容進(jìn)行比對(duì)。(這一點(diǎn)在書同文《四部叢刊》的開發(fā)中已經(jīng)得到修正。)
2)檢索結(jié)果必須通過閱讀原文才能知曉具體內(nèi)容,不能集中顯示,也給用戶使用帶來了一些麻煩。比如“朱子”的檢索結(jié)果就高達(dá)9133卷、37910個(gè)匹配,若將此外的“文公”(13180卷,33153個(gè)匹配)、“晦庵”(1665、3293)、“朱熹”(1839、4508)加在一起,計(jì)有25817卷、78864個(gè)匹配。至于“孔子”,更是高達(dá)23757卷、111641個(gè)匹配。假定每個(gè)匹配的閱讀時(shí)間平均為1分鐘(加上復(fù)制相關(guān)資料、標(biāo)點(diǎn),實(shí)際一條資料的處理時(shí)間遠(yuǎn)遠(yuǎn)超過1分鐘),每天八小時(shí)不間斷地閱讀,則“朱子”等條資料需要花164天、“孔子”需要花233天才能閱讀完畢。如果是通過網(wǎng)絡(luò)閱讀,其麻煩會(huì)更大些。(臺(tái)灣中央研究院的《漢籍電子文獻(xiàn)》、陳郁夫先生的“寒泉”檢索系統(tǒng)都采用了可以分段顯示的方法,甚是便利。)
2.原文閱讀方面
1)原文顯示上區(qū)分正文和注文,一方面將有些并非注文的小字誤作注文,另一方面在拷貝時(shí)將注文置于頁(yè)末,頗為不便。(后者在《四部叢刊》全文檢索中已經(jīng)得到糾正。)
2)未妥善解決異體字等關(guān)聯(lián)問題,導(dǎo)致有些文章在拷貝后必須補(bǔ)充大量空缺的文字(四庫(kù)自帶了方正楷體大字庫(kù),但并非所用使用者的本地機(jī)上都有這種字庫(kù),因而在無此字庫(kù)支持的電腦上閱讀和編輯都不方便)。
此兩者可舉《晦庵集》中一條為例。原文截圖如下:
拷貝到相關(guān)編輯器中的結(jié)果如下(截圖):
3.原文圖像方面
筆者無意否認(rèn)附帶原文圖像的價(jià)值,但這種做法事實(shí)上造成了產(chǎn)品難以在更大范圍推廣。《四庫(kù)》的全文檢索安裝盤僅16張光盤,而圖像盤高達(dá)167張,這無疑也提高了制作成本,從而相應(yīng)帶來了價(jià)格的提高。國(guó)內(nèi)不少用戶對(duì)《四庫(kù)》全文檢索心向往之,卻最終沒有去購(gòu)買,高昂的價(jià)格大概是使他們望而卻步的一個(gè)重要原因。
(三)檢索模式
《四庫(kù)》提供了全文檢索、分類檢索、書名檢索、著者檢索以及“開啟當(dāng)前檢索條件”用以修正當(dāng)前檢索的內(nèi)容。全文檢索還可分部、分書或分著者進(jìn)行,并支持復(fù)合檢索。而在全文閱讀狀態(tài)下,還可以通過選擇當(dāng)前閱讀頁(yè)面中的文字進(jìn)行再檢索。分類、書名、著者檢索提供簡(jiǎn)單、具體、詳細(xì)三種顯示方式并提供了相關(guān)鏈接以進(jìn)行切換。此外,在全文檢索、書名檢索、著者檢索中還增添了一些輔助功能設(shè)計(jì),分類檢索中則包含了部、類、書、目錄的層級(jí)搜索方式。這些檢索方式,可以滿足用戶不同的檢索要求,使用也很方便,非常值得贊賞。而附加的聯(lián)機(jī)字典、添加筆記、放大鏡等工具也頗具實(shí)用價(jià)值(其聯(lián)機(jī)字典猶具價(jià)值,惜釋義稍簡(jiǎn))。
感覺不方便的地方是:原文的卷次顯示于頁(yè)面的底端,位置不當(dāng)。有些著作的卷次顯示尤有問題。比如別集類明代的一些著作,標(biāo)成“集部,別集,洪武至崇禎,?…”(?為書名的第一個(gè)字),顯示了前面一堆無用的信息,而關(guān)鍵的卷次信息卻被省略。
(四)檢準(zhǔn)率
從整體上看,《四庫(kù)》全文檢索的命中率應(yīng)該是很高的。筆者利用它考證一些概念的演變、人物的生平、古籍整理上引文的查核以及校勘等,都取得了滿意的結(jié)果。甚至偷閑的時(shí)候胡亂檢索一些字詞,也常常得到意想不到的結(jié)果。比如“愛情”兩字,檢索得159卷163個(gè)匹配,雖然其中許多都是兩字碰巧排在一起,但也確實(shí)有兩字連用者。如《禮記集說》“若愛情在心,則聲和柔”、《續(xù)資治通鑒長(zhǎng)編》卷一六九“伏望陛下斷以大義,稍割愛情”、《清河畫舫錄》卷一二上“自亦不堪屬目,以徇愛情而已”之類,雖意思與現(xiàn)代的男女情愛邈不相關(guān),亦頗見古今詞義之變化。尤為有趣者,現(xiàn)代人通常把歷史上的禮制想像得非常可怕,而且似乎歷久不變,然檢索“離婚”兩字,得172卷192個(gè)匹配,其事件可追于春秋,而《晉書》即屢屢見“離婚”二字,若輔以其他記載,諸資料內(nèi)容頗有可判今人認(rèn)識(shí)之誤者。
要求《四庫(kù)》全文檢索在命中率上達(dá)到完全無誤,顯然是一種太過苛刻的要求。但從完善產(chǎn)品的角度言,《四庫(kù)》在檢索的準(zhǔn)確率上的確還有待提高。由于版本不同,筆者無法用其他的全文檢索產(chǎn)品來進(jìn)行對(duì)比,在此僅列舉一個(gè)事例以作說明。
檢索“講會(huì)”二字資料,得36卷、37條。然通過個(gè)人所知者復(fù)核,發(fā)覺《四庫(kù)》脫漏甚多。比如《法苑珠林》一條,另載于《廣博物志》卷
五、《太平廣記》卷九九兩條未檢出;《東都事略》卷一一
四、《宋名臣言行錄外集》卷三所載“赴講,會(huì)”條,另載于《續(xù)資治通鑒長(zhǎng)編卷》四0
四、《太平治跡統(tǒng)類》卷二
五、《伊洛淵源錄》卷
四、《二程遺書》附錄、《近思錄集注》附說、《御纂朱子全書》卷五
三、《晦庵集》卷九八諸條未檢出。《晦庵集》檢索得一條,但筆者所知另一條《白鹿講會(huì)次卜丈韻》詩(shī)(卷七)未能檢出,而此詩(shī)又載于《江西通志》卷一五
四、《性理大全書》卷七0、《御纂朱子全書》卷六
六、《宋詩(shī)鈔》卷六0,亦未檢出。此外,史部正史類無一條檢出,而《舊唐書·蕭俛》附蕭仿傳,《明史》沈懋學(xué)、史孟麟、呂維祺傳及顧憲成等傳贊、儒林傳之陳時(shí)芳傳中均有“講會(huì)”字。一條檢索出現(xiàn)如此多的失誤,對(duì)一個(gè)成熟的產(chǎn)品來說是不應(yīng)該的。
此外,《四庫(kù)》全文檢索中還有不少錯(cuò)字,也影響了它的質(zhì)量。(《四部叢刊》全文檢索版允許用戶在本地機(jī)改正錯(cuò)字,值得提倡。
應(yīng)該說,《四庫(kù)全書》全文檢索版的開發(fā),為中國(guó)古籍的大規(guī)模數(shù)字化提供了一個(gè)成功的先例。雖然從用戶的實(shí)際需求方面言,這個(gè)產(chǎn)品還存在一些問題,但是,不能要求一種產(chǎn)品完成用戶所想做的所有事情,也應(yīng)該是合理對(duì)待這類產(chǎn)品的態(tài)度。而正因?yàn)槿绱耍端膸?kù)》以及類似數(shù)字化產(chǎn)品依然為未來的數(shù)字化工作留下了很大空間。
四、趨勢(shì)
關(guān)于古籍?dāng)?shù)字化的發(fā)展趨勢(shì),臺(tái)灣元智大學(xué)羅鳳珠先生(“網(wǎng)路展書讀”的開發(fā)者)《臺(tái)灣地區(qū)中國(guó)古籍文獻(xiàn)資料數(shù)字化的過程與未來的發(fā)展方向》(cls.admin.yzu.edu.tw/present/tarcf.htm"TARGET=_blank>cls.admin.yzu.edu.tw/present/tarcf.htm)一文言之甚詳,已無需筆者班門弄斧。唯個(gè)人覺得:大型綜合性可提供全文檢索等功能的、建立者與用戶動(dòng)態(tài)合作的網(wǎng)絡(luò)數(shù)據(jù)庫(kù)(或網(wǎng)絡(luò)圖書館)的建設(shè),以及投資商、技術(shù)開發(fā)公司、圖書館和專業(yè)研究機(jī)構(gòu)合作開發(fā)更多、更專門的數(shù)字化產(chǎn)品,或許是發(fā)展的主要趨勢(shì)。此外,謀求同國(guó)外一些機(jī)構(gòu)的合作,以多種方式將數(shù)字化產(chǎn)品推廣出去,借以傳播中國(guó)優(yōu)秀之文化,亦當(dāng)在考慮之列。