☆ 藤農線上書籍 ☆

Home

來生不做中國人

        過去二十年間,我每次搬房子最煩惱的事就是堆積如山的藏書,每次都要勞師動眾,禍連朋友,而且也要費時重新整理,當然更要在寸金尺土的斗室中繼續為這些藏 書像神主牌一樣的闢室供奉。幸而我比許多人都更早醒覺到,無止境的買書和藏書只可能是富貴人家的嗜好,並認識到這會嚴重危害到個人的財政、居住環境以至行 動自由,是快樂人生中的極大負累。
        於是我於1997年又一次搬房子時,痛下決心戒除買書癮和藏書癮,極其沉痛地從數千本藏書中挑出最重要的兩三百本,其他的都放棄了。但是,書癮果然像毒癮 一樣,不出兩三年,我的藏書又填滿斗室了。終於,2003年,我要移居挪威了,我覺得書本給我的負累要到此為止了。我再一次從數千本藏書中挑出最重要的兩 百本左右隨身。這兩年來,在挪威我買的書不超過 50 本 (當中幾乎一半是關於學習挪威語的,其他也絕大多數是極其廉宜的舊書),雖然這兩年來我身邊的藏書是過去廿年來最少的,好友也為我在異鄉的精神生活擔心, 但其實這些日子我在精神上毫無匱乏之苦,反而恰恰相反,由於越來越多新書或舊書可以在網上瀏覽,這兩年來我所能閱讀到的書籍和資訊卻是平生以來最多的。
百萬圖書全日侍候
        截至2005年9月,我隨時可以閱讀的中、英文書約有 1 百萬本。有關書籍分佈如下,英文書 : Netlibrary(www.netlibrary.com) 6 萬本,Questia(www.questia.com) 6萬本,Ebrary(www.ebrary.com)2 萬多本,十八世紀經典古籍線上資料庫Eighteenth Century Collections Online (www.galenet.com/servlet/ECC)十五萬本,早期英語文獻線上資料庫 Early English Books Online(wwwlib.umi.com/eebo)12萬本,Amazon(www.amazon.com)30萬本,Google Print(http://print.google.com)數萬本(扣除似與亞馬遜重複部份),另加網上免費的約 5 萬本等等。中文書 : 超星圖書(www.ssreader.com) 25 萬本(總數有近60萬本),《四庫全書》8萬卷另加網上免費的約 5 千本等等。現在我要看的書九成以上都有了,連孫隆基的新作《中國人民族性》(The Chinese National Character:From Nationhood to Individuality)也可以在網上局部瀏覽 。最近要斥資買張戎的《毛澤東 : 鮮為人知的故事》(Mao : the Unknown  Story),是例外。現在我用於買書的開支是十五年前的百分之一左右,但可隨時動用的書籍卻是那時的數以千倍。
        我連過去丟棄的書都大都沒有看完,一些我買了十多年的書還只是翻了幾頁,我哪裡需要擁有 1 百萬本書呢?的確,若這 1 百萬本書是傳統的印刷本,即使我有財力將之私藏也多是病態戀物癖所致。但是現在的網上電子書庫,特別是英語的,都可作全文搜尋,不單是搜尋該書的全文,也 可以一次搜尋整個書庫的全文。我第一次全文搜尋幾萬本書時的快感,就如我第一次全文搜尋Dow Jones Interactive 幾千萬筆資料那樣,刻骨銘心。我覺得,全文搜尋書籍,特別是整個書庫的全文搜尋,是人類學習的飛躍。這極有助於我們重溫過去讀過卻已印象模糊的知識,和以 火速找到我們學習上所需的書籍資料。英國的詞典編纂巨人約翰遜 (Samuel Johnson,1709-1784) 的名言 : Knowledge is of two kinds.We know a Subject ourSelves,or we know we can find information upon it.〈「知識有兩種。要麼我們認識某課題,要麼我們懂得怎樣可以找到關於某課題的資料。」〉在這個講求全文搜尋的互聯網資訊革命年代,這句話得到了最透 徹的演繹。我也已把我對這些激動人心的資料庫的研究,寫成《網上搜證實典:附全球 26 名校網上資料庫效能測試報告》一書,譬如我示範怎樣用博學堂的《文淵閣四庫全書》網絡版搜尋,找到雍正皇帝及其他清史家說的 「台灣自古不屬中國」;和示範怎樣用美國政府解密檔案 Declassified Documents Reference System 搜尋,找到美國中央情報局記錄中共在 1950 年代初向香港傾銷鴉片的機密文件。
垃圾文獻也應數碼化
        當然,有人會質疑,是否所有的文獻都值得數位化呢?備受敬重的歷史學權威葛劍雄教授(1945-)在博學堂將《文淵閣四庫全書》製成光碟時,就強力反對,他說「《四庫全書》在編纂過程中是作了不少刪改的,錯訛之處也不少,其中的不少書當 時就沒有採用更好的版本,到今天可以說其中的大部分書已經不是最好的版本。」葛教授在另外一篇文章〈分久必合,合久必分〉中更仗義聲討《四庫全書》:
『在將《四庫全書》讚揚為「偉大的文化工程」時,我們不應該無視成千上萬種不符合乾隆皇帝思想的書籍被毀於一旦的事實,更不應該忘記無數慘死在文字獄中的冤魂和被禁錮在思想牢籠中的可憐的知識分子。』
        在名流、學者爭嚷「因擁有代表博大精深的中華文化的《四庫全書》而深感自豪」之際,葛教授振聾發聵,令人仰視,但我認為,將粗製濫造的《四庫全書》數位化還是意義巨大的,正如葛教授其後也說他在《四庫全書》光碟全文搜尋後,才知道 「歷史」一詞在中國文獻中出現得比他所知的早。我的角度是,《四庫全書》無論怎樣粗製濫造,已是歷史的一部份〈反正「粗製濫造」也符合中國人的精神風 貌〉,不論好壞,也是不妨保存、研究的。垃圾一旦成為歷史,不但隨時有收藏拍賣的價值,也可供研究。就如超星圖書庫裡面的 60 萬冊數位化中文書其實絕大部份都是沒有思想學術自由下的垃圾,同樣,已經數碼化的自創刊以來的《人民日報》裡面所載的,百分之九十九都是用以草菅人命的廢 話謊話,甚至國內交口稱譽的「中國期刊網」也可局部作如是觀,但我覺得它們都極有數碼化以供永遠保存並全文搜尋的價值。大家只要明白我們研讀中文資料 -----特別是來自中國本土的中文資料-----的主要目的不是為了增長知識、智慧或磨練思辨,而是想了解五分之一人類得以胡混千年並惡性繁殖的因由, 則我們對於處理中文資料自會有一些不同的準則,對於閱讀僵化的漢語古籍也會有較大的動力。
千萬篇學術論文按之即來
        但單單看書並不足夠,書本上的資訊一般較舊,而且一些著作從來都不會結集成書,還有全球主要大學的博碩士論文。所以我也需要學術論文和新聞的資料庫。基本 上,英語學術論文我主要依賴 Proquest(http://proquest.umi.com/pqdw-eb)、綜合學科全文資料庫 Academic Search Premier(http://Search.epnet.com)、EXpanded Academic ASAP(http://galenet.gale.com)、JSTOR(http://www.jstor.org/)、劍橋電子期刊全文資料庫 Cambridge Journals Online(www.jour-nals.cambridge.org)和Sciencedirect(www.sciencedirect.com)等上面約兩萬 種學刊通常自創刊以來的幾千萬篇全文論文,和自 1861 年以來全球主要大學的兩百萬篇博碩士論文全文。中文的學術或半學術論文則多靠有近 7,000 種期刊、1,200 百萬篇論文的 「中國期刊網」(www.cnki.net)。至於新聞,則主要依賴包括中港台三百多個傳媒全文新聞的慧科新聞(http://wise- news.wisers.net/)、和網羅全球以英語為主的 8 千多個傳媒(也有若干學刊)、資料近兩億筆的超級全文新聞庫 Factiva(www.factiva.com)。若要幾十年前的舊新聞,則用 Proquest 就《華爾街日報》、《紐約時報》、《華盛頓郵報》、《基督教科學箴言報》等八份美國主要報刊自創刊以來的全文網上版(http://proquest.umi.com)。另外,英國自 1785 年以來的《泰晤士報》已數位化,台灣的《自由時報》、《聯合報》、《中國時報》、《中央日報》,《台灣時報》,和中國大陸的《人民日報》也大抵如是。
        可見,從資訊流通的角度看,互聯網狂熱決不是一場過眼雲煙的狂夢。除了電郵的普及,這裡所說的印刷文獻數碼化在互聯網泡沫爆破後依然挺進。亞馬遜在網上擺 賣 3 百萬種書固然值得我們致敬,但其更偉大的貢獻可能是,居然能細說服出版商將卅萬本書的全文放在站台上讓客戶作全文搜尋。雖說用戶只能免費瀏覽當中的一部 份,但只要稍用心思,這卅萬本書固然可作全文搜尋,其絕大部份內文也是可以瀏覽甚至是存檔的。當然「善用」網上資源也有高下,有人覺得亞馬遜看來設計簡陋 的搜尋器一無是處,或者只用來查核學生的作業有沒有抄襲書本,但你也可以將之善用為有卅萬藏書的私人圖書館。這也正是互聯網當中一個可愛之處,就是你不一定要很有「財」才可以善用現有資源,有「才」也可以的,這比較公平。我最服膺香港首富李嘉誠的「知識改變命運」之說,可是知識本身也往往是昂貴得令人卻步。要是你 真的把我在本文介紹的網上資料庫一一訂用,一年怎樣也要花上百萬港元,而這批資料庫還大概只佔同類產品中的三四成而已。
歐洲和中國未能善用互聯網
        亞馬遜在 2003 年 10 月推出 Search Inside the Book,容許客戶搜尋約 10 萬本書的全文以圖刺激銷量後,Google 隨即於同年 12 月悄悄推出 GooglePrint,但最初構想也只是讓用戶瀏覽書本的摘要(excerpt),後來亞馬遜的 Search Inside the Book越做越旺,在推出第一年亞馬遜的銷售額上升了近三成,於是出版商更加願意將書本全文放到亞馬遜站台讓人搜尋。大抵,在亞馬遜成功經驗的刺激下,去年12月Google高姿態公佈會於未來六年將史丹福、哈佛和牛津幾家大學的圖書館的 1 千 5 百萬冊圖書全文數位化並放到搜尋器上,消息令歐洲特別是法國的文化界風聲鶴唳。在法國國家圖書館館長讓納內Jean-Noel Jeanneney 的策動下,歐洲多國初步同意共同創建一個以歐洲語文為本位的搜尋器及類於 Google Print 的數位圖書館,以抗衡他們所說的由 Google 推動的英語或美國文化霸權。
        英語世界的互聯網在雄心萬丈的美國人的推動下,天天風起雲湧,長期躲進小樓的歐洲文化守護者所知道的似乎就只有 Google,但是已經倉皇失措;在中國大陸,政府則死力封鎖互聯網上有關西方特別是英語世界的自由人權言論思想。歐洲繼續因自負而付出代價,和中國繼續 因禁絕言論自由而糟蹋了紙張、印刷術到互聯網等用以提昇文明的工具,競自作孽,可以怨誰? 〈原載於2005年10月《開放雜誌》〉