- 相關(guān)推薦
關(guān)于數(shù)字信息資源的另一面
【內(nèi)容提要】任何事物都有兩面性。文章從數(shù)字信息資源存在的問題,如使用權(quán)與所有權(quán)問題;易逝性特征;數(shù)字信息的不安全性;數(shù)字信息的權(quán)威性差;適宜于共時(shí)研究,歷時(shí)研究方面有待技術(shù)的進(jìn)步與支持;應(yīng)加強(qiáng)信息過濾技術(shù)的研究,充分考慮技術(shù)上的難度和各方面所需的條件等方面,論述了數(shù)字信息及數(shù)字圖書館建設(shè)中應(yīng)注意的問題。【摘 要 題】數(shù)字圖書館論壇
目前,在我國圖書館界幾乎是言必稱數(shù)字,會(huì)必議數(shù)字,刊必載數(shù)字,課必講數(shù)字,沒有“數(shù)字”就不時(shí)髦。對此,我們可以完全理解,并予以充分肯定。但是“這種熱潮”帶有很大的盲目性,是對數(shù)字圖書館的認(rèn)識(shí)存在誤區(qū)所致。筆者認(rèn)為這可能反映了國內(nèi)圖書館界對于實(shí)現(xiàn)數(shù)字圖書館在技術(shù)上的難度和各方面所需的條件還認(rèn)識(shí)不足;而如果沒有充分的認(rèn)識(shí)和多方面的準(zhǔn)備,我們在探索實(shí)現(xiàn)數(shù)字圖書館的過程中可能會(huì)走彎路。
1 應(yīng)深刻認(rèn)識(shí)、加深理解的幾個(gè)問題
1.1 使用權(quán)與所有權(quán)問題
其實(shí)對于數(shù)字化信息資源,我們僅僅擁有使用權(quán),僅僅在付費(fèi)的那一段時(shí)間內(nèi),擁有使用權(quán),而并無所有權(quán)。這一點(diǎn)與傳統(tǒng)的紙質(zhì)文獻(xiàn)資源相比,有很大的不同。傳統(tǒng)紙質(zhì)印刷品,是一個(gè)物理實(shí)體,當(dāng)你付錢購買后,你就擁有了所有權(quán),不存在版權(quán)問題,不存在內(nèi)容失真問題。數(shù)字圖書館的信息資源,受知識(shí)產(chǎn)權(quán)的保護(hù)限制,許多著作內(nèi)容不經(jīng)原著者同意,不能轉(zhuǎn)換,更不能隨意上網(wǎng)傳播;一般說來,網(wǎng)址信息的穩(wěn)定則依賴于誰擁有服務(wù)的空間,擁有者意味著網(wǎng)址作者控制空間的使用與內(nèi)容及服務(wù)器的管理政策。而存儲(chǔ)空間的數(shù)量則與服務(wù)器提供者的經(jīng)濟(jì)承受能力有關(guān)。網(wǎng)絡(luò)空間是人們花一定費(fèi)用取得的使用權(quán)。擁有網(wǎng)絡(luò)空間就要對其進(jìn)行維護(hù),包括上網(wǎng)費(fèi),電話線路費(fèi),線路資源費(fèi)用。
因而,數(shù)字圖書館的建設(shè)是一項(xiàng)高技術(shù)、高投入的工作,即使美國政府的項(xiàng)目,也不是由政府出全資開發(fā)建設(shè),并且在項(xiàng)目的管理上多采用經(jīng)營模式,技術(shù)的開發(fā)上很注重標(biāo)準(zhǔn)化和開放性。以下2002年的兩則新聞,很值得引起我們重視:一則是歐洲最大的因特網(wǎng)數(shù)據(jù)運(yùn)營商KPNQWest公司21日宣布該公司的數(shù)據(jù)網(wǎng)絡(luò)將停止運(yùn)營。KPNQWest為荷蘭電信公司KPN和美國電訊商QWest組建的聯(lián)合公司,已于5月31日宣布破產(chǎn)。據(jù)報(bào)道,該公司數(shù)據(jù)網(wǎng)絡(luò)覆蓋歐洲50個(gè)城市,其關(guān)閉將極大影響歐洲的數(shù)據(jù)傳送。另一則是2002年5月15日根據(jù)國外媒體報(bào)道,在關(guān)鍵字(Keyword)領(lǐng)域較為突出的國際知名公司RealNames,于當(dāng)?shù)貢r(shí)間本周一裁去全部員工,宣布破產(chǎn)。目前RealNames已經(jīng)關(guān)閉了其網(wǎng)站,RealNames成千上萬的網(wǎng)絡(luò)關(guān)鍵字客戶陷入了前景不可知的境地。故應(yīng)積極研究開發(fā)利用網(wǎng)絡(luò)信息資源,對網(wǎng)上特定領(lǐng)域內(nèi)的信息資源進(jìn)行系統(tǒng)挖掘并且進(jìn)行有序加工和整理,為用戶提供有效利用。否則,花費(fèi)了大量的人力物力,最后僅僅剩下幾臺(tái)電腦。
1.2 易逝性特征
為了保證網(wǎng)絡(luò)系統(tǒng)檢索的速度與穩(wěn)定性,網(wǎng)絡(luò)系統(tǒng)中的信息需要定期刪除,猶如飛機(jī)中的黑匣子,它僅保留最后一段時(shí)間的詳細(xì)資料,以前的資料逐次消去。而目前各國在法律上并沒有規(guī)定網(wǎng)絡(luò)服務(wù)商要承擔(dān)信息保存的職責(zé),因此網(wǎng)上信息有易逝性的特點(diǎn),信息資源的積累較為困難。數(shù)字資料不像印刷媒體也許還能找到孤本,殘本,網(wǎng)上電子文件在沒有了之后是不留蛛絲馬跡的,F(xiàn)在網(wǎng)絡(luò)文件的平均壽命為44天,因特網(wǎng)上網(wǎng)頁的平均壽命是75天,F(xiàn)在沒有辦法把網(wǎng)上所有變化全部存儲(chǔ)下來。號(hào)稱是最瘋狂的新聞網(wǎng)站hand.com,全天24小時(shí)發(fā)布新聞,新聞內(nèi)容平均6分鐘更新一次,并且不存擋,因而有人發(fā)出感嘆,作為人類溝通的第四媒體,互聯(lián)網(wǎng)的歷史將無以寄托[1]。同時(shí),有關(guān)如何利用網(wǎng)上數(shù)字信息資源方面,當(dāng)前法律方面并無明確規(guī)定。一方面有相當(dāng)多的數(shù)字信息在不斷消失,另一方面由于版權(quán)等原因,人們無法大膽開發(fā)利用,處于一種兩難的境界。而且,經(jīng)轉(zhuǎn)化為數(shù)字化的信息知識(shí),有的容易失真,甚至容易消失;數(shù)字信息載體與紙質(zhì)印刷品比較,保存期短,磁帶壽命為15~20年,光盤壽命為20~30年,遠(yuǎn)不及紙質(zhì)印刷品在這方面穩(wěn)定可靠。再則,技術(shù)更新、實(shí)體變質(zhì)、病毒感染、黑客攻擊、斷電、誤操作、服務(wù)器毀壞、系統(tǒng)癱瘓等因素都會(huì)影想數(shù)字信息的有效存取!霸俅问羌夹g(shù)和標(biāo)準(zhǔn)變遷時(shí),數(shù)字資源需要周期性的歸檔,以便將數(shù)字資源轉(zhuǎn)移,變換到新的硬件和軟件平臺(tái)上。由于存儲(chǔ)技術(shù)發(fā)展迅速而導(dǎo)致的技術(shù)廢退,那些認(rèn)真開發(fā)和維護(hù)的數(shù)字藏品可能會(huì)有朝一日不能解讀!薄啊蛱鼐W(wǎng)上信息的獲取這個(gè)途徑基本沒有利用。筆者的調(diào)查咨詢還顯示,98家圖書館中只有四川工業(yè)學(xué)院,上海交通大學(xué)有專人搜集因特網(wǎng)信息,占調(diào)查單位的2%!盵2]
在此情況下,圖書館應(yīng)充分發(fā)揮自己在收藏整理方面的特長,及早動(dòng)手。根據(jù)實(shí)際情況,有目的、有計(jì)劃地搜集保存相關(guān)資料。無論是實(shí)體保護(hù),還是技術(shù)環(huán)境的維護(hù),其最終目的都是為了確保數(shù)字信息的長期可處理性,可利用性。由于數(shù)字圖書館是一個(gè)海量多媒體數(shù)據(jù)庫,其信息數(shù)據(jù)最之大是前所未有。傳統(tǒng)的二級(jí)存儲(chǔ)器(主存儲(chǔ)器和磁盤)已難以容納龐大的數(shù)字圖書館數(shù)據(jù),數(shù)字圖書館中的海量數(shù)據(jù)需要使用三級(jí)存儲(chǔ)器存儲(chǔ)。目前常用的三級(jí)存儲(chǔ)器有磁帶,磁盤,光盤,機(jī)器手光盤庫,機(jī)器手磁盤庫等。[3]在日常工作中,應(yīng)重視收集因特網(wǎng)上更新頻度快的灰色文獻(xiàn)資源。比如動(dòng)態(tài)報(bào)道,其中包含了很多具有重大情報(bào)價(jià)值的內(nèi)容,一但網(wǎng)頁更新,再也難覓其蹤影,所以要求圖書館人員發(fā)揮優(yōu)勢,日積月累,將這類信息收入現(xiàn)實(shí)館藏。[4]從而安全保存數(shù)字信息資料。
1.3 數(shù)字信息的不安全性
除了數(shù)字信息對產(chǎn)生信息的原有系統(tǒng)的依賴性,信息與實(shí)體的可分離性,信息的易改性等因素對信息的安全帶來一系列的影響之外,網(wǎng)絡(luò)安全的薄弱性是不可忽視的。計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)并不安全,有時(shí)會(huì)出現(xiàn)某些隱患,從而使數(shù)字信息化為烏有;ヂ(lián)網(wǎng)不安全性的原因主要有三個(gè):網(wǎng)絡(luò)系統(tǒng)過于復(fù)雜,缺陷太多,易于遭受黑客攻擊;網(wǎng)絡(luò)管理的法制體系不夠健全;計(jì)算機(jī)專家設(shè)計(jì)的技術(shù)防范措施不得力。[5]另外病毒破壞、硬盤故障、電壓不穩(wěn)定、停電、誤操作等因素都會(huì)造成服務(wù)器毀壞,系統(tǒng)癱瘓,信息數(shù)據(jù)丟失的問題。這些都能造成難以估量的損失。
1.4 數(shù)字信息的權(quán)威性差
“眾所周知,因特網(wǎng)點(diǎn)是一個(gè)包含眾多信息格式,眾多信息內(nèi)容的信息混合體,是一個(gè)極具價(jià)值的信息源。與有著信息質(zhì)量控制機(jī)制的傳統(tǒng)信息發(fā)布和傳播模式相比,自由、開放的因特網(wǎng)為用戶提供了更為方便、更加快捷和更為廣泛的信息獲取渠道,但它在為用戶提供浩如煙海的信息的同時(shí),也造成了信息過載和信息污染等傳統(tǒng)環(huán)境下不易出現(xiàn)的新問題!盵6]越來越多的專家開始關(guān)注網(wǎng)絡(luò)信息資源的質(zhì)量問題,并呼吁對網(wǎng)絡(luò)信息資源開展同傳統(tǒng)信息環(huán)境下評(píng)價(jià)紙質(zhì)文獻(xiàn)一樣的嚴(yán)格的質(zhì)量評(píng)價(jià)。這不僅是因?yàn)榫W(wǎng)絡(luò)出版具有自由與自發(fā)特性,信息發(fā)布缺乏質(zhì)量控制機(jī)制,更因?yàn)樵谔摂M環(huán)境下,用戶很難從作者權(quán)威性,出版機(jī)構(gòu)權(quán)威性,新穎性等印刷體信息環(huán)境下常用的評(píng)價(jià)信息資源質(zhì)量的指標(biāo)中判斷網(wǎng)絡(luò)信息資源質(zhì)量。[7]
這些都是由網(wǎng)上信息的特點(diǎn)決
定的。首先,Interne網(wǎng)上信息的發(fā)布大多未經(jīng)過仔細(xì)的審閱。印刷型文獻(xiàn)出版時(shí),一般具有較為嚴(yán)格的審稿制度,以便對稿件進(jìn)行修改,把大量可能出現(xiàn)的錯(cuò)誤在印刷前改正。而Interne的信息發(fā)布,雖有一些單位、機(jī)構(gòu)落實(shí)專人進(jìn)行控制,但大多數(shù)是未經(jīng)審閱的所謂“自行發(fā)布”(VanityPublishing)形式。其次,Interne信息資源數(shù)量巨大,整序不夠,同種主題的WEB網(wǎng)站數(shù)量不斷增加,F(xiàn)有搜索引擎的索引功能尚待完善,一次檢索往往出現(xiàn)成千上萬條命中記錄的情況,令上網(wǎng)點(diǎn)檢索者無所適從。第三,Interne信息資源還存在良莠不齊、信息垃圾充斥的現(xiàn)象。許多學(xué)者對Interne信息資源的準(zhǔn)確性、可靠性存有懷疑,有的認(rèn)為網(wǎng)上信息是膚淺的和不可信的[8]。由于在Interne上個(gè)人網(wǎng)站多,信息發(fā)布隨意,除了存在虛假的信息外,還充斥著大量的價(jià)值低劣的信息。從而導(dǎo)致網(wǎng)上信息來源復(fù)雜多樣,真實(shí)性、可靠性無確實(shí)保證,處于一種無序化狀態(tài),信息的組織化程序不高。由于在網(wǎng)上有著巨大的、不可忽視的、分布分散的信息源,以及網(wǎng)絡(luò)信息管理機(jī)制及規(guī)范并未建立,人們在大量無序的信息中想要全面、迅速、有效地查到所需信息還比較困難,單靠幾個(gè)搜索引擎是不夠用的。《時(shí)代周刊》曾評(píng)論道:“因特網(wǎng)與其說是把新用戶帶入了新世界,不如說是把他們引進(jìn)了茫茫無際的大!薄9]
1.5 適宜于共時(shí)研究,歷時(shí)研究有待技術(shù)進(jìn)步與支持
共時(shí)研究,研究當(dāng)代以來的各種問題時(shí),各種資源浩如煙海,任何一個(gè)大的事件,都可以很快找到大量的信息;歷時(shí)研究,當(dāng)從歷史的角度來研究考察許多問題時(shí),則無法很好進(jìn)行,因?yàn)閿?shù)字資源的積累量太少,歷史太短;“與傳統(tǒng)圖書館比較,數(shù)字圖書館存儲(chǔ)的信息量有限,且不系統(tǒng)不全面,不能滿足人們系統(tǒng)學(xué)習(xí)研究的需要;”[10]而歷史文化資源數(shù)據(jù)庫的建設(shè),需要大量的投入,需要很長的時(shí)間來進(jìn)行。如根據(jù)統(tǒng)計(jì),我國現(xiàn)存古籍10余萬種,1000萬冊以上,如果再加上古代藝術(shù)作品、近現(xiàn)代資料,總量將達(dá)到幾十萬種。限于數(shù)字圖書館建設(shè)的重點(diǎn)和資金等問題,歷史文化資源建設(shè)只能選其精品。[11]有人估計(jì)將俄羅斯的全部古籍?dāng)?shù)字化保存,至少需要200年時(shí)間,暫且不考慮所需資金。而且目前,我國全文文獻(xiàn)資源數(shù)據(jù)庫幾乎沒有,更談不上規(guī)模,而且也沒有形成統(tǒng)一的或兼容的格式!跋衩绹鴩鴷(huì)圖書館就開設(shè)了虛擬電子圖書館,但網(wǎng)絡(luò)上無法查閱原文,只能查閱館內(nèi)所藏書籍的簡介。”[12]同時(shí)從經(jīng)濟(jì)方面考慮,有資源的可獲得性問題,這里又有三層含義:一是目前還缺乏大量的數(shù)字化資源,而轉(zhuǎn)換的代價(jià)又很高;二是尚未形成“無處不在的網(wǎng)絡(luò)”和“無處不在的計(jì)算機(jī)”;三是用戶對數(shù)字圖書館的可承受性(支付能力)還不高[13]!暗,目前網(wǎng)上社科信息資源分布極不平衡,金融、貿(mào)易、法律等一些應(yīng)用學(xué)科的信息所占比重較大,而哲學(xué)、政治學(xué)、文學(xué)、歷史、考古等一些老化速度慢、時(shí)效性不太強(qiáng)的學(xué)科的信息則相對少一些。而且,由于國內(nèi)外對社會(huì)科學(xué)的劃分標(biāo)準(zhǔn)存在差異,造成各自的社會(huì)科學(xué)主題分類目錄下所涉及的信息領(lǐng)域內(nèi)容不同,使網(wǎng)上社科信息資源處于分散狀態(tài),不利于用戶查全,查準(zhǔn)所需信息。”[14]由于網(wǎng)絡(luò)信息服務(wù)實(shí)踐缺乏理論的指導(dǎo),而真正的資源共享運(yùn)行機(jī)制目前尚未形成,異地索取原始文獻(xiàn)困難重重。
1.6 應(yīng)加強(qiáng)信息過渡技術(shù)的研究
信息化社會(huì)的到來,信息量的巨大增長,信息傳遞速度的加快,信息對人類生活的重要性日益加強(qiáng)。然而人類鑄造的科技這把“雙刃劍”,把自己趕到知識(shí)和信息的海洋的同時(shí),作為個(gè)體的人卻被知識(shí)與信息的海洋淹沒了,過量的信息使人迷失,虛假信息使人行為失策,信息干擾導(dǎo)致人們無法作出正確的判斷,而垃圾信息則嚴(yán)重地影響了人們的正常工作、學(xué)習(xí)和生活并成為污染人類精神世界的元兇之一。作為信息“過濾器”的圖書館應(yīng)責(zé)無旁貸的擔(dān)當(dāng)起對網(wǎng)絡(luò)信息進(jìn)行過濾整理的工作,對網(wǎng)絡(luò)信息去粗存精,去偽存真,凈化網(wǎng)絡(luò)信息環(huán)境。但是由于技術(shù)上的原因,各種過渡軟件都難以達(dá)到目的,對網(wǎng)絡(luò)信息的過濾效果并不向宣稱的那樣好。[15]“人們還缺乏對龐大而混亂的網(wǎng)絡(luò)信息進(jìn)行有效整序的能力,這種狀況既影響了讀者獲得的信息的質(zhì)量,又使信息應(yīng)用的效率得不到保障”。[16]面對被污染的信息資源,過濾是行之有效的防范手段。加強(qiáng)信息過濾技術(shù)的研究,有利于用戶快速找到有用的信息,保持信息高速公路的暢通無阻。
2 關(guān)鍵技術(shù),統(tǒng)一標(biāo)準(zhǔn)和管理人才問題也應(yīng)該引起我們的高度重視
2.1 關(guān)鍵的技術(shù)問題尚未解決
數(shù)字圖書館建設(shè)中的瓶頸技術(shù)問題如:海量信息存儲(chǔ)技術(shù)、互操作技術(shù)、網(wǎng)絡(luò)信息檢索技術(shù)、個(gè)性化信息定制與推送技術(shù)、數(shù)字化信息的開放描述、數(shù)字圖書館的硬件平臺(tái)、數(shù)字版權(quán)保持技術(shù)等等,有待于技術(shù)的進(jìn)一步完善,有待于人們進(jìn)一步的研究、實(shí)踐。
2.2 標(biāo)準(zhǔn)與法規(guī)的制定和實(shí)施,缺乏應(yīng)有的統(tǒng)一標(biāo)準(zhǔn)和規(guī)范
由于眾所周知的原因,目前各個(gè)數(shù)據(jù)庫之間的編碼格式不同,數(shù)據(jù)庫之間無法進(jìn)行轉(zhuǎn)換,同時(shí)也缺乏跨庫的檢索技術(shù),因此目前數(shù)字圖書館的數(shù)據(jù)資源無法發(fā)揮整體優(yōu)勢。在進(jìn)行數(shù)字圖書館研究和建設(shè)數(shù)字資源庫的過程中,我們必須明白,這是一項(xiàng)跨行業(yè),跨部門,跨地區(qū)的國家的重大工程,單靠哪一個(gè)部門、哪一個(gè)單位是無法完成的。
2.3 高質(zhì)量的管理運(yùn)營人才缺乏
非常重要的是要有適應(yīng)數(shù)字圖書館運(yùn)行、管理和服務(wù)的新型的圖書館員(Cyberian)。數(shù)字圖書館的建設(shè)和發(fā)展離不開高素質(zhì)人才。數(shù)字圖書館工作要求管理人員具有較高學(xué)歷和專業(yè)素質(zhì),需要掌握多方面的知識(shí)。同樣重要的是相關(guān)專業(yè)人員之間的緊密合作。
在數(shù)字化浪潮中,我們應(yīng)以“社會(huì)資源館藏化”為主要職能,部分館藏進(jìn)行數(shù)字化轉(zhuǎn)換只是一種補(bǔ)充行為,“館藏資源數(shù)字化”不宜成為圖書館的主要任務(wù),更不宜作為一種口號(hào)提出來。同時(shí),圖書情報(bào)界應(yīng)盡快擺脫自產(chǎn)自用文獻(xiàn)數(shù)據(jù)庫的狀況。有所不為才能有所為。作為國家重要的信息資源基地,應(yīng)該加強(qiáng)橫向交流與協(xié)作,發(fā)揮圖書館界整體優(yōu)勢,走“分散建庫,集中聯(lián)庫,分散服務(wù),資源共享”的聯(lián)合建庫道路。
收稿日期:2003-04-25
【參考文獻(xiàn)】
1 王曉美.論圖書館對網(wǎng)址信息的收藏和保護(hù).圖書館雜志,1999,(9):29~31
2 鄧永莉.國內(nèi)數(shù)字圖書館建設(shè)的反思.圖書情報(bào)工作,2003,(3):104~108
3 鄧永莉.國內(nèi)數(shù)字圖書館建設(shè)的反思.圖書情報(bào)工作,2003,(3):104~108
4 高文,劉峰,黃鐵軍等.數(shù)字圖書館——原理與技術(shù)實(shí)現(xiàn).清華大學(xué)出版社,2000
5 徐義全.電子文件的特性與長期保存.檔案學(xué)研究,2000,(1):53~57
6 張?jiān)?網(wǎng)絡(luò)信息資源評(píng)價(jià)辦法.圖書情報(bào)工作,2002,(10):41~47,61
7 Janicke Hinchliffe,Lisa.Resource selection and information eval uation.
http://alexia.lis.uiuc.edu
/janicke/Evaluate.html
8 HawkinsD.T.WhatisCredibleInformation?Online,1999,23(5):86-89
9 張文華.從用戶研究與擁護(hù)需求變化看我國數(shù)字圖書館教育.大學(xué)圖書館學(xué)報(bào),2000,(5):71~72
10 黃宗忠,王曉燕.論復(fù)合圖書館與圖書館發(fā)展趨向.圖書館論壇,2002,(5):6~11,21
11 強(qiáng)自力,苗凌,李人厚.關(guān)于建設(shè)有中國特色的數(shù)字圖書館的思考.大學(xué)圖書館學(xué)報(bào),2000,(1):3~6
12 于升峰等.數(shù)字圖書館的關(guān)鍵技術(shù)研究.情報(bào)學(xué)報(bào),1999,(12):536~540
13 朱強(qiáng).談?wù)剶?shù)字圖書館實(shí)現(xiàn)的條件.大學(xué)圖書館學(xué)報(bào),2000,(1):11~13
14 李伶.Interne上社會(huì)科學(xué)信息資源的利用,大學(xué)圖書館學(xué)報(bào),2000,(2):68~74
15 李伶.Interne上社會(huì)科學(xué)信息資源的利用,大學(xué)圖書館學(xué)報(bào),2000,(2):68~74
16 張成昱.論第三代數(shù)字圖書館.圖書情報(bào)工作,2003,(3):66~71
【數(shù)字信息資源的另一面】相關(guān)文章:
數(shù)字信息資源合理使用問題探討08-05
數(shù)字圖書館信息資源本體論的構(gòu)建08-05
信息資源:特點(diǎn)·價(jià)值·機(jī)制08-05
我的另一面03-02
另一面作文04-30
另一面小學(xué)作文02-21
[優(yōu)]另一面作文02-17
媽媽的另一面作文03-27