關于地方文獻數(shù)據(jù)庫建設的思考
關于地方文獻的界定,地方文獻工作的前輩杜定友先生認為“地方文獻是指有關本地方的一切資料,表現(xiàn)于各種記載形式的,如:圖書、雜志、報紙、圖片、照片、影片、畫片、拓本、表格、傳單、票據(jù)、文告、手稿、印模、簿籍等”。隨著社會的發(fā)展,新型載體形式的不斷涌現(xiàn),諸如光化學、磁記錄制品等的面世,增加了地方文獻載體形式的新家族。在如此眾多的文獻類型和文獻載體中選取相關的地方文獻信息進行數(shù)據(jù)庫建設是社會發(fā)展的必然,也是地方文獻對社會需求的積極反應。
地方文獻數(shù)據(jù)庫建設工作是地方文獻全面實現(xiàn)自動化和網(wǎng)絡化的基礎,是提高地方文獻工作管理水平與質量,建立和實現(xiàn)地方文獻資源共享的前提。本文是筆者對地方文獻數(shù)據(jù)庫建設過程中涉及到問題的一些思考,供同道師友參考。
1 數(shù)據(jù)庫建設論證
數(shù)據(jù)庫建設作為一項系統(tǒng)工程在投資興建前應對其經濟效益和社會效果進行多方面的調研、預測和評介,進行可行性論證,以回答在限定條件下,數(shù)據(jù)庫建設的目標能否達到,是否可行,何者為優(yōu)諸多問題。論證的主要內容包括需求研究、可行性研究和評價報告等步驟。
需求研究是對項目的背景,研究工作的依據(jù)和范圍,市場需求和擬建規(guī)模的調研。
地方文獻是反映一個地方諸多方面信息的文獻總集成,研究的主題和范圍有著嚴格的界定,其信息密度和獨特性是其他文獻無可替代的。在網(wǎng)絡環(huán)境下,以數(shù)據(jù)庫建設為契機對地方文獻中的核心文獻進行一次全面深入的發(fā)掘和整理,逐步實現(xiàn)地方文獻數(shù)字化。其意義在于突破了地方文獻信息傳統(tǒng)傳輸?shù)南拗?實現(xiàn)了跨地域、無時限的信息獲取方式。將地方文獻推向一個廣闊的傳播空間,在這個文獻基礎上建設的數(shù)據(jù)庫存在著廣泛的市場需求和信息開發(fā)價值。地方文獻從整體范圍上說分為核心文獻和非核心文獻,數(shù)據(jù)庫選題應首先選擇地方文獻的核心文獻作為數(shù)據(jù)庫的建設重點。建立獨具特色的數(shù)據(jù)庫是地方文獻建庫的原則,在這個基礎上精心策劃和設計建設符合實際的地方文獻數(shù)據(jù)庫,可以包括不同的文獻類型和文獻載體,其規(guī)模應視實際情況而定,不能貪大求快作表面文章,要特別重視數(shù)據(jù)庫的實用性和社會效益。
可行性研究是對資金、資源和人員等進行分析研究,并提出和考慮幾種方案以便比較,從數(shù)據(jù)庫使用的角度回答項目的可行與否。
數(shù)據(jù)庫建設主要是將紙本文獻信息通過技術手段加工成為電子文件的過程,在這個過程中涉及到文獻資源、資金和專業(yè)技術人員等諸多因素,涉及到多部門之間協(xié)作。數(shù)據(jù)庫建設工作中的每一個環(huán)節(jié),都應經過認真研究和分析才能作出決定,而不能簡單化。行政命令不能解決本應通過討論和協(xié)商解決的問題,應該注意解決的問題含糊不得。
數(shù)據(jù)庫建設資金是非常重要的問題。資金籌措和使用管理等應請有關專家領導研究和論證方可決定。與資金相關的問題是數(shù)據(jù)生產方式,而采用什么樣的數(shù)據(jù)生產方式又涉及到數(shù)據(jù)庫建設人員問題。生產方式不外乎本單位生產和社會化加工兩種。如果自己具備數(shù)據(jù)生產能力,資金投入從理論上應該低于社會化加工,通過實際工作還可以培養(yǎng)和造就一批專業(yè)人才。如果本館數(shù)據(jù)加工能力有限,需要社會化加工,也應考慮資金投入與獲得利益的價值比。
完成上述工作后,提出周密詳細可靠的評介報告交付決策部門,整個數(shù)據(jù)庫建設論證工作才算完成。
2 數(shù)據(jù)庫建設工作流程
決策部門下達了數(shù)據(jù)庫建設任務后,數(shù)據(jù)庫建設任務的承擔部門應迅速擬定出具體的建設方案及業(yè)務工作流程,以指導數(shù)據(jù)庫建設工作有序進行。建設方案主要內容應包括:文獻選取、數(shù)據(jù)庫結構、文獻加工、文獻標引、數(shù)據(jù)灌裝鏈接等。
①工作流程圖
②文獻選取
文獻選取工作是數(shù)據(jù)庫建設的重要內容之一,關系到數(shù)據(jù)庫的質量高低和成功與否。文獻選取應以社會需求、社會效果和地方文獻基礎業(yè)務建設需要為主要參考依據(jù),選取標準應定位在地方文獻核心文獻。
考慮不同時期文獻的字體形式、紙張問題、印刷技術在文獻數(shù)據(jù)加工時的難易和成本費用的高低等。先期選取文獻時以簡體橫排文字圖書為主體,古籍線裝圖書盡可能使用再版排印本,這樣可以大大降低文獻掃描識別的難度。
③數(shù)據(jù)庫結構
數(shù)據(jù)庫結構設計的合理與否關系到數(shù)據(jù)庫使用,因此在進行數(shù)據(jù)庫結構設計時,數(shù)據(jù)庫設計人員和地方文獻業(yè)務人員應該從使用者的角度,進行細致的研究分析,力求操作簡便快捷。
數(shù)據(jù)庫結構主要包括以下內容:
題名、題名責任者(可重復字段)、母體文獻名稱、母體文獻責任者、出版社、出版日期、頁數(shù)、分類號(可重復字段)、主題詞(可重復字段)、索引號、ISBN、摘要。
對象數(shù)據(jù):文本(文獻全文)、圖像(文獻全文、封面和插圖)
④文獻加工
文獻加工是通過數(shù)據(jù)庫掃描、識別、灌裝、鏈接等工序將紙本文獻加工成為電子文獻,以實現(xiàn)文獻性質的轉換,完成數(shù)據(jù)庫檢索功能。
文獻加工是項復雜的事情,紙本文獻由于出版年代不同,存在著繁體字豎排版、異體字等問題,這是數(shù)據(jù)加工的難點之一。全文數(shù)據(jù)庫的文獻格式有圖形文件(tif)和文本文件(txt),兩種格式的文件性質不同加工價格也不同。圖形文件在數(shù)據(jù)庫中僅供瀏覽不能進行檢索,當然加工價格也便宜。文本文件在數(shù)據(jù)庫中不僅可以瀏覽重要的是可供檢索,自然加工價格也貴許多。兩種文獻格式的加工費用比例約為1比5。受價格因素的制約,在文獻加工時選擇那種文獻格式,要對使用目的和文獻加工價格綜合考慮。
⑤文獻標引
文獻標引工作是一項復雜的技術性工作,標引質量受各個工作環(huán)節(jié)的制約,因此必須嚴格遵守一定的工作程序。地方文獻標引工作因其文獻的地域性和特殊性,在遵循圖書館文獻標引工作的原則和方法前提下,應根據(jù)地方文獻工作的特點制定出一些符合實際工作需求的標準和方法,以滿足地方文獻標引工作需要。文獻標引涉及到數(shù)據(jù)庫檢索質量問題,檢全率、檢準率是衡量數(shù)據(jù)庫質量的重要標準,因此文獻標引工作應由富有經驗的地方文獻專業(yè)人員完成。
⑥數(shù)據(jù)灌裝鏈接
從事數(shù)據(jù)灌裝鏈接工作的技術人員需要很強的責任心,良好的專業(yè)素質,操作謹慎細致,來不得一點馬虎。灌裝鏈接中一個不經意的誤差可能導致數(shù)據(jù)庫檢索失敗,出現(xiàn)誤檢或漏檢,大大降低數(shù)據(jù)庫的檢全率和檢準率,極大的削弱數(shù)據(jù)庫使用功能。
數(shù)據(jù)灌裝鏈接專業(yè)人員要與地方文獻專業(yè)人員進行必要的溝通,傾聽他們對數(shù)據(jù)庫的使用要求,最大限度的滿足地方文獻工作的特殊檢索要求。
3 數(shù)據(jù)庫建設中的相關因素
數(shù)據(jù)庫建設中涉及的因素有很多,如人員素質、文獻資源、資金、計算機軟硬件、數(shù)據(jù)加工、協(xié)作關系等。在諸多因素中,人員素質、數(shù)據(jù)來源應視為主要因素。
①人員素質
人員素質是影響數(shù)據(jù)庫建設最直接的因素之一。人員包括地方文獻專業(yè)人員和數(shù)據(jù)庫技術人員,地方文獻專業(yè)人員在地方文獻數(shù)據(jù)庫選題、建設方案、文獻選取、文獻標引等工作中舉足輕重。地方文獻專業(yè)人員作為數(shù)據(jù)庫建設的主體人員應具備較高專業(yè)素質和思想素質。數(shù)據(jù)庫技術人員是地方文獻數(shù)據(jù)庫得以實現(xiàn)的技術保障。因此應該對參加建庫人員進行專業(yè)技術培訓,進行上崗考核,確保各項工作規(guī)范化。
②文獻資源
文獻資源是數(shù)據(jù)庫建設的首要條件因素之一,缺乏文獻資源支持的數(shù)據(jù)庫建設是無源之水,無米之炊。地方文獻數(shù)據(jù)庫建設分為書目數(shù)據(jù)庫和全文數(shù)據(jù)庫或稱對象數(shù)據(jù)庫,無論是哪種形式的數(shù)據(jù)庫都離不開文獻資源的支持。具備地方文獻專藏系統(tǒng)的單位可以本館資源為主體來源,同時加強對社會其他文獻資源中地方文獻的檢索和梳理。未建立地方文獻專藏的單位首先根據(jù)地方文獻工作原則和標準,通過書目控制理順和檢全文獻資源,做到心中有數(shù)。做好建庫的前期準備工作,最大限度的提高數(shù)據(jù)庫的完整性、系統(tǒng)性、權威性。
圖書館數(shù)據(jù)庫建設是一項繁雜的系統(tǒng)工程,地方文獻數(shù)據(jù)庫由于受地方文獻特殊性的影響就更是復雜。因此在建設地方文獻數(shù)據(jù)庫時,應就其建設目標、社會需求及相關的諸多因素進行認真的研究分析以求獲得最理想的結果。
網(wǎng)絡環(huán)境下數(shù)據(jù)庫技術使地方文獻的利用和傳播突破了空間和時間的限制,社會信息用戶對地方文獻的需求呈現(xiàn)出較高渴望,人們對地方文獻數(shù)據(jù)庫建設表現(xiàn)出極大的熱情,而地方文獻數(shù)據(jù)庫工作也作為衡量圖書館工作的一項重要指標納入圖書館工作考核之中。所有這些都給圖書館地方文獻工作者們提出了更高的要求。勤于思考、認真對待,深入研究和開發(fā)利用地方文獻將是地方文獻工作者們今后需要認真研究的重要課題。
〔出處〕 圖書館工作與研究2002增刊
【地方文獻數(shù)據(jù)庫建設的思考】相關文章:
建設河池地區(qū)地方文獻數(shù)據(jù)庫的思考08-09
地方文獻數(shù)據(jù)庫建設初探08-09
組建萍鄉(xiāng)地區(qū)地方文獻數(shù)據(jù)庫的思考08-09
關于加強地方文獻資源建設的思考08-09