《關于數字信息資源的另一面》由會員分享,可在線閱讀,更多相關《關于數字信息資源的另一面(10頁珍藏版)》請在裝配圖網上搜索。
1、
關于數字信息資源的另一面
(作者 :___________單位 : ___________ 郵編 : ___________ )
【內容提要】任何事物都有兩面性。文章從數字信息資源存在的問題,如使用權與所有權問題;易逝性特征;數字信息的不安全性;數字信息的權威性差;適宜于共時研究,歷時研究方面有待技術的進步與支持; 應加強信息過濾技術的研究, 充分考慮技術上的難度和各方面所需的條件等方面, 論述了數字信息及數字圖書館建設中應注意的問題。
【摘要題】數字圖書館論壇
目前,在
2、我國圖書館界幾乎是言必稱數字,會必議數字,刊必載數字,課必講數字,沒有“數字”就不時髦。對此,我們可以完全理解,并予以充分肯定。但是“這種熱潮”帶有很大的盲目性,是對數字圖書館的認識存在誤區(qū)所致。 筆者認為這可能反映了國內圖書館界對于實現數字圖書館在技術上的難度和各方面所需的條件還
認識不足;而如果沒有充分的認識和多方面的準備, 我們在探索實現數字圖書館的過程中可能會走彎路。
1 應深刻認識、加深理解的幾個問題
1.1 使用權與所有權問題
其實對于數字化信息資源, 我們僅僅擁有使用權, 僅僅在
付費的那一段時間內,擁有使用權,而
3、并無所有權。這一點與傳統(tǒng)的紙質文獻資源相比,有很大的不同。傳統(tǒng)紙質印刷品,是一個物理實體,當你付錢購買后,你就擁有了所有權,不存在版權問題,不存在內容失真問題。數字圖書館的信息資源,受知識產權的保護限制,許多著作內容不經原著者同意,不能轉換,更不能隨意上網傳播;一般說來,網址信息的穩(wěn)定則依賴于誰擁有服務的空間, 擁有者意味著網址作者控制空間的使用與內容及服務器的管理政策。 而存儲空間的數量則與服務器提供者的經濟承受能力有關。 網絡空間是人們花一定費用取得的使用權。擁有網絡空間就要對其進行維護,包括上網費,電話線路費,線路資源費用。
因而,數字圖書館的建設是一項高技術、高投入的工作,即
4、使美國政府的項目, 也不是由政府出全資開發(fā)建設, 并且在項目的管理上多采用經營模式, 技術的開發(fā)上很注重標準化和開放性。 以下 2002 年的兩則新聞,很值得引起我們重視:一則是歐洲最大的因特
網數據運營商 KPNQWest公司 21 日宣布該公司的數據網絡將停止運
營。 KPNQWest為荷蘭電信公司 KPN和美國電訊商 QWest組建的聯(lián)合
公司,已于 5 月 31 日宣布破產。據報道,該公司數據網絡覆蓋歐洲
50 個城市,其關閉將極大影響歐洲的數據傳送。另一則是
2002 年 5
月 15 日根據國外媒體報道, 在關鍵字 (Keywo
5、rd) 領域較為突出的國際知名公司 RealNames,于當地時間本周一裁去全部員工,宣布破產。目前 RealNames已經關閉了其網站, RealNames成千上萬的網絡關鍵字客戶陷入了前景不可知的境地。 故應積極研究開發(fā)利用網絡信息資
源,對網上特定領域內的信息資源進行系統(tǒng)挖掘并且進行有序加工和
整理,為用戶提供有效利用。否則,花費了大量的人力物力,最后僅
僅剩下幾臺電腦。
1.2 易逝性特征
為了保證網絡系統(tǒng)檢索的速度與穩(wěn)定性, 網絡系統(tǒng)中的信
息需要定期刪除, 猶如飛機中的黑匣子, 它僅保留最后一段時間的詳細資
6、料,以前的資料逐次消去。 而目前各國在法律上并沒有規(guī)定網絡服務商要承擔信息保存的職責, 因此網上信息有易逝性的特點, 信息資源的積累較為困難。 數字資料不像印刷媒體也許還能找到孤本, 殘本,網上電子文件在沒有了之后是不留蛛絲馬跡的。 現在網絡文件的平均壽命為 44 天,因特網上網頁的平均壽命是 75 天。現在沒有辦法
把網上所有變化全部存儲下來。號稱是最瘋狂的新聞網站 ,
全天 24 小時發(fā)布新聞, 新聞內容平均 6 分鐘更新一次, 并且不存擋,因而有人發(fā)出感嘆, 作為人類溝通的第四媒體, 互聯(lián)網的歷史將無以寄托 [1] 。同時,有關如何利用網上數字信息資源方面,當前法律方
7、
面并無明確規(guī)定。 一方面有相當多的數字信息在不斷消失, 另一方面由于版權等原因,人們無法大膽開發(fā)利用,處于一種兩難的境界。而且,經轉化為數字化的信息知識,有的容易失真,甚至容易消失;數
字信息載體與紙質印刷品比較,保存期短,磁帶壽命為
15~20 年,
光盤壽命為 20~30 年,遠不及紙質印刷品在這方面穩(wěn)定可靠。 再則,技術更新、實體變質、病毒感染、黑客攻擊、斷電、誤操作、服務器毀壞、系統(tǒng)癱瘓等因素都會影想數字信息的有效存取。 “再次是技術
和 準 遷 ,數字 源需要周期性的 檔,以便將數字 源 移, 到新的硬件和 件平臺上。 由
8、于存 技 展迅速而 致的技
退,那些 真開 和 的數字藏品可能會有朝一日不能解 。 ” “??因特網上信息的 取 個途徑基本沒有利用。 筆者的 咨 示, 98 家 中只有四川工 學院,上海交通大學有 人搜集因特網信息,占 位的 2%?!盵2]
在此情況下, 充分 自己在收藏整理方面的特 ,及早 手。根據 情況, 有目的、有 劃地搜集保存相關 料。無 是 體保 , 是技 境的 , 其最 目的都是 了確保數字信息的 期可 理性, 可利用性。由于數字 是一個海量多媒體數據 ,其信息數據最之大是前所未有。 的二 存 器(主存 器和磁
9、)已 以容 大的數字 數據, 數字 中的海量數據需要使用三 存 器存 。 目前常用的三 存 器有磁 , 磁 ,光 ,機器手光 ,機器手磁 等。 [3] 在日常工作中, 重 收集因特網上更新 度快的灰色文獻 源。 比如 道, 其中包含了很多具有重大情 價 的內容, 一但網 更新, 再也 其蹤影,所以要求 人 ,日 月累,將 信息收入 藏。 [4] 從而安全保存數字信息 料。
1.3 數字信息的不安全性
除了數字信息 生信息的原有系 的依 性, 信息與
體的可分離性,信息的易改性等因素 信息的安全 來一
10、系列的影響
之外,網 安全的薄弱性是不可忽 的。 算機網 系 并不安全,
有時會出現某些隱患, 從而使數字信息化為烏有。 互聯(lián)網不安全性的
原因主要有三個: 網絡系統(tǒng)過于復雜, 缺陷太多,易于遭受黑客攻擊;
網絡管理的法制體系不夠健全; 計算機專家設計的技術防范措施不得
力。 [5] 另外病毒破壞、硬盤故障、電壓不穩(wěn)定、停電、誤操作等因
素都會造成服務器毀壞,系統(tǒng)癱瘓,信息數據丟失的問題。這些都能
造成難以估量的損失。
1.4 數字信息的權威性差
“眾所周知,因特網點是一個包含眾多信息格式
11、,眾多信息內容的信息混合體, 是一個極具價值的信息源。 與有著信息質量控制機制的傳統(tǒng)信息發(fā)布和傳播模式相比, 自由、開放的因特網為用戶提供了更為方便、 更加快捷和更為廣泛的信息獲取渠道, 但它在為用戶提供浩如煙海的信息的同時, 也造成了信息過載和信息污染等傳統(tǒng)環(huán)境下不易出現的新問題。 ”[6] 越來越多的專家開始關注網絡信息資源的質量問題,并呼吁對網絡信息資源開展同傳統(tǒng)信息環(huán)境下評價紙質文獻一樣的嚴格的質量評價。 這不僅是因為網絡出版具有自由與自發(fā)特性,信息發(fā)布缺乏質量控制機制,更因為在虛擬環(huán)境下,用戶很難從作者權威性, 出版機構權威性, 新穎性等印刷體信息環(huán)境下常用的評價信息資源質量的指標中
12、判斷網絡信息資源質量。 [7]
這些都是由網上信息的特點決定的。首先, In
terne 網上信息的發(fā)布大多未經過仔細的審閱。 印刷型文獻出版時,
一般具有較為嚴格的審稿制度, 以便對稿件進行修改, 把大量可能出
現的錯誤在印刷前改正。而 Interne 的信息發(fā)布,雖有一些單位、機
構落實專人進行控制,但大多數是未經審閱的所謂“自行發(fā)布”
(VanityPublishing) 形式。其次, Interne 信息資源數量巨大,整序
不夠,同種主題的 WEB網站數量不
13、斷增加。 現有搜索引擎的索引功能
尚待完善,一次檢索往往出現成千上萬條命中記錄的情況, 令上網點
檢索者無所適從。第三, Interne 信息資源還存在良莠不齊、信息垃
圾充斥的現象。 許多學者對 Interne 信息資源的準確性、 可靠性存有
懷疑,有的認為網上信息是膚淺的和不可信的 [8] 。由于在 Interne
上個人網站多,信息發(fā)布隨意,除了存在虛假的信息外,還充斥著大
量的價值低劣的信息。從而導致網上信息來源復雜多樣,真實性、可
靠性無確實保證,處于一種無序化狀態(tài),信息的組織化程序不高。由
于在網上有
14、著巨大的、不可忽視的、分布分散的信息源,以及網絡信
息管理機制及規(guī)范并未建立, 人們在大量無序的信息中想要全面、 迅
速、有效地查到所需信息還比較困難, 單靠幾個搜索引擎是不夠用的。
《時代周刊》曾評論道: “因特網與其說是把新用戶帶入了新世界,
不如說是把他們引進了茫茫無際的大?!?。[9]
1.5 適宜于共時研究,歷時研究有待技術進步與支持
共時研究,研究當代以來的各種問題時, 各種資源浩如煙海,任何一個大的事件,都可以很快找到大量的信息;歷時研究,當從歷史的角度來研究考察許多問題時, 則無法很好進行, 因為數
15、字資
源的積累量太少,歷史太短; “與傳統(tǒng)圖書館比較,數字圖書館存儲
的信息量有限,且不系統(tǒng)不全面,不能滿足人們系統(tǒng)學習研究的需
要;”[10] 而歷史文化資源數據庫的建設,需要大量的投入,需要很
長的時間來進行。如根據統(tǒng)計,我國現存古籍 10 余萬種, 1000 萬冊
以上,如果再加上古代藝術作品、 近現代資料,總量將達到幾十萬種。
限于數字圖書館建設的重點和資金等問題, 歷史文化資源建設只能選
其精品。 [11] 有人估計將俄羅斯的全部古籍數字化保存,至少需要
200 年時間,暫且不考慮所需資金
16、。而且目前,我國全文文獻資源數據庫幾乎沒有,更談不上規(guī)模,而且也沒有形成統(tǒng)一的或兼容的格式?!跋衩绹鴩鴷D書館就開設了虛擬電子圖書館, 但網絡上無法查閱原文,只能查閱館內所藏書籍的簡介。 ”[12] 同時從經濟方面考慮,有資源的可獲得性問題, 這里又有三層含義: 一是目前還缺乏大量的數字化資源,而轉換的代價又很高;二是尚未形成“無處不在的網絡”和“無處不在的計算機” ;三是用戶對數字圖書館的可承受性(支付能力)還不高 [13] 。“但是,目前網上社科信息資源分布極不平衡,金融、貿易、法律等一些應用學科的信息所占比重較大,而哲學、政治學、文學、歷史、考古等一些老化速度慢、時效性不太強的學科的信息
17、則相對少一些。 而且,由于國內外對社會科學的劃分標準存在差異,造成各自的社會科學主題分類目錄下所涉及的信息領域內容不
同,使網上社科信息資源處于分散狀態(tài),不利于用戶查全,查準所需信息?!?[14] 由于網絡信息服務實踐缺乏理論的指導,而真正的資源共享運行機制目前尚未形成,異地索取原始文獻困難重重。
1.6 應加強信息過渡技術的研究
信息化社會的到來, 信息量的巨大增長, 信息傳遞速度的加快,信息對人類生活的重要性日益加強。 然而人類鑄造的科技這把“雙刃劍”,把自己趕到知識和信息的海洋的同時,作為個體的人卻被知識與信息的海洋淹沒了, 過量的信息使人迷
18、失, 虛假信息使人行為失策,信息干擾導致人們無法作出正確的判斷, 而垃圾信息則嚴重地影響了人們的正常工作、 學習和生活并成為污染人類精神世界的元兇之一。作為信息 “過濾器”的圖書館應責無旁貸的擔當起對網絡信息進行過濾整理的工作,對網絡信息去粗存精,去偽存真,凈化網絡信息環(huán)境。但是由于技術上的原因,各種過渡軟件都難以達到目的,對網絡信息的過濾效果并不向宣稱的那樣好。 [15] “人們還缺乏對龐大而混亂的網絡信息進行有效整序的能力, 這種狀況既影響了讀者獲得的信息的質量,又使信息應用的效率得不到保障” 。[16] 面對被污染的信息資源, 過濾是行之有效的防范手段。 加強信息過濾技術的研究,有利于用
19、戶快速找到有用的信息, 保持信息高速公路的暢通無阻。
2 關鍵技術,統(tǒng)一標準和管理人才問題也應該引起
我們的高度重視
2.1 關鍵的技術問題尚未解決
數字圖書館建設中的瓶頸技術問題如:海量信息存儲技
術、互操作技術、網絡信息檢索技術、個性化信息定制與推送技術、
數字化信息的開放描述、 數字圖書館的硬件平臺、 數字版權保持技術
等等,有待于技術的進一步完善,有待于人們進一步的研究、實踐。
2.2 標準與法規(guī)的制定和實施,缺乏應有的統(tǒng)一標準和
規(guī)范
由于眾所周知的原因, 目前各個數據
20、庫之間的編碼格式不同,數據庫之間無法進行轉換,同時也缺乏跨庫的檢索技術,因此目前數字圖書館的數據資源無法發(fā)揮整體優(yōu)勢。 在進行數字圖書館研究和建設數字資源庫的過程中,我們必須明白,這是一項跨行業(yè),跨部門,跨地區(qū)的國家的重大工程,單靠哪一個部門、哪一個單位是無法完成的。
2.3 高質量的管理運營人才缺乏
非常重要的是要有適應數字圖書館運行、 管理和服務的新型的圖書館員 (Cyberian) 。數字圖書館的建設和發(fā)展離不開高素質人才。數字圖書館工作要求管理人員具有較高學歷和專業(yè)素質, 需要掌握多方面的知識。同樣重要的是相關專業(yè)人員之間的緊密合作。
在數字化浪潮中,我們
21、應以“社會資源館藏化”為主要職能,部分館藏進行數字化轉換只是一種補充行為, “館藏資源數字化”不宜成為圖書館的主要任務,更不宜作為一種口號提出來。同時,圖書情報界應盡快擺脫自產自用文獻數據庫的狀況。 有所不為才能有所為。作為國家重要的信息資源基地,應該加強橫向交流與協(xié)作,發(fā)揮
圖書館界整體優(yōu)勢, 走“分散建庫, 集中聯(lián)庫,分散服務,資源共享”的聯(lián)合建庫道路。
收稿日期: 2003-04-25
【參考文獻】
1 王曉美 . 論圖書館對網址信息的收藏和保護 . 圖書館雜
志, 1999,(9):29 ~31
2 鄧永莉
22、 . 國內數字圖書館建設的反思 . 圖書情報工作,
2003,(3):104 ~108
3 鄧永莉 . 國內數字圖書館建設的反思 . 圖書情報工作,
2003,(3):104 ~108
4 高文,劉峰,黃鐵軍等 . 數字圖書館——原理與技術實
現 . 清華大學出版社, 2000
5 徐義全 . 電子文件的特性與長期保存 . 檔案學研究,
2000,(1):53 ~57
6 張詠 . 網絡信息資源評價辦法. 圖書情報工作,
2002,(10):41 ~47,61
7
JanickeHinchliffe,Lisa.Resourceselectionandinformationevalu
ation.