丁香婷婷网,黄色av网站裸体无码www,亚洲午夜无码精品一级毛片,国产一区二区免费播放

現(xiàn)在位置:范文先生網(wǎng)>理工論文>計算機(jī)信息技術(shù)>地方歷史文獻(xiàn)存取、檢索的趨勢以及遇到的問題

地方歷史文獻(xiàn)存取、檢索的趨勢以及遇到的問題

時間:2023-02-22 15:51:15 計算機(jī)信息技術(shù) 我要投稿
  • 相關(guān)推薦

地方歷史文獻(xiàn)存取、檢索的趨勢以及遇到的問題


摘 要 闡述縮微技術(shù)和數(shù)字影像技術(shù)所提供的資料保存方法、策略和其中產(chǎn)生的問題。主要介紹丹麥圖書館等文獻(xiàn)機(jī)構(gòu)在提供書目記錄的同步電子存取方面所進(jìn)行的卓有成效的合作。對獲取數(shù)字化的源文獻(xiàn)中信息的有效方法———索引和領(lǐng)域特定檢索點進(jìn)行了探討。

地方歷史文獻(xiàn)存取、檢索的趨勢以及遇到的問題

關(guān)鍵詞 地方文獻(xiàn) 文獻(xiàn)保存 提供途徑 趨勢 問題

一、導(dǎo)論

地方歷史文獻(xiàn)的首要用戶應(yīng)該是系譜專家以及研究地方文獻(xiàn)的歷史學(xué)家。在歷史上,正是由于對這些材料的需要,在很多國家、州或者是省份、縣以及鄉(xiāng)鎮(zhèn)都形成了相當(dāng)數(shù)量的家譜和地方志學(xué)會。這些學(xué)會的職責(zé)就是收集書面資料、圖片、大事記以及其他的古代器具,然后通過圖書館、博物館以及發(fā)行出版物的方式,把這些資料提供給研究人員使用。也存在著這么一種情況,那就是這些學(xué)會以及館藏后來就發(fā)展成了政府檔案館②。近年來,一些圖書館和檔案館開始創(chuàng)建家譜和地方志閱覽室③,以此來滿足系譜專家以及研究地方文獻(xiàn)的歷史學(xué)家進(jìn)行研究的需要。

直到2001年,國際圖聯(lián)(IFLA)專業(yè)圖書館部下設(shè)了地方志和家譜小組,地方志和家譜的重要性才開始得到認(rèn)同。這個小組的使命是:“……提供給從事地方文獻(xiàn)和家譜的圖書館員一個在國際信息界發(fā)言的機(jī)會,為專家和圖書館、檔案館、博物館以及其他相關(guān)的學(xué)會、機(jī)構(gòu)之間的交流提供便利,鼓勵擴(kuò)大地方志和家譜文獻(xiàn)的收藏,改善服務(wù)!雹芪医裉煜肱c大家分享的信息均來自國際圖聯(lián)大會年會期間地方志和家譜小組組織的討論會。

二、存取方式、策略以及出現(xiàn)的問題

上個世紀(jì),引入新技術(shù)作為歷史文獻(xiàn)收集、存取和提供檢索方式的趨勢在不斷進(jìn)步。20世紀(jì)上半葉,作為存取和檢索文獻(xiàn)中所含信息的方式,圖書館、博物館和檔案館(以下簡稱為“信息提供機(jī)構(gòu)”)開始采用縮微技術(shù)。隨之而來的是20世紀(jì)80年代之后,人類進(jìn)入數(shù)字時代。數(shù)字時代以所謂“新媒體”的出現(xiàn)為典型特征,具體表現(xiàn)為如下形式:計算機(jī)技術(shù)、電子數(shù)據(jù)庫、光學(xué)介質(zhì)以及因特網(wǎng)和萬維網(wǎng)。由此,在決定自身距離數(shù)字時代的差距以及何時步入數(shù)字時代的時候,對于如何管理館藏傳統(tǒng)資源,信息提供機(jī)構(gòu)會面臨一些重大的決擇,經(jīng)受嚴(yán)峻的考驗。這里,只強(qiáng)調(diào)幾個與信息提供機(jī)構(gòu)所采用的存儲方式和策略相關(guān)的問題,并著重闡述縮微技術(shù)以及數(shù)字化技術(shù)。

如上所述,縮微技術(shù)是一種成熟的存取技術(shù)。如果采用國際通用標(biāo)準(zhǔn)的話,縮微技術(shù)能夠保證檔案的品質(zhì)。如果在理想狀態(tài)下使用、存儲,保存在銀鹽縮微膠片(Imagesonsilverfilm)之上的圖片可以滿足100年的使用需求。然而,對于缺少經(jīng)費的圖書館和檔案館來說,提供空間和理想的存儲條件所需要的開支問題就會顯得更加重要。

數(shù)字成像是一項新的快速發(fā)展的技術(shù)。由于軟硬件的升級,現(xiàn)在抓取的圖片在五年后可能就變得不可讀。目前數(shù)字存取仍然不穩(wěn)定,如果存儲在質(zhì)量較差的光盤上,其壽命不過幾個月而已。

為確保數(shù)字圖片的存取,信息提供機(jī)構(gòu)可能采取的策略如下:(1)存儲在同一個服務(wù)器上的不同驅(qū)動器中;(2)存儲在不同的服務(wù)器或者鏡像中;(3)通過計算機(jī)輸出膠片進(jìn)行復(fù)制。由于需要定期把原有內(nèi)容移入新的軟硬件上,再加上不斷更新的管理技術(shù),前兩種策略都會涉及到重復(fù)投入費用的問題。就當(dāng)前來說,第三種策略使原始圖像抓取的費用翻倍。從長遠(yuǎn)的角度來考慮,有人認(rèn)為存取圖片的費用會比把數(shù)字圖片轉(zhuǎn)化成縮微膠片的費用低,這是因為減少了存取費用。然而這一觀點的支持者們一般都忽視了如下兩部分費用:一般管理費用以及從事存取工作的IT工作人員的工資費用。

存取“數(shù)字原生資源”以及紙質(zhì)文檔的數(shù)字圖片所面臨的挑戰(zhàn),已經(jīng)成為政府機(jī)構(gòu)以及其他信息提供機(jī)構(gòu)所關(guān)注的重大問題。因此,各國中央政府均在加大投入以解決這些問題。比如說,美國國會撥款9980萬美元用于資助美國國會圖書館的國家數(shù)字信息基礎(chǔ)設(shè)施和存取項目②。美國國家檔案和文件管理局(NARA)剛剛宣布獎勵2000萬美元給兩個主要的機(jī)構(gòu),以支持他們在接下來的五年里找到可行的解決辦法③。因此,我們應(yīng)該對于數(shù)字圖片存檔的未來充滿希望。

三、提供檢索并加以管理

圖書館和檔案館有責(zé)任為讀者或者用戶提供館藏信息的訪問途徑。在此,我只是突出強(qiáng)調(diào)以下兩種信息:書目數(shù)據(jù)和源文檔。

1 訪問書目數(shù)據(jù)

過去,人們對于書目數(shù)據(jù)的訪問僅僅限于查閱書目卡片或者瀏覽圖書館和檔案館的書目單。然而,在數(shù)字時代,在線檢索書目數(shù)據(jù)以及通過信息提供機(jī)構(gòu)的網(wǎng)站進(jìn)行檢索已經(jīng)變成現(xiàn)實。萬維網(wǎng)為不同機(jī)構(gòu)之間共享書目數(shù)據(jù)以及為讀者提供對于大多數(shù)圖書館/檔案館的館藏的同步檢索提供了便利。

隨著計算機(jī)的廣泛應(yīng)用,人們使用計算機(jī)能力的增強(qiáng),加之資源豐富的網(wǎng)站的不斷出現(xiàn),使信息搜集者更多地把因特網(wǎng)和萬維網(wǎng)作為信息的首要來源。在數(shù)字時代的虛擬世界里,圖書館/檔案館之間的物理障礙正在消失。信息搜集者不在乎他們是從什么機(jī)構(gòu)去獲取信息,關(guān)鍵在于他們要得到信息。

對于這一現(xiàn)象的認(rèn)知引導(dǎo)各個機(jī)構(gòu)在提供對于館藏書目數(shù)據(jù)的檢索途徑上進(jìn)行合作。一個最近的事例就是丹麥的“北日德蘭半島文化歷史數(shù)據(jù)庫(NOKS)”。這個數(shù)據(jù)庫通過一個單一的網(wǎng)絡(luò)門戶為讀者提供訪問以下機(jī)構(gòu)館藏的途徑,包括北日德蘭縣的3個歷史檔案館,3個文化歷史博物館,2個藝術(shù)博物館以及縣中央圖書館。整個工程耗時1年,利用經(jīng)費14.3萬歐元。2003年書目數(shù)據(jù)的訪問量達(dá)到11.5萬條。

這種合作必須建立在不同種類的機(jī)構(gòu)平等參與的基礎(chǔ)之上。各種機(jī)構(gòu)分別有一些根據(jù)檔案館、圖書館或者博物館編目原則編寫的書目數(shù)據(jù)。因為目標(biāo)是提供跨機(jī)構(gòu)的同步檢索,所以這些書目數(shù)據(jù)必須采用統(tǒng)一的格式,或者必須找到一個能夠連接不同編目系統(tǒng)的辦法。

北日德蘭半島文化歷史數(shù)據(jù)庫采用的辦法較為實用,他們利用現(xiàn)存的書目數(shù)據(jù),通過連接所有參與機(jī)構(gòu)的相同的主題詞,實現(xiàn)預(yù)期的對于不同系統(tǒng)的同步檢索的目標(biāo)。因此,比如在圖書館系統(tǒng)搜索相關(guān)主題詞“關(guān)注老年人”(careofseniorcitizens)同樣也會獲得檔案館的關(guān)于“老年人”(elderlypeople)的書目數(shù)據(jù)以及博物館的關(guān)于“老年人”(seniorcitizens)的書目數(shù)據(jù)。

2 訪問源文檔

索引。簡化檢索的要求緊隨著新電子傳播工具的出現(xiàn)而出現(xiàn)。然而,要對數(shù)字圖片里面的信息進(jìn)行檢索,我們必須首先建立圖片的索引。索引方式可以是全文的、域的或者是兩者合二為一④。全文檢索需要返回到包含所查詢的內(nèi)容的每一張圖片,這樣的話,讀者在真正找到自己需要的信息之前,就需要瀏覽很多不相關(guān)的圖片。域檢索只是查詢那些被域數(shù)據(jù)特別標(biāo)注的圖片。這種方法,如果使用得當(dāng)?shù)脑?可以使搜索更快,更準(zhǔn)確;然而,如果使用全文檢索,可以發(fā)現(xiàn)一些隨機(jī)的有用的相關(guān)信息,而域檢索卻會漏掉這些信息。

全文檢索只有滿足如下兩種條件的一種才成為可能:數(shù)字化的原文可以轉(zhuǎn)化成被光學(xué)字符識別(OCR)軟件識別的文本;或者原文是打字鍵入的。直到現(xiàn)在,光學(xué)字符識別軟件只適用于識別已排字的或者印刷的文檔。全文索引之所以更快、更經(jīng)濟(jì)是因為電腦可以完成,同時也需要手工編輯。光學(xué)字符識別軟件對于進(jìn)行那些系譜專家和歷史學(xué)家非常感興趣的手寫文檔的搜索就不是那么可靠了。這也就意味著,要制作全文索引,原文必須是打字鍵入的。雖然這項工程的規(guī)模以及成本看上去可能非常巨大,但是韓國正在采用這種方式,通過重新鍵入來制作傳統(tǒng)家譜的數(shù)字化版本。

制作域索引是一項手工操作過程,需要靈活選擇,使用一致的關(guān)鍵詞。這種檢索的制作費用要比在OCR?guī)椭轮谱魅乃饕嘿F,卻比手工輸入數(shù)據(jù)創(chuàng)建可搜索文本便宜。因此,選擇使用何種索引,需要綜合考慮如下因素:潛在讀者的檢索需求,文檔的類型(印刷的還是手寫的)以及制作索引的費用。

著錄。傳統(tǒng)的檢索點,如:作者、標(biāo)題、主題對于源文檔提供了很高水平的檢索點,但是查找到包含真正所需信息的文檔的概率較低。數(shù)字化歷史文獻(xiàn)的用戶需要這些書目數(shù)據(jù)包含更多的“粒度”(指“著錄”)。

對于制作數(shù)字圖片的索引來說,一種可能的辦法就是制作對于特殊用戶群體所需要的源文檔的元數(shù)據(jù),也就是學(xué)科———專業(yè)主題(domain-specificaccesspoints)。比如說,一個西方人要做家譜研究,現(xiàn)在正在查找目標(biāo)個體一生中的重要事件(出生、婚姻以及死亡)的信息,這些事件發(fā)生在不同的時間、地點。如果源文檔中的數(shù)據(jù)元素,如姓名、地點、日期等己經(jīng)是源文檔著錄的檢索點,搜索成功的概率就能得到極大的提高。

現(xiàn)存編目標(biāo)準(zhǔn)以及元數(shù)據(jù)標(biāo)準(zhǔn)不支持這種書目數(shù)據(jù)描述。地方歷史文獻(xiàn)提供機(jī)構(gòu)需要進(jìn)行游說,以便把學(xué)科———專業(yè)主題檢索點或者“著錄款目”寫入這些標(biāo)準(zhǔn)中。

3 管理對于數(shù)字源文檔的訪問

數(shù)字時代的到來為用戶創(chuàng)造了前所未有的快捷、全面檢索信息的機(jī)會。但是隨之也帶來了新的問題。比如說,在美國,系譜專家以及當(dāng)?shù)貧v史學(xué)家很感興趣的檔案均收藏在縣法院里。法院里的檔案是公用的,也就是說公眾有權(quán)力使用。然而,對于那些曾經(jīng)使用法院檔案的研究人員來說,他們知道,在法院里查找自己所需要的特定檔案是非常困難的。因為這些檔案通常是隨便擺放的,而且缺乏足夠的搜索幫助手段。也就是說,檔案和信息實際上是不可檢索的。即使是這些資料被縮微化處理之后,檢索信息的難度依然很大。然而,如果這些書目數(shù)據(jù)經(jīng)過數(shù)字化處理,編制索引并提供到萬維網(wǎng)上,訪問就會變得容易、快速、普遍。但是這樣一來,信息的隱匿性就會減低,就可能更多地限制或者禁止公眾訪問法院檔案的呼聲。

由于恐怖主義以及利用假身份進(jìn)行盜竊行為的增加,人們對于個人身份數(shù)據(jù)隱私的關(guān)注顯著增強(qiáng)。然而,一般來說,盜賊并不是為了竊取受害人的身份而進(jìn)行研究。研究表明,大多數(shù)利用假身份進(jìn)行盜竊案例的涉案人是家庭成員或者是陌生人。家庭成員可以在家中查看受害者駕照或者是信用卡上面的個人信息;陌生人通常是通過竊取郵件,或者在因特網(wǎng)上騙取個人信息。盡管只有少量的利用假身份進(jìn)行盜竊案例與使用從家譜資料中獲取的信息有關(guān),如出生日期、死亡記錄等用戶可以免費獲得的公眾領(lǐng)域的文件,萬維網(wǎng)上包含這些信息的電子數(shù)據(jù)庫、索引以及圖片的可訪問性還是引起了人們的恐慌。

另一個人們關(guān)注的問題是:對于散發(fā)和復(fù)制這些記錄的控制減弱,以及在這些記錄以電子文本提供訪問后存在被更改的可能。

4 數(shù)據(jù)隱私權(quán)法律以及規(guī)定

信息提供機(jī)構(gòu)有責(zé)任遵守所處地區(qū)的數(shù)據(jù)隱私權(quán)法律。如果沒有這種法律,各個機(jī)構(gòu)有責(zé)任制定自己的數(shù)據(jù)隱私權(quán)政策,以此來保護(hù)人們的身份信息。

信息提供機(jī)構(gòu)在立法和制定政策的過程中采取建設(shè)性的干涉,這種“干涉”有時對于保護(hù)用戶訪問歷史檔案的合法權(quán)利是適當(dāng)?shù)?也是必要的。他們需要關(guān)注那些旨在保護(hù)隱私權(quán)的立法提案或者規(guī)定。如果法律描述不準(zhǔn)確,這些措施就可能會矯枉過正,從而禁止訪問那些本身不需要被保護(hù)的檔案和信息。下面的事例發(fā)生在美國喬治亞州。最近喬治亞州討論的一項議案旨在限制對于二戰(zhàn)老兵的退役檔案的訪問。然而,根據(jù)其表述,對于1776年美國獨立戰(zhàn)爭以來的相似記錄的訪問都將被屏蔽。幸運的是,一位檔案館員注意到這個問題,并與議案的發(fā)起者一起修改了提案,從而既實現(xiàn)了其真正的目的,又保留了人們對與歷史文獻(xiàn)的訪問權(quán)利。

5 數(shù)據(jù)安全

數(shù)據(jù)提供機(jī)構(gòu)有責(zé)任保證其提供訪問的源文檔內(nèi)容的安全性或者是完整性。這可以通過數(shù)字圖片上的水印或者其他方式實現(xiàn)。比如說,在韓國,當(dāng)數(shù)字家譜出版機(jī)構(gòu)簽署協(xié)議,來對一些世系機(jī)構(gòu)提供的家譜進(jìn)行數(shù)字化的時候,他們必須同意保護(hù)原文的措詞不被修改。方式有二:只向用戶提供原文的圖片;屏蔽對于原文的下載。

6 數(shù)字權(quán)管理

上面提到的很多問題都可以通過數(shù)字權(quán)的主動管理來解決。必須制定政策來鑒別用戶,定義他們的使用權(quán)限。通過使用軟件可以管理用戶對于文件和信息的訪問、下載以及復(fù)制。后者也適用于模擬控制印刷品,或者如果必要的話,能夠提供更多的控制。

電子商務(wù)部門開發(fā)的數(shù)字權(quán)管理軟件(DRM)可能并不適用于圖書館和其他信息提供機(jī)構(gòu)。商務(wù)數(shù)字權(quán)管理軟件設(shè)計用于保護(hù)創(chuàng)作者和數(shù)字內(nèi)容出版者的權(quán)利,而不是保護(hù)用戶權(quán)利。他們通常涉足于當(dāng)前流通量較大的資料,可能不會考慮公共領(lǐng)域的文件或者圖書館向讀者提供的“流通量較小”的資料。

信息提供機(jī)構(gòu)和讀者統(tǒng)一體應(yīng)該開發(fā)自己的數(shù)字權(quán)管理標(biāo)準(zhǔn)和管理軟件,使得圖書館既能兌現(xiàn)與電子出版者之間的合同,又能在版權(quán)法下保護(hù)圖書館用戶的權(quán)利,管理圖書館制作的數(shù)字內(nèi)容的傳播和使用,繼續(xù)履行圖書館的傳統(tǒng)職能,如館藏數(shù)字資源以及類似資料的外借、歸檔和存儲。研究開發(fā)一個有效的數(shù)字權(quán)管理系統(tǒng)并進(jìn)行執(zhí)行和維護(hù),所需的費用非常高。因此,以合作方式解決圖書館的這一問題可能是最切實可行的辦法。

四、總述

隨著新技術(shù)應(yīng)用于歷史資料的收集、保存以及檢索,圖書館以及其他信息提供機(jī)構(gòu)在館藏的管理方面都面臨著重大的抉擇,經(jīng)受著嚴(yán)峻的考驗。就保存技術(shù)和策略而言,縮微無疑是一種可行的選擇(如果能適當(dāng)?shù)剡M(jìn)行存儲的話);但是對于很多圖書館來說,費用也許太高。數(shù)字成像是一項新的正在不斷進(jìn)步的技術(shù)。保存技術(shù)對于政府機(jī)構(gòu)和信息提供機(jī)構(gòu)來說,是薄弱環(huán)節(jié),當(dāng)然也是他們重要的科研課題。

隨著新技術(shù)應(yīng)用于歷史資料的收集、保存以及檢索,圖書館以及其他信息提供機(jī)構(gòu)在館藏的管理方面都面臨著重大的抉擇,經(jīng)受著嚴(yán)峻的考驗。就保存技術(shù)和策略而言,縮微無疑是一種可行的選擇(如果能適當(dāng)?shù)剡M(jìn)行存儲的話);但是對于很多圖書館來說,費用也許太高。數(shù)字成像是一項新的正在不斷進(jìn)步的技術(shù)。保存技術(shù)對于政府機(jī)構(gòu)和信息提供機(jī)構(gòu)來說,是薄弱環(huán)節(jié),當(dāng)然也是他們重要的科研課題。

就提供對于圖片的有效檢索來說,索引是一種必要的工具。要決定選擇何種索引方式,必須綜合考慮讀者的需求,文檔的格式以及費用問題。在編目中使用學(xué)科———專業(yè)主題檢索點和制作數(shù)字圖片的元數(shù)據(jù),這兩種方式可能會提供一種比較經(jīng)濟(jì)的選擇。

在數(shù)字時代,信息提供機(jī)構(gòu)必須要與立法者以及政策制定者合作,從而在保護(hù)個人身份數(shù)據(jù)隱私的同時,能夠保證讀者訪問歷史文獻(xiàn)的合法權(quán)利。他們必須采取相應(yīng)的措施來保證已經(jīng)數(shù)字化了的源文檔的完整性(integrity)數(shù)字權(quán)管理政策以及技術(shù)可以用來解決源文檔數(shù)字化中產(chǎn)生的大多數(shù)問題。

(沙其敏 博士 美國猶他家譜學(xué)會)

〔出處〕 國家圖書館學(xué)刊2005年第1期



【地方歷史文獻(xiàn)存取、檢索的趨勢以及遇到的問題】相關(guān)文章:

“文件存取”中常見的問題及教學(xué)對策08-17

談?wù)剬幭牡胤轿墨I(xiàn)檢索08-09

中國鄉(xiāng)村自治:現(xiàn)狀、問題與趨勢08-16

企業(yè)辦學(xué)遇到的新問題08-17

地方研究文獻(xiàn)數(shù)據(jù)庫主題檢索初探08-09

政府網(wǎng)站發(fā)展的現(xiàn)狀、問題與趨勢08-05

面試遇到敏感問題要謹(jǐn)慎08-15

政府網(wǎng)站發(fā)展的現(xiàn)狀、問題與趨勢208-05

政府網(wǎng)站發(fā)展的現(xiàn)狀、問題與趨勢108-05