- 相關(guān)推薦
信息整流與知識(shí)增值服務(wù)
【內(nèi)容提要】本文提出數(shù)字圖書(shū)館的主要功能目標(biāo)是信息整流與知識(shí)增值服務(wù);信息與知識(shí)轉(zhuǎn)換是數(shù)字圖書(shū)館的關(guān)鍵理論和技術(shù)問(wèn)題。圖書(shū)館受到Internet的巨大沖擊、不再是文獻(xiàn)信息服務(wù)的唯一提供者,數(shù)字圖書(shū)館如何才能挽回失去的老用戶,吸引新用戶?知識(shí)管理工程將使數(shù)字圖書(shū)館成為21世紀(jì)學(xué)習(xí)的大平臺(tái)、文化知識(shí)的大平臺(tái)和知識(shí)資源中心。【摘 要 題】信息服務(wù)
1 數(shù)字圖書(shū)館的信息整流
數(shù)字圖書(shū)館把傳統(tǒng)圖書(shū)館的功能由信息的查詢和圖書(shū)資料的借閱擴(kuò)展到知識(shí)服務(wù)的新階段。實(shí)現(xiàn)這一宏偉目標(biāo)需要解決許多技術(shù)和社會(huì)問(wèn)題,其中有兩個(gè)最關(guān)鍵的技術(shù)是信息的整流和知識(shí)的創(chuàng)新。前者涉及數(shù)字圖書(shū)館的知識(shí)鏈建立問(wèn)題,后者涉及數(shù)字圖書(shū)館的信息變換成知識(shí)的知識(shí)增值服務(wù)問(wèn)題。
1.1 數(shù)字圖書(shū)館的知識(shí)鏈
數(shù)字圖書(shū)館是一個(gè)龐大的數(shù)字資料庫(kù),包括所有資料的數(shù)字化存儲(chǔ),在線網(wǎng)上資料、多媒體資料、電子出版物等。數(shù)字圖書(shū)館根據(jù)用戶對(duì)信息的不同需求,將文本、圖片等原件制作成不同數(shù)字形式。一般有純圖像形式,目錄文本形式,正文圖像形式,全文本形式和全文索引形式。但關(guān)鍵還是知識(shí)鏈的建立。
為實(shí)現(xiàn)知識(shí)鏈信息,數(shù)字圖書(shū)館將資源分成為元數(shù)據(jù)和對(duì)象數(shù)據(jù)。對(duì)象數(shù)據(jù)指數(shù)字化的文本、圖像、聲言、影像等,元數(shù)據(jù)則指那些描述和管理對(duì)象的數(shù)據(jù)。對(duì)象數(shù)據(jù)分布式地存放在各地的資源站點(diǎn)內(nèi),元數(shù)據(jù)則集中存放在數(shù)字圖書(shū)館中心的超大規(guī)模服務(wù)器上。用戶查詢時(shí),中心調(diào)度系統(tǒng)通過(guò)元數(shù)據(jù)來(lái)調(diào)度各對(duì)象數(shù)據(jù)庫(kù)以提供服務(wù)。
知識(shí)的控制單位長(zhǎng)期停留在文獻(xiàn)這一級(jí)上,而人對(duì)知識(shí)的需求一般不是以文獻(xiàn)為單位的。早在20世紀(jì)70年代后期就有專(zhuān)家指出,知識(shí)的控制單位將從文獻(xiàn)深化到文獻(xiàn)中的數(shù)據(jù)、公式、事實(shí)、結(jié)論等最小的獨(dú)立的“知識(shí)元”.一旦實(shí)現(xiàn)知識(shí)的控制單位由文獻(xiàn)深化到“知識(shí)元”,大量文獻(xiàn)中所包含的“知識(shí)元”及相關(guān)信息間的鏈接將產(chǎn)生極大的知識(shí)增值,從而大大推進(jìn)人類(lèi)對(duì)知識(shí)的利用,促進(jìn)新知識(shí)的創(chuàng)造,從而也將推動(dòng)知識(shí)資源業(yè)的重大發(fā)展[1].
一篇文獻(xiàn)反映作者的科學(xué)研究成果,包含著作者的知識(shí)創(chuàng)新的過(guò)程。于是文本結(jié)構(gòu)本身就隱含著對(duì)某學(xué)科問(wèn)題的知識(shí)鏈。
假如我們把每篇文獻(xiàn)的知識(shí)看成是人類(lèi)知識(shí)結(jié)構(gòu)中的一個(gè)知識(shí)單元,知識(shí)單元與知識(shí)結(jié)構(gòu)就組成了個(gè)性知識(shí)與共性知識(shí)的知識(shí)系統(tǒng)。個(gè)性知識(shí)體現(xiàn)在知識(shí)的創(chuàng)新上,共性知識(shí)結(jié)構(gòu)則表現(xiàn)在知識(shí)的完整性上。于是我們就建立了個(gè)性知識(shí)與共性知識(shí)的知識(shí)鏈。事實(shí)上,專(zhuān)利文獻(xiàn)就明顯地表現(xiàn)了個(gè)性知識(shí)單元與人類(lèi)知識(shí)結(jié)構(gòu)的知識(shí)創(chuàng)新鏈關(guān)系[2].
數(shù)字圖書(shū)館對(duì)文本的知識(shí)標(biāo)引,既體現(xiàn)了標(biāo)引者應(yīng)用學(xué)科知識(shí)結(jié)構(gòu)的背景知識(shí)的能力,同時(shí)又體現(xiàn)了標(biāo)引者識(shí)別和提煉作者的知識(shí)創(chuàng)新點(diǎn)的判斷和知識(shí)組織能力。因此,是一個(gè)知識(shí)鏈建立的知識(shí)增值過(guò)程。
1.2 數(shù)字圖書(shū)館的知識(shí)發(fā)現(xiàn)
知識(shí)鏈的建立過(guò)程是知識(shí)發(fā)現(xiàn)和知識(shí)再組織的過(guò)程。知識(shí)發(fā)現(xiàn)的主要目標(biāo)是采用有效的算法,從大量現(xiàn)有或歷史數(shù)據(jù)集合中發(fā)現(xiàn)并找出最初未知、但最終可理解的有用知識(shí),并用簡(jiǎn)明的方式顯示出來(lái)。知識(shí)發(fā)現(xiàn)一般包含如下幾個(gè)步驟:(1)理解相應(yīng)的問(wèn)題領(lǐng)域;(2)準(zhǔn)備相關(guān)數(shù)據(jù)子集;(3)發(fā)現(xiàn)模式(數(shù)據(jù)挖掘);(4)所發(fā)現(xiàn)模式的后處理;(5)應(yīng)用發(fā)現(xiàn)結(jié)果。
。1)文本知識(shí)結(jié)構(gòu)分析技術(shù)
盡管與多媒體信息相比,文本信息顯得比較普通,但文本仍然是記載和傳播信息的最主要媒體,因此對(duì)文本信息知識(shí)發(fā)現(xiàn)技術(shù)的研究具有十分重要的意義和廣泛的應(yīng)用前景。
文本結(jié)構(gòu)分析的目的在于發(fā)現(xiàn)文本表達(dá)主題概念的物理組織結(jié)構(gòu),由物理結(jié)構(gòu)自動(dòng)重組主題概念的邏輯結(jié)構(gòu),實(shí)現(xiàn)對(duì)文本知識(shí)的抽象化和具體化推理檢索。
文獻(xiàn)[3]把文本結(jié)構(gòu)分成物理結(jié)構(gòu)和邏輯結(jié)構(gòu)。物理結(jié)構(gòu)={標(biāo)題,段落,句子,詞匯},它表示了文本的組成情況?刹捎孟蛄靠臻g模型表示文本及文本各個(gè)部分,進(jìn)行文本結(jié)構(gòu)分析,其中主要是文本的層次分析,從而得到文本的邏輯結(jié)構(gòu)。邏輯結(jié)構(gòu)={主題,層次,段落,句子,主題詞},它更著重于表示文本所包含的思想內(nèi)容和表達(dá)的邏輯方式。
。2)知識(shí)鏈結(jié)構(gòu)
文本的物理結(jié)構(gòu)是文本的外表形式,邏輯結(jié)構(gòu)體現(xiàn)了作者表達(dá)目的的邏輯順序,而文本的知識(shí)鏈結(jié)構(gòu)則是作者的目的和靈魂,知識(shí)鏈結(jié)構(gòu)={問(wèn)題,已有解的優(yōu)缺點(diǎn),新解的方案,性能評(píng)價(jià),今后方向}.研究文本的目的是為了獲得文本的知識(shí)鏈,以創(chuàng)建新的知識(shí)鏈。
引文方法是一種很好的文獻(xiàn)鏈,表現(xiàn)了引用文獻(xiàn)與被引用文獻(xiàn)之間的多種關(guān)系。但它并不完全直接表現(xiàn)知識(shí)鏈關(guān)系。文獻(xiàn)鏈?zhǔn)且环N龐大的文獻(xiàn)引用系統(tǒng)。知識(shí)鏈則是一種巨大的知識(shí)引用系統(tǒng)。若能完成這一巨大的系統(tǒng),人類(lèi)將可能進(jìn)行更有效的知識(shí)學(xué)習(xí)。
1.3 信息整流的實(shí)現(xiàn)
知識(shí)鏈?zhǔn)俏谋局R(shí)結(jié)構(gòu)的普遍特性,是人類(lèi)學(xué)習(xí)、創(chuàng)新的紐帶。信息整流與信息濾波不同。信息濾波的目的主要有兩點(diǎn),即過(guò)濾掉不相關(guān)的文檔以及將相關(guān)文檔列表分為新的文檔和已經(jīng)查閱過(guò)的文檔,并按相似度大小排序,對(duì)已檢索的相關(guān)文檔,通知信息Agent不必返回全文文檔,以減少通信費(fèi)用。信息整流的目的在于建立數(shù)字圖書(shū)館的知識(shí)鏈庫(kù),提供知識(shí)鏈服務(wù)。
信息整流是建立知識(shí)鏈的過(guò)程。從全文提取出知識(shí)單元,形成獨(dú)立的知識(shí)基礎(chǔ),構(gòu)成知識(shí)單元庫(kù),把各種知識(shí)單元庫(kù)進(jìn)行鏈接,構(gòu)成數(shù)字圖書(shū)館廣泛的知識(shí)網(wǎng)絡(luò)庫(kù)。
知識(shí)網(wǎng)絡(luò)庫(kù)形成了學(xué)科橫向交叉和學(xué)科縱向延伸的科學(xué)知識(shí)體系。描述了人類(lèi)知識(shí)學(xué)習(xí)和知識(shí)創(chuàng)新的知識(shí)網(wǎng)絡(luò)結(jié)點(diǎn)。把人類(lèi)知識(shí)學(xué)習(xí)和創(chuàng)新活動(dòng)之間的距離大大的縮短。在知識(shí)網(wǎng)絡(luò)庫(kù)中,用戶可以跨知識(shí)單元庫(kù)學(xué)習(xí)所感興趣的知識(shí),更可以通過(guò)知識(shí)單元庫(kù)直接學(xué)習(xí)到解決問(wèn)題的知識(shí)和辦法。
知識(shí)單元庫(kù)的實(shí)現(xiàn)是知識(shí)網(wǎng)絡(luò)庫(kù)建立的基礎(chǔ)和關(guān)鍵。已有的信息置標(biāo)語(yǔ)言HTML(Hyper Text Markup Language)的超級(jí)鏈接功能使Web技術(shù)從計(jì)算機(jī)世界走向社會(huì)、走向千家萬(wàn)戶,實(shí)現(xiàn)Web與數(shù)據(jù)庫(kù)的超級(jí)鏈接。HTML表現(xiàn)出Web顯示數(shù)據(jù)的通用方法,而XML提供了一個(gè)直接處理Web數(shù)據(jù)的通用方法。HTML著重描述Web頁(yè)面的顯示格式,而XML著重描述Web頁(yè)面的內(nèi)容。XML是文檔的各種數(shù)字表示方式,用XML表示的數(shù)字文檔可以由計(jì)算機(jī)處理,也可以供人閱讀。XML文檔是一種純文本文檔,可以包含圖片、視頻或其他多媒體信息,可以是百科全書(shū),也可以是一封電子郵件,或一則天氣預(yù)報(bào)、一張電子商務(wù)交易單等。如對(duì)〈商品〉的描述中,若在應(yīng)用中的名稱、質(zhì)量、價(jià)格還不足以描述一個(gè)商品的特征時(shí),還可通過(guò)其他模式增加新特征,只要加入的元素在它們各自名域的前后關(guān)系中是有效的。這就為知識(shí)單元的描述提供了工具,通過(guò)XML標(biāo)記將文本標(biāo)記成知識(shí)單元,繼而將知識(shí)單元鏈接成知識(shí)結(jié)構(gòu),實(shí)現(xiàn)知識(shí)鏈。
與引文索引不同,在用XML實(shí)現(xiàn)知識(shí)單元的描述中,可以將被引文獻(xiàn)中的知識(shí)單元采用指針的方式加以直接標(biāo)記,于是實(shí)現(xiàn)了知識(shí)鏈接的作用。
鏈接(Linking)是Web實(shí)現(xiàn)關(guān)鍵。HTML的鏈接是單向的有兩個(gè)端點(diǎn)——源端和目標(biāo)端,源端通常是Web頁(yè)的一個(gè)片段,如一個(gè)詞語(yǔ)、一段文本或一幅圖像,目標(biāo)端是一個(gè)“資源”.由統(tǒng)一資源標(biāo)記(URI)地址指定。XML是描述結(jié)構(gòu)化數(shù)據(jù)的底層文法,用這種簡(jiǎn)單文法可以支持種類(lèi)繁多的應(yīng)用。預(yù)計(jì)XML將成為數(shù)字圖書(shū)館信息整流的基礎(chǔ)性語(yǔ)言。
2 數(shù)字圖書(shū)館的知識(shí)增值服務(wù)
數(shù)字圖書(shū)館不僅是傳統(tǒng)圖書(shū)館的數(shù)字化,而且是來(lái)源極其豐富的網(wǎng)上資源庫(kù)。通過(guò)對(duì)信息資源的深加工和合理、有效的組織,使之成為永久、有序的知識(shí)源泉。數(shù)字圖書(shū)館不僅要進(jìn)行信息整流,而且還要進(jìn)行知識(shí)增值服務(wù)。數(shù)字圖書(shū)館將構(gòu)筑起信息與知識(shí)轉(zhuǎn)換的社會(huì)大平臺(tái),為實(shí)現(xiàn)全民終身學(xué)習(xí)、自主學(xué)習(xí)、隨時(shí)隨地學(xué)習(xí)創(chuàng)造條件。
2.1 圖書(shū)館受到Internet巨大沖擊
Internet正在成為世界上最大的“圖書(shū)館”.網(wǎng)絡(luò)信息資源的迅猛擴(kuò)大,越來(lái)越加深了人們對(duì)網(wǎng)絡(luò)的依賴程度,影響和改變著人們選擇信息、使用信息的行為和方式。目前,Internet上已擁有各種日?qǐng)?bào)、雜志及時(shí)事快報(bào)、新書(shū)報(bào)道,世界上大多數(shù)主要的檢索系統(tǒng)、數(shù)據(jù)庫(kù)都已上網(wǎng),并且向用戶提供信息服務(wù)。Internet信息服務(wù)商以其雄厚的資金投入和先進(jìn)的技術(shù)設(shè)備優(yōu)勢(shì),面向企業(yè)、面向市場(chǎng)開(kāi)發(fā)信息產(chǎn)品,圖書(shū)館不再是信息服務(wù)的唯一提供者,圖書(shū)館傳統(tǒng)的信息產(chǎn)品受到巨大沖擊。
2.2 數(shù)字圖書(shū)館的知識(shí)增值服務(wù)
數(shù)字圖書(shū)館如何才能挽回以前的老用戶,并吸引更多的新用戶?這是圖書(shū)館轉(zhuǎn)型的根本所在,是數(shù)字圖書(shū)館建設(shè)的核心。為此,數(shù)字圖書(shū)館的服務(wù)內(nèi)容和質(zhì)量要比目前網(wǎng)上的信息服務(wù)更加獨(dú)具一格,數(shù)字圖書(shū)館要向信息實(shí)體虛擬化、信息資源數(shù)字化、信息傳遞網(wǎng)絡(luò)化、信息利用共享化、信息提供的知識(shí)化方向轉(zhuǎn)型發(fā)展。數(shù)字圖書(shū)館發(fā)展的優(yōu)勢(shì)將在什么地方?
知識(shí)增值服務(wù)是數(shù)字圖書(shū)館占領(lǐng)知識(shí)服務(wù)市場(chǎng)的優(yōu)勢(shì)所在。數(shù)字圖書(shū)館應(yīng)用系統(tǒng)應(yīng)是可擴(kuò)展的知識(shí)服務(wù)網(wǎng)絡(luò)系統(tǒng)。
數(shù)字圖書(shū)館對(duì)于有高價(jià)值的圖像、文本、語(yǔ)言、音響、影像、影視、軟件和科學(xué)數(shù)據(jù)等多媒體信息進(jìn)行高質(zhì)量的加工,實(shí)現(xiàn)知識(shí)增值,并提供在廣域網(wǎng)上高速橫向跨庫(kù)的便捷的數(shù)字知識(shí)存取服務(wù)。
由此,我們可以說(shuō),數(shù)字圖書(shū)館的興起是Internet網(wǎng)絡(luò)技術(shù)的巨大沖擊;數(shù)字圖書(shū)館的發(fā)展的強(qiáng)大推動(dòng)力是人類(lèi)知識(shí)需求速度的猛增。人類(lèi)不僅需求更多的信息,而且需要更高質(zhì)量的知識(shí)。數(shù)字圖書(shū)館將面向知識(shí)增值服務(wù)系統(tǒng)的轉(zhuǎn)型發(fā)展。
2.3 數(shù)字圖書(shū)館的知識(shí)創(chuàng)新
國(guó)家創(chuàng)新體系的主要功能,是知識(shí)創(chuàng)新、知識(shí)傳播、知識(shí)交換和知識(shí)利用。大力促進(jìn)和提高知識(shí)的生產(chǎn)、傳播、交換和利用的水平、規(guī)模和效率,是國(guó)家創(chuàng)新體系的基本任務(wù)。
。1)知識(shí)創(chuàng)新過(guò)程
知識(shí)創(chuàng)新是數(shù)字圖書(shū)館發(fā)展的最主要的動(dòng)力源泉。信息經(jīng)過(guò)加工和改造形成知識(shí)。知識(shí)是人腦創(chuàng)新的成果,是人類(lèi)智慧的結(jié)晶。智慧是人類(lèi)文明的源泉,是推動(dòng)歷史發(fā)展的永恒動(dòng)力,是生產(chǎn)力諸要素中的核心。
知識(shí)一般可分為陳述性知識(shí)、過(guò)程性知識(shí)和控制性知識(shí)。陳述性知識(shí)提供概念和事實(shí),描述系統(tǒng)狀態(tài)、環(huán)境和條件,使人們知道是什么。過(guò)程性知識(shí)提供有關(guān)狀態(tài)的變化、問(wèn)題求解過(guò)程的操作、演算和動(dòng)作的知識(shí)。
個(gè)性知識(shí)單元由最小的知識(shí)元素“知識(shí)元”組成,知識(shí)元的不同排列構(gòu)成了不同知識(shí)單元之間的差異,知識(shí)元也是知識(shí)結(jié)構(gòu)的最小元素,在知識(shí)結(jié)構(gòu)中可以由知識(shí)元直接組成新的知識(shí)單元,這就是知識(shí)學(xué)習(xí)與知識(shí)創(chuàng)新的過(guò)程。
。2)知識(shí)創(chuàng)新的度量方法
在考慮知識(shí)創(chuàng)新度量問(wèn)題時(shí),我們應(yīng)盡可能從知識(shí)單元與知識(shí)結(jié)構(gòu)之間所表現(xiàn)的特征尋找描述度量的方法。就某一篇文獻(xiàn)而言,它的知識(shí)包含有兩個(gè)層次。一個(gè)是局部的,即是圍繞該文本主題有關(guān)方面的判斷、推理、結(jié)論等。另一個(gè)是全局的、總體的,即是相對(duì)該學(xué)科主題現(xiàn)狀的知識(shí)增量。比如,一篇綜述性文獻(xiàn),由于采用知識(shí)的提煉與合成技術(shù),它本身的(局部的)知識(shí)容量增加了,建立了新的知識(shí)鏈關(guān)系,就有知識(shí)創(chuàng)新產(chǎn)生。
從知識(shí)度量角度講,我們所研究的知識(shí)是事實(shí)性的、靜態(tài)的知識(shí),是關(guān)于事物的分類(lèi)、屬性、事物間關(guān)系等的科學(xué)事實(shí)或客觀事實(shí)。具體到某一篇文獻(xiàn)而言,知識(shí)是指關(guān)于其所研究對(duì)象(主題)的結(jié)構(gòu)、關(guān)系、屬性和取值等方面所做的概念、判斷、推理,即有關(guān)該主題對(duì)象新有的結(jié)論。相對(duì)學(xué)科主題而言,它的知識(shí)則指的是新增加的那一部分,即知識(shí)創(chuàng)新的增量。知識(shí)是可學(xué)習(xí)的、可復(fù)制的,而智慧是不可復(fù)制的。目前對(duì)知識(shí)創(chuàng)新度量最簡(jiǎn)單的方法是對(duì)產(chǎn)生新的知識(shí)增量及其效應(yīng)的判別和估價(jià)。這種估價(jià)的結(jié)果表現(xiàn)為一種數(shù)量現(xiàn)象,實(shí)質(zhì)上估價(jià)知識(shí)的增量隱含著對(duì)智慧的測(cè)度,因?yàn)閷?shí)現(xiàn)知識(shí)創(chuàng)新的根源是智慧,但對(duì)智慧的度量目前則是太困難了。
(3)信息與知識(shí)的變換
科技發(fā)展史上的一條規(guī)律說(shuō)明:當(dāng)把兩門(mén)表面看來(lái)毫不相干的學(xué)科結(jié)合起來(lái)的時(shí)候,就可能形成一門(mén)新的學(xué)科;當(dāng)把兩種似乎沒(méi)有任何聯(lián)系的現(xiàn)象聯(lián)系起來(lái),就可能在科學(xué)技術(shù)上取得某些進(jìn)展或突破。不同學(xué)科的文獻(xiàn)常有內(nèi)在的聯(lián)系,包含隱含的知識(shí)或信息,可以從中重組出全新的知識(shí)或信息,得出全新的推理或結(jié)論。
·隱含信息的關(guān)聯(lián)
隱含信息的重組是知識(shí)的外化和外延。一些信息本身沒(méi)有什么價(jià)值,但在它身后卻隱藏著另外一種很有價(jià)值的信息,這種延伸或潛在的信息單元、知識(shí)單元,有一定的隱蔽性,往往不易被人發(fā)現(xiàn),一旦被開(kāi)發(fā)出來(lái),并運(yùn)用到實(shí)踐當(dāng)中去,卻可產(chǎn)生不可估量的效益。
美國(guó)芝加哥大學(xué)圖書(shū)館研究生院、信息中心的Swansan D.R.等一直在從事認(rèn)知科學(xué)和文獻(xiàn)內(nèi)容相互關(guān)系的研究,對(duì)信息重組和知識(shí)創(chuàng)新過(guò)程進(jìn)行了不少研究。由于他們一直對(duì)文獻(xiàn)的隱含信息進(jìn)行研究,并在研究過(guò)程中,利用現(xiàn)代的計(jì)算機(jī)技術(shù),設(shè)計(jì)了一種新穎的計(jì)算機(jī)輔助信息檢索軟件(ARROWSMITH算法),能辨別出生物醫(yī)學(xué)文獻(xiàn)中兩個(gè)詞語(yǔ)間的聯(lián)系,從而進(jìn)一步發(fā)現(xiàn)隱含信息的關(guān)聯(lián),促進(jìn)新知識(shí)的產(chǎn)生。
·知識(shí)的消息通信
知識(shí)元、知識(shí)單元、知識(shí)結(jié)構(gòu)都以信息的方式在文獻(xiàn)中表現(xiàn),把隱含在文獻(xiàn)中的大量復(fù)雜知識(shí)元以消息通信的方式連接起來(lái),提高隱含知識(shí)的明晰化程度,將是未來(lái)數(shù)字圖書(shū)館向知識(shí)創(chuàng)新努力的關(guān)鍵[4].
知識(shí)檢索是在知識(shí)結(jié)構(gòu)中獲取知識(shí)的過(guò)程,用戶可以通過(guò)知識(shí)單元間接地獲取知識(shí),更可以通過(guò)知識(shí)元直接獲取知識(shí);信息檢索只能通過(guò)間接的知識(shí)單元信息獲取文獻(xiàn)。
知識(shí)鏈接是數(shù)字圖書(shū)館的核心,是實(shí)現(xiàn)數(shù)字圖書(shū)館從信息服務(wù)向知識(shí)服務(wù)轉(zhuǎn)型的關(guān)鍵技術(shù)。因此,采用知識(shí)鏈研究知識(shí)標(biāo)引與檢索是合理的,研究知識(shí)元、知識(shí)單元、知識(shí)結(jié)構(gòu)之間的信息與知識(shí)的變換是可實(shí)現(xiàn)的。
從人工智能觀點(diǎn)看,知識(shí)是對(duì)事實(shí)的合理推理的結(jié)果。知識(shí)的表達(dá)與處理可以有多種方法,且已有許多優(yōu)秀成果,但最關(guān)鍵的是如何實(shí)現(xiàn)知識(shí)元與知識(shí)單元和知識(shí)結(jié)構(gòu)之間的繼承性,以及如何有效地實(shí)現(xiàn)它們之間的消息通信。
·信息轉(zhuǎn)換成知識(shí)
從標(biāo)引“知識(shí)元”層面研究,揭示單篇文獻(xiàn)的個(gè)體“知識(shí)元”信息與某領(lǐng)域共性“知識(shí)結(jié)構(gòu)”的鏈接關(guān)系,從而找出信息與知識(shí)的轉(zhuǎn)換的普遍規(guī)律[5],是提高用戶通過(guò)檢索系統(tǒng)直接獲取有效知識(shí)而不是一大堆文獻(xiàn)的有效方法。
傳統(tǒng)的信息服務(wù)只提供文獻(xiàn)的信息或提供作為知識(shí)素材的文獻(xiàn),并沒(méi)有揭示文獻(xiàn)中的知識(shí)鏈。人們獲取的只是文獻(xiàn)數(shù)據(jù)信息本身,并不是知識(shí)。比如人們看到了題錄摘要,從中未必可以看到知識(shí)。即使讀完了一次文獻(xiàn),也許仍不能準(zhǔn)確了解其中的知識(shí)所在。
數(shù)字圖書(shū)館中存在大量的文獻(xiàn)信息庫(kù),文獻(xiàn)信息庫(kù)中的知識(shí)是非結(jié)構(gòu)化的,知識(shí)元之間的關(guān)系是隱含的,需要一種能把文獻(xiàn)中的知識(shí)元及其信息背景一起封裝的技術(shù),實(shí)現(xiàn)知識(shí)與訪問(wèn)該知識(shí)的信息成為獨(dú)立的知識(shí)元,又要使得在檢索需要的時(shí)候,獨(dú)立知識(shí)元之間的關(guān)系能通過(guò)它們所帶的信息實(shí)現(xiàn)連接,這就是我們要實(shí)現(xiàn)的知識(shí)鏈概念。具體方法我們將另文介紹。其基本框架有:
。1)將標(biāo)引的每一個(gè)工序合理安排;
。2)借助歷史數(shù)據(jù)盡快完成知識(shí)增值標(biāo)引;
。3)在系統(tǒng)中捆綁專(zhuān)家工具,以便快速抽取知識(shí)元,建立知識(shí)鏈關(guān)系;
(4)自動(dòng)整理現(xiàn)有工序操作流程,并在知識(shí)庫(kù)中總結(jié)工作吸取教訓(xùn);
。5)自動(dòng)形成標(biāo)引的標(biāo)準(zhǔn);
。6)校驗(yàn)后決定是否修改;
(7)將結(jié)論整理存入知識(shí)網(wǎng)格庫(kù);
。8)用戶查詢的經(jīng)驗(yàn)及要求的加入等。
人們期望數(shù)字圖書(shū)館能提供知識(shí)服務(wù),數(shù)字圖書(shū)館正在由文獻(xiàn)信息服務(wù)向知識(shí)增值服務(wù)轉(zhuǎn)型。數(shù)字圖書(shū)館將造就一門(mén)新的學(xué)科——知識(shí)管理工程。它將是以計(jì)算機(jī)技術(shù)、通信技術(shù)、管理科學(xué)、人工智能技術(shù)為骨干的新型學(xué)科。信息過(guò)濾,信息與知識(shí)轉(zhuǎn)換,將對(duì)知識(shí)管理工程產(chǎn)生深遠(yuǎn)的影響。新一代數(shù)字圖書(shū)館的工作者將是信息整流和知識(shí)創(chuàng)新的人才。
【參考文獻(xiàn)】
1 徐如鏡。開(kāi)發(fā)知識(shí)資源發(fā)展知識(shí)產(chǎn)業(yè)服務(wù)知識(shí)經(jīng)濟(jì)。在“2001數(shù)字化信息資源與知識(shí)倉(cāng)庫(kù)標(biāo)準(zhǔn)國(guó)際研討會(huì)”上的講話。
2 溫有奎。計(jì)算機(jī)檢索中的情報(bào)取樣與濾波分析。情報(bào)學(xué)報(bào),1993,12(1):61——68
3 林鴻飛,戰(zhàn)學(xué)剛,姚天順。基于概念的文本結(jié)構(gòu)分析方法。計(jì)算機(jī)研究與發(fā)展,2000(3)
4 賴伯年等。西北地區(qū)數(shù)字圖書(shū)館建設(shè)與社會(huì)經(jīng)濟(jì)可持續(xù)發(fā)展研究,社科基金2002
5 溫有奎,徐國(guó)華。信息與知識(shí)變換。情報(bào)學(xué)報(bào),2002,21(5):613——617
【信息整流與知識(shí)增值服務(wù)】相關(guān)文章:
BP:一個(gè)價(jià)值增值的知識(shí)企業(yè)08-05
試析我國(guó)創(chuàng)業(yè)投資機(jī)構(gòu)增值服務(wù)問(wèn)題的幾點(diǎn)思考08-05
信息服務(wù)模式研究08-05
社科信息需求與服務(wù)08-05
銀行服務(wù)禮儀知識(shí)技巧04-27