- 相關推薦
論知識倉庫的架構(gòu)
【內(nèi)容提要】在知識管理時代,知識倉庫具有隱性知識共享和轉(zhuǎn)化功能、知識存儲和檢索功能、知識分析功能、新知識產(chǎn)生和反饋功能,以及用戶行為分析跟蹤功能。知識倉庫的架構(gòu)分為6個主要構(gòu)件:共享和獲取隱性知識模塊;獲取顯性知識模塊;知識的抽取、轉(zhuǎn)換和儲存模塊;知識分析模塊;用戶(系統(tǒng)管理員)界面模塊;3個反饋環(huán)。目前,已經(jīng)開發(fā)出一些知識倉庫軟件系統(tǒng)。圖1。參考文獻8。【摘 要 題】專題探討
1 知識管理時代知識倉庫的地位
知識可劃分為顯性知識(explicit knowledge)和隱性知識(tacit knowledge)兩類。其中,顯性知識是指能夠用語言、符號、規(guī)則、公式或?qū)ο蟮日奖磉_并能夠傳輸給他人的知識;隱性知識是深深根植于人腦中的信念、觀點、創(chuàng)意和智力模型,包括某人長期從事某項活動或職業(yè)而形成的主觀經(jīng)驗、洞察力和直覺。二者緊密關聯(lián),并與經(jīng)濟活動融為一體,成為當代社會發(fā)展的主要推進力量。
知識管理是通過共享和抓住隱性知識并將其轉(zhuǎn)變?yōu)轱@性知識,篩選、存儲、加工、檢索、傳遞和利用顯性知識,創(chuàng)新新的知識來增加社會價值的。這種實踐活動可用知識螺旋(knowledge spiral)來描述。在每一個螺旋中存在4個階段:共享隱性知識階段、隱性知識轉(zhuǎn)變?yōu)轱@性知識階段、顯性知識轉(zhuǎn)變?yōu)樾轮R階段和通過學習產(chǎn)生新的隱性知識階段。每一次新的顯性知識和隱性知識的產(chǎn)生便是知識螺旋的一次上升。相對于知識管理,信息管理注重顯性知識或稱編碼型知識(codified knowledge)的搜集、存儲、加工、檢索、分析和預測,這方面的研究成果主要表現(xiàn)為數(shù)據(jù)倉庫(Data Warehouse,簡稱DW)的開發(fā)和利用。數(shù)據(jù)倉庫使企業(yè)能抽取、篩選、存儲大量的數(shù)據(jù),對用戶的檢索進行有效而準確的反應,并為決策活動提供了強大的基礎。然而,數(shù)據(jù)倉庫中僅僅存儲了決策者所需知識的一部分,企業(yè)絕大部分智力財富以隱性知識的方式存在于員工的大腦中,因此,數(shù)據(jù)倉庫不足以滿足對知識檢索的需求。為了滿足知識管理和知識決策的需求,可以對現(xiàn)存的企業(yè)數(shù)據(jù)倉庫進一步擴充,成為滿足知識管理需求的知識倉庫(Knowledge Warehouse,簡稱KW)。知識倉庫能夠?qū)Σ煌愋偷闹R(顯性知識和隱性知識)和不同形式的知識(純文本、二進制對象、模型等)進行捕捉、存儲、編碼、組織和分析。另外,這些知識還包括元知識(關于知識的知識)和分析后產(chǎn)生的新知識。
2 知識倉庫的主要功能分析
知識倉庫強調(diào)為決策者提供一個提升知識管理流程全過程的智能分析平臺,它在很大程度上依賴于信息技術的發(fā)展并被日新月異的信息技術所推動。信息技術包括人工智能、神經(jīng)網(wǎng)絡、專家系統(tǒng)、多媒體技術、數(shù)據(jù)庫、信息可視化、機器學習、信息分析與挖掘等,其中OLAP(Online Analytical Processing,在線分析處理)與DM(Data Mining,數(shù)據(jù)挖掘)是基于數(shù)據(jù)倉庫技術而發(fā)展起來的信息分析與挖掘工具。OLAP是驗證型的,建立在多維視圖的基礎上,重在根據(jù)已有的模式將直接源自數(shù)據(jù)倉庫中的不同信息源的大量相關信息聯(lián)系起來,以給分析人員一個清晰、一致的視圖。OLAP主要有兩個特點,一是在線性(online),即對用戶的請求做出快速響應;二是可以應用多種統(tǒng)計分析工具、算法對數(shù)據(jù)進行多維分析(multi-analysis)。DM是挖掘型的,建立在各種信息源的基礎上,重在發(fā)現(xiàn)隱藏在大量原始數(shù)據(jù)深層中的對人們有用的模式(patterns)。被抽取的模式即知識,具備可信、新穎、有效、易于理解的特點。DM有兩個主要過程,即建立模型和預測未來結(jié)果。在這些過程中,可應用統(tǒng)計分析、神經(jīng)網(wǎng)絡、決策樹、遺傳算法、模糊邏輯、基于記憶的推理(memory-based reasoning)等技術,OLAM(Online Analvtical Mining,在線分析挖掘)是OLAP和DM相結(jié)合的產(chǎn)物,OLAM兼有OLAP多維分析的在線性、靈活性和DM對數(shù)據(jù)處理的深入性,目前OLAM正處于研究之中,針對LAM的發(fā)展驅(qū)動力和基本結(jié)構(gòu),以下幾點是必要的:OLAM建立在多維數(shù)據(jù)庫和OLAP的基礎之上,能對任何它想要的數(shù)據(jù)進行挖掘;用戶對挖掘算法具有動態(tài)選擇的權力;具有強大的基于超立方體的挖掘算法;能夠協(xié)調(diào)好執(zhí)行效率與挖掘的準確性之間的關系;具有靈活的可視化工具和良好的擴展性。
信息技術的發(fā)展使知識倉庫的功能實現(xiàn)變?yōu)榭赡,知識倉庫應具備以下主要功能:
。1)隱性知識共享和轉(zhuǎn)化功能。即知識倉庫應具備共享隱性知識和將隱性知識轉(zhuǎn)變?yōu)轱@性知識的能力,這依賴于機器學習、神經(jīng)網(wǎng)絡、信息可視化、多媒體技術等。
。2)知識存儲和檢索功能。即知識倉庫必須提供數(shù)據(jù)倉庫所擁有的全部功能,并具有更加豐富的知識表現(xiàn)形式。知識倉庫應能有效生產(chǎn)、存儲、檢索、管理各種形式的知識。
。3)知識分析功能。知識分析是一個非常復雜的過程,分析任務常常利用各類歸納和演繹的人工智能技術,如神經(jīng)網(wǎng)絡、數(shù)據(jù)處理的分組方法、統(tǒng)計、基因算法、基于案例的推理等。每一個任務在輸入數(shù)據(jù)、執(zhí)行參數(shù)和輸出格式方面都有自己的要求。
。4)新知識的產(chǎn)生和反饋功能。知識倉庫中的知識隨著不同的反饋環(huán)而得到實時更新,如通過頭腦風暴法產(chǎn)生、共享和獲取新的隱性知識;從用戶剛剛驗證和證實的結(jié)果中產(chǎn)生新的顯性知識。
。5)用戶行為分析跟蹤功能。知識倉庫能夠根據(jù)用戶所提供的信息、用戶的行為習慣和傾向進行跟蹤并針對性地提供決策服務。
3 知識倉庫的架構(gòu)
知識倉庫包括6個主要構(gòu)件(見圖1):共享和獲取隱性知識模塊;獲取顯性知識模塊;知識的抽取、轉(zhuǎn)變和存儲模塊;知識分析模塊:用戶(系統(tǒng)管理員)界面模塊;3個反饋環(huán)。
附圖
圖1 知識倉庫的架構(gòu)
3.1 共享和獲取隱性知識模塊
隱性知識是無法交流的知識。例如,學生通過書本可間接地學到用文字表達出來的顯性知識,而通過上課不僅可學到顯性知識,而且能體會到教師講授中無法表達的隱性知識。這即是所謂的言傳身教,但在對所講所學知識的理解上學生和教師總存在差別。又如,邀請一位有經(jīng)驗的管理者作報告,假設該管理者對自己所理解的管理理論和實踐經(jīng)驗盡其全力進行表達,是否聽報告的人在報告后便能成為與其一樣出色的管理者?答案是否定的,究其原因,該管理者能表達出來的知識是顯性知識,而他頭腦中大量存在的是他無法表達清楚的隱性知識,這些隱性知識在該管理者的管理實踐中起非常重要的決策支持作用。知識管理非常強調(diào)對隱性知識的挖掘,共享和獲取隱性
知識模塊應具體擁有以下功能:①行為隱性知識獲取。表現(xiàn)為行為跟蹤、動作慢放,如將外科手術、工藝操作等過程進行錄制生成多媒體信息,再對這些多媒體信息進行慢放,通過觀摩這些慢放的畫面,可以共享人的行為中所擁有的隱性知識。②提供一個平臺,讓大家各抒己見,如在BBS、聊天室或頭腦風暴法基礎上加上跟蹤軟件,分析表達出來的、看起來分散而孤立的顯性知識之間的關系,挖掘隱性知識。③基于模型環(huán)境的數(shù)學模型抽取。④基于專家環(huán)境的規(guī)則抽取。
3.2 獲取顯性知識模塊
這個模塊功能類似于數(shù)據(jù)倉庫中相應的功能,能夠?qū)︼@性知識進行搜集和篩選。
3.3 知識的抽取、轉(zhuǎn)換和存儲模塊
這個模塊是知識倉庫的基本構(gòu)件。它是一個面向?qū)ο蟮闹R庫管理系統(tǒng)(Knowledge Base Manage ment System.簡稱KBMS),集成了知識庫、模型庫和分析任務等,知識以框架、規(guī)則、語義網(wǎng)絡等形式存儲在知識庫中。KBMS管理如何將廣泛的知識對象集成為一個功能體,這些知識對象包括數(shù)字、文本流、驗證的模型、元模型,電影剪輯、動畫片斷以及控制它們的軟件。KBMS在面向?qū)ο蟮沫h(huán)境中實施,不僅管理數(shù)據(jù),而且管理聽有的對象、對象模型、過程模型、案例模型、對象交互模型和用來處理、解釋知識并產(chǎn)生知識庫的動態(tài)模型,
3.4 知識分析模塊
知識分析模塊處理所有與分析任務有關的活動,包括知識工程、任務控制、判斷生成和技術管理。知識工程次模塊是基于專家系統(tǒng)的子系統(tǒng),它負責開發(fā)知識分析目標和基本的模型環(huán)境原則。
任務控制次模塊處理所有數(shù)據(jù)要求和運行中的交互(包括耐用戶傾向偏好的分析和跟蹤),即以任務控制臺的形式作為任務交互的基于人工智能的代理決策者,使真正的決策者不必知道其中的技術、微小區(qū)別和交互過程等。
判斷生成次模塊對各類分析任務的輸出(包括基于用戶行為跟蹤分析而提供的針對性決策服務)進行評估,特別是對于因果任務,篩選出基于某個標準的假的或不一致的結(jié)果,然后產(chǎn)生希望能使用戶明白模型環(huán)境的簡單而深刻的解釋。在這個過程中,判斷產(chǎn)生模型與知識庫、例子庫和模型庫交互,利用演繹知識、類比推理和其他技術。
技術管理次模塊對分析技術庫進行管理,它提供從新生分析算法到對象模型類的封裝、遺留數(shù)據(jù)挖掘集成應用、新生分析模型和元模型的對象模型庫合并,等等。
3.5 用戶(系統(tǒng)管理員)界面模塊
這個模塊處理KBMS和用戶間的所有分析通信,包括5個功能子模塊:判斷界面、輸入處理器、輸出處理器、在線幫助和系統(tǒng)管理員界面。
判斷界面是為了有效幫助用戶確定一個或多個條件進行觀察,它包括一個通過變化一個或多個參數(shù)值來提出相關例子的類比構(gòu)件,還包括一個或多個交互圖形以顯示操作過程,以便用戶能快速看清什么已經(jīng)試過、哪些例子可引向更深的洞察。判斷界面還應能提供基于計劃分析任務的具有潛在價值的案例分析。
輸入處理器在用戶和分析任務間提供界面,它將用戶確定的自然語言、SQL檢索語句等轉(zhuǎn)變成機器可執(zhí)行的檢索,或?qū)⒂脩舻恼Z音和繪圖等信息轉(zhuǎn)變成機器可識別的數(shù)據(jù)。
輸出處理器為每一個分析結(jié)果選擇最合適的可視化顯示,如圖、自然語言、多項式、決策樹等。這種選擇是基于分析任務輸出和用戶偏好的結(jié)合,而這又是基于適應性機器學習算法,它可分析當前用戶的歷史行為。
幫助子模塊向用戶提供有關模型(如參數(shù)范圍、測量單位、內(nèi)部模型結(jié)構(gòu))、例子(與基本案例的差異,關鍵決策變量值)、相關知識(如元模型,元數(shù)據(jù),基本原則,分析目的)和分析任務(如應用技術,技術描述,結(jié)果的解釋跟蹤,使用的技術參數(shù),技術的優(yōu)勢和局限)的信息。
系統(tǒng)管理員界面是為系統(tǒng)維護者提供的一個與知識倉庫通信的端口。
3.6 反饋環(huán)
知識倉庫包括3個反饋環(huán),一是從用戶(系統(tǒng)管理員)界面模塊到知識分析模塊之間的環(huán),它通過分析用戶的傾向偏好來更好地為用戶提供知識分析及其結(jié)果輸出服務;二是從知識分析模塊和用戶(系統(tǒng)管理員)界面模塊到獲取顯性知識模塊之間的環(huán),知識分析和用戶產(chǎn)生新的顯性知識,新的知識通過這個環(huán)存儲到知識庫中,這是知識管理的第3個階段;三是從用戶(系統(tǒng)管理員)界面模塊到共享和獲取隱性知識模塊之間的環(huán),用戶通過學習而產(chǎn)生新的隱性知識,這是知識管理的第4個階段。
4 知識倉庫系統(tǒng)開發(fā)實踐
目前已出現(xiàn)支持知識倉庫部分功能的軟件系統(tǒng)。下面針對知識倉庫應具備的功能對其中的幾個軟件進行分析。
首先,知識倉庫應當有效地生產(chǎn)、組織、檢索和管理各種形式的知識,具有智能模型抽取、知識工程等功能,向決策者提供一個智能分析平臺,以提升知識管理全過程。下面以IBM software,Solution為例進行分析,IBM是世界最大的信息技術企業(yè),自20世紀80年代以來一直處于幫助企業(yè)進行革新的領先地位,其軟件提供各類計算機平臺的最廣范圍的應用、中間件(middleware)和運行系統(tǒng)。IBM的Knowl edgeX技術能幫助企業(yè)通過更好地獲取、分析和共享數(shù)據(jù),做出更精明的決策,能平衡所有類型的數(shù)據(jù),而不論這些數(shù)據(jù)是來自數(shù)據(jù)庫內(nèi),還是來自公開出版的新聞或者因特網(wǎng)。IBM計劃未來將KnowledgeX技術集成到DB2廣義數(shù)據(jù)庫(DB2universal Database)和企業(yè)智能方案(business intellingence solutions)中,以為客戶帶來更多的功能。通過鏡像人類解決問題的過程,KnowledgeX從各類數(shù)據(jù)源中搜集信息,發(fā)現(xiàn)數(shù)據(jù)間的關聯(lián)和關系,將數(shù)據(jù)應用到問題中,并幫助開發(fā)出方案,目前利用KnowledgeX的一些領域包括競爭情報、合并和獲取、銷售力自動化、訴訟、垂直產(chǎn)業(yè)應用和知識管理。當今的企業(yè)正在利用更多的數(shù)據(jù)源以構(gòu)建或保持其競爭優(yōu)勢——來自Internet和Extranets,或來自文檔和公司數(shù)據(jù)庫,將IBM的數(shù)據(jù)庫和企業(yè)智能方案與KnowledgeX結(jié)合起來.企業(yè)將能更好地處理各種來源的數(shù)據(jù),尋找獲勝機會,并在企業(yè)中將知識轉(zhuǎn)變?yōu)樾袆,KnowledgeX軟件能揭示企業(yè)數(shù)據(jù)中隱藏的關系,決定這些關系的力量,并識別它們對企業(yè)目標和問題的實用性。KnowledgeX能顯示關鍵產(chǎn)業(yè)活動者間的關系,解釋過去的行為、合同或聯(lián)盟,能分析并鏈接看起來分散的信息以跟蹤發(fā)展方向并智能地預測競爭者未來的行動。KnowledgeX技術對IBM在數(shù)據(jù)和企業(yè)智能空間如DB2廣義數(shù)據(jù)庫,文本智能挖掘機(intelligent miner for text),可視化倉庫(visual warehouse)等中的工具和方法起到補充作用。KnowledgeX與企業(yè)智能工具如數(shù)據(jù)倉庫、數(shù)據(jù)挖掘和在線分析處理一起允許企業(yè)從數(shù)據(jù)源中獲取更多的洞察力。目前,全球的客戶正利用
IBM企業(yè)智能系統(tǒng)來更快、更明智地決定應進入哪個市場、雇用哪個客戶、宣傳哪個產(chǎn)品。以達到提升利潤和競爭力的目的。
其次,知識倉庫應當能執(zhí)行和管理各類知識分析任務及其支持技術(如敏捷度分析、機器學習、神經(jīng)網(wǎng)絡、知識倉庫挖掘和模式識別等)。下面以VantagePoint為例進行分析,VantagePoint提供從文本數(shù)據(jù)庫中挖掘知識的能力,它具有以下功能:①抽取并索引新數(shù)據(jù),通過檢索,用戶將數(shù)據(jù)引入到VantagePoint中,在這個過程中,VantagePoint使用了一個數(shù)據(jù)庫構(gòu)成文件(這對于不同的數(shù)據(jù)庫和數(shù)據(jù)庫提供商都不一樣),利用模式匹配、規(guī)則基礎和自然語言處理技術從文本中挖掘字段,除記錄通常的字段以外(如作者、單位和分類號),VantagePoint還能利用自然語言處理技術從文摘中抽取有意義的詞和詞組。②同發(fā)生矩陣,利用同發(fā)生矩陣,用戶可對表進行交叉。如利用同發(fā)生矩陣中的“作者”和“出版年代”,用戶可觀察某作者一段時間內(nèi)的出版傾向,并按年代瀏覽他的作品,這可提供有關哪個作者在某領域工作時間最長,現(xiàn)在他們是否還活著等方面的信息。表或同發(fā)生矩陣中的數(shù)據(jù)可輸出到其他應用中以便進行可視化顯示或分析。③映射/網(wǎng)絡,在一維(表)和二維(同發(fā)生矩陣)分析之外,VantagePoint還可運行多維統(tǒng)計分析以識別概念之間的簇和關系。④Vantagepoint可將數(shù)據(jù)分解為更小的、分散的數(shù)據(jù)集以進行識別。⑤VantagePoint利用模糊匹配技術進行數(shù)據(jù)識別、關聯(lián)并減少數(shù)據(jù)冗余。用戶可創(chuàng)建、編輯同義詞詞典。⑥用戶可利用VantagePoint的微軟VB.Script擴展功能來調(diào)整操。VantagePoint在VBScript中增加了5個VB對象和50多種AB方法,允許用戶創(chuàng)建和分配腳本,這可使定制分析技術重復使用。
最后,知識倉庫應具有用戶友好的界面和共享隱性知識的平臺,下面以Lotus Developments為例進行分析,Domino.Doc將小范圍專家使用的文檔管理界面擴展為基于網(wǎng)絡環(huán)境的、更靈活的、適用于企業(yè)內(nèi)每一個成員的解決方案。企業(yè)成員通過Web瀏覽器共享信息和應用,企業(yè)服務器通過擴充能力、靈活性和安全性的平衡使其在知識管理中發(fā)揮主要作用。 CK
1 Hamid R.Nemati et al.Knowledge warehouse;an architectural integration of knowledge management,decision support,artificial intelligence and data warehousing,Decision Support Systems 33(2002),pp.143~161
2 馬海群.論知識經(jīng)濟、知識管理與知識產(chǎn)權.圖書情報知識,2000(2)
3 褚峻.知識管理的資源性分析.圖書情報知識,2000(2)
4 劉夫濤.從OLAP、數(shù)據(jù)挖掘到OLAM(上).網(wǎng)絡世界, 1990-02-01
5 劉夫濤.從OLAP、數(shù)據(jù)挖掘到OLAM(下).網(wǎng)絡世界, 1999-02-08
6 http://www.software.ibm
7 http://www.thevantagepoint.com
8 http://www.Lotus.com
【論知識倉庫的架構(gòu)】相關文章:
論商號的知識產(chǎn)權保護08-05
論企業(yè)知識管理的基本問題08-05
論科技成果知識產(chǎn)權化08-05
經(jīng)驗主義、實在論和因果知識08-05
論中學歷史知識的性質(zhì)及地位08-07
架構(gòu)師心得01-10
論知識經(jīng)濟與人力資源的開發(fā)和管理08-17