- 相關推薦
論知識倉庫的架構
【內容提要】在知識管理時代,知識倉庫具有隱性知識共享和轉化功能、知識存儲和檢索功能、知識分析功能、新知識產生和反饋功能,以及用戶行為分析跟蹤功能。知識倉庫的架構分為6個主要構件:共享和獲取隱性知識模塊;獲取顯性知識模塊;知識的抽取、轉換和儲存模塊;知識分析模塊;用戶(系統(tǒng)管理員)界面模塊;3個反饋環(huán)。目前,已經開發(fā)出一些知識倉庫軟件系統(tǒng)。圖1。參考文獻8。【摘 要 題】專題探討
1 知識管理時代知識倉庫的地位
知識可劃分為顯性知識(explicit knowledge)和隱性知識(tacit knowledge)兩類。其中,顯性知識是指能夠用語言、符號、規(guī)則、公式或對象等正式表達并能夠傳輸給他人的知識;隱性知識是深深根植于人腦中的信念、觀點、創(chuàng)意和智力模型,包括某人長期從事某項活動或職業(yè)而形成的主觀經驗、洞察力和直覺。二者緊密關聯(lián),并與經濟活動融為一體,成為當代社會發(fā)展的主要推進力量。
知識管理是通過共享和抓住隱性知識并將其轉變?yōu)轱@性知識,篩選、存儲、加工、檢索、傳遞和利用顯性知識,創(chuàng)新新的知識來增加社會價值的。這種實踐活動可用知識螺旋(knowledge spiral)來描述。在每一個螺旋中存在4個階段:共享隱性知識階段、隱性知識轉變?yōu)轱@性知識階段、顯性知識轉變?yōu)樾轮R階段和通過學習產生新的隱性知識階段。每一次新的顯性知識和隱性知識的產生便是知識螺旋的一次上升。相對于知識管理,信息管理注重顯性知識或稱編碼型知識(codified knowledge)的搜集、存儲、加工、檢索、分析和預測,這方面的研究成果主要表現(xiàn)為數(shù)據(jù)倉庫(Data Warehouse,簡稱DW)的開發(fā)和利用。數(shù)據(jù)倉庫使企業(yè)能抽取、篩選、存儲大量的數(shù)據(jù),對用戶的檢索進行有效而準確的反應,并為決策活動提供了強大的基礎。然而,數(shù)據(jù)倉庫中僅僅存儲了決策者所需知識的一部分,企業(yè)絕大部分智力財富以隱性知識的方式存在于員工的大腦中,因此,數(shù)據(jù)倉庫不足以滿足對知識檢索的需求。為了滿足知識管理和知識決策的需求,可以對現(xiàn)存的企業(yè)數(shù)據(jù)倉庫進一步擴充,成為滿足知識管理需求的知識倉庫(Knowledge Warehouse,簡稱KW)。知識倉庫能夠對不同類型的知識(顯性知識和隱性知識)和不同形式的知識(純文本、二進制對象、模型等)進行捕捉、存儲、編碼、組織和分析。另外,這些知識還包括元知識(關于知識的知識)和分析后產生的新知識。
2 知識倉庫的主要功能分析
知識倉庫強調為決策者提供一個提升知識管理流程全過程的智能分析平臺,它在很大程度上依賴于信息技術的發(fā)展并被日新月異的信息技術所推動。信息技術包括人工智能、神經網絡、專家系統(tǒng)、多媒體技術、數(shù)據(jù)庫、信息可視化、機器學習、信息分析與挖掘等,其中OLAP(Online Analytical Processing,在線分析處理)與DM(Data Mining,數(shù)據(jù)挖掘)是基于數(shù)據(jù)倉庫技術而發(fā)展起來的信息分析與挖掘工具。OLAP是驗證型的,建立在多維視圖的基礎上,重在根據(jù)已有的模式將直接源自數(shù)據(jù)倉庫中的不同信息源的大量相關信息聯(lián)系起來,以給分析人員一個清晰、一致的視圖。OLAP主要有兩個特點,一是在線性(online),即對用戶的請求做出快速響應;二是可以應用多種統(tǒng)計分析工具、算法對數(shù)據(jù)進行多維分析(multi-analysis)。DM是挖掘型的,建立在各種信息源的基礎上,重在發(fā)現(xiàn)隱藏在大量原始數(shù)據(jù)深層中的對人們有用的模式(patterns)。被抽取的模式即知識,具備可信、新穎、有效、易于理解的特點。DM有兩個主要過程,即建立模型和預測未來結果。在這些過程中,可應用統(tǒng)計分析、神經網絡、決策樹、遺傳算法、模糊邏輯、基于記憶的推理(memory-based reasoning)等技術,OLAM(Online Analvtical Mining,在線分析挖掘)是OLAP和DM相結合的產物,OLAM兼有OLAP多維分析的在線性、靈活性和DM對數(shù)據(jù)處理的深入性,目前OLAM正處于研究之中,針對LAM的發(fā)展驅動力和基本結構,以下幾點是必要的:OLAM建立在多維數(shù)據(jù)庫和OLAP的基礎之上,能對任何它想要的數(shù)據(jù)進行挖掘;用戶對挖掘算法具有動態(tài)選擇的權力;具有強大的基于超立方體的挖掘算法;能夠協(xié)調好執(zhí)行效率與挖掘的準確性之間的關系;具有靈活的可視化工具和良好的擴展性。
信息技術的發(fā)展使知識倉庫的功能實現(xiàn)變?yōu)榭赡,知識倉庫應具備以下主要功能:
(1)隱性知識共享和轉化功能。即知識倉庫應具備共享隱性知識和將隱性知識轉變?yōu)轱@性知識的能力,這依賴于機器學習、神經網絡、信息可視化、多媒體技術等。
。2)知識存儲和檢索功能。即知識倉庫必須提供數(shù)據(jù)倉庫所擁有的全部功能,并具有更加豐富的知識表現(xiàn)形式。知識倉庫應能有效生產、存儲、檢索、管理各種形式的知識。
。3)知識分析功能。知識分析是一個非常復雜的過程,分析任務常常利用各類歸納和演繹的人工智能技術,如神經網絡、數(shù)據(jù)處理的分組方法、統(tǒng)計、基因算法、基于案例的推理等。每一個任務在輸入數(shù)據(jù)、執(zhí)行參數(shù)和輸出格式方面都有自己的要求。
。4)新知識的產生和反饋功能。知識倉庫中的知識隨著不同的反饋環(huán)而得到實時更新,如通過頭腦風暴法產生、共享和獲取新的隱性知識;從用戶剛剛驗證和證實的結果中產生新的顯性知識。
。5)用戶行為分析跟蹤功能。知識倉庫能夠根據(jù)用戶所提供的信息、用戶的行為習慣和傾向進行跟蹤并針對性地提供決策服務。
3 知識倉庫的架構
知識倉庫包括6個主要構件(見圖1):共享和獲取隱性知識模塊;獲取顯性知識模塊;知識的抽取、轉變和存儲模塊;知識分析模塊:用戶(系統(tǒng)管理員)界面模塊;3個反饋環(huán)。
附圖
圖1 知識倉庫的架構
3.1 共享和獲取隱性知識模塊
隱性知識是無法交流的知識。例如,學生通過書本可間接地學到用文字表達出來的顯性知識,而通過上課不僅可學到顯性知識,而且能體會到教師講授中無法表達的隱性知識。這即是所謂的言傳身教,但在對所講所學知識的理解上學生和教師總存在差別。又如,邀請一位有經驗的管理者作報告,假設該管理者對自己所理解的管理理論和實踐經驗盡其全力進行表達,是否聽報告的人在報告后便能成為與其一樣出色的管理者?答案是否定的,究其原因,該管理者能表達出來的知識是顯性知識,而他頭腦中大量存在的是他無法表達清楚的隱性知識,這些隱性知識在該管理者的管理實踐中起非常重要的決策支持作用。知識管理非常強調對隱性知識的挖掘,共享和獲取隱性
知識模塊應具體擁有以下功能:①行為隱性知識獲取。表現(xiàn)為行為跟蹤、動作慢放,如將外科手術、工藝操作等過程進行錄制生成多媒體信息,再對這些多媒體信息進行慢放,通過觀摩這些慢放的畫面,可以共享人的行為中所擁有的隱性知識。②提供一個平臺,讓大家各抒己見,如在BBS、聊天室或頭腦風暴法基礎上加上跟蹤軟件,分析表達出來的、看起來分散而孤立的顯性知識之間的關系,挖掘隱性知識。③基于模型環(huán)境的數(shù)學模型抽取。④基于專家環(huán)境的規(guī)則抽取。
3.2 獲取顯性知識模塊
這個模塊功能類似于數(shù)據(jù)倉庫中相應的功能,能夠對顯性知識進行搜集和篩選。
3.3 知識的抽取、轉換和存儲模塊
這個模塊是知識倉庫的基本構件。它是一個面向對象的知識庫管理系統(tǒng)(Knowledge Base Manage ment System.簡稱KBMS),集成了知識庫、模型庫和分析任務等,知識以框架、規(guī)則、語義網絡等形式存儲在知識庫中。KBMS管理如何將廣泛的知識對象集成為一個功能體,這些知識對象包括數(shù)字、文本流、驗證的模型、元模型,電影剪輯、動畫片斷以及控制它們的軟件。KBMS在面向對象的環(huán)境中實施,不僅管理數(shù)據(jù),而且管理聽有的對象、對象模型、過程模型、案例模型、對象交互模型和用來處理、解釋知識并產生知識庫的動態(tài)模型,
3.4 知識分析模塊
知識分析模塊處理所有與分析任務有關的活動,包括知識工程、任務控制、判斷生成和技術管理。知識工程次模塊是基于專家系統(tǒng)的子系統(tǒng),它負責開發(fā)知識分析目標和基本的模型環(huán)境原則。
任務控制次模塊處理所有數(shù)據(jù)要求和運行中的交互(包括耐用戶傾向偏好的分析和跟蹤),即以任務控制臺的形式作為任務交互的基于人工智能的代理決策者,使真正的決策者不必知道其中的技術、微小區(qū)別和交互過程等。
判斷生成次模塊對各類分析任務的輸出(包括基于用戶行為跟蹤分析而提供的針對性決策服務)進行評估,特別是對于因果任務,篩選出基于某個標準的假的或不一致的結果,然后產生希望能使用戶明白模型環(huán)境的簡單而深刻的解釋。在這個過程中,判斷產生模型與知識庫、例子庫和模型庫交互,利用演繹知識、類比推理和其他技術。
技術管理次模塊對分析技術庫進行管理,它提供從新生分析算法到對象模型類的封裝、遺留數(shù)據(jù)挖掘集成應用、新生分析模型和元模型的對象模型庫合并,等等。
3.5 用戶(系統(tǒng)管理員)界面模塊
這個模塊處理KBMS和用戶間的所有分析通信,包括5個功能子模塊:判斷界面、輸入處理器、輸出處理器、在線幫助和系統(tǒng)管理員界面。
判斷界面是為了有效幫助用戶確定一個或多個條件進行觀察,它包括一個通過變化一個或多個參數(shù)值來提出相關例子的類比構件,還包括一個或多個交互圖形以顯示操作過程,以便用戶能快速看清什么已經試過、哪些例子可引向更深的洞察。判斷界面還應能提供基于計劃分析任務的具有潛在價值的案例分析。
輸入處理器在用戶和分析任務間提供界面,它將用戶確定的自然語言、SQL檢索語句等轉變成機器可執(zhí)行的檢索,或將用戶的語音和繪圖等信息轉變成機器可識別的數(shù)據(jù)。
輸出處理器為每一個分析結果選擇最合適的可視化顯示,如圖、自然語言、多項式、決策樹等。這種選擇是基于分析任務輸出和用戶偏好的結合,而這又是基于適應性機器學習算法,它可分析當前用戶的歷史行為。
幫助子模塊向用戶提供有關模型(如參數(shù)范圍、測量單位、內部模型結構)、例子(與基本案例的差異,關鍵決策變量值)、相關知識(如元模型,元數(shù)據(jù),基本原則,分析目的)和分析任務(如應用技術,技術描述,結果的解釋跟蹤,使用的技術參數(shù),技術的優(yōu)勢和局限)的信息。
系統(tǒng)管理員界面是為系統(tǒng)維護者提供的一個與知識倉庫通信的端口。
3.6 反饋環(huán)
知識倉庫包括3個反饋環(huán),一是從用戶(系統(tǒng)管理員)界面模塊到知識分析模塊之間的環(huán),它通過分析用戶的傾向偏好來更好地為用戶提供知識分析及其結果輸出服務;二是從知識分析模塊和用戶(系統(tǒng)管理員)界面模塊到獲取顯性知識模塊之間的環(huán),知識分析和用戶產生新的顯性知識,新的知識通過這個環(huán)存儲到知識庫中,這是知識管理的第3個階段;三是從用戶(系統(tǒng)管理員)界面模塊到共享和獲取隱性知識模塊之間的環(huán),用戶通過學習而產生新的隱性知識,這是知識管理的第4個階段。
4 知識倉庫系統(tǒng)開發(fā)實踐
目前已出現(xiàn)支持知識倉庫部分功能的軟件系統(tǒng)。下面針對知識倉庫應具備的功能對其中的幾個軟件進行分析。
首先,知識倉庫應當有效地生產、組織、檢索和管理各種形式的知識,具有智能模型抽取、知識工程等功能,向決策者提供一個智能分析平臺,以提升知識管理全過程。下面以IBM software,Solution為例進行分析,IBM是世界最大的信息技術企業(yè),自20世紀80年代以來一直處于幫助企業(yè)進行革新的領先地位,其軟件提供各類計算機平臺的最廣范圍的應用、中間件(middleware)和運行系統(tǒng)。IBM的Knowl edgeX技術能幫助企業(yè)通過更好地獲取、分析和共享數(shù)據(jù),做出更精明的決策,能平衡所有類型的數(shù)據(jù),而不論這些數(shù)據(jù)是來自數(shù)據(jù)庫內,還是來自公開出版的新聞或者因特網。IBM計劃未來將KnowledgeX技術集成到DB2廣義數(shù)據(jù)庫(DB2universal Database)和企業(yè)智能方案(business intellingence solutions)中,以為客戶帶來更多的功能。通過鏡像人類解決問題的過程,KnowledgeX從各類數(shù)據(jù)源中搜集信息,發(fā)現(xiàn)數(shù)據(jù)間的關聯(lián)和關系,將數(shù)據(jù)應用到問題中,并幫助開發(fā)出方案,目前利用KnowledgeX的一些領域包括競爭情報、合并和獲取、銷售力自動化、訴訟、垂直產業(yè)應用和知識管理。當今的企業(yè)正在利用更多的數(shù)據(jù)源以構建或保持其競爭優(yōu)勢——來自Internet和Extranets,或來自文檔和公司數(shù)據(jù)庫,將IBM的數(shù)據(jù)庫和企業(yè)智能方案與KnowledgeX結合起來.企業(yè)將能更好地處理各種來源的數(shù)據(jù),尋找獲勝機會,并在企業(yè)中將知識轉變?yōu)樾袆,KnowledgeX軟件能揭示企業(yè)數(shù)據(jù)中隱藏的關系,決定這些關系的力量,并識別它們對企業(yè)目標和問題的實用性。KnowledgeX能顯示關鍵產業(yè)活動者間的關系,解釋過去的行為、合同或聯(lián)盟,能分析并鏈接看起來分散的信息以跟蹤發(fā)展方向并智能地預測競爭者未來的行動。KnowledgeX技術對IBM在數(shù)據(jù)和企業(yè)智能空間如DB2廣義數(shù)據(jù)庫,文本智能挖掘機(intelligent miner for text),可視化倉庫(visual warehouse)等中的工具和方法起到補充作用。KnowledgeX與企業(yè)智能工具如數(shù)據(jù)倉庫、數(shù)據(jù)挖掘和在線分析處理一起允許企業(yè)從數(shù)據(jù)源中獲取更多的洞察力。目前,全球的客戶正利用
IBM企業(yè)智能系統(tǒng)來更快、更明智地決定應進入哪個市場、雇用哪個客戶、宣傳哪個產品。以達到提升利潤和競爭力的目的。
其次,知識倉庫應當能執(zhí)行和管理各類知識分析任務及其支持技術(如敏捷度分析、機器學習、神經網絡、知識倉庫挖掘和模式識別等)。下面以VantagePoint為例進行分析,VantagePoint提供從文本數(shù)據(jù)庫中挖掘知識的能力,它具有以下功能:①抽取并索引新數(shù)據(jù),通過檢索,用戶將數(shù)據(jù)引入到VantagePoint中,在這個過程中,VantagePoint使用了一個數(shù)據(jù)庫構成文件(這對于不同的數(shù)據(jù)庫和數(shù)據(jù)庫提供商都不一樣),利用模式匹配、規(guī)則基礎和自然語言處理技術從文本中挖掘字段,除記錄通常的字段以外(如作者、單位和分類號),VantagePoint還能利用自然語言處理技術從文摘中抽取有意義的詞和詞組。②同發(fā)生矩陣,利用同發(fā)生矩陣,用戶可對表進行交叉。如利用同發(fā)生矩陣中的“作者”和“出版年代”,用戶可觀察某作者一段時間內的出版傾向,并按年代瀏覽他的作品,這可提供有關哪個作者在某領域工作時間最長,現(xiàn)在他們是否還活著等方面的信息。表或同發(fā)生矩陣中的數(shù)據(jù)可輸出到其他應用中以便進行可視化顯示或分析。③映射/網絡,在一維(表)和二維(同發(fā)生矩陣)分析之外,VantagePoint還可運行多維統(tǒng)計分析以識別概念之間的簇和關系。④Vantagepoint可將數(shù)據(jù)分解為更小的、分散的數(shù)據(jù)集以進行識別。⑤VantagePoint利用模糊匹配技術進行數(shù)據(jù)識別、關聯(lián)并減少數(shù)據(jù)冗余。用戶可創(chuàng)建、編輯同義詞詞典。⑥用戶可利用VantagePoint的微軟VB.Script擴展功能來調整操。VantagePoint在VBScript中增加了5個VB對象和50多種AB方法,允許用戶創(chuàng)建和分配腳本,這可使定制分析技術重復使用。
最后,知識倉庫應具有用戶友好的界面和共享隱性知識的平臺,下面以Lotus Developments為例進行分析,Domino.Doc將小范圍專家使用的文檔管理界面擴展為基于網絡環(huán)境的、更靈活的、適用于企業(yè)內每一個成員的解決方案。企業(yè)成員通過Web瀏覽器共享信息和應用,企業(yè)服務器通過擴充能力、靈活性和安全性的平衡使其在知識管理中發(fā)揮主要作用。 CK
1 Hamid R.Nemati et al.Knowledge warehouse;an architectural integration of knowledge management,decision support,artificial intelligence and data warehousing,Decision Support Systems 33(2002),pp.143~161
2 馬海群.論知識經濟、知識管理與知識產權.圖書情報知識,2000(2)
3 褚峻.知識管理的資源性分析.圖書情報知識,2000(2)
4 劉夫濤.從OLAP、數(shù)據(jù)挖掘到OLAM(上).網絡世界, 1990-02-01
5 劉夫濤.從OLAP、數(shù)據(jù)挖掘到OLAM(下).網絡世界, 1999-02-08
6 http://www.software.ibm
7 http://www.thevantagepoint.com
8 http://www.Lotus.com
【論知識倉庫的架構】相關文章:
論商號的知識產權保護08-05
論企業(yè)知識管理的基本問題08-05
論科技成果知識產權化08-05
經驗主義、實在論和因果知識08-05
論中學歷史知識的性質及地位08-07
架構師心得01-10
論知識經濟與人力資源的開發(fā)和管理08-17
論知識經濟與人力資源的開發(fā)和管理08-09
知識譜系的轉換──中國哲學史研究范例論析08-05