<button id="6ymue"><menu id="6ymue"></menu></button>
    • <s id="6ymue"></s>
    • 美章網 資料文庫 企業競爭情報的語義挖掘范文

      企業競爭情報的語義挖掘范文

      本站小編為你精心準備了企業競爭情報的語義挖掘參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。

      企業競爭情報的語義挖掘

      1引言

      競爭情報是知識經濟時代企業保持競爭優勢的戰略資源和分析與預測行業發展態勢、制定科學戰略決策的依據。目前,已被公認為除資本、技術、人才之外的企業“第四核心競爭力”[1]。隨著Web2.0和語義Web的快速發展和普及,網絡信息資源日益豐富并逐漸成為企業競爭情報分析和獲取的最重要的信息來源,Google、微軟、百度等企業紛紛提出“Internetisdatabase”的觀點,即未來企業所需的信息、知識和情報都可以通過網絡獲取,企業競爭優勢的保持和核心競爭力的培育很大程度上取決于網絡信息資源分析與獲取的能力[2]。然而,由于網絡信息資源通常具有高維、海量、異質異構和動態等特征,傳統的競爭情報分析和獲取方法,如SWOT分析法、定標比超分析法、關鍵成功因素分析法等定性和定量分析法,雖然可以對結構化數據信息實現自動排序、篩選和去重,但對于海量的半結構化與非結構化、異構分布式數據還不能進行有效的加工處理。此外,當前的情報分析與獲取主要依靠人工方法,速度慢、效率低,無法適應網絡信息資源的快速增長和動態變化,而且人工定性分析和經驗判斷存在較多的不確定性,導致分析結果隨機性較大。主流的競爭情報系統,如TRS競爭情報系統、天下互聯競爭情報系統以及賽迪數據競爭情報系統等[3],雖然借助智能、數據挖掘、知識管理等智能信息處理技術進行競爭情報挖掘和自動分析,但由于這些統采用類似搜索引擎的網頁搜索與分析技術,其自動分析與挖掘功能局限在信息采集和有限的數據挖掘上,僅僅實現了淺層信息的統計分析,無法獲取深層情報內容和挖掘情報的潛在價值,嚴重影響了競爭情報的質量和情報獲取的效率,并且最終分析結果是以網頁或文本塊的粒度來描述競爭情報信息,而企業競爭情報需要的是關于競爭對手、競爭環境和競爭策略的完整描述,兩者之間存在認知上的極大不匹配[4],從而制約了競爭情報的實用性和應用效果。面對網絡環境下持續增長的海量信息以及知識經濟時代企業競爭壓力的不斷增大,傳統的競爭情報分析與獲取方法逐漸難以適應復雜競爭環境的動態變化和企業對大規模、高質量、深層次的情報知識需求。面對紛繁蕪雜、結構類型多樣的海量網絡動態信息,如何利用多學科領域的先進理論與最新成果,實現競爭情報集成化、自動化、智能化以及高效化地分析挖掘,獲取高質量、深層次的競爭情報,已成為當前學術界和企業界亟待解決的難題。本文在分析、比較和綜合國內外競爭情報分析與獲取方法的基礎上,利用本體和上下文知識從情報語義和應用環境兩個方面進行語義層面的深層競爭情報挖掘和情報分析,研究了本體與上下文知識的融合實現,設計了一種基于語義決策樹的競爭情報歸納學習算法進行競爭情報語義挖掘和情報知識發現。實驗結果表明,該算法顯著提高了情報挖掘的智能性和情報分析的準確性,在一定程度上實現了競爭情報語義挖掘和情報知識自動分析與獲取。

      2本體和上下文知識的融合實現

      本體對共享概念形式化的明確表示,通過提供對數據信息的一致性理解使得計算機能夠正確分析和處理信息的語義,解決相同信息不同含義和不同信息相同含義之間存在的差異[5]。上下文知識是在對數據信息一致性理解的基礎上解決由于應用環境和對象的不同所導致的對數據信息及其分析挖掘結果上的理解差異,提供針對具體應用環境和特定對象的特例化知識。融合本體和上下文知識進行情報分析可以實現面向特定應用環境的、更準確的深層次分析,如在情報分析的過程中可以使用本體知識來精確情報語義,使用上下文知識來約束情報分析的應用環境空間,實現面向具體應用環境的高效分析。融合本體和上下文知識進行情報分析的首要問題在于如何實現本體和上下文知識的有效融合。通過分析相關研究成果發現:在情報分析中,本體提供的主要是領域內通用的知識,而上下文提供的是關于特定環境的特例化知識,可以認為上下文知識是本體知識在特定環境下的擴展。目前,關于本體知識的表示方法與技術,如:RDF(ResourceDescriptionFramework)、DAML(DARPAAgentMark-upLanguage)、DAML-S(DAML-Service)、DAML+OIL(DAML+OntologyInfer-enceLayer)、OWL(WebOntologyLanguage)等非常成熟,通過在本體知識表示方法的基礎上擴充上下文知識是進行本體與上下文知識融合的有效途徑。根據文獻[6]的方法,本文采用一個三元組來表示本體與上下文知識的融合模型:M={O,C,R}其中O表示本體集合,C表示上下文知識集合,R表示本體間、本體與上下文間、上下文間的關系。本體集合O={o1,o2…on},其中o1,o2…on表示本體知識;上下文集合C={c1,c2,c3…cn;kc1,kc2,kc3…kcn},其中c1,c2,c3…cn表示上下文標識,kci表示屬于上下文標識ci的上下文知識集合;關系R={roo,roc,rck,rkk},其中roo=(oi,oj)表示本體知識間的關系,roc=(oi,cj)表示本體知識與上下文標識間的關系,rck=(ci,kj)表示上下文標識與形成該標識的上下文知識間的關系,rkk=(ki,kj)表示上下文知識間的關系。在該融合模型中,通過在本體知識表示的基礎上增加一個上下文標識來表征一個由附加的多個上下文知識構成的具體應用環境,如圖1所示。在情報分析過程中,通過上下文標識來識別和調用相應的上下文知識進行面向具體應用環境的情報分析,提高情報分析的針對性和分析結果的實用性。

      3基于本體和上下文知識相融合的競爭情報分析算法

      決策樹歸納學習是數據挖掘中常用的一種數據驅動的、無優先級別的歸納學習算法,采用自頂向下的遞歸方式,挖掘出以決策樹為表示形式的隱含規則指導情報分析,具備很高的運算速率和準確率。其中最具影響的決策樹歸納學習算法是R.Quilan設計的ID3算法及其改進版C4.5算法,具有簡單易懂、易于實現等優點。常見的決策樹歸納學習算法還有CHAID算法、CART算法以及為了適應處理大規模數據集的要求和提高海量信息中知識獲取的效率而設計的SLIQ算法和SPRINT算法。這些算法在進行情報分析的過程中主要通過計算特征的信息熵來選擇特征,信息熵大的特征被優先選取構造決策樹。但是,在計算信息熵時僅僅考慮語法層面關鍵詞的簡單匹配,沒有涉及數據的語義信息和上下文環境對數據的影響,缺乏對其所包含的語義信息和具體環境的理解,導致算法缺乏一定的智能性和語義處理能力,使得情報挖掘和分析結果的實用性和針對性不強[7]。針對傳統決策樹歸納學習算法的不足,借鑒當前本體和上下文知識研究領域的科研成果[8-11],設計了一種融合本體和上下文知識的歸納學習算法(InductiveLearningAlgorithmbasedonSemanticDecisionTree,ILASDT)進行語義層面的情報挖掘和知識發現。利用企業競爭情報本體提供背景知識,上下文知識提供約束機制進行自頂向下多層的知識引導和搜索過程,實現智能化、自動化、高效的語義知識挖掘。具體來說,該算法主要由四部分組成:

      (1)構建語義概念樹。利用本體知識對語義元數據庫進行概念規范化和泛化處理,借助本體豐富的層次結構和抽取的概念及其關系或實體及其關系進行語義概念樹的構建。

      (2)獲取基于本體的決策規則。利用構建的語義概念樹,對語義元數據庫中的概念或實體結點進行初步劃分,并利用本體知識進行語義推理,得到基于本體的決策規則。

      (3)獲取基于上下文知識的決策規則。在上述獲取的決策規則中,利用上下文知識進行特化,以本體知識結點為根結點,上下文知識為子結點,進行概念或實體結點的二次劃分,得到基于上下文知識的決策規則。

      (4)語義決策樹的構建與優化。將上述兩步獲取的決策規則進行語義整合,選擇其中沒有語義重復的結點及其關系和獲取的語義規則進行語義決策樹的構建,并利用本體和上下文知識提供的層次結構和背景知識進行決策樹的優化和完善。

      4實驗結果及分析

      本文采用實驗分析法來驗證算法的優越性。

      (1)實驗數據。選自UCI[12]網站提供的Monk、Bal-anceScale和BreastCancer三種數據集作為實驗分析的原始數據。

      (2)實驗環境。處理器為Inter(R)Core(TM)2CPU44002.0GHz,內存2G,硬盤120G,操作系統為WindowsXP,編程語言為Java(JDK1.6.2)。

      (3)實驗過程與結果。在上述相同的實驗數據和實驗環境中利用數據挖掘與知識發現領域兩種經典的決策樹歸納學習算法C4.5和SPRINT作為參考算法進行對比實驗。選擇決策樹歸納學習算法評估中常用的四個重要標準———復雜度、可理解性、效率和準確率來檢驗本文模型和算法的性能。其中,復雜度利用算法生成的節點數來衡量,可理解性利用算法生成的規則數來衡量,效率利用算法的執行時間來衡量,準確率利用算法的分類精度來衡量。

      (4)實驗結果分析。從表1~表4可以看出,本文設計的算法在復雜度、可理解性、效率和準確率等方法均優于現有的算法。主要因為融合本體和上下文知識的語義分析算法利用本體提供的普遍知識和上下文提供的特定知識來選擇分析的特征及特征間關系,約束分析算法的執行層次和遍歷空間,所生成的決策樹由本體和上下文知識共同決定,整個過程只產生企業所需要的、針對性強的、具有綜合性的深層關聯規則,消除決策樹中語義重復節點和“空枝”現象,提高了算法的準確率和可理解性,同時也降低了算法的執行時間和復雜度。

      5結語

      融合本體和上下文知識進行語義層面的企業競爭情報分析是提高情報挖掘與獲取效率和準確率以及面向具體應用環境和對象的有效方法。本文研究并設計的分析算法能夠有效地結合本體和上下文知識進行語義層面的情報挖掘和知識發現,促使更具潛在價值和實用性的深層情報內容的產生。

      主站蜘蛛池模板: 看免费的黄色片| 美女扒开腿让男生桶爽网站| 成全视频在线观看在线播放高清| 侵犯小太正bl浴室子开张了 | 男人把j桶进女的屁股的动态| 国产精品入口麻豆高清在线| 丰满少妇被猛烈高清播放| 波多野结衣一区在线| 国产区香蕉精品系列在线观看不卡| sss在线观看免费高清| 明星ai换脸高清一区| 免费看国产曰批40分钟| 久久五月天综合网| 好男人视频网站| 五月婷婷色综合| 男人强行被开发尿孔漫画| 国产极品视觉盛宴| www.久久99| 日韩a在线观看免费观看| 人与动人物A级毛片在线| 韩国一级做a爱性色毛片| 大尺度无遮挡h彩漫| 久久亚洲日韩精品一区二区三区| 波多野结衣办公室33分钟| 国产乱子伦一区二区三区| 亚洲av无码久久忘忧草| 精品一区二区三区无码视频| 国产欧美在线视频免费| eeuss影院www天堂免费| 日本香蕉一区二区三区| 亚洲精品456人成在线| 美女跪下吃j8羞羞漫画| 国产精品99久久久精品无码| √天堂资源最新版中文种子| 日韩在线一区二区三区免费视频| 亚洲色国产欧美日韩| 色综合久久一本首久久| 婷婷五月综合激情| 久久婷婷人人澡人人喊人人爽| 欧美色欧美亚洲高清在线观看| 吃奶摸下的激烈免费视频播放|