本站小編為你精心準備了元數據倉儲知識庫的幾點認識參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
開發科技創新決策分析服務系統,其基礎性的工作是構建元數據倉儲知識庫。從科技文獻數據庫種類來看,包括:科技期刊、學位論文、會議論文、標準、專利文獻數據庫及科技成果、企業產品、科研機構、科技名人等事實型數據庫,從這些科技文獻中,挖掘其相互邏輯關系、交叉融合間的溝通脈絡是知識獲取、知識組織的關鍵。結合科技文獻資源的特性和文獻檢索導航需求分析,萬方軟件公司提出了基于“知識獲取五要素”的知識組織方法【4】,將學科、主題、人物、機構、基金五要素作為知識獲取的分析主題,構成二維空間,組成各個要素之間的相互關聯關系。五要素之間的相互關聯包含了多種科研信息,從各個角度,各個側面都有無窮的知識可以去挖掘分析。比如:機構和學科關聯,可以獲得各個機構的研究學科,以及有哪些機構在研究該學科的分析結果;機構、學科和作者關聯,可以獲得某個學科在某個機構中有哪些人在做相關研究的分析結果等等。因此從知識的組織角度,在構建元數據倉儲知識庫時,以五要素知識元為基礎,通過對海量科技文獻的處理(采集、轉換、清洗、質量檢測)和對五要素的深度標引,最終構建基于五要素的元數據知識倉儲,作為開發科技創新決策分析服務系統的基礎。
2科技創新決策分析服務體系架構和功能設計
元數據倉儲知識庫的構建為科技創新決策分析服務提供了基礎保障,在此基礎上,運用數據挖掘技術、自動分類∕聚類技術、信息可視化等技術,開發基于WEB的科技創新決策分析服務系統?;谠獢祿}儲知識庫的科技創新決策分析服務主要體現在對科技創新能力的定量評價。主要功能設計如下:⑴主題知識脈絡分析。主要對主題關鍵詞所代表的知識點或概念在各年度的研究發展趨勢和研究熱點進行分析。包括:該主題各年度發文總量趨勢;該主題的相關關鍵詞;關注該主題的相關人物、機構以及涉及該主題的重要發文期刊。系統可通過用戶輸入的主題關鍵詞,在主題知識庫中挖掘揭示主題相關的各類科研產出情況,并通過主題相關的創新實體分析,為用戶推薦權威的研究機構和行業領域專家。⑵
科研人員科研能力評估分析。主要對科研人員(作者)科研產出情況進行統計分析。包括:科研人員的簡介;與作者合作過的相關科技人員信息;作者的研究主題、研究方向、主要發文期刊及參與基金項目情況。系統可通過用戶輸入的科研人員姓名,在人物庫中進行機構匯總,并經過用戶篩選科研人員現在或歷史所在機構,對作者的科研產出能力和科研績效水平得出最全面和客觀的評估和總結。⑶
論文引用情況分析。主要對被引用情況進行統計分析。包括:該論文被引論文具體信息(期刊、學位、會議、技術報告等)和比例、被引數量、被引用頻次等。系統按用戶輸入的論文標題、作者、關鍵詞進行檢索,按發文時間、相關度、題名進行排序,從而可以對該論文進行學術質量的綜合、定量的評價。該功能即可獨立使用,也可嵌入在科研人員科研能力評估分析系統中使用。⑷機構創新能力評估。主要對機構的期刊論文、學位論文、會議論文、專利、成果及機構承擔的國家基金項目進行統計分析,從而反映出機構的總體科學實力和科研績效水平。系統可通過用戶輸入的機構名稱,通過簡稱俗稱的規范對應,按論文類別、基金類別等方式進行機構科研產出的揭示,得出機構的科研能力和學術定位。
3科技創新決策分析服務系統的應用
科技創新決策分析服務系統目前在科技文獻共享服務平臺中已開始應用,平臺主要為用戶提供了作者科研協作關系、主題知識脈絡分析、機構科研能力評估三種服務。⑴作者科研協作關系。在作者科研協作關系服務中,可以分析出用戶所關心作者的如下信息:①作者合作關系:通過可視化的與合作者的關系呈現,可以分析出作者在科研工作中與合作者的合作關系,節點間的距離越近,表明與合作者合作發表的論文次數越多,合作關系越緊密。②作者科研產出統計:可以統計出作者總體的數量。③作者研究主題和研究方向:可以分析出作者的研究主題和按學科分析的研究方向。④主要發文期刊:可以統計出作者在不同期刊的數量,獲得作者關注的期刊情況。⑤作者簡介:獲得作者單位、職稱、職務等基本信息。在知識脈絡分析服務中,以用戶輸入的主題詞為分析依據,通過可視化信息展示,分析出主題詞所代表的知識點或概念在各年度的研究發展趨勢和研究熱點。并提供主題詞所關聯的相關詞、相關人物、相關期刊和機構的知識脈絡。
4結語
提供面向政府、企業、科研管理部門科技創新決策分析服務的作者科研協作關系分析、機構科研能力分析、主題知識脈絡分析服務在一定程度上還需待進一步改進,其中主要是解決元數據倉儲知識庫的質量的問題。包括知識庫中所整合的資源是否涵蓋全面、資源的更新是否快捷、簡稱俗稱的規范對應問題、不同分類法的對接等等問題,其二是提高用戶分析的響應速度問題。影響響應速度的因素包括用戶的網絡環境、應用程序處理數據的效率、服務器與客戶端的交互方式、元數據倉儲庫的部署等多方面,其中重點是解決海量元數據倉儲庫的部署問題。當前科技創新決策分析服務已在山西省科技文獻共享服務平臺對外試用【5】,并在征求廣大用戶的意見。隨著決策分析服務系統的逐步完善,文獻共享和服務平臺不僅成為為科技創新提供文獻保障的平臺,也成為為科技創新提供輔助決策分析的知識服務平臺。
作者:劉軍,牛爭艷 單位:山西省科學技術情報研究所