本站小編為你精心準備了網絡搜索論文:網教資源環境搜索模板透析參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
作者:馬驤飛劉淑麗孫濱單位:鄭州華信學院信息工程系鄭州華信學院圖書館
語義檢索體系結構
本文提出的基于Ontology的網絡教育資源語義檢索模型的體系結構采用B/S模式的MVC架構:數據存儲層、業務處理控制層和表示層。體系結構如圖2所示。其中存儲層包括教育資源Ontology、教育資源及元數據描述信息,應用索引組件索引元數據描述信息而生成的索引庫以及利用標注技術生成的語義元數據信息;業務處理層包含語義標注、語義分析、語義推理和語義查詢組件;表示層主要處理的工作是提供用戶多種查詢接口,以及處理查詢結果集合的結果呈現接口。
關鍵技術研究
1教育資源
Ontology構建建立領域Ontology是一個復雜的過程,涉及到該領域的相關概念以及概念與概念之間的關系。愛丁堡大學開發的EnterpriseOntoloyg由一組關于企業的術語和定義組成,主要用于企業模擬。
2教育資源
Ontology的形式化本文使用OWL形式化描述教育資源Ontology,它主要應用OWL定義的表達式對提取出的概念術語及其關系進行形式化描述。教育資源Ontology利用Protégé4.0.2工具構建完成,完成后的Ontology以OWL文件格式存儲。下面將介紹使用Protégé4.0.2建設教育資源Ontology的過程。
2.1概念類的形式化
在Protégé4.0.2中,所有用戶定義的類都是缺省的OWL:Thing的子類,而領域內相關的根類只需要給出簡單的類聲明就可以了。如在教育資源Ontology中“學科”類和“教育資源類型”類中的定義如下:類的最基本的構造器是subClassOf,如在描述案例是教育資源類型的一個子類時可以這樣描述:此外,為了對某些重要的概念進行說明時,可以使用OWL語言提供的注解標簽〈rdfs:label〉來標記對應概念的內容信息,示例代碼可表示如下:現代教育技術是指在現代教育思想、現代教育理論的指導下對教育資源、教育過程進行開發設計、評價、運用、以實現對教育教學的優化。上述代碼定義了“信息技術教育”概念類,它是“學科”概念的子類,此外,使用標簽〈rdfs:label〉對“信息技術教育”進行了解釋說明。
2.2類屬性的形式化
OWL語言提供了兩種類型的屬性表達,一種是數據類型(DataType)的屬性主要是使用XMLSchemaDataType所定義的簡單類型完成,這些簡單的數據類型包括char、string、int、float、datetime、boolean等。如下述代碼對“關鍵字”、“持續時間”及“費用”的定義:對象類型的屬性主要用來說明類成員屬性是有復雜的對象組成。如下面代碼表達了“數學”是適合開設“微積分”的“適用學科”。其中“微積分”表示為“代數”學科的一個實例。
2.3實例的形式化
實例的生成是通過聲明它是某個類的成員來表達,比如“程序設計”作為“計算機科學”學科的重要“課程”的實例,可以用如下代碼表示:
2.4教育資源Ontology的確認和評價
教育資源Ontology構建的正確性取決于基于它開發的系統的正確性和有效性,目前Ontology的正確性的核查還沒有統一的方法,常用的檢查Ontology正確性的方法是使用推理機軟件來核查。例如在使用Protégé工具中集成的推理機Racer來核查教育資源Ontology中定義的兩個類:“音頻”和“圖像”。這兩個類在意義上是不相交的,使用OWL語言中的owl:disjointWith關系來描述概念類的不相交關系,代碼片段如下:在建設Ontology時,如果不小心把本屬于“音頻”類的“讓我們蕩起雙槳”(MP3格式)作為實例添加到“視頻錄像”中,那么在構建信息檢索系統時可能會查出不符合用戶要求,給系統的推理帶來一定的安全隱患。因此,當教育資源Ontology構建完成時,利用推理機,可以很容易發現一些不一致的問題,快速的對構建的Ontology進行維護。
3語義標注技術
元數據是信息共享交換的基礎和前提,它通過構成自身的元素來顯式地表示資源信息或者幫助提供獲取某種信息資源的途徑。元數據的主要作用在于識別資源、評判資源,追蹤資源在使用中的變化,從而實現高效地管理海量的網絡資源數據信息。語義標注是指在Ontology的指導下映射教育資源的元數據。首先通過解析教育資源Ontology,然后有系統提示標注者填寫需要標注的內容,系統把這些標注的元數據資源信息映射成Ontology庫中的實例,最后系統保存帶有標注信息的教育資源元數據RDF文檔并存儲到數據庫中。語義標注涉及到的主要技術包括讀取和解析Ontology技術Jena及Ontology查詢語言SPARQL。
SPARQL通過調用QueryExecutionFactory.create(query,model)獲取該實例。對應較為簡單的Select查詢,可以調用execSelect()方法返回查詢結果集ResultSet。如下給出了查詢示例代碼:上述示例中,變量path是Ontology文件存儲路徑,變量express是查詢的關鍵字,而變量queryExpress是構造的查詢規則,FILTER則是對查詢關鍵字進行過濾,支持模糊查詢。
4語義檢索策略
對于檢索系統來講,一個好的檢索策略,既使用何種檢索方式準確把握用戶的檢索需求,對領域知識和事實數據信息進行深層次地推理,提高資源檢索“查全率”和“查準率”具有舉足輕重作用。當前資源檢索系統查全率、查準率差的原因主要包括有兩個:1)用戶需求表達不充分,機器不能理解其真正需求;2)檢索系統對檢索條件機械匹配,不能進行語義分析和自動擴展。因此提高檢索質量可以從兩個方面入手:
1)參照Ontology中的概念關系對檢索式進行優化,利用教育資源Ontology中的語義關系將用戶的檢索條件映射成為Ontology的概念和關系,從而實現用戶需求和機器理解的一致。
2)利用教育資源Ontology中的概念關系對用戶檢索的概念進行擴展,當系統中沒有滿足檢索條件的結果時,根據教育資源Ontology中的概念相關程度對檢索式中的概念適當進行擴展,形成新的檢索概念集,而后再重新查找。
系統原型實現
作為試驗系統,我們以教育資源領域中的教學資源為研究對象,首先針對教育資源元數據信息進行組織,建立數據模型。其次,基于Ontology對教育資源元數據進行映射,生成教育資源語義元數據庫;第三,設計索引組件,對資源元數據信息建立索引,生成索引庫;最后,設計語義分析和查詢組件,實現系統的檢索功能。由于教育資源Ontology構建和語義標注在前面部分作了說明,這里重點介紹索引組件、語義分析組件和語義查詢組件。例如條件檢索將該請求轉化成邏輯表達式。在實驗的原型系統中,用戶的條件檢索表達式最終由系統轉化成對RDF圖的交、并、補的操作,如圖3所示。
結語
本文研究了Ontology的構建,將其應用到教育資源建設,通過構建教育資源Ontology,可以為網絡教育資源提供語義表示機制。在教育資源Ontology驅動之下,提出一個語義檢索模型,用于支持知識共享、語義匹配的網絡教育資源檢索系統的開發,以期解決資源檢索中語義匹配問題,提高檢索質量和效率。