本站小編為你精心準(zhǔn)備了協(xié)同任務(wù)的資源服務(wù)序列挖掘參考范文,愿這些范文能點燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。
《計算機集成制造系統(tǒng)雜志》2016年第三期
摘要:
協(xié)同任務(wù)系統(tǒng)的應(yīng)用越來越廣泛,為提高組織之間資源服務(wù)的協(xié)同性,挖掘資源服務(wù)的時序關(guān)系極為重要,而目前的研究主要集中資源服務(wù)組合以及簡單聚集上。為此,面向協(xié)同任務(wù)系統(tǒng),從工作流模型和運行數(shù)據(jù)兩個層面,提出一種資源服務(wù)時序挖掘方法。首先,通過分析工作流模型,依據(jù)資源服務(wù)間存在的任務(wù)相關(guān)性,求解依賴關(guān)系較強的資源服務(wù)集,并從中獲取初步的資源服務(wù)序列,即資源服務(wù)鏈;為提高資源服務(wù)時序的重用性,以初始資源服務(wù)鏈為聚類中心,對其進行擴展后,對運行數(shù)據(jù)中每個新到達的擴展鏈,求解相似度,最終得到修正后的聚類中心。最后,通過實驗和分析驗證方法的可行性。對提高資源選取效率、提高資源可用性、利用率有積極的意義。
關(guān)鍵詞:
協(xié)同任務(wù);資源服務(wù)序列;工作流;挖掘
1問題的提出
當(dāng)前,除典型的制造業(yè)外,多組織參與并協(xié)作完成一項任務(wù)的應(yīng)用模式已經(jīng)滲透入更多領(lǐng)域[1],公共管理、合作科學(xué)研究、電子商務(wù)、醫(yī)療等領(lǐng)域也逐漸表現(xiàn)出更多的協(xié)同性。伴隨著云計算、物聯(lián)網(wǎng)、移動互聯(lián)等新興信息技術(shù)和應(yīng)用模式的快速發(fā)展,這類協(xié)同任務(wù)系統(tǒng)一般通過服務(wù)平臺,例如云制造服務(wù)平臺,在工作流技術(shù)的支持下,集成和協(xié)調(diào)各組織的資源,最終完成共同的任務(wù)[1],如圖1所示。廣泛分布的各類資源通常被封裝成服務(wù),為業(yè)務(wù)過程所使用。伴隨著業(yè)務(wù)活動的交互,資源服務(wù)所形成的序列稱作資源服務(wù)鏈(ResourceServiceChain,RSC)。對資源服務(wù)鏈進行挖掘,揭示資源服務(wù)的時序模式,不僅可以從全局管理和優(yōu)化分布的資源服務(wù),而且作為更大粒度的組合服務(wù),資源服務(wù)序列還可以提高該領(lǐng)域的資源選取、資源配置和調(diào)度的效率,在分布的業(yè)務(wù)環(huán)境下,提高工作流的執(zhí)行的成功率,進而提高組織間的交互效率。對資源服務(wù)鏈的挖掘很難通過建模或者建立評價體系的方法進行。這是因為各個領(lǐng)域的資源種類都十分龐雜,如制造業(yè),工作流模型或者資源服務(wù)時序模型中通常只能描述資源服務(wù)的類別而非實例,資源服務(wù)的可用性需運行階段才能確定;同時,資源服務(wù)之間還存在著共存、排斥、支持和控制等復(fù)雜的依賴關(guān)系[2],從運行數(shù)據(jù)或歷史數(shù)據(jù)這些成功案例中挖掘資源服務(wù)序列要比模型分析更切合實際;而通過建模的方法分析資源的靜態(tài)屬性并匯聚資源,是一種靜態(tài)分析,缺少動態(tài)性和適應(yīng)性的考慮。以制造業(yè)這一典型的協(xié)同任務(wù)系統(tǒng)為例,如家電制造行業(yè),其資源服務(wù)序列需要行之有效的挖掘方法,才能準(zhǔn)確地反映客觀現(xiàn)實的業(yè)務(wù)情況。目前,對資源(服務(wù))的挖掘主要集中在對資源的簡單聚集上,對資源服務(wù)序列的挖掘研究仍顯不足。因此,本文針對協(xié)同任務(wù)系統(tǒng)提出一種資源服務(wù)時序挖掘方法,獲取最為頻繁出現(xiàn)的資源服務(wù)鏈。該方法對工作流模型和運行數(shù)據(jù)進行兩階段分析,并提出相應(yīng)的挖掘算法。依據(jù)工作流模型,通過資源服務(wù)之間的相關(guān)性,可得到初步的資源服務(wù)鏈集(InitialResourceServiceChainSet,InitRSCS),再通過挖掘工作流運行數(shù)據(jù)更新InitRSCS,獲得最終的資源服務(wù)鏈集合。該方法可更準(zhǔn)確地體現(xiàn)組織之間資源服務(wù)的協(xié)同方式,進而以時序的方式為資源服務(wù)選取、組合、推薦和調(diào)度提供更加準(zhǔn)確的資源服務(wù)聚集。
2相關(guān)工作
協(xié)同任務(wù)管理系統(tǒng)通常指基于任務(wù)的平臺系統(tǒng),通過優(yōu)化過程過程管理與增強知識管理等途徑輔助多人或者多組織完成協(xié)作任務(wù),從而實現(xiàn)企業(yè)的資源共享,提升企業(yè)的核心競爭力。目前,在云計算、物聯(lián)網(wǎng)、移動互聯(lián)等新興信息技術(shù)的支撐下,協(xié)同任務(wù)系統(tǒng)正在向服務(wù)業(yè)務(wù)模式轉(zhuǎn)型。對其資源挖掘的研究,主要集中在制造業(yè),并大多以資源集成為目的。因此,下面重點對協(xié)同制造系統(tǒng)中資源(服務(wù))集成方法進行綜述。制造即服務(wù)是制造領(lǐng)域的云計算,其資源具有分散性、動態(tài)性、互操作性、實時性、協(xié)同性和服務(wù)性等特點,對制造資源服務(wù)的集成更加重要,目前的方法也很多。基于K-Means的資源集成方法仍然是最為常用的數(shù)據(jù)挖掘方法,但大多用于云計算環(huán)境中的計算資源[3-5]以及數(shù)據(jù)資源的分析[6-8]。基于agent的方法中,通常把作為資源和行為的描述,如文獻[9]基于此研究了虛擬資源管理方法并提出了一種基于的框架以及相應(yīng)的資源聚集方法。此外,基于框架的方法也常用于資源集成。文獻[10]提出了一個MRVM模型,通過制造資源的靜態(tài)和動態(tài)信息的描述,并基于這兩類信息實現(xiàn)制造資源的動態(tài)集成。文獻[11]提出一個網(wǎng)絡(luò)化制造的架構(gòu)用于集成分散的資源服務(wù)。基于語義的資源挖掘方法主要通過本體描述[12]、語義框架[13]以及語義模型[14]的方法,文獻[12]提出了一個基于本體的自動設(shè)計方法,在物聯(lián)網(wǎng)環(huán)境下配置醫(yī)療資源,文獻[13]提出一個語義集成框架描述資源相關(guān)的信息和知識,最終用于集成資源。文獻[14]提出的多粒度資源模型可集成業(yè)務(wù)過程中的制造資源,并通過本體推理形成服務(wù)序列。服務(wù)質(zhì)量(QualityofService,QoS)經(jīng)常作為資源聚類的依據(jù)[15-17],如引入到物聯(lián)網(wǎng)的應(yīng)用中實現(xiàn)制造資源和制造能力的優(yōu)化分配,這其中就體現(xiàn)了資源集成[15],文獻[16]采用非功能性的QoS優(yōu)化動態(tài)的資源服務(wù)組合,資源集成問題也常被當(dāng)作多目標(biāo)優(yōu)化問題采用并行智能算法解決[17]。以上資源集成或挖掘方法都是對資源做簡單匯聚,針對資源序列的挖掘方法很少。文獻[18]采用QoS屬性量化業(yè)務(wù)過程的方法集成資源服務(wù),其他方法還包括多粒度的資源集成方法[19],資源服務(wù)時序推薦方法[18],以及文獻[21,22]。總體上看,目前關(guān)注較多的是資源(服務(wù))序列的集成,大多是基于、語義、框架和模型的方法,通過業(yè)務(wù)歷史數(shù)據(jù)挖掘相應(yīng)的資源服務(wù)序列的研究目前還很欠缺。
3問題描述
協(xié)同任務(wù)系統(tǒng)中資源服務(wù)廣泛分布,不同組織則通過管理平臺進行資源的交互,協(xié)作完成共同的任務(wù),如圖1所示。因此,資源服務(wù)序列,即資源服務(wù)鏈可定義如下:定義1資源服務(wù)鏈資源服務(wù)鏈RSC可表示成:RSC={<R1,…,Rm>|m|Act|},其中,資源服務(wù)集R1,…,Rm服務(wù)于業(yè)務(wù)活動集Act。當(dāng)分布的業(yè)務(wù)活動交互時,相應(yīng)的資源服務(wù)鏈隨即形成,未必需要一個明確的工作流管理系統(tǒng)。盡管如此,多組織交互時往往離不開工作流技術(shù)的支持。工作流則是業(yè)務(wù)過程的一個技術(shù)層面的概念,包括工作流建模和運行兩個階段。工作流模型可定義業(yè)務(wù)活動的執(zhí)行順序,以及每個業(yè)務(wù)活動使用的資源服務(wù)。
4資源服務(wù)鏈挖掘策略
當(dāng)多個資源服務(wù)同時服務(wù)于一個業(yè)務(wù)活動時,資源服務(wù)之間就存在著一種任務(wù)相關(guān)(Task-related)的依賴關(guān)系,當(dāng)業(yè)務(wù)過程向前推進時,資源服務(wù)集之間存在著時序關(guān)系。因此,任意一對資源服務(wù)間的時序關(guān)系可通過工作流模型或者資源服務(wù)時序模型得到,通過統(tǒng)計,可進一步得到該時序關(guān)系在模型出現(xiàn)的頻率。模型雖然可以描述所有可能的資源服務(wù)鏈,但資源服務(wù)序列的頻度還是要通過運行數(shù)據(jù)反映。工作流運行時,工作流實例以及相應(yīng)的資源服務(wù)鏈都保存到工作流日志中,這便于我們進行挖掘,進而得到各資源服務(wù)鏈被使用的頻率,使用頻率高的資源服務(wù)鏈就是我們要挖掘的目標(biāo)。即便沒有工作流系統(tǒng),業(yè)務(wù)數(shù)據(jù)發(fā)生的時間也可以作為資源服務(wù)序列的重要參考。挖掘結(jié)果中,對相應(yīng)的工作流實例而言,資源服務(wù)鏈可以是一條完整的序列,也可以是部分的序列。例如圖2中,挖掘得到的資源服務(wù)鏈可以是<r2,r2,r3,r4>,也可以是<r2,r3>。這是因為對于一個工作流實例來說,完整的資源服務(wù)鏈也會因為資源依賴強度的存在而被劃分為多個子序列,不同的子序列其被使用的頻率也不盡相同。因此,資源服務(wù)鏈的挖掘從工作流模型以及運行數(shù)據(jù)兩個方面進行。
5資源服務(wù)鏈挖掘方法
資源服務(wù)鏈挖掘分別從工作流模型和運行數(shù)據(jù)入手(本文方法從工作流模型入手,資源時序模型可通過工作流模型獲得,或者直接建立),依據(jù)資源依賴強度可得到不同的資源服務(wù)集,再得到初始資源服務(wù)鏈集合InitRSCS;然后,擴展InitRSCS中的資源服務(wù)鏈并以此為聚類中心,通過挖掘運行數(shù)據(jù)得到新的資源服務(wù)鏈集合,即新的聚類中心。
5.1InitRSCS挖掘算法初始資源服務(wù)鏈集挖掘分兩個步驟:①獲得依賴強度最高的資源服務(wù)集;②根據(jù)工作流模型,識別資源服務(wù)集中的時序。直觀地,工作流模型已經(jīng)為每個業(yè)務(wù)活動定義了資源服務(wù)集,設(shè)RS={R1,R2…,Rm},Ri是業(yè)務(wù)活動ai使用的資源服務(wù)集,Ri.dep表示Ri中資源服務(wù)的依賴強度。此外,還需要考慮Ri的所有子集Rij,采用統(tǒng)計方法可獲得依賴強度高的資源服務(wù)集。上述算法得到的是共同使用而且較為頻繁的資源服務(wù)集,根據(jù)工作流模型規(guī)定的資源服務(wù)時序,容易得到其中的資源服務(wù)時序關(guān)系。例如上例,依賴強度較高的資源服務(wù)集{r3,r5}在工作流模型中存在時序關(guān)系,即<r3,r5>和<r5,r3>,對應(yīng)了業(yè)務(wù)活動a2a3。InitRSCS可手工獲得,不需要算法協(xié)助。
5.2運行數(shù)據(jù)的挖掘因為從模型獲得的依賴強度高的資源服務(wù),不能反映現(xiàn)實業(yè)務(wù)交互中被使用的頻率。因此,以上節(jié)獲得的InitRSCS為核心,通過挖掘運行數(shù)據(jù),修正InitRSCS的偏差。挖掘策略如下:以提高資源服務(wù)鏈的復(fù)用性為目的,以InitRSCS中每個資源服務(wù)鏈為聚類中心,對其擴展序列進行聚類,修改InitRSCS以求解新的聚類中心。擴展序列也是資源服務(wù)鏈,是對任意一條資源服務(wù)鏈rscInitRSCS,插入其他資源服務(wù)后形成的新序列。InitRSCS連同最后形成的擴展序列集合,統(tǒng)一記作exRSCS(extendedResourceServiceChainSet)。挖掘exRSCS的使用頻率,這樣的策略就是要盡可能地提高業(yè)務(wù)領(lǐng)域內(nèi)資源服務(wù)的可復(fù)用性。算法ClusterRSC最后通過算術(shù)平均值求解各擴展鏈到InitRSCS的相似度均值,最終得到最佳擴展鏈,即與InitRSCS最為相似并且使用最為頻繁的資源服務(wù)序列。挖掘的最終目的是找出頻繁使用的資源服務(wù)序列,為相似制造領(lǐng)域選取、資源推薦等提供合理依據(jù)。
6實驗與案例分析
下面分別通過仿真實驗和案例分析驗證所提方法的有效性。
6.1實驗驗證首先描述實驗用例的領(lǐng)域。以典型的電器產(chǎn)品設(shè)計與組裝為例,如圖4所示,分析在協(xié)同任務(wù)環(huán)境下的制造資源服務(wù)組合方法。示例涵蓋了產(chǎn)品設(shè)計、加工、組裝和零部件供應(yīng)的全過程。其中,產(chǎn)品設(shè)計屬于多專業(yè)的協(xié)同設(shè)計,包括硬件、軟件、機械和電源設(shè)計四個專業(yè),所需資源主要包括人力資源和技術(shù)資源。產(chǎn)品加工過程主要涉及到硬件加工和機械加工,零部件供應(yīng)為電源提供組裝部件,同時也為產(chǎn)品的最終組裝提供零件,主要涉及到技術(shù)資源和物料等。各業(yè)務(wù)活動所需資源如表1所示。
6.2實驗結(jié)果分析從實驗結(jié)果看,從模型得到的使用頻繁的資源服務(wù)鏈,其擴展鏈的使用頻繁程度,取決于運行數(shù)據(jù),即取決于實際業(yè)務(wù)情況。本文方法的主要用途之一就是提高資源服務(wù)選取的效率,因此,在工作流路徑不同執(zhí)行頻率權(quán)重下,仍以<r2,r5>為例,比較效率提高的程度。這里,設(shè)定1個資源服務(wù)選取的效率消耗為1個單位,而且一條資源服務(wù)鏈的效率消耗為其長度。
6.3案例分析本節(jié)以某中小型家電生產(chǎn)企業(yè)為例,選擇出入庫流水賬作為數(shù)據(jù)源。在產(chǎn)品生命周期內(nèi)該企業(yè)負(fù)責(zé)加工制造環(huán)節(jié),由于除人力資源、資金資源等之外,庫存流水賬保存了用于硬件和機械加工過程以及電源裝配過程的所有資源,而且每次出入庫都保存有時間戳,因此適合用于挖掘資源服務(wù)序列。該案例不以工作流模型為基礎(chǔ),并且假設(shè)出庫時間就是該資源服務(wù)的時間。項目個數(shù)選取1000個,數(shù)據(jù)對象81386個,共267個小類,6大類:電器元件、電源元器件、機械加工材料、機械冰箱部件、風(fēng)冷冰箱部件、空調(diào)制冷系統(tǒng)部件。數(shù)據(jù)對象屬性說明如表6所示。隱含的資源服務(wù)鏈<ri,rj>需滿足如下條件:W(<ri,rj>)>W(<rj,ri>),并且Ws=W(<ri,rj>)-W(<rj,ri>)的值較大。Ws的閾值選取可遵循如下原則:對Ws值排序,按從大到小的順序獲取相應(yīng)的資源服務(wù)鏈,當(dāng)某Ws值相應(yīng)的資源服務(wù)已不是合理的時序時,可設(shè)定該Ws為閾值。這是因為Ws值足夠小時,其時序關(guān)系已不再是一種必須的約束。經(jīng)處理后得到如下資源服務(wù)鏈:<8,4>,<8,6>,<10,4>,<10,6>,<4,17>,<15,13>,<15,14>。擴展后還可得到另外兩條資源服務(wù)鏈:<8,4,17>,<10,4,17>。此9條資源服務(wù)鏈即為挖掘結(jié)果。
7結(jié)束語
資源服務(wù)鏈挖掘在協(xié)同任務(wù)系統(tǒng)中是一個重要的研究問題。本文提出了一種協(xié)同任務(wù)系統(tǒng)下針對資源服務(wù)時序的挖掘方法,方法主要從工作流模型和運行數(shù)據(jù)兩個方面進行挖掘。當(dāng)?shù)玫筋l繁使用的資源服務(wù)集后,即可獲取其中包含的時序,通過對運行數(shù)據(jù)的挖掘獲得頻繁使用的資源服務(wù)時序。雖然所提方法從工作流模型入手,但也可以從業(yè)務(wù)數(shù)據(jù)的時間戳入手,因此本文方法并不依賴于工作流模型。本文方法是對資源服務(wù)序列的挖掘,現(xiàn)有方法大多是對資源服務(wù)做簡單聚集,因此,可作為對現(xiàn)有方法的補充。這對資源選取效率、提高資源可用性和利用率都具有積極的作用。未來的工作,主要集中在條件約束下的資源服務(wù)序列的挖掘與組合優(yōu)化方面。
作者:李海波 梁夢夏 單位:華僑大學(xué) 計算機科學(xué)與技術(shù)學(xué)院