本站小編為你精心準備了原燃料結算的數據挖掘論文參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
1問題定義
對原燃料結算方式進行數據挖掘的目的是為了控制結算成本,采用的方法是根據超出我方檢斤檢質結算量屬性對原燃料進行分類,構建原燃料結算控制模型。
2數據準備
數據收集:需要嚴格控制我方檢斤檢質的過程以作為判斷的依據,同時盡可能多的從事物數據庫中收集各種原燃料按不同結算方式所得到的結算量屬性值。數據預處理:首先根據經驗去掉明顯有誤的數據;其次根據原燃料結算方式,選擇與數據挖掘相關的屬性。數據變換:對數據進行相應的變換,從初始特征中找出真正有用的特征。在本次數據挖掘中原燃料屬性主要包括:原燃料種類,供方檢斤檢質結算量,我方檢斤檢質結算量,供方檢斤檢質與我方檢斤檢質之間的結算量差別。然后根據我方檢斤檢質結算量與供方檢斤檢質結算量之間的差別作為分類的依據,對上述屬性進行歸一化[1],得到表1、表2數據。SupQty表示供方量,SupH2O表示供方水分,Qty表示我方量,H2O表示我方水分,SupInsQty表示供方檢斤檢質量,in-sQty表示我方檢斤檢質量,calculQty表示供方檢斤檢質量與我方檢斤檢質量之間的差值。
3數據挖掘
通過編程實現K均值聚類方法[6]來處理表2數據。此K-均值算法是發現給定數據集的k個簇的算法,每個簇通過其質心(centroid),即簇中所有點的中心來描述。首先,隨機確定k個初始點作為質心,然后將數據集中的每個點分配到一個簇中,具體來講,就是為每個點找距其最近的質心,并將其分配給該質心所對應的簇。這一步完成之后,每個簇的質心更新為該簇所有點的平均值。根據實際情況,本文K均值法采用3個初始點作為質心,按歸一化我方檢斤檢質和歸一化超出我方檢斤檢質量作為分類屬性,得到3個類的質心坐標,結果如表3,同時得到每種原燃料的分類圖,如圖1。
4結果解釋和評估
從分析結果可以得出,原燃料C、D、E屬于第0類,F、H屬于第1類,A、B、G屬于第2類。其中第2類是結算量嚴重超出我方檢斤檢質的量,對于這類原燃料,企業需要重點關注,這類原燃料可能是市場供應商較少,但是企業需求量較多的,所以企業需要采取相應的措施,增大采購尋源的范圍,與供應商可以簽訂長期的采購合同已降低采購成本,并提出另外兩種結算方式:供方檢斤我方檢質、我方檢斤供方檢質的結算方式,從而達到降低此類原燃料的采購成本。第1類原燃料是結算量小于我方檢斤檢質的量,對于此類原燃料可能是市場供應量大于企業需求量,企業需要跟此類供應商進行長期合作。第0類原燃料是結算量稍微超出我方檢斤檢質的量,對于此類原燃料,企業需要在與現有供應商保持合作的同時,去尋找其他供應商,盡可能地降低采購成本,提高企業的經濟效益。
作者:汪光陽趙睿高天單位:安徽工業大學計算機與技術學院