本站小編為你精心準備了上海統計元數據研究參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
《統計科學與實踐雜志》2014年第六期
一、元數據標準管理與運用
(一)國際上運用元數據標準管理數據的做法1.美國聯邦普查局。美國聯邦普查局從2003年開始建設元數據管理系統,該系統主要包括兩個子系統:一是電子數據傳播系統,用于支持數據用戶通過英特網等渠道獲取數據;二是統計業務全流程自動化系統,用于支持統計人員在線開展統計規劃、設計、操作、處理并評估統計調查項目。2.加拿大統計局。加拿大統計局基于元數據管理建立的總體業務框架,涵蓋業務流程、計算機軟件、硬件以及組織機構等統計業務各個方面,對問卷開發、數據收集、數據加工和信息進行統一管理,最大程度地減少了業務流程和計算機系統的數量,避免了部門內部的重復勞動,提高了整體效率。3.澳大利亞全國衛生信息庫。澳大利亞全國衛生信息庫是一個存儲澳大利亞國民衛生健康信息元數據的電子網站,配有一個強大的查詢工具。使用者可以在這個數據庫中對各類信息進行查詢。這個知識庫還提供了一個直達澳大利亞全國健康狀況信息計劃各項主要內容版面的綜合接口。
(二)國家企業一套表主要元數據標準2011年國家統計局以國家企業一套表制度為管理對象,參照國內和國際相關標準,研究制定統一規范的統計元數據標準,旨在實現統計元數據的規范化和標準化管理。統一規范的元數據標準有助于對統計數據的一致性理解,為統計數據和元數據的高效共享和交換提供基礎。1.國家企業一套表元數據標準的主要內容。國家企業一套表元數據標準主要包括統計指標元數據標準、統計分組元數據、統計目錄元數據標準以及報表元數據標準。2.國家企業一套表元數據庫覆蓋范圍。國家企業一套表元數據庫以國家企業一套表制度為對象,內容覆蓋國家企業一套表制度中的全部報表、指標、分組目錄,涉及工業、建筑業、批發和零售業、住宿和餐飲業、房地產開發經營業等行業,以及調查單位基本情況、勞動工資、能源、科技及信息化等專業統計,共計報表47張,指標450個,分組23個,目錄17個。3.國家企業一套表元數據標準的優點。2011年國家統計局針對國家企業一套表制度設計國家企業一套表元數據標準,并建立覆蓋國家企業一套表范圍的元數據庫,其優點主要體現在以下幾個方面:創新性:國家企業一套表元數據標準是國家統計局參照國內和國際相關標準,結合我國統計工作實際,為滿足國家企業一套表業務流程以及數據收集和管理要求,首次創新性提出的統計元數據標準。示范性:國家企業一套表元數據標準的提出為全國統計系統整理統計報表、指標、分組、目錄,規范統計工作,提高統計工作的信息化水平,提供了示范性文本。可持續性:國家統計局繼2011年提出國家企業一套表元數據標準和元數據庫后,于2013年8月出臺統計元數據維護與管理辦法,就管理范圍、工作職責、工作流程作出了相應規定。使國家企業一套表元數據標準和元數據庫成為一項具有可持續性的統計標準化管理工具。4.國家企業一套表元數據標準的不足。經過對國家企業一套表元數據標準的研究,結合上海市統計工作實際,課題組認為國家企業一套表元數據標準和元數據庫在以下方面尚存在不足:(1)覆蓋范圍有限。國家企業一套表元數據庫內容覆蓋國家企業一套表制度中的全部報表、指標、分組目錄。而現行統計報表制度中除了納入企業一套表制度范圍的報表外還包括針對“四下”企業的統計報表制度、根據上海市統計工作需要增加的地方統計報表制度,以及普查制度和專項調查制度等。對于這些未納入國家企業一套表范圍的統計報表制度,國家企業一套表元數據庫尚未進行整理。因此,國家企業一套表元數據庫在覆蓋范圍上尚顯不足。(2)部分屬性不便于查詢和管理。統計指標代碼屬性,是由企業一套表主要元數據代碼編制規則確定的唯一碼,由一級類別代碼、二級類別代碼、核心指標代碼和順序碼組成。在實際工作中,若要對各類別的指標進行篩選查詢,通過該代碼無法迅速查詢到下屬指標。因此擬將該指標代碼屬性根據一級類別代碼、二級類別代碼、核心指標代碼和順序碼拆分成四個屬性,便于實際工作中的查詢。分組/目錄元數據標準中的分組/目錄代碼屬性,是分組/目錄的唯一編碼,采用四位順序碼的形式。該編碼規則無法反映該分組/目錄使用的領域,因此擬將指標代碼的編碼規則運用于分組/目錄的編碼,將指標與分組/目錄結合起來,便于實際工作中的篩選和查詢。
二、上海建設統計元數據標準的思路和方法
(一)增加部分屬性反映上海市統計報表制度對國家統計報表制度的修訂針對國家企業一套表元數據標準無法滿足上海統計報表制度對國家統計報表制度的補充這一不足,擬增加部分屬性,以進一步完善地方統計元數據庫功能。1.報表元數據標準中增加:(1)報表管理級別。分國家統計局、上海市統計局、國家統計局上海調查總隊三種情況。“國家統計局”表示該報表為國家統計局布置報表;“上海市統計局”表示該報表為根據上海市統計工作實際需要增加的地方統計報表;“國家統計局上海調查總隊”表示該報表為國家統計局上海調查總隊增加的地方統計報表。(2)與國家報表相比調整情況。分新增報表、增加頻率、增加指標、擴大調查范圍、無變化五種情況。“新增報表”表示該報表為上海市增加的地方統計報表;“增加頻率”表示該報表在國家報表基礎上增加調查頻率;“增加指標”表示該報表在國家報表基礎上增加部分指標;“擴大調查范圍”表示該報表在國家報表基礎上擴大調查范圍;“無變化”表示上海市嚴格執行國家報表,未做任何修訂。該屬性旨在反映上海市針對國家報表制度三增一擴的情況。(3)上報平臺。分清華同方、和利時3.0、京云萬峰。由于上海市聯網直報數據采集平臺有3個,除國家企業一套表范圍內報表在清華同方平臺上進行數據采集外,其他報表根據實際情況在三個平臺上分別采集。因此上海統計元數據標準中增加“上報平臺”屬性記錄以聯網直報方式填報的報表具體上報平臺。2.在分組/目錄元數據標準中分別增加:與國家分組/目錄相比進行的調整。為適應服務地方統計需求,滿足反映上海市產業發展水平和結構,對國家統計制度中的分組/目錄進行調整,如增加部分上海市特有的產品目錄等。通過該屬性記錄與國家目錄相比的調整。
(二)增加部分屬性以便于查詢和管理1.在指標元數據標準中增加:將指標代碼根據指標代碼編碼規則拆分成一級類別、二級類別、核心指標和順序號。一級類別包括調查單位基本情況、從業人員、人工成本、生產經營、土地和固定資產支出、科技活動、信息化情況、效益和分配八大類,對各一級類別分別進行細化形成二級類別和核心指標。2.在報表元數據標準中增加:報表涉及行業范圍、報表所屬制度。此外,為記錄報表、指標、分組和目錄的動態變化,增加版本說明屬性,反映統計報表、統計指標的精簡、統計指標口徑、指標解釋、計算方法的調整以及統計分組和目錄條目的增減變動等,動態管理上海統計制度中報表、指標、分組、目錄,并可以查詢到歷史變化。
(三)擴大國家企業一套表元數據庫的覆蓋范圍針對國家企業一套表元數據庫僅覆蓋國家企業一套表制度這一不足,上海統計元數據庫將整理范圍擴大到上海政府統計體系中的所有基層表制度,包括常規年定報制度、普查制度和專項調查制度。考慮到上海政府統計體系統計報表制度的復雜性以及上海統計元數據標準尚在探索階段,還不成熟,故建議分三階段推進上海統計元數據標準及元數據庫建設(表1)。
三、建立上海統計元數據標準和元數據庫的職責分工與業務流程
上海統計元數據標準和元數據庫建設分為設計建立、運用和常態維護三大階段,需要設管部門和專業部門分工協作,本課題將各階段各部門的職責分工與業務流程以流程圖的形式介紹如下:
四、加強元數據建設的思路和方向
(一)完善指標代碼編碼規則現階段,上海統計元數據標準中的指標代碼編碼規則使用國家企業一套表主要元數據代碼編碼規則。由于該指標代碼體系是基于國家企業一套表制度整理歸納的,能覆蓋國家一套表制度中的指標,而上海市建立的上海統計元數據庫將覆蓋范圍擴大到上海統計系統所有基層表制度。該編碼規則無法滿足上海統計元數據庫的整理歸類需求,部分指標無法對應到具體的細分類。如:金融業統計報表制度等上海市增加的地方統計報表制度中的指標,只能籠統歸入其他類別,不利于對指標的歸類整理和篩選查詢。擬在上海統計元數據標準建立過程中,在國家企業一套表主要元數據代碼編碼規則基礎上,增加二級類別和核心指標,滿足上海統計元數據庫建設的歸類需求。
(二)研發適用于信息化平臺的元數據管理程序上海市的統計元數據建設為起步階段,主要完成了元數據標準的建立和元數據庫的初步整理。如何將事后管理轉化為事前管理,在報表制定設計之初就將報表、指標、分組和目錄規范化、標準化,是今后元數據標準工作的努力方向。下階段將首先研究如何將元數據標準和元數據庫應用于上海市信息化平臺,將元數據庫轉化為可供平臺使用的格式,嘗試在平臺定制報表的過程中可從元數據庫中直接調用標準化的指標、分組和目錄,起到對統計報表的事前管理,提高統計信息化管理水平。
(三)細化元數據管理的職責分工和業務流程對元數據標準和元數據庫管理的職責分工和業務流程提出的初步設想,目前元數據庫的更新維護工作主要由設管部門牽頭負責在年度年定報制度修訂完成后進行。這樣的操作模式存在幾個弊端,一是時效性差;二是存在重復勞動現象;三是如果元數據庫僅是年度修訂更新可能會遺漏一次性的專項調查制度,不利于元數據庫的統一管理。擬進一步細化元數據管理的職責分工和業務流程,形成設管部門牽頭,各業務處室按照業務分工負責維護的工作制度;加強宣傳與培訓,明確工作要求,將元數據管理同時融入年定報制訂、審批環節和日常的地方統計調查報表設計、審批管理過程中,確保上海市元數據庫更新的及時性和完整性,更好地發揮元數據在統計管理中的積極作用。
作者:上海市統計局課題組