前言:我們精心挑選了數篇優質大數據時代意義文章,供您閱讀參考。期待這些文章能為您帶來啟發,助您在寫作的道路上更上一層樓。
【關鍵詞】大數據 政府統計 發展政府統計
國家政策的制定,各種決策的產生都需要政府統計部門進行全面的信息統計工作。政府的統計工作的有效進行是維護國家大環境平穩運行的有力保障,對社會和諧發展也具有重要意義。面對“大數據”時代的來臨,政府應該正確認識大數據的基本內涵,重視其對統計工作的影響,積極主動配合大數據的時代特點進行政府統計工作的調整。
一、大數據時代
大數據時代的產生是伴隨著信息的數字化和智能化的發展形成的[1]。近年來信息領域的專家對其產生與發展討論激烈,在討論過程中使人們意識到大數據的重要性。大數據的特點是容量大,形式復雜,數據生成快且信息價值密度低。其中形成的數據整體規模不斷擴大,導致信息數據的跳躍式發展狀態。隨著數據來源渠道的增多,數據的結構也發生改變,其結構類型包括結構化、非結構化、半結構化。數據的數量與速率的提升,導致其利用程度大大提升,使其在諸多領域發揮其應用價值,因此,對于政府的統計工作也具有重要意義。
二、大數據時代對政府統計工作的意義
(一)改變傳統的政府統計工作的特點
(1)數據量整體提升,改變數據的有限性。傳統的政府統計要在一定時間內處理大量來自各種門類,各種行業的報表,這些報表的上交都是統計工作人員根據相應的調查目的,要求企業直接上交的數據信息,雖然數據的整體數量大,但其數據的有限性突出。在大數據的背景下,政府的統計部門在進行報表的收集和處理時,各企業對其報表進行數字化的轉換,然后進行數字化的數據傳輸,使收集過程變得簡單明了,由于政府統計人員在進行數據收集時沒有目的性,各行業的數據按規定定期上交,使統計數據成倍增長,從而減弱了數據的有限性特點。
(2)改變其單一類型的特點。傳統的政府統計工作處理的數據類型主要以文字、表格、數字為主,導致數據的處理類型單一,大數據的運用,改變了傳統、單一的數據處理類型,其類型由文字、表格、數據轉化為多種形式的可以被計算機所識別的數據。例如,多媒體的音頻、視頻、圖片等。
(3)改變數據分析的難度。傳統的政府統計工作由于對企業報表的調查目的性強,使數據在收集、處理時程序簡單,核算方式、核算結果都比較明確,數據收集與數據調查的關聯性大,使數據分析過程簡單容易。現今大數據的廣泛應用使數據的收集與調查關聯性減弱,大量的數據涌入統計系統,統計人員在進行調查時要將眾多數據信息進行目的性的分類,在分類中根據調查目的進行數據的分析,導致數據分析難度加大,缺乏高超的技術性分析,很難得出有價值、有作用的分析結果。
(二)提高政府名錄庫建設
統計部門進行政府名錄庫建設是其基本工作職能之一,政府名錄庫的建設可以促進統計工作的有效進行。現今,大數據的背景下,信息之間交流日趨便捷,交流渠道多樣,導致數據的總體數量逐步提升。政府應根據現今社會的發展模式,充分利用大數據,將企業的發展動向,和企業的發展現狀相結合,分析企業出現狀況的原因,從而促進企業的發展。另一方面,在動態的數據分析中,發現企業新的利益增長點,從而形成數據更新及時,數據涵蓋全面的名錄庫,使其服務企業,服務政府的功能得以實現。
(三)促進統計知識宣傳氛圍的形成
現今,政府的統計部門由于工作量大,工作過程具有嚴格的保密性,導致對政府統計部門的工作質疑聲越來越多,人們對統計知識的了解不足也導致對政府統計部門的不信任。在大數據的背景下,技術得到前所未有的更新,技術的更新使統計部門在進行數據的傳輸中速度加快,為促進統計知識宣傳氛圍的形成提供了技術保障。在逐步進行統計知識宣傳中,打破人們對于統計部門的思維定式,消除統計部門在人們心中的疑慮,使統計工作得到人民大眾的支持。
(四)改進數據的采集、數據的處理
傳統的政府統計數據的采集和處理均采用聯網直接報表的形式,其形式雖然對統計工作有一定的積極影響,但其存在的弊端也十分明顯。在大數據的背景下,政府統計部門建立一個新的信息處理系統。在新的程序運行下進行數據的采集,對數據的質量進行合理的分析,找出其存在的問題,針對問題進行及時處理,減少系統中數據的錯誤以及更新不及時的問題出現,從而提高統計數據的質量,促進政府統計工作的有效進行。
(五)強化數據分析能力
政府的統計工作的重點停留在業務數據的處理層,國家在進行決策使難以從靜態的數據中提煉大量的有價值的信息[3]。在“大數據”時代,數據的靜態形式漸漸消除,利用大數據中的“云計算”技術,可以同時進行大量數據的運算,將計算結果進行動態的呈現,使數據中的潛在價值得以有效發揮,在計算中建立數據與數據之間的內在聯系,使政府統計工作高效、準確。
綜上所述,政府的統計工作在面對大數據時代的來臨時,首先要正確認識大數據的基本內涵,充分運用大數據的優勢促進政府統計工作的進行。注重依靠大數據在改變傳統的政府統計工作的特點,加快政府名錄庫建設,促進統計知識宣傳氛圍的形成,改進數據的采集、數據的處理方式,強化數據分析能力方面的意義,從而促進政府統計工作的順利完成。
參考文獻:
[1]李冬梅.大數據時代背景下政府統計工作模式創新及其配套舉措研究[J].統計與咨詢,2014,(01).
在這樣的故事中,現在比較喧囂的就是“大數據”。什么是大數據,已經有諸多的論述,總體上來看大同小異。涉及到大數據對不同領域的影響,如何正確認識大數據及其在國際傳播中的意義,似需逐步理清如下幾個線索。
第一,計算方式革命奠定了大數據的時代意義
大數據的發展,是信息高速公路硬件鋪設后,在信息流量的增加、信息積累方式的多元、數據存儲和分析技術的突破、用戶數量的飛躍等因素推動下,對于數據認識和數據挖掘上的革命性突破。
簡而言之,大數據實現了兩種計算方式上的革命:
首先是精確計算。一個充分利用信息傳播新興終端的主體,即充分享受了移動、即時、通信的終端服務的主體,其個人信息將被全息記載,精確計算。比如一個普通人,在大數據時代享受的便利包括,使用google等搜索引擎,可以快捷地享受到信息廣泛和瞬間的匯總——但個人的IP地址以及搜索關鍵詞、搜索習慣所有痕跡被記錄在案;醫療健康信息歷史和當下的儲存、比照以及血壓安全閾值的監測;個人消費數據和投資的檢測分析等。
其次,模糊計算。個人在享受大數據提供的信息超值服務的同時,也將自我的信息分享出去,在“個體(individual)”的對面,還有一個利益集團的狼群,在不斷搜集“群”、“眾”一類的信息,并將他們通過大數據的模糊計算,不斷通過對個人精確信息的獲取而將這些模糊信息精確化個人被算計而不知。
這個用戶和“對面”的用戶,既是“個體”、“主體”或者個人,也可以是一個公司、集團,在某種程度上也可以是一個國家。
第二,社會控制手段“質”的飛躍凸顯了大數據的政治意義
從量的積累到質的飛躍的道理廣為人知。從社會控制的角度來看,大數據將這個道理最終落到了實處。大數據提醒我們,“社會控制”在信息時代的價值內涵,已經不再是虛擬的,而是通過采集和分析每個主體的個人信息,實現最優化的、不同層面的利益最大化和社會控制。有這樣一則大數據在美國政治傳播領域的調查案例結果引人思考。
2012年4月23日到5月6日,美國賓夕法尼亞大學安娜伯格傳播學院邁克爾·德利·卡皮尼(Michael X,Delli Carpini)教授和約瑟夫·特羅(Joseph Turow)教授帶領兩位博士生Nora Draper和Rowan Howard-Williams進行了一項有關大數據政治傳播方面的研究。由研究人員設計了20分鐘的調查問卷,普林斯頓國際調查研究機構(Princeton Survey Research AssociatesInternational)抽取了有代表性的美國成人網民1503個樣本進行電話訪談(包括座機和手機),就大數據時代概念運用于政治選舉時,選民對定制性的政治推廣的看法進行了調查。
2012年7月24日公布的調查結果顯示,占很大比重的美國人絕對反對(dead-set against)針對他們個人量身定制的政治廣告(tailored political advertising)尤其是當時在即將到來的2012大選中類似的活動在前所未有地上升的背景下。實際上,很多美國人非常不喜歡量身定制的政治廣告,他們表示,如果發現自己打算投票的目標候選人卷入類似行為的話,他們的支持率會大大降低。更詳細的數據包括:86%的人說,他們不歡迎“根據個人興趣量身定制的政治廣告”。這個數據遠遠高于那些拒絕“量身定制型傳播”(tailored communication)形式人群的比例(61%)、“量身定制的新聞(news thatis tailored to your interests)”(56%),“量身定制的折扣(discounts that are tailored to your interests)”(46%)。
64%的美國人說,如果他們獲悉他們傾向投票的候選人在競選過程中購買他們(選民)的上網行蹤(onlineactivities)以及他們鄰居的在線行蹤等數據,并依此向他們推送不同類型的政治信息的話(這些行為在2012年的大選中已經很普遍),37%的人說會大大降低他們的支持率,27%的人說無論如何也會降低他們的支持率。
70%的成年美國人說,如果他們獲悉他們傾向投票的候選組織在競選過程中運用臉譜網(Facebook)向他們的鏈接朋友發送包含朋友的文件照片以及表示支持候選人的“聲稱”廣告的話,50%的人會大大降低他們的支持率,22%的人說無論如何也會降低他們的支持率(而這種類似的行為在201 2年大選中已經發生)。
77%的美國人同意(其中35%的人嚴重同意)如果一個網站將我瀏覽該網頁的信息分享給那些政治廣告人,我將再不會返回這個網站。(實際上,很多網站,或者自主、或者通過第三方都在分享類似的數據。)
85%的人同意(其中47%的人嚴重同意)如果發現臉譜網(Facebook)用我在帳戶中已經設置為私人信息的東西制作并推送給我政治候選人廣告的話,我會很憤怒。
主持這項研究的約瑟夫·特羅教授說,2012年的大選標志著在線廣告推介的一個分水嶺。空前的途徑和范圍,全美政治大選組織運用幾百件細碎的、有關個人在線和離線的生活信息以確保他們認為的“正確的”人被“正確的”信息所命中。“但是我們也發現,與市場營銷人員所宣稱的迥然不同的是,大多數成年美國人不希望根據他們的個人興趣來制造和推送政治廣告”。
這個案例中似乎是很專業的分析“定向廣告”(Targeting advertising),即就個體數據的分析來決定“誰”應該接到勸說性的信息,“如何(how)、何時(when)”以及“出于什么原因”(for what reasons)。“量身定制性廣告”(Tailored advertising)意味著給某個獨特的個體打造某種勸說性的信息——這個定向的過程基于對這個獨特個體興趣和價值的分析結論。但是,這個所謂專業化的案例直指大數據的政治傳播實質,從批評的聲音中我們也看到,人們認為這樣的行為威脅了隱私權并侵蝕民主價值觀。市場營銷人士也包括政治競選活動顧問們則辯護說,這樣做可以給美國人他們實際想要的東西:與他們的關注焦點密切相關的政治廣告以及其他形式的內容。
從中國現實來看,以往每個個體,無論是從事何種工作,都具有很強的地域性、個體性、階段性,社會關系也或者類似“山藥蛋”——一個圈層一個圈層各自獨立,類似先生所總結的鄉土社會格局。在自己交往能力、經濟能力以及權勢所能輻射的范圍內活動,頂多再配上一些“煙花”——比如遠方親戚、外地工作親屬、外地同學等弱關系。尤其每個人的社會活動都相對比較封閉。
但是,大數據互聯網背景下,每個人都觸網、上網,成為社會大網絡上的一個物理性節點。在全國乃至全球物理性一張網的概念下,個體的任何活動都具有了可追溯性、可復原性,最重要的是可分析性。大型信息網站通過多維數據源來進行人的跟蹤和定位,精確把握用戶信息,并進行裸的掠奪式使用。除了GPS進行物理定位外,通過個人消費行為和習慣也可以進行人的性格乃至行為取向定位,比如瀏覽網頁、收發電子郵件、搜索關鍵詞和關心信息、手機號碼、網吧頻率。
由此激發人們思考的是,每個人的個人信息都有哪些機構在搜集,都有可能被用于何處?比如買手機有不同的公司,上網實名制,銀行,學校,單位,超市會員等等,都在進行著大眾個人化信息的搜集和匯總。
那么,再進一步思考,又有多少外國機構、利益集團乃至犯罪機構等通過這些渠道進行跨國的、中國國民信息的搜集和分析,已經將這樣的信息用向何方呢?第三,政治邊界內涵改變和重組揭示大數據的國際傳播意義
毋庸置疑,大數據將為人們認識世界和改造世界提供新的強有力工具,使人們能更加容易地把握事物規律,更準確地預測未來。亟需更寬大、長遠的頂層設計,以之來調適數據規模以及計算模式的革命給既往思維、管理模式帶來的挑戰。
美國已經將大數據提升到國家戰略層面上實施。美國是最先提出“大數據”概念并開展應用的國家,依靠其先進的信息技術以及數據科學的研究水平逐步建立起了系統的“大數據”基礎理論和應用模式,并在實際應用中積累了豐富的經驗。2012年12月10日,美國國家情報委員會了名為《2030年全球趨勢——不一樣的世界》(Global Trends 2030:Alternative Worlds)的報告。這是全美情報界最高層級戰略評估性情報分析產品,提交給總統,意在為其提供未來20年內的全球趨勢預測,為白宮和情報界遠景戰略政策提供思考框架。報告反映了美國政府16個情報機構對未來20年世界局勢的預判,其中提到的四類技術將影響2030年前全球經濟、社會和軍事發展:信息技術,制造和自動化技術,資源相關技術,衛生保健技術。在信息技術領域,大數據存儲和處理技術、社交網絡技術以及智能城市技術等將改變人們的生活和經營方式,社交媒體和網絡安全會成為新興市場。大數據的存儲和處理會協助政策制定者有效應對經濟和治理的難題。
大數據概念和實踐提示我們,在信息化時代,國家和機構的權力半徑在一定程度上取決于風險預警和信息獲取的半徑。大數據技術提供了這樣一種可能,那就是物理和行業的邊界已經被信息重新劃定,包括信息的獲取、處理和分析能力重組了國家的實際權力的發揮以及發揮的實質性內涵。舉例來說,一個國家的領土規模可能很大,但信息無障礙傳播和獲取分析處理能力低下的情況,有可能決定了這個國家或地區的權力延伸物理半徑很是狹小,以至于權力延伸和發揮影響的心理和生理半徑則會呈現一種疑竇重生和肢端萎縮的趨勢;相反,一個國家和另外一個國家的距離可能很遠,可是通過信息傳感器的充分布設以及信息處理能力的提升,另外一個國家可能會淪為信息強國的一個節點和包圍,喪失任何的信息主動權而深度為奴。
余論
20世紀著名的三論——信息論、系統論、控制論,在大數據時代充分得以驗證。
在大數據時代中,大數據的應用效能、應用方便度、應用當地覆蓋面是未來大數據應用所關注的重點,而目前在大數據應用方面存在許多的問題,這些問題的存在影響了未來大數據的應用,如何解決這些問題,重現在開始從最基礎方面開始,解決這些問題是大數據未來應用的重要工作。本文首先列舉了目前大數據應用中存在的問題,分析了產生這些問題的原因,針對這種情況提出了基于基礎數據結構體系建立的解決方案設想,為未來大數據應用發揮更大效益的解決方法。
【關鍵詞】大數據 基礎數據結構 軟件工程 數據標準
隨著智慧城市建設項目的開展,作為智慧城市建設的重要基礎就是圍繞大型基礎數據平臺的建設,在業界定義為大數據時代的來臨。圍繞大數據的概念,在全國范圍內的各領域各行業都在大數據的如何組織、如何應用、如何共享、如何關聯召開了各類研討會。大數據應用的云計算技術、數據倉庫技術等成為業內討論的重要話題。本人認為,在做了這些工作后,應回過頭來看一看,無論數據量有多大,都離不開基礎數據結構與體系的建設,在此要闡明的一個基本觀點就是在大數據時代更應該重視基礎數據結果的研究與應用。
1 大數據的概念
什么是大數據, IBM 最早的定義是:將大數據的特征歸納為4個“V”(量Volume,多樣Variety,價值Value,速Velocity),或者說特點有四個層面:第一,數據體量巨大。大數據的起始計量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T);第二,數據類型繁多。比如,網絡日志、視頻、圖片、地理位置信息等等。第三,價值密度低,商業價值高。第四,處理速度快。最后這一點也是和傳統的數據挖掘技術有著本質的不同。
在大數據概念中的第一條是數據量大,這是大數據的特點,而卻隨著信息系統應用的深入,數量的數量級也在不斷的提高,這是毋容置疑的。我們在此要討論的是第二條數據類型繁多的問題。
2 目前大數據應用存在的主要問題
隨著信息化系統應用的深入,在社會、自然界、生活中所涉及的數據面越來越廣,由此使得數據類型也越來越多,數據類型的數量在不斷增加,這些數據類型之間的關系和相互關聯性也越來越復雜,大數據量下的數據應用造成了困難。數據結構類型繁多造成問題主要表現在以下幾個方面。
2.1 數據類型是有限量的認識不清楚
未來大數據情況下,數據類型是有限量的還是無限量的概念模糊,為此首先要么明確一個基本的概念,那就是,數據類型在繁多,但是數據類型的數量是有限量的,只是這個限量的數量級大一些而已。在數據類型是有限量的情況下,對于解決數據類型繁多的方法是完全不同的。
如果數據類型的量是無限量的,那么解決問題的方法是要研究解決數據類型問題的方式是研究規律,拿出解決問題的方式與方法,對于具體數據類型時,按照方式方法理論與技術去解決問題。如果數據類型是有限量的話,那么解決問題的方式就不只是從理論上的解決問題方法,而應該更加切合實際的去針對每一種數據類型直接進行研究,形成數據標準,指導各個系統對每一個具體數據類型的應用。
2.2 相同數據在不同系統中的表現類型繁多
由于系統開發方各自的開發經驗、所開發系統的規模不同,系統應用方對系統要求不同,系統應用行業的不同,使得在開發過程中,對于數據類型的定義只遵循本系統使用需要進行定義,沒有完整的標準,即是有相應的國家或國際標準,也不能完全遵循。
2.3 各個行業制定的標準相互矛盾
各個行業在制定相應的標準時,是以滿足自身需要為主導,造成了數據類型在其數據定義時不但長度不同,就是數據類型都不相同。這也就造成了各個系統在未來大數據應用中出現了嚴重的數據應用障礙。
2.4 大數據應用的實現效率低
由于不同系統技術數據結構的不統一,使得對于大數據的應用上要對不同系統的數據結構進行分析,構建關聯,而后才能進行數據的應用,這項工作的工作量大,技術含量高,降低數據的應用效率。這些都是事后分析數據存在的問題。
2.5 數據浪費巨大
由于數據各個系統間數據結構的不同,加上分析手段的局限性,使許多的數據無法進行使用,由此也降低了數據的使用率。并造成數據的大量浪費。
3 造成目前對大數據應用存在問題原因
由于以上幾方面的問題存在,為了做好大數據的應用,許多相應的技術應運而生,數據倉庫技術、網格技術、云計算的數據處理技術等等。這些技術促進了數據應用的發展,提高了數據應用效率,為大數據應用發揮了巨大作用。但是這種做法只能針對具體的大數據應用項目起到作用,不能從根本上解決問題。那么造成這種問題根本是什么呢?
3.1 理論基礎有偏差
目前所有這些高精尖技術的發展,為大數據應用的發展起到了不可替代的作用,但是這些技術在理論出發點上存在偏差,那就是,這些技術的理論出發點設定的是,數據類型是無限量的,是無窮盡的,所以所有的技術研究都不面對具體的數據項,這樣做的結果是促進技術的發展,弊端是不能面對具體的應用,所有的技術應用都要在這就技術下進行二次應用研究。也就是,這些理論是治標不治本的做法。
有限量數據類型與無限量數據類型是兩個根本不同的概念,對于技術的發展影響也是完全不同的。為此,目前在無限量數據類型概念下的大數據應用技術與體系將會存在極大的局限性,對未來的大數據應用造成影響。
3.2 對大數據認識有偏差
目前在各個系統對大數據的應用中,對大數據的認識是,只要有足夠量的數據,就是大數據,而對于數據之間的關系,整體的數據結構體系沒有很深的認識,甚至將原有的多個分散的系統中的數據庫,做一個小的關聯數據庫,就認為是數據云計算,就是綜合數據平臺了,而在這種情況下,對于大數據的應用,因為系統的獨立,數據庫的獨立、數據結構的不統一造成了大數據應用的瓶頸和障礙,在系統應用到一定程度后,數據量是很大,但是無法進行大數據應用,或者說是要進行大數據的應用,需要另外投入很高的成本進行數據整理、數據管理和數據分析。所以應該明確的是,在數據結構混亂的情況下,在大的數據量也不能稱為大數據,這個觀念上的偏差,是造成目前數據應用困難的原因之一。
3.3 數據結構不規范
這些情況的出現,歸結的一起,就是數據結構不規范,不統一。在三方面主要原因造成這個局面,一是目前的應用系統的開發,由不同的公司進行,每個開發單位對數據結構的定義有各自的標準,基本都是按照多年開發經驗總結出來的,因此各個公司開發的系統在數據結構上相差很遠。二是對于同一個公司不同時期開發的系統所涉及的數據結構不統一,到后期,開發單位不愿意在投入成本對前期開發的系統進行重新開發,這就造成了前期開的的系統中的數據結構與后期開發的數據結構不統一。三是對于應用開發單位在開發每一個具體應用項目時,由于是不同的開發小組在進行,為此,在進行數據結構設定時,只為了滿足本系統開發的需要,而沒有考慮系統未來的發展和系統的整體架構,這也造成了不同應用系統中對相同字段的設定不相同,數據結構不統一。以上這些都是在應用系統開發過程中遺留的問題,而這些問題嚴重影響了大數據的使用。
3.4 有統一的標準不用
在系統開發過程中涉及的數據結構,許多都有相應的標準,主要有以下幾個方面,一是國家法律層面的,對于一些重要的數據要求以立法方式進行規范。二是國家標準,制定和規范了國家層面的有關方面的數據要求和限定。三是部頒標準,由各個部委辦局制定的相應標準,這些標準有一大部分直接針對信息化系統建設的應用和數據標準。四是行業標準,作為每一個行業內進行行為約束的標準,這種標準雖然不具備強制性,但是在行業內是一個自覺遵守的標準。四是國際相關標準,雖然國際標準沒有任何的法律約束性,但是為了走出去,各行各業都在遵循這個標準。
這些標準都是在系統建立時的數據結構依據,但是目前許多系統在進行數據結構設定時,都沒有按照這些標準執行,而是根據自己系統的需要進行設定的。這使得許多的系統中的數據不能相互交換使用,由此而影響了大數據的應用。
3.5 不同行業對標準的設定不統一
在國家標準體系中,由于標準制定的年代不同,同是一個部門頒布的標準對相同的數據要求也不同,各個部門由于獨立制定標準,同樣出現相同數據在不同部門制定的標準中規定的不同,這幾方面原因也就造成了即使遵照標準,也存在著相同數據在不同應用系統中的數據結構不同的現象。
以上是大數據應用問題出現的主要原因,作為大數據應用的剛剛起步階段,應針對這些問題進行研究給出相應的解決方案,為未來大數據應用的發展打下一個良好的基礎,避免今后的大數據應用走彎路。
4 解決大數據應用問題的對策
解決大數據應用存在的問題,應從最基礎的數據結構建立開始,從根本上去解決問題,也為未來大數據應用的發展打下一個良好的基本數據結構基礎,對此提出以下幾方面的對策。
4.1 開展和加強對基礎數據結構建立的理論研究
從軟件工程學的角度出發,以數據結構類型是有限量的概念為依托,圍繞具體的數據類型開展數據結構體系的理論研究。依托一個數據結構分類的理論體系來支撐整個數據結構體系的劃分,其中包括劃分方法、劃分層次、劃分的軟件工程學理論支撐等內容,制定大數據底層數據結構劃分的理論體系,形成在大數據下的數據結構構建的理論體系。
4.2 開展對具體數據結構的研究
按照建立的數據結構理論體系要求,對每一個具體數據結構進行研究,針對數據項的名稱、類型、含義、層次、結構、與其他數據的關系、涉及內容規定等方面制定出具體數據的標準。這項工作可以在有組織的情況下由全社會共同參與,按照指導理論的要求進行研究,這樣,隨著應用系統的不斷深入,所涉及的數據類型項將逐步擴展,最終實現數據的全覆蓋,而完成整個架構體系的建立。
4.3 制定相應的數據結構標準
對于由各個方面制定的數據結構進行分類、篩選、審核,而后想這些結構形成一個統一的架構體系,制定相應的技術標準,通過這個標準來規范應用系統的開發,形成完整的、規范的、統一的數據結構體系,為大數據應用打下堅實的基礎。
4.4 成立相應的機構來負責這項工作的完成
對于這項工作的開展,應在軟件工程相應的有關組織下,建立一個專門的機構,負責指導這項工作的完成。由這個機構成立專門的實驗室,負責整體架構的制定,數據類型項的搜集、分類、篩選,并形成統一的數據庫體系,為所有的應用系統的開發提供數據庫基礎支撐和服務。
綜上所述,通過對基礎數結構的研究與體系的建立,從根本上解決大數據應用的效率,充分發揮未來大數據的作用,簡化大數據應用的方式與過程。
參考文獻
[1]嚴霄鳳,張德馨.大數據研究[J].計算機技術與發展,2013(04).
[2]李學龍,龔海剛.大數據系統綜述[J].中國科學:信息科學,2015(01).
[3]方璐.大數據時代的科學研究方法[J].浙江工業大學,2014.
作者簡介
李鏵(1962-),男,江蘇省無錫市人。學士學位,現為無錫科技職業學院教師、高級工程師。主要研究方向為軟件工程學、物聯網概論。