美章網(wǎng) 精品范文 大數(shù)據(jù)時代意義范文

    大數(shù)據(jù)時代意義范文

    前言:我們精心挑選了數(shù)篇優(yōu)質(zhì)大數(shù)據(jù)時代意義文章,供您閱讀參考。期待這些文章能為您帶來啟發(fā),助您在寫作的道路上更上一層樓。

    大數(shù)據(jù)時代意義

    第1篇

    【關(guān)鍵詞】大數(shù)據(jù) 政府統(tǒng)計 發(fā)展政府統(tǒng)計

    國家政策的制定,各種決策的產(chǎn)生都需要政府統(tǒng)計部門進行全面的信息統(tǒng)計工作。政府的統(tǒng)計工作的有效進行是維護國家大環(huán)境平穩(wěn)運行的有力保障,對社會和諧發(fā)展也具有重要意義。面對“大數(shù)據(jù)”時代的來臨,政府應該正確認識大數(shù)據(jù)的基本內(nèi)涵,重視其對統(tǒng)計工作的影響,積極主動配合大數(shù)據(jù)的時代特點進行政府統(tǒng)計工作的調(diào)整。

    一、大數(shù)據(jù)時代

    大數(shù)據(jù)時代的產(chǎn)生是伴隨著信息的數(shù)字化和智能化的發(fā)展形成的[1]。近年來信息領(lǐng)域的專家對其產(chǎn)生與發(fā)展討論激烈,在討論過程中使人們意識到大數(shù)據(jù)的重要性。大數(shù)據(jù)的特點是容量大,形式復雜,數(shù)據(jù)生成快且信息價值密度低。其中形成的數(shù)據(jù)整體規(guī)模不斷擴大,導致信息數(shù)據(jù)的跳躍式發(fā)展狀態(tài)。隨著數(shù)據(jù)來源渠道的增多,數(shù)據(jù)的結(jié)構(gòu)也發(fā)生改變,其結(jié)構(gòu)類型包括結(jié)構(gòu)化、非結(jié)構(gòu)化、半結(jié)構(gòu)化。數(shù)據(jù)的數(shù)量與速率的提升,導致其利用程度大大提升,使其在諸多領(lǐng)域發(fā)揮其應用價值,因此,對于政府的統(tǒng)計工作也具有重要意義

    二、大數(shù)據(jù)時代對政府統(tǒng)計工作的意義

    (一)改變傳統(tǒng)的政府統(tǒng)計工作的特點

    (1)數(shù)據(jù)量整體提升,改變數(shù)據(jù)的有限性。傳統(tǒng)的政府統(tǒng)計要在一定時間內(nèi)處理大量來自各種門類,各種行業(yè)的報表,這些報表的上交都是統(tǒng)計工作人員根據(jù)相應的調(diào)查目的,要求企業(yè)直接上交的數(shù)據(jù)信息,雖然數(shù)據(jù)的整體數(shù)量大,但其數(shù)據(jù)的有限性突出。在大數(shù)據(jù)的背景下,政府的統(tǒng)計部門在進行報表的收集和處理時,各企業(yè)對其報表進行數(shù)字化的轉(zhuǎn)換,然后進行數(shù)字化的數(shù)據(jù)傳輸,使收集過程變得簡單明了,由于政府統(tǒng)計人員在進行數(shù)據(jù)收集時沒有目的性,各行業(yè)的數(shù)據(jù)按規(guī)定定期上交,使統(tǒng)計數(shù)據(jù)成倍增長,從而減弱了數(shù)據(jù)的有限性特點。

    (2)改變其單一類型的特點。傳統(tǒng)的政府統(tǒng)計工作處理的數(shù)據(jù)類型主要以文字、表格、數(shù)字為主,導致數(shù)據(jù)的處理類型單一,大數(shù)據(jù)的運用,改變了傳統(tǒng)、單一的數(shù)據(jù)處理類型,其類型由文字、表格、數(shù)據(jù)轉(zhuǎn)化為多種形式的可以被計算機所識別的數(shù)據(jù)。例如,多媒體的音頻、視頻、圖片等。

    (3)改變數(shù)據(jù)分析的難度。傳統(tǒng)的政府統(tǒng)計工作由于對企業(yè)報表的調(diào)查目的性強,使數(shù)據(jù)在收集、處理時程序簡單,核算方式、核算結(jié)果都比較明確,數(shù)據(jù)收集與數(shù)據(jù)調(diào)查的關(guān)聯(lián)性大,使數(shù)據(jù)分析過程簡單容易。現(xiàn)今大數(shù)據(jù)的廣泛應用使數(shù)據(jù)的收集與調(diào)查關(guān)聯(lián)性減弱,大量的數(shù)據(jù)涌入統(tǒng)計系統(tǒng),統(tǒng)計人員在進行調(diào)查時要將眾多數(shù)據(jù)信息進行目的性的分類,在分類中根據(jù)調(diào)查目的進行數(shù)據(jù)的分析,導致數(shù)據(jù)分析難度加大,缺乏高超的技術(shù)性分析,很難得出有價值、有作用的分析結(jié)果。

    (二)提高政府名錄庫建設(shè)

    統(tǒng)計部門進行政府名錄庫建設(shè)是其基本工作職能之一,政府名錄庫的建設(shè)可以促進統(tǒng)計工作的有效進行。現(xiàn)今,大數(shù)據(jù)的背景下,信息之間交流日趨便捷,交流渠道多樣,導致數(shù)據(jù)的總體數(shù)量逐步提升。政府應根據(jù)現(xiàn)今社會的發(fā)展模式,充分利用大數(shù)據(jù),將企業(yè)的發(fā)展動向,和企業(yè)的發(fā)展現(xiàn)狀相結(jié)合,分析企業(yè)出現(xiàn)狀況的原因,從而促進企業(yè)的發(fā)展。另一方面,在動態(tài)的數(shù)據(jù)分析中,發(fā)現(xiàn)企業(yè)新的利益增長點,從而形成數(shù)據(jù)更新及時,數(shù)據(jù)涵蓋全面的名錄庫,使其服務企業(yè),服務政府的功能得以實現(xiàn)。

    (三)促進統(tǒng)計知識宣傳氛圍的形成

    現(xiàn)今,政府的統(tǒng)計部門由于工作量大,工作過程具有嚴格的保密性,導致對政府統(tǒng)計部門的工作質(zhì)疑聲越來越多,人們對統(tǒng)計知識的了解不足也導致對政府統(tǒng)計部門的不信任。在大數(shù)據(jù)的背景下,技術(shù)得到前所未有的更新,技術(shù)的更新使統(tǒng)計部門在進行數(shù)據(jù)的傳輸中速度加快,為促進統(tǒng)計知識宣傳氛圍的形成提供了技術(shù)保障。在逐步進行統(tǒng)計知識宣傳中,打破人們對于統(tǒng)計部門的思維定式,消除統(tǒng)計部門在人們心中的疑慮,使統(tǒng)計工作得到人民大眾的支持。

    (四)改進數(shù)據(jù)的采集、數(shù)據(jù)的處理

    傳統(tǒng)的政府統(tǒng)計數(shù)據(jù)的采集和處理均采用聯(lián)網(wǎng)直接報表的形式,其形式雖然對統(tǒng)計工作有一定的積極影響,但其存在的弊端也十分明顯。在大數(shù)據(jù)的背景下,政府統(tǒng)計部門建立一個新的信息處理系統(tǒng)。在新的程序運行下進行數(shù)據(jù)的采集,對數(shù)據(jù)的質(zhì)量進行合理的分析,找出其存在的問題,針對問題進行及時處理,減少系統(tǒng)中數(shù)據(jù)的錯誤以及更新不及時的問題出現(xiàn),從而提高統(tǒng)計數(shù)據(jù)的質(zhì)量,促進政府統(tǒng)計工作的有效進行。

    (五)強化數(shù)據(jù)分析能力

    政府的統(tǒng)計工作的重點停留在業(yè)務數(shù)據(jù)的處理層,國家在進行決策使難以從靜態(tài)的數(shù)據(jù)中提煉大量的有價值的信息[3]。在“大數(shù)據(jù)”時代,數(shù)據(jù)的靜態(tài)形式漸漸消除,利用大數(shù)據(jù)中的“云計算”技術(shù),可以同時進行大量數(shù)據(jù)的運算,將計算結(jié)果進行動態(tài)的呈現(xiàn),使數(shù)據(jù)中的潛在價值得以有效發(fā)揮,在計算中建立數(shù)據(jù)與數(shù)據(jù)之間的內(nèi)在聯(lián)系,使政府統(tǒng)計工作高效、準確。

    綜上所述,政府的統(tǒng)計工作在面對大數(shù)據(jù)時代的來臨時,首先要正確認識大數(shù)據(jù)的基本內(nèi)涵,充分運用大數(shù)據(jù)的優(yōu)勢促進政府統(tǒng)計工作的進行。注重依靠大數(shù)據(jù)在改變傳統(tǒng)的政府統(tǒng)計工作的特點,加快政府名錄庫建設(shè),促進統(tǒng)計知識宣傳氛圍的形成,改進數(shù)據(jù)的采集、數(shù)據(jù)的處理方式,強化數(shù)據(jù)分析能力方面的意義,從而促進政府統(tǒng)計工作的順利完成。

    參考文獻:

    [1]李冬梅.大數(shù)據(jù)時代背景下政府統(tǒng)計工作模式創(chuàng)新及其配套舉措研究[J].統(tǒng)計與咨詢,2014,(01).

    第2篇

    在這樣的故事中,現(xiàn)在比較喧囂的就是“大數(shù)據(jù)”。什么是大數(shù)據(jù),已經(jīng)有諸多的論述,總體上來看大同小異。涉及到大數(shù)據(jù)對不同領(lǐng)域的影響,如何正確認識大數(shù)據(jù)及其在國際傳播中的意義,似需逐步理清如下幾個線索。

    第一,計算方式革命奠定了大數(shù)據(jù)的時代意義

    大數(shù)據(jù)的發(fā)展,是信息高速公路硬件鋪設(shè)后,在信息流量的增加、信息積累方式的多元、數(shù)據(jù)存儲和分析技術(shù)的突破、用戶數(shù)量的飛躍等因素推動下,對于數(shù)據(jù)認識和數(shù)據(jù)挖掘上的革命性突破。

    簡而言之,大數(shù)據(jù)實現(xiàn)了兩種計算方式上的革命:

    首先是精確計算。一個充分利用信息傳播新興終端的主體,即充分享受了移動、即時、通信的終端服務的主體,其個人信息將被全息記載,精確計算。比如一個普通人,在大數(shù)據(jù)時代享受的便利包括,使用google等搜索引擎,可以快捷地享受到信息廣泛和瞬間的匯總——但個人的IP地址以及搜索關(guān)鍵詞、搜索習慣所有痕跡被記錄在案;醫(yī)療健康信息歷史和當下的儲存、比照以及血壓安全閾值的監(jiān)測;個人消費數(shù)據(jù)和投資的檢測分析等。

    其次,模糊計算。個人在享受大數(shù)據(jù)提供的信息超值服務的同時,也將自我的信息分享出去,在“個體(individual)”的對面,還有一個利益集團的狼群,在不斷搜集“群”、“眾”一類的信息,并將他們通過大數(shù)據(jù)的模糊計算,不斷通過對個人精確信息的獲取而將這些模糊信息精確化個人被算計而不知。

    這個用戶和“對面”的用戶,既是“個體”、“主體”或者個人,也可以是一個公司、集團,在某種程度上也可以是一個國家。

    第二,社會控制手段“質(zhì)”的飛躍凸顯了大數(shù)據(jù)的政治意義

    從量的積累到質(zhì)的飛躍的道理廣為人知。從社會控制的角度來看,大數(shù)據(jù)將這個道理最終落到了實處。大數(shù)據(jù)提醒我們,“社會控制”在信息時代的價值內(nèi)涵,已經(jīng)不再是虛擬的,而是通過采集和分析每個主體的個人信息,實現(xiàn)最優(yōu)化的、不同層面的利益最大化和社會控制。有這樣一則大數(shù)據(jù)在美國政治傳播領(lǐng)域的調(diào)查案例結(jié)果引人思考。

    2012年4月23日到5月6日,美國賓夕法尼亞大學安娜伯格傳播學院邁克爾·德利·卡皮尼(Michael X,Delli Carpini)教授和約瑟夫·特羅(Joseph Turow)教授帶領(lǐng)兩位博士生Nora Draper和Rowan Howard-Williams進行了一項有關(guān)大數(shù)據(jù)政治傳播方面的研究。由研究人員設(shè)計了20分鐘的調(diào)查問卷,普林斯頓國際調(diào)查研究機構(gòu)(Princeton Survey Research AssociatesInternational)抽取了有代表性的美國成人網(wǎng)民1503個樣本進行電話訪談(包括座機和手機),就大數(shù)據(jù)時代概念運用于政治選舉時,選民對定制性的政治推廣的看法進行了調(diào)查。

    2012年7月24日公布的調(diào)查結(jié)果顯示,占很大比重的美國人絕對反對(dead-set against)針對他們個人量身定制的政治廣告(tailored political advertising)尤其是當時在即將到來的2012大選中類似的活動在前所未有地上升的背景下。實際上,很多美國人非常不喜歡量身定制的政治廣告,他們表示,如果發(fā)現(xiàn)自己打算投票的目標候選人卷入類似行為的話,他們的支持率會大大降低。更詳細的數(shù)據(jù)包括:86%的人說,他們不歡迎“根據(jù)個人興趣量身定制的政治廣告”。這個數(shù)據(jù)遠遠高于那些拒絕“量身定制型傳播”(tailored communication)形式人群的比例(61%)、“量身定制的新聞(news thatis tailored to your interests)”(56%),“量身定制的折扣(discounts that are tailored to your interests)”(46%)。

    64%的美國人說,如果他們獲悉他們傾向投票的候選人在競選過程中購買他們(選民)的上網(wǎng)行蹤(onlineactivities)以及他們鄰居的在線行蹤等數(shù)據(jù),并依此向他們推送不同類型的政治信息的話(這些行為在2012年的大選中已經(jīng)很普遍),37%的人說會大大降低他們的支持率,27%的人說無論如何也會降低他們的支持率。

    70%的成年美國人說,如果他們獲悉他們傾向投票的候選組織在競選過程中運用臉譜網(wǎng)(Facebook)向他們的鏈接朋友發(fā)送包含朋友的文件照片以及表示支持候選人的“聲稱”廣告的話,50%的人會大大降低他們的支持率,22%的人說無論如何也會降低他們的支持率(而這種類似的行為在201 2年大選中已經(jīng)發(fā)生)。

    77%的美國人同意(其中35%的人嚴重同意)如果一個網(wǎng)站將我瀏覽該網(wǎng)頁的信息分享給那些政治廣告人,我將再不會返回這個網(wǎng)站。(實際上,很多網(wǎng)站,或者自主、或者通過第三方都在分享類似的數(shù)據(jù)。)

    85%的人同意(其中47%的人嚴重同意)如果發(fā)現(xiàn)臉譜網(wǎng)(Facebook)用我在帳戶中已經(jīng)設(shè)置為私人信息的東西制作并推送給我政治候選人廣告的話,我會很憤怒。

    主持這項研究的約瑟夫·特羅教授說,2012年的大選標志著在線廣告推介的一個分水嶺。空前的途徑和范圍,全美政治大選組織運用幾百件細碎的、有關(guān)個人在線和離線的生活信息以確保他們認為的“正確的”人被“正確的”信息所命中。“但是我們也發(fā)現(xiàn),與市場營銷人員所宣稱的迥然不同的是,大多數(shù)成年美國人不希望根據(jù)他們的個人興趣來制造和推送政治廣告”。

    這個案例中似乎是很專業(yè)的分析“定向廣告”(Targeting advertising),即就個體數(shù)據(jù)的分析來決定“誰”應該接到勸說性的信息,“如何(how)、何時(when)”以及“出于什么原因”(for what reasons)。“量身定制性廣告”(Tailored advertising)意味著給某個獨特的個體打造某種勸說性的信息——這個定向的過程基于對這個獨特個體興趣和價值的分析結(jié)論。但是,這個所謂專業(yè)化的案例直指大數(shù)據(jù)的政治傳播實質(zhì),從批評的聲音中我們也看到,人們認為這樣的行為威脅了隱私權(quán)并侵蝕民主價值觀。市場營銷人士也包括政治競選活動顧問們則辯護說,這樣做可以給美國人他們實際想要的東西:與他們的關(guān)注焦點密切相關(guān)的政治廣告以及其他形式的內(nèi)容。

    從中國現(xiàn)實來看,以往每個個體,無論是從事何種工作,都具有很強的地域性、個體性、階段性,社會關(guān)系也或者類似“山藥蛋”——一個圈層一個圈層各自獨立,類似先生所總結(jié)的鄉(xiāng)土社會格局。在自己交往能力、經(jīng)濟能力以及權(quán)勢所能輻射的范圍內(nèi)活動,頂多再配上一些“煙花”——比如遠方親戚、外地工作親屬、外地同學等弱關(guān)系。尤其每個人的社會活動都相對比較封閉。

    但是,大數(shù)據(jù)互聯(lián)網(wǎng)背景下,每個人都觸網(wǎng)、上網(wǎng),成為社會大網(wǎng)絡(luò)上的一個物理性節(jié)點。在全國乃至全球物理性一張網(wǎng)的概念下,個體的任何活動都具有了可追溯性、可復原性,最重要的是可分析性。大型信息網(wǎng)站通過多維數(shù)據(jù)源來進行人的跟蹤和定位,精確把握用戶信息,并進行裸的掠奪式使用。除了GPS進行物理定位外,通過個人消費行為和習慣也可以進行人的性格乃至行為取向定位,比如瀏覽網(wǎng)頁、收發(fā)電子郵件、搜索關(guān)鍵詞和關(guān)心信息、手機號碼、網(wǎng)吧頻率。

    由此激發(fā)人們思考的是,每個人的個人信息都有哪些機構(gòu)在搜集,都有可能被用于何處?比如買手機有不同的公司,上網(wǎng)實名制,銀行,學校,單位,超市會員等等,都在進行著大眾個人化信息的搜集和匯總。

    那么,再進一步思考,又有多少外國機構(gòu)、利益集團乃至犯罪機構(gòu)等通過這些渠道進行跨國的、中國國民信息的搜集和分析,已經(jīng)將這樣的信息用向何方呢?第三,政治邊界內(nèi)涵改變和重組揭示大數(shù)據(jù)的國際傳播意義

    毋庸置疑,大數(shù)據(jù)將為人們認識世界和改造世界提供新的強有力工具,使人們能更加容易地把握事物規(guī)律,更準確地預測未來。亟需更寬大、長遠的頂層設(shè)計,以之來調(diào)適數(shù)據(jù)規(guī)模以及計算模式的革命給既往思維、管理模式帶來的挑戰(zhàn)。

    美國已經(jīng)將大數(shù)據(jù)提升到國家戰(zhàn)略層面上實施。美國是最先提出“大數(shù)據(jù)”概念并開展應用的國家,依靠其先進的信息技術(shù)以及數(shù)據(jù)科學的研究水平逐步建立起了系統(tǒng)的“大數(shù)據(jù)”基礎(chǔ)理論和應用模式,并在實際應用中積累了豐富的經(jīng)驗。2012年12月10日,美國國家情報委員會了名為《2030年全球趨勢——不一樣的世界》(Global Trends 2030:Alternative Worlds)的報告。這是全美情報界最高層級戰(zhàn)略評估性情報分析產(chǎn)品,提交給總統(tǒng),意在為其提供未來20年內(nèi)的全球趨勢預測,為白宮和情報界遠景戰(zhàn)略政策提供思考框架。報告反映了美國政府16個情報機構(gòu)對未來20年世界局勢的預判,其中提到的四類技術(shù)將影響2030年前全球經(jīng)濟、社會和軍事發(fā)展:信息技術(shù),制造和自動化技術(shù),資源相關(guān)技術(shù),衛(wèi)生保健技術(shù)。在信息技術(shù)領(lǐng)域,大數(shù)據(jù)存儲和處理技術(shù)、社交網(wǎng)絡(luò)技術(shù)以及智能城市技術(shù)等將改變?nèi)藗兊纳詈徒?jīng)營方式,社交媒體和網(wǎng)絡(luò)安全會成為新興市場。大數(shù)據(jù)的存儲和處理會協(xié)助政策制定者有效應對經(jīng)濟和治理的難題。

    大數(shù)據(jù)概念和實踐提示我們,在信息化時代,國家和機構(gòu)的權(quán)力半徑在一定程度上取決于風險預警和信息獲取的半徑。大數(shù)據(jù)技術(shù)提供了這樣一種可能,那就是物理和行業(yè)的邊界已經(jīng)被信息重新劃定,包括信息的獲取、處理和分析能力重組了國家的實際權(quán)力的發(fā)揮以及發(fā)揮的實質(zhì)性內(nèi)涵。舉例來說,一個國家的領(lǐng)土規(guī)模可能很大,但信息無障礙傳播和獲取分析處理能力低下的情況,有可能決定了這個國家或地區(qū)的權(quán)力延伸物理半徑很是狹小,以至于權(quán)力延伸和發(fā)揮影響的心理和生理半徑則會呈現(xiàn)一種疑竇重生和肢端萎縮的趨勢;相反,一個國家和另外一個國家的距離可能很遠,可是通過信息傳感器的充分布設(shè)以及信息處理能力的提升,另外一個國家可能會淪為信息強國的一個節(jié)點和包圍,喪失任何的信息主動權(quán)而深度為奴。

    余論

    20世紀著名的三論——信息論、系統(tǒng)論、控制論,在大數(shù)據(jù)時代充分得以驗證。

    第3篇

    在大數(shù)據(jù)時代中,大數(shù)據(jù)的應用效能、應用方便度、應用當?shù)馗采w面是未來大數(shù)據(jù)應用所關(guān)注的重點,而目前在大數(shù)據(jù)應用方面存在許多的問題,這些問題的存在影響了未來大數(shù)據(jù)的應用,如何解決這些問題,重現(xiàn)在開始從最基礎(chǔ)方面開始,解決這些問題是大數(shù)據(jù)未來應用的重要工作。本文首先列舉了目前大數(shù)據(jù)應用中存在的問題,分析了產(chǎn)生這些問題的原因,針對這種情況提出了基于基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)體系建立的解決方案設(shè)想,為未來大數(shù)據(jù)應用發(fā)揮更大效益的解決方法。

    【關(guān)鍵詞】大數(shù)據(jù) 基礎(chǔ)數(shù)據(jù)結(jié)構(gòu) 軟件工程 數(shù)據(jù)標準

    隨著智慧城市建設(shè)項目的開展,作為智慧城市建設(shè)的重要基礎(chǔ)就是圍繞大型基礎(chǔ)數(shù)據(jù)平臺的建設(shè),在業(yè)界定義為大數(shù)據(jù)時代的來臨。圍繞大數(shù)據(jù)的概念,在全國范圍內(nèi)的各領(lǐng)域各行業(yè)都在大數(shù)據(jù)的如何組織、如何應用、如何共享、如何關(guān)聯(lián)召開了各類研討會。大數(shù)據(jù)應用的云計算技術(shù)、數(shù)據(jù)倉庫技術(shù)等成為業(yè)內(nèi)討論的重要話題。本人認為,在做了這些工作后,應回過頭來看一看,無論數(shù)據(jù)量有多大,都離不開基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)與體系的建設(shè),在此要闡明的一個基本觀點就是在大數(shù)據(jù)時代更應該重視基礎(chǔ)數(shù)據(jù)結(jié)果的研究與應用。

    1 大數(shù)據(jù)的概念

    什么是大數(shù)據(jù), IBM 最早的定義是:將大數(shù)據(jù)的特征歸納為4個“V”(量Volume,多樣Variety,價值Value,速Velocity),或者說特點有四個層面:第一,數(shù)據(jù)體量巨大。大數(shù)據(jù)的起始計量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T);第二,數(shù)據(jù)類型繁多。比如,網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息等等。第三,價值密度低,商業(yè)價值高。第四,處理速度快。最后這一點也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。

    在大數(shù)據(jù)概念中的第一條是數(shù)據(jù)量大,這是大數(shù)據(jù)的特點,而卻隨著信息系統(tǒng)應用的深入,數(shù)量的數(shù)量級也在不斷的提高,這是毋容置疑的。我們在此要討論的是第二條數(shù)據(jù)類型繁多的問題。

    2 目前大數(shù)據(jù)應用存在的主要問題

    隨著信息化系統(tǒng)應用的深入,在社會、自然界、生活中所涉及的數(shù)據(jù)面越來越廣,由此使得數(shù)據(jù)類型也越來越多,數(shù)據(jù)類型的數(shù)量在不斷增加,這些數(shù)據(jù)類型之間的關(guān)系和相互關(guān)聯(lián)性也越來越復雜,大數(shù)據(jù)量下的數(shù)據(jù)應用造成了困難。數(shù)據(jù)結(jié)構(gòu)類型繁多造成問題主要表現(xiàn)在以下幾個方面。

    2.1 數(shù)據(jù)類型是有限量的認識不清楚

    未來大數(shù)據(jù)情況下,數(shù)據(jù)類型是有限量的還是無限量的概念模糊,為此首先要么明確一個基本的概念,那就是,數(shù)據(jù)類型在繁多,但是數(shù)據(jù)類型的數(shù)量是有限量的,只是這個限量的數(shù)量級大一些而已。在數(shù)據(jù)類型是有限量的情況下,對于解決數(shù)據(jù)類型繁多的方法是完全不同的。

    如果數(shù)據(jù)類型的量是無限量的,那么解決問題的方法是要研究解決數(shù)據(jù)類型問題的方式是研究規(guī)律,拿出解決問題的方式與方法,對于具體數(shù)據(jù)類型時,按照方式方法理論與技術(shù)去解決問題。如果數(shù)據(jù)類型是有限量的話,那么解決問題的方式就不只是從理論上的解決問題方法,而應該更加切合實際的去針對每一種數(shù)據(jù)類型直接進行研究,形成數(shù)據(jù)標準,指導各個系統(tǒng)對每一個具體數(shù)據(jù)類型的應用。

    2.2 相同數(shù)據(jù)在不同系統(tǒng)中的表現(xiàn)類型繁多

    由于系統(tǒng)開發(fā)方各自的開發(fā)經(jīng)驗、所開發(fā)系統(tǒng)的規(guī)模不同,系統(tǒng)應用方對系統(tǒng)要求不同,系統(tǒng)應用行業(yè)的不同,使得在開發(fā)過程中,對于數(shù)據(jù)類型的定義只遵循本系統(tǒng)使用需要進行定義,沒有完整的標準,即是有相應的國家或國際標準,也不能完全遵循。

    2.3 各個行業(yè)制定的標準相互矛盾

    各個行業(yè)在制定相應的標準時,是以滿足自身需要為主導,造成了數(shù)據(jù)類型在其數(shù)據(jù)定義時不但長度不同,就是數(shù)據(jù)類型都不相同。這也就造成了各個系統(tǒng)在未來大數(shù)據(jù)應用中出現(xiàn)了嚴重的數(shù)據(jù)應用障礙。

    2.4 大數(shù)據(jù)應用的實現(xiàn)效率低

    由于不同系統(tǒng)技術(shù)數(shù)據(jù)結(jié)構(gòu)的不統(tǒng)一,使得對于大數(shù)據(jù)的應用上要對不同系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)進行分析,構(gòu)建關(guān)聯(lián),而后才能進行數(shù)據(jù)的應用,這項工作的工作量大,技術(shù)含量高,降低數(shù)據(jù)的應用效率。這些都是事后分析數(shù)據(jù)存在的問題。

    2.5 數(shù)據(jù)浪費巨大

    由于數(shù)據(jù)各個系統(tǒng)間數(shù)據(jù)結(jié)構(gòu)的不同,加上分析手段的局限性,使許多的數(shù)據(jù)無法進行使用,由此也降低了數(shù)據(jù)的使用率。并造成數(shù)據(jù)的大量浪費。

    3 造成目前對大數(shù)據(jù)應用存在問題原因

    由于以上幾方面的問題存在,為了做好大數(shù)據(jù)的應用,許多相應的技術(shù)應運而生,數(shù)據(jù)倉庫技術(shù)、網(wǎng)格技術(shù)、云計算的數(shù)據(jù)處理技術(shù)等等。這些技術(shù)促進了數(shù)據(jù)應用的發(fā)展,提高了數(shù)據(jù)應用效率,為大數(shù)據(jù)應用發(fā)揮了巨大作用。但是這種做法只能針對具體的大數(shù)據(jù)應用項目起到作用,不能從根本上解決問題。那么造成這種問題根本是什么呢?

    3.1 理論基礎(chǔ)有偏差

    目前所有這些高精尖技術(shù)的發(fā)展,為大數(shù)據(jù)應用的發(fā)展起到了不可替代的作用,但是這些技術(shù)在理論出發(fā)點上存在偏差,那就是,這些技術(shù)的理論出發(fā)點設(shè)定的是,數(shù)據(jù)類型是無限量的,是無窮盡的,所以所有的技術(shù)研究都不面對具體的數(shù)據(jù)項,這樣做的結(jié)果是促進技術(shù)的發(fā)展,弊端是不能面對具體的應用,所有的技術(shù)應用都要在這就技術(shù)下進行二次應用研究。也就是,這些理論是治標不治本的做法。

    有限量數(shù)據(jù)類型與無限量數(shù)據(jù)類型是兩個根本不同的概念,對于技術(shù)的發(fā)展影響也是完全不同的。為此,目前在無限量數(shù)據(jù)類型概念下的大數(shù)據(jù)應用技術(shù)與體系將會存在極大的局限性,對未來的大數(shù)據(jù)應用造成影響。

    3.2 對大數(shù)據(jù)認識有偏差

    目前在各個系統(tǒng)對大數(shù)據(jù)的應用中,對大數(shù)據(jù)的認識是,只要有足夠量的數(shù)據(jù),就是大數(shù)據(jù),而對于數(shù)據(jù)之間的關(guān)系,整體的數(shù)據(jù)結(jié)構(gòu)體系沒有很深的認識,甚至將原有的多個分散的系統(tǒng)中的數(shù)據(jù)庫,做一個小的關(guān)聯(lián)數(shù)據(jù)庫,就認為是數(shù)據(jù)云計算,就是綜合數(shù)據(jù)平臺了,而在這種情況下,對于大數(shù)據(jù)的應用,因為系統(tǒng)的獨立,數(shù)據(jù)庫的獨立、數(shù)據(jù)結(jié)構(gòu)的不統(tǒng)一造成了大數(shù)據(jù)應用的瓶頸和障礙,在系統(tǒng)應用到一定程度后,數(shù)據(jù)量是很大,但是無法進行大數(shù)據(jù)應用,或者說是要進行大數(shù)據(jù)的應用,需要另外投入很高的成本進行數(shù)據(jù)整理、數(shù)據(jù)管理和數(shù)據(jù)分析。所以應該明確的是,在數(shù)據(jù)結(jié)構(gòu)混亂的情況下,在大的數(shù)據(jù)量也不能稱為大數(shù)據(jù),這個觀念上的偏差,是造成目前數(shù)據(jù)應用困難的原因之一。

    3.3 數(shù)據(jù)結(jié)構(gòu)不規(guī)范

    這些情況的出現(xiàn),歸結(jié)的一起,就是數(shù)據(jù)結(jié)構(gòu)不規(guī)范,不統(tǒng)一。在三方面主要原因造成這個局面,一是目前的應用系統(tǒng)的開發(fā),由不同的公司進行,每個開發(fā)單位對數(shù)據(jù)結(jié)構(gòu)的定義有各自的標準,基本都是按照多年開發(fā)經(jīng)驗總結(jié)出來的,因此各個公司開發(fā)的系統(tǒng)在數(shù)據(jù)結(jié)構(gòu)上相差很遠。二是對于同一個公司不同時期開發(fā)的系統(tǒng)所涉及的數(shù)據(jù)結(jié)構(gòu)不統(tǒng)一,到后期,開發(fā)單位不愿意在投入成本對前期開發(fā)的系統(tǒng)進行重新開發(fā),這就造成了前期開的的系統(tǒng)中的數(shù)據(jù)結(jié)構(gòu)與后期開發(fā)的數(shù)據(jù)結(jié)構(gòu)不統(tǒng)一。三是對于應用開發(fā)單位在開發(fā)每一個具體應用項目時,由于是不同的開發(fā)小組在進行,為此,在進行數(shù)據(jù)結(jié)構(gòu)設(shè)定時,只為了滿足本系統(tǒng)開發(fā)的需要,而沒有考慮系統(tǒng)未來的發(fā)展和系統(tǒng)的整體架構(gòu),這也造成了不同應用系統(tǒng)中對相同字段的設(shè)定不相同,數(shù)據(jù)結(jié)構(gòu)不統(tǒng)一。以上這些都是在應用系統(tǒng)開發(fā)過程中遺留的問題,而這些問題嚴重影響了大數(shù)據(jù)的使用。

    3.4 有統(tǒng)一的標準不用

    在系統(tǒng)開發(fā)過程中涉及的數(shù)據(jù)結(jié)構(gòu),許多都有相應的標準,主要有以下幾個方面,一是國家法律層面的,對于一些重要的數(shù)據(jù)要求以立法方式進行規(guī)范。二是國家標準,制定和規(guī)范了國家層面的有關(guān)方面的數(shù)據(jù)要求和限定。三是部頒標準,由各個部委辦局制定的相應標準,這些標準有一大部分直接針對信息化系統(tǒng)建設(shè)的應用和數(shù)據(jù)標準。四是行業(yè)標準,作為每一個行業(yè)內(nèi)進行行為約束的標準,這種標準雖然不具備強制性,但是在行業(yè)內(nèi)是一個自覺遵守的標準。四是國際相關(guān)標準,雖然國際標準沒有任何的法律約束性,但是為了走出去,各行各業(yè)都在遵循這個標準。

    這些標準都是在系統(tǒng)建立時的數(shù)據(jù)結(jié)構(gòu)依據(jù),但是目前許多系統(tǒng)在進行數(shù)據(jù)結(jié)構(gòu)設(shè)定時,都沒有按照這些標準執(zhí)行,而是根據(jù)自己系統(tǒng)的需要進行設(shè)定的。這使得許多的系統(tǒng)中的數(shù)據(jù)不能相互交換使用,由此而影響了大數(shù)據(jù)的應用。

    3.5 不同行業(yè)對標準的設(shè)定不統(tǒng)一

    在國家標準體系中,由于標準制定的年代不同,同是一個部門頒布的標準對相同的數(shù)據(jù)要求也不同,各個部門由于獨立制定標準,同樣出現(xiàn)相同數(shù)據(jù)在不同部門制定的標準中規(guī)定的不同,這幾方面原因也就造成了即使遵照標準,也存在著相同數(shù)據(jù)在不同應用系統(tǒng)中的數(shù)據(jù)結(jié)構(gòu)不同的現(xiàn)象。

    以上是大數(shù)據(jù)應用問題出現(xiàn)的主要原因,作為大數(shù)據(jù)應用的剛剛起步階段,應針對這些問題進行研究給出相應的解決方案,為未來大數(shù)據(jù)應用的發(fā)展打下一個良好的基礎(chǔ),避免今后的大數(shù)據(jù)應用走彎路。

    4 解決大數(shù)據(jù)應用問題的對策

    解決大數(shù)據(jù)應用存在的問題,應從最基礎(chǔ)的數(shù)據(jù)結(jié)構(gòu)建立開始,從根本上去解決問題,也為未來大數(shù)據(jù)應用的發(fā)展打下一個良好的基本數(shù)據(jù)結(jié)構(gòu)基礎(chǔ),對此提出以下幾方面的對策。

    4.1 開展和加強對基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)建立的理論研究

    從軟件工程學的角度出發(fā),以數(shù)據(jù)結(jié)構(gòu)類型是有限量的概念為依托,圍繞具體的數(shù)據(jù)類型開展數(shù)據(jù)結(jié)構(gòu)體系的理論研究。依托一個數(shù)據(jù)結(jié)構(gòu)分類的理論體系來支撐整個數(shù)據(jù)結(jié)構(gòu)體系的劃分,其中包括劃分方法、劃分層次、劃分的軟件工程學理論支撐等內(nèi)容,制定大數(shù)據(jù)底層數(shù)據(jù)結(jié)構(gòu)劃分的理論體系,形成在大數(shù)據(jù)下的數(shù)據(jù)結(jié)構(gòu)構(gòu)建的理論體系。

    4.2 開展對具體數(shù)據(jù)結(jié)構(gòu)的研究

    按照建立的數(shù)據(jù)結(jié)構(gòu)理論體系要求,對每一個具體數(shù)據(jù)結(jié)構(gòu)進行研究,針對數(shù)據(jù)項的名稱、類型、含義、層次、結(jié)構(gòu)、與其他數(shù)據(jù)的關(guān)系、涉及內(nèi)容規(guī)定等方面制定出具體數(shù)據(jù)的標準。這項工作可以在有組織的情況下由全社會共同參與,按照指導理論的要求進行研究,這樣,隨著應用系統(tǒng)的不斷深入,所涉及的數(shù)據(jù)類型項將逐步擴展,最終實現(xiàn)數(shù)據(jù)的全覆蓋,而完成整個架構(gòu)體系的建立。

    4.3 制定相應的數(shù)據(jù)結(jié)構(gòu)標準

    對于由各個方面制定的數(shù)據(jù)結(jié)構(gòu)進行分類、篩選、審核,而后想這些結(jié)構(gòu)形成一個統(tǒng)一的架構(gòu)體系,制定相應的技術(shù)標準,通過這個標準來規(guī)范應用系統(tǒng)的開發(fā),形成完整的、規(guī)范的、統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)體系,為大數(shù)據(jù)應用打下堅實的基礎(chǔ)。

    4.4 成立相應的機構(gòu)來負責這項工作的完成

    對于這項工作的開展,應在軟件工程相應的有關(guān)組織下,建立一個專門的機構(gòu),負責指導這項工作的完成。由這個機構(gòu)成立專門的實驗室,負責整體架構(gòu)的制定,數(shù)據(jù)類型項的搜集、分類、篩選,并形成統(tǒng)一的數(shù)據(jù)庫體系,為所有的應用系統(tǒng)的開發(fā)提供數(shù)據(jù)庫基礎(chǔ)支撐和服務。

    綜上所述,通過對基礎(chǔ)數(shù)結(jié)構(gòu)的研究與體系的建立,從根本上解決大數(shù)據(jù)應用的效率,充分發(fā)揮未來大數(shù)據(jù)的作用,簡化大數(shù)據(jù)應用的方式與過程。

    參考文獻

    [1]嚴霄鳳,張德馨.大數(shù)據(jù)研究[J].計算機技術(shù)與發(fā)展,2013(04).

    [2]李學龍,龔海剛.大數(shù)據(jù)系統(tǒng)綜述[J].中國科學:信息科學,2015(01).

    [3]方璐.大數(shù)據(jù)時代的科學研究方法[J].浙江工業(yè)大學,2014.

    作者簡介

    李鏵(1962-),男,江蘇省無錫市人。學士學位,現(xiàn)為無錫科技職業(yè)學院教師、高級工程師。主要研究方向為軟件工程學、物聯(lián)網(wǎng)概論。

    主站蜘蛛池模板: 国产成人AV区一区二区三| 久久久精品日本一区二区三区| 成人免费一区二区三区在线观看| 一区二区国产在线观看| 国产福利无码一区在线| 69福利视频一区二区| 国产午夜精品一区二区三区嫩草| 无码一区二区三区亚洲人妻| 中文激情在线一区二区| 亚洲一区二区三区免费观看| 中文字幕人妻无码一区二区三区| 精品一区二区三区在线视频观看| 国产日本亚洲一区二区三区| 色婷婷一区二区三区四区成人网 | 亚洲AV无码一区二区三区DV| 亚洲A∨精品一区二区三区| 日韩精品一区二区三区在线观看l| 亚洲福利一区二区精品秒拍| 无码人妻精品一区二区在线视频| 国产精品免费一区二区三区四区| 国产无套精品一区二区| 成人免费一区二区三区| 熟女大屁股白浆一区二区| 国产午夜三级一区二区三| 国产午夜精品一区二区三区小说| 精品国产毛片一区二区无码| 国内精品无码一区二区三区| 中文字幕日本精品一区二区三区| 果冻传媒一区二区天美传媒| 国产在线精品一区二区三区直播| 亚洲综合无码精品一区二区三区| 国产婷婷色一区二区三区| 久久久无码精品国产一区| 99精品国产一区二区三区不卡| 久久久久人妻精品一区| 无码中文字幕乱码一区 | 亚洲区精品久久一区二区三区| 日韩人妻不卡一区二区三区| 精品乱码一区二区三区四区| 日本国产一区二区三区在线观看 | 成人免费观看一区二区|