search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

【學術】大數據標準化現狀與發展思路研究:產業發展視角

摘要

隨著信息技術和經濟社會的融合發展,數據已成為國家基礎性戰略資源,大數據對推動創新創業、轉型升級,提升國家治理能力的作用日益顯著。本文結合大數據研究現狀,分析了國內外各標準組織開展的大數據標準化工作的情況和進展,在對比分析基礎上剖析了大數據標準化研究工作所存在的主要問題。結合上述問題從大數據產業發展的角度,提出了未來大數據標準化發展的思路和建議。

關鍵詞:大數據,大數據標準化,大數據產業

1 引 言

從2012年大數據元年到如今,大數據(Big Data)作為一場遍及學界和業界的技術革命,悄然改變著我們的學習、生活和思維方式。儘管業界對大數據並未給出一個統一的定義,但對於大數據的基本特徵已經能取得廣泛的共識,Yuri Demchenko等在大數據4V特徵的基礎上提出了5V的觀點,即數據體量巨大(Volume)、數據種類繁多(Variety)、數據時效性強(Velocity)、數據價值密度低(Value)和數據真實性(Veracity)。在大數據及與大數據相關的數據挖掘、機器學習、人工智慧等領域,目前已積累了豐富的實踐和研究成果。當前,大數據發展不再局限於某一或者某幾個學科領域,而是成為跨越計算機科學、數學、統計學、經濟學和工程學等眾多學科的交叉領域。大數據的5V特徵使得對於數量巨大、高維和非結構化的數據進行採集、清洗、分析、呈現、存儲等都帶來較大的困難,數據規模的質變帶來的問題迫切需要相應的技術標準予以指導和規範。業內認為大數據代表著數據作為一種資源在日常經濟實踐中扮演的重要角色,與其相關的環境包括技術、產業和政策等會交互影響,以數據採集存儲、加工分析、數據服務等為主的大數據產業也逐漸成為信息技術產業中一個主要經濟增長點。

根據互聯網數據中心(IDC)統計和預測,2016全球大數據市場規模年增長率達40%,在2017年將達530億美元。信息產業在「十二五」期間積累的信息資源、技術創新和應用突破等優勢為「十三五」 時期大數據產業進一步發展奠定了紮實的基礎。從數據資源到產業體系,目前大數據產業發展已具備良好的基礎,但也存在像技術創新不強與產業支撐體系較弱等問題。如何加快大數據標準化研究工作,充分發揮大數據標準化對於大數據產業發展支撐能力,是當前需要解決的重要現實問題。本文在分析國內外大數據標準化研究工作的基礎上,對比國內外大數據標準化發展特徵,總結出目前大數據標準化發展的3個特徵,從標準對產業的支撐作用的角度對大數據標準化研究工作提出一些建議與展望。

2 大數據標準化研究現狀

隨著大數據相關技術的發展與應用,國內外眾多標準化組織啟動了大數據標準的研究和制定工作, ISO、IEC、ITU等國際標準化組織,美國國家標準與技術研究院(NIST)、信息技術標準化技術委員會(TC 28)等組織相繼建立了標準化工作組並開展相關工作。截至目前,各標準化組織已經出台了一系列大數據標準,取得了明顯的進展。但就大數據整體技術體系和發展規模而言,當前大數據標準化研究仍處於起步階段,與產業發展水平和需求仍不相稱。本文就以上各標準化組織關於大數據標準化研究歷程和目前取得的一些成果進行一個簡單的梳理,旨在釐清當前大數據標準化研究現狀。

2.1 國外大數據標準化研究現狀

ISO和IEC大數據標準化研究工作主要由其聯合技術委員會——JTC1負責,包括ISO/IEC JTC1 WG9工作組和ISO/IEC JTC1 SC32分技術委員會。

ISO/ IEC J TC1 WG9工作組是於2014年11月成立的大數據工作組,主要負責研製包括參考架構和術語在內的基礎性大數據標準;對潛在的大數據標準化需求進行識別和認定;保持和大數據相關的JTC1其他工作組之間的聯繫等。ISO/IEC JTC1 WG9的最近一次會議於2016年10月12日在北京召開,會議討論了過去兩年來WG9工作組一直在研製的大數據標準:ISO/IEC TR20547-1《信息技術-大數據參考架構-第1部分:框架和應用過程》、ISO/IEC TR 20547-2《信息技術-大數據參考架構-第2部分:用例和派生要求》、ISO/IEC TR20547-3《信息技術-大數據參考架構-第3部分:參考架構》、ISO/IEC TR 20547-5《信息技術-大數據參考架構-第5部分:標準路線圖》,並決定這4個部分標準的研製進度,其中第2部分將於2017年6月發布。

ISO/IEC JTC1 SC32是數據管理和交換工作分技術委員會,是與大數據最為密切相關的標準化組織。該分技術委員會致力於研究信息技術系統下的數據管理和交換標準,以期協調不同行業之間數據交換。ISO/IEC JTC1 SC32主要研究的大數據標準內容包括:對現有數據標準和新制定的標準框架進行協調;研究用於持久性數據存儲、併發式數據訪問和互動式數據協議等標準;用於元數據構造和註冊及各類信息資源交互方法、語言服務和協議等標準。SC32下包括4個工作組:WG1電子業務、WG2元數據、WG3資料庫語言和WG4 SQL多媒體和應用包。

ITU曾在2013年11月發布了有關大數據的技術觀察報告,該報告對彼時尚未新興的有關大數據應用案例進行了剖析,對大數據的基本特徵和大數據應用技術進行了深度的解釋,並對大數據可能面臨的挑戰以及ITU-T要開展的標準化工作進行了初步的說明。ITU-T認為大數據面臨的最大挑戰在於數據保護、隱私和網路安全,以及相關法律法規的制定等問題。ITU-T目前開展的標準化工作包括大數據網路基礎設施;網路數據抓取、挖掘和分析標準;開放數據標準等。其大數據標準化工作主要由SG13(第13 研究組)負責展開,下設Q2(第2課題組)、Q17(第17 課題組)和Q18(第18課題組)3個課題組,其中Q2主要研究「物聯網大數據的能力需求」,已於2016年6月完成報批;Q17的主要研究課題為「基於雲計算的大數據需求和能力」,該課題相關的標準已於2015年8月發布;Q18涉及的研究課題為「大數據即業務的功能架構」,相關的標準研製也於2016年10月報批。3個課題組以Q17牽頭開展大數據標準化研究工作並負責向TSAG(電信標準化諮詢委員會)彙報。

2.1.2 國外主要國家大數據標準化研究現狀

NIST(美國國家標準與技術研究院)針對大數據標準化工作成立了大數據公共工作組(N BD - PWG),其工作宗旨是將業界、學界和政府在有關大數據定義、術語、安全參考體系結構和技術路線圖的內容上形成一致性意見。工作組認為大數據技術在當前和未來應用中應滿足互操作、可移植性、可用性和擴展性需求等要求。該工作組目前共有5個分組,分別是術語和定義、用例和需求、安全與隱私、參考體系結構和技術路線圖,截至2016年底工作組已完成《大數據定義》《大數據分類》《大數據用例和需求》《大數據安全和隱私需求》《大數據參考架構調研白皮書》《大數據參考架構》和《大數據技術路線圖》等輸出物V2.0版本。

英國政府早在2011年就發布了大數據研究戰略決策,其後又成立了世界上首個非盈利性質的開放數據協會(Open Data Institude,ODI),在加快英國大數據開放和釋放商業潛力等方面效果顯著。但在大數據標準研究方面,BSI(英國標準協會)近兩年才逐漸重視大數據標準研究工作,BSI認為目前英國已有超過35000條由BSI制定的標準,但與大數據及信息技術相關的標準則少之又少。在2016年上半年發布的研究報告中,BSI從6個方面對大數據潛在標準進行了歸納和研究,包括大數據指導標準、元數據標準、術語和條件標準、消費者數據管理標準、大數據交流標準以及大數據的制定標準等。

日本曾在2013年由安倍政府頒布「創建最尖端IT國家」戰略,認為在2020年前日本信息產業都將以大數據為核心。在大數據標準方面,日本並未有專門機構來研究,日本政府在2013年底首次制定大數據相關標準,對大數據搜集和相關隱私規範進行了界定,後來又有日本大數據科學家資格標準,但就整體而言,日本目前尚未形成大數據標準體系。

2.2 國內大數據標準化研究現狀

在大數據浪潮下,大數據標準化研究工作在工信部和國標委的支持下也得以快速展開。2014年2月,全國信息技術標準化技術委員會(TC28)成立大數據標準工作組,主要負責研製大數據領域的標準體系,對大數據相關技術標準展開研究。國務院在2015年8月發布的《促進大數據發展行動綱要》明確指出要「建立標準規範體系,推進大數據產業標準體系建設,加快建立政府部門、事業單位等公共機構的數據標準和統計標準體系,推進數據採集、政府數據開放、指標口徑、分類目錄、交換介面、數據質量、數據交易、技術產品、安全保密等關鍵共性標準的制定和實施。加快建立大數據市場交易標準體系。開展標準驗證和應用試點示範,建立標準符合性評估體系,充分發揮標準在培育服務市場、提升服務能力、支撐行業管理等方面的作用。積极參与相關國際標準制定工作」。為了加快大數據相關標準的研製,信標委大數據標準工作組於2015年7月成立7個研究專題組:總體專題組、國際專題組、技術專題組、產品和平台專題組、安全專題組、工業大數據專題組、電子商務大數據專題組,以此來研究大數據領域不同方向的標準化工作。截至2016年底,除去申請立項的大數據標準,工作組在研的國家標準名稱和進展見表1。

電子技術標準化研究院聯合信標委於2014 年7月發布了《大數據標準化白皮書V1.0》,並於2015年12月和2 016年5月發布了《大數據標準化白皮書V2.0》和《大數據標準化白皮書(2016)》版本,對當前大數據的基本概念、特徵與作用、發展現狀與趨勢分析、大數據關鍵技術、大數據標準化現狀、大數據標準體系和今後一段時間內大數據工作重點的一些建議進行了詳細且全面的闡述,這是大數據標準化工作的一個里程碑事件。

作為通信行業的標準化研究組織和管理單位,通信標準化協會(CCSA)近年來也相繼開展了大數據標準化研究工作,目前CCSA在研的11個大數據標準化項目涉及大數據需求架構、大數據可視化技術、大數據環境下數據質量要求與數據質量評估方法,以及電信互聯網大數據開放平台標準化研究等方面。

2.3 國內外大數據標準化研究對比

從上述兩節可以看出,隨著大數據技術發展逐漸成熟,大數據標準化研究工作已有加速發展之勢。就總體而言,儘管國內外研究程度不一,但大數據標準化研究工作仍處於起步階段,而且這個階段會隨著大數據技術的持續創新而長期存在。大數據標準從本質上而言是一種技術標準,技術標準的一個重要特徵是其成功與否很大程度上取決於技術與市場對該領域的雙重影響。大數據標準作為一種需求導向型標準,技術與市場的內在驅動是其不斷發展與完善的動力,目前大數據標準化研究工作正是因此而不斷發展。技術標準在成為市場事實標準的過程中,通常會經過研發階段、產業化階段和市場化階段[6],當前大數據標準仍然處於大數據技術標準研發階段,且大數據標準化工作與大數據處理技術耦合度較低,數據開放共享程度低,進一步推動大數據標準與技術的融合是未來發展需要面對的一個關鍵問題。

就國內大數據標準化研究現狀而言,目前在該領域研究特徵表現為在宏觀體系架構上已有顯著進展,如:信標委提出的大數據標準體系為整個大數據標準化工作指明了方向,但在具體某個大數據技術分支領域的標準上,目前的研究尚不充分。從《大數據標準化白皮書(2016版)》中整理出的目前已發布、已報批、已立項、在研以及擬研製的99項大數據相關的國家標準進行分類別統計,統計結果顯示目前已立項、擬研製和在研的大數據相關標準有69項,總比例近70%(見表2),分佈在大數據標準體系的各個子類別中。可見大數據標準化研究工作雖有整體框架,但具體研究工作仍然總體處於研究階段。而國外標準化組織在進行大數據標準化研究時,更側重於對具體標準的研製工作,這一點可以從ISO/IEC JTC1 SC32和ITU-T對於不同大數據領域分為不同的工作組和課題組進行標準研究看出。

最後,大數據標準對產業的支撐能力相較於歐美國家弱,標準研究與產業應用還有較大差距。ITU-T和NIST都較早就形成了大數據標準化工作機制,在大數據基礎標準、技術體系和核心架構上早已研製出一批能夠對本國大數據產業有足夠支撐力的大數據標準,大數據技術研發實驗室、大數據產業創新平台和產業聯盟等大數據產業支撐平台也逐漸完善,且大數據標準和產業平台之間存在較強的互動關係。反觀現狀,一方面大數據標準自身相對不成熟,另一方面標準制定和產業發展之間的關聯性也較弱,因而總體上大數據標準對產業發展的支撐力不強。我們根據相關產業聯盟工作範圍和應用中涉及標準的多少來定義標準參與程度,表3列出了部分大數據產業聯盟標準參與程度信息,可以看出目前國內各大數據產業聯盟的標準參與程度總體偏低, 足以證明大數據標準對產業的支撐力較弱。

3 產業視角下大數據標準發展思路與建議

目前,大數據產業正處於高速發展期,不同種類的商業模式逐漸得到市場印證,新產品和新服務的不斷推出使得大數據市場開始走向差異化競爭。根據「十三五」大數據產業規劃統計,目前已有295家跨地區經營互聯網數據中心(IDC)。雲計算平台服務已趨於成熟,產業格局已初步顯現,數據處理規模和處理能力已處於世界領先地位,為大數據提供強大的計算存儲能力。一些新的產業模式和產業形態開始在大數據技術和應用領域湧現,逐步形成頂尖互聯網企業引領,其他企業互動互惠的產業格局。在生產要素方面,大數據技術和產業服務吸收社會資本的能力逐年提升,與大數據領域相關的創業市場也成為熱點。「十三五」時期國內外產業技術將不斷迎來變革,國內大數據市場將面臨集中爆發期,大數據產業發展將面臨重要的機會和挑戰。

針對目前大數據標準化研究現狀和大數據產業發展現狀,結合國內外大數據標準化研究比較分析結果,本文從大數據產業發展的角度提出未來大數據標準化研究工作建議。

3.1 加快數據共享開放標準的研製

作為在數據量上僅次於美國的數據大國,目前僅有8%的互聯網企業有關於數據租售服務的業務。雖然在大數據發展上具有較好的數量優勢,但相較於網路大數據和企業大數據的應用,對政府大數據的利用是微乎其微的,企業幾乎無法利用政府的數據進行決策來提高社會生產力,更遑論推進大數據產業的發展。因此,加快對大數據共享開放標準的研製是極為關鍵的一步。具體建議包括:建立類似於data.gov.cn 這一國家級的數據開放網站。從數據可獲性、可分類性、異源融合、安全性等多角度全面地設計和實施建設大數據開放平台,增強數據資源的可獲得性;對數據資源的採集、存儲和處理制定國家標準,提高標準數據集的開放共享程度。

3.2 重點制定數據安全和隱私保護標準

大數據與數據安全、隱私保護本身就是一個矛盾體。隨著數據分析與數據挖掘技術成為大數據時代的核心技術環節,如何確保數據安全和保護用戶隱私成為各方都不可避免的問題。目前,在這方面不僅法律法規上相對滯后,在標準上也處於起步階段,當前關於大數據安全和個人信息保護的標準均還處於擬研製和在研狀態,現階段的數據安全和隱私保護的標準化研究工作並不足以為大數據產業發展創造健康的外部環境。當前大數據技術仍在快速發展,新的技術使得數據安全和隱私保護需要與時俱進的標準,應儘早重點研製出數據安全和隱私保護方面的法律、法規和標準。

3.3 加強以應用需求為導向的標準研究

2017年1月發布的《大數據產業發展規劃》明確提出要加強大數據在重點行業領域的深入應用,規劃指出要推動電信、能源、金融、商貿、農業、食品、文化創意、公共安全等行業領域大數據應用,推進行業數據資源的採集、整合、共享和利用,突出顯現大數據在產業應用中的價值,加快傳統行業與大數據生態的融合,利用大數據改革傳統行業的經營管理方式。我們通過《大數據標準化白皮書(2016版)》中整理出的99項擬研製、在研、已立項、已報批的大數據標準,以應用需求為導向的標準項目僅有7項,包括2項工業大數據標準和5項電子商務大數據標準,其中有當前大數據標準化研究工作剛剛起步的原因,但也從側面反映出當前大數據標準化研究工作並未以應用需求為導向。大數據應用需求是大數據產業的發展動力,也應該成為大數據標準化的發展動力。以市場應用需求為導向,將提升大數據標準對於大數據產業發展的支撐作用。因此,結合《大數據產業發展規劃》,未來大數據標準化工作應以這些重點行業領域的應用為導向,重點研製出一批有關於行業應用需求的大數據標準。

3.4 鼓勵和探索大數據團體標準形成機制

作為由市場機制產生的標準,社會團體標準對於發揮社會組織作用和激發市場主體活力,以及更好地發揮市場在標準化資源配置中的作用具有顯著影響。目前大數據標準制定工作方興未艾,而由社會團體主導制定的大數據標準幾乎沒有,鼓勵和探索大數據團體標準形成機制,把大數據標準產生機制由政府決定交給市場決定,既可防止大數據標準與市場發展相脫節,又可完善大數據標準形成機制,加快推進大數據標準化工作。

在具體建議上,我們認為,可率先在部分互聯網經濟和大數據產業發達的地區和城市進行大數據社會團體標準的試點工作,在試點實踐中不斷完善大數據社會團體標準的制定、實施及其他管理方法,在大數據團體標準成熟之後也可將其轉化上升為地方標準乃至國家標準。

3.5 建立和完善大數據標準測試和認證體系

在大數據標準研製過程中,當前還缺乏一套能夠對大數據標準進行權威、多樣化、面向商用的標準測試方法和認證體系,以促進大數據產業健康有序發展。此前信標委曾啟動過《信息技術 大數據 系統通用規範》等標準的研製工作,成為第一個面向大數據商用系統的分級測評體系,但對於整個大數據標準體系而言還遠遠不夠。在「十三五」期間,應加大對大數據標準試驗驗證和符合性檢測平台的建設力度,對第三方機構獨立建立測試認證平台給予政策優惠。

4 結 語

本文在對比分析國內外大數據標準化研究工作的基礎上,從大數據產業發展的角度總結了目前大數據標準化工作所存在的問題,並從標準對產業發展支撐的角度對未來大數據標準化工作提出了建議。結合大數據標準化研究工作,合理布局大數據基礎設施,構建大數據產業發展公共服務平台,建立大數據發展評估體系等都是未來繁榮大數據產業的應有之舉。

宋明順:計量大學經濟與管理學院,教授,博士,主要研究方向為質量管理與標準化。

魯偉:計量大學經濟與管理學院,研究所,主要研究方向為可靠性統計。

鄭素麗:計量大學經濟與管理學院,教授,博士,主要研究方向為技術創新與知識產權管理。

基金項目

本文由國家社會科學基金(基金編號:15BTJ016)和浙江省重點軟科學項目(項目編號:2016C25005)資助。

參考文獻

[1] Demchenko Y, Laat C D,Membrey P.Defining architecture components of the Big Data Ecosystem[C]//International Conference on Collaboration Technologies and Systems. IEEE, 2014:104-112.

[2] 迪莉婭. 大數據產業發展研究[J]. 科技進步與對策, 2014(4):56-60.

[3] 電子技術標準化研究院. 大數據標準化白皮書V2.0[R].北京:電子技術標準化研究院,2016.

[4] BSI Standards Limited. Big Data and standards market research: Circle research[J].2016,1.

[5] 中華人民共和國國務院. 促進大數據發展行動綱要[J].成組技術與生產現代化, 2015, 32(3):51-58.

[6] 王道平, 韋小彥, 方放. 基於技術標準特徵的標準研發聯盟合作夥伴選擇研究[J]. 科研管理, 2015, 36(1):81-89.

[7] 《大數據產業發展規劃》編寫組. 「十三五」大數據產業發 展規劃[R]. 2017,1.

[8] 康俊生, 晏紹慶. 對社會團體標準發展的分析與思考[J]. 標準科學, 2015(3):6-9.

[9]大數據測評體系建設正在不斷推進[EB/OL].(2016-06-07)[2017.3]http://www.forestry.gov.cn/portal/xxb/s/2526/ content-878371.html.

關注「標準化」「標準化」旗下刊物《標準化》《標準化海外版《標準科學》《標準生活》《產品安全與召回》


熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦