數(shù)字標(biāo)牌網(wǎng) 服務(wù)熱線:400-6787-360 | 投稿郵箱 | 會(huì)員登錄 | 免費(fèi)注冊(cè) | 設(shè)為首頁 | 加入收藏 | RSS | 客戶服務(wù) | 月刊訂閱 | |||
|
![]() |
四個(gè)“V”精準(zhǔn)概括何為大數(shù)據(jù)
大數(shù)據(jù)(Big Data)是近年才出現(xiàn)的IT熱詞,而且如今跟各種IT人士交流的時(shí)候,仿佛不提大數(shù)據(jù)這個(gè)詞就跟落伍似的。但是到底什么是大數(shù)據(jù)?大數(shù)據(jù)是單指數(shù)據(jù)量大嗎?這可能是很多人會(huì)提出的問題。
筆者從百度百科和ZOL存儲(chǔ)論壇中查了一些資料,雖然資料很多,但是相似度較大,很多資料生澀令人難懂。筆者在這里希望跟大家交流一下我對(duì)大數(shù)據(jù)學(xué)習(xí)后的一些總結(jié),希望能讓您對(duì)云計(jì)算有個(gè)全新的了解。
首先我們可以從百度百科中查看到大數(shù)據(jù)的概念:大數(shù)據(jù)(big data),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。
通過上面的定義,可能很多人依然不能夠徹底的了解大數(shù)據(jù),其實(shí)業(yè)內(nèi)專家已經(jīng)將大數(shù)據(jù)的特點(diǎn)給我們做了形象的描述,簡稱4個(gè)“V”:Volume、Variety、Velocity、Value。
大數(shù)據(jù)的4個(gè)“V”是目前人們形容大數(shù)據(jù)用到最多也是大家比較公認(rèn)的大數(shù)據(jù)特點(diǎn)。這4個(gè)“V”從四個(gè)層面對(duì)大數(shù)據(jù)進(jìn)行了比較形象的描述。即更大的容量(Volume,從TB級(jí)躍升至PB級(jí),甚至EB級(jí))、更高的多樣性(Variety,包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)),以及更快的生成速度(Velocity)。前面三個(gè)“V”的組合推動(dòng)了第四個(gè)因素——價(jià)值(Value)。
這四個(gè)“V”讓用戶能夠更形象的了解大數(shù)據(jù)。我們可以看出大數(shù)據(jù)不但有型(數(shù)據(jù)大),而且更有財(cái)(數(shù)據(jù)價(jià)值),四個(gè)“V”雖然看起來簡單、易懂 ,但卻又是對(duì)大數(shù)據(jù)的一個(gè)總體的闡述,這4個(gè)“V”的相互作用才形成了如今的大數(shù)據(jù)。
讀了這些內(nèi)容,網(wǎng)友有可能會(huì)問,大數(shù)據(jù)為什么受到這么多的關(guān)注?怎么可以說大數(shù)據(jù)是IT界發(fā)展的潛力股呢?請(qǐng)看下文:
大數(shù)據(jù)數(shù)量大但還擁有大的價(jià)值
爆炸式增長 大數(shù)據(jù)到底有多大?
隨著移動(dòng)計(jì)算的發(fā)展,如今的數(shù)據(jù)呈現(xiàn)爆炸式的增長,但是是大數(shù)據(jù)到底有多大呢?或者是多大的數(shù)據(jù)才能被稱為大數(shù)據(jù)呢?
數(shù)據(jù)呈現(xiàn)爆炸式增加,我們熟知的G(1G=1千兆,即2的30次方字節(jié))和T(即1千G)已經(jīng)不能衡量存儲(chǔ)的數(shù)據(jù),如今PB,EB甚至ZB等更多的容量單位已經(jīng)出現(xiàn)。舉例:百度首頁每天就要從超過1.5PB的數(shù)據(jù)中進(jìn)行挖掘,這些容量的數(shù)據(jù)如果打印出來的就將超過5千億張A4的紙,全部摞起來的話就要超過4萬公里高,接近地球的同步衛(wèi)星軌道,平鋪可以鋪滿海南島。
到2012年年底,全球數(shù)據(jù)總量將達(dá)到2.7ZB,到2015年將達(dá)到8ZB,而這種增長的趨勢并不是遞增的方式,而是爆炸式增長。據(jù)麥肯錫預(yù)測,到2020年全球數(shù)據(jù)使用量要暴增44倍(不是生產(chǎn)量,而是使用量)達(dá)到35.2ZB。只需兩天就能創(chuàng)造出自文明誕生以來到2003年所產(chǎn)生的數(shù)據(jù)總量,這是一個(gè)多么大的數(shù)據(jù)。
數(shù)據(jù)是資源 大數(shù)據(jù)的價(jià)值有多大?
很多人通常會(huì)認(rèn)為大數(shù)據(jù)就是只數(shù)量很大的數(shù)據(jù),如果單純的用數(shù)量大來形容大數(shù)據(jù)是并不確切的,前面的4個(gè)“V”已經(jīng)非常形象的描述的什么是大數(shù)據(jù)。數(shù)量大只是之中的一個(gè)元素,而最核心的依然是價(jià)值。
能夠發(fā)掘價(jià)值的數(shù)據(jù)才擁有意義,數(shù)據(jù)就像我們的資源,如空氣、水、石油和煤炭一樣。我們能夠從這些資源中獲取我們需要的“養(yǎng)分”,也就是我們需要發(fā)掘大數(shù)據(jù)的價(jià)值,這樣的大數(shù)據(jù)才擁有意義。我們需要從數(shù)據(jù)資源中發(fā)掘我們的價(jià)值來為我們服務(wù)。
利用大數(shù)據(jù)發(fā)現(xiàn)價(jià)值的案例如今已經(jīng)屢見不鮮,沃爾瑪?shù)攘闶凵掏ㄟ^對(duì)銷售額、定價(jià)以及經(jīng)濟(jì)學(xué)、人口統(tǒng)計(jì)學(xué)和天氣數(shù)據(jù)進(jìn)行分析,藉此在特定的連鎖店中選擇合適的上架產(chǎn)品,并基于這些分析來判定商品減價(jià)的時(shí)機(jī)。京東商城,通過對(duì)客戶的瀏覽頁面以及購買情況,來鎖定用戶的喜好和關(guān)注點(diǎn)進(jìn)行產(chǎn)品的推薦,等等,這些都是利用大數(shù)據(jù)來實(shí)現(xiàn)商業(yè)價(jià)值的典型案例。
編輯點(diǎn)評(píng):大數(shù)據(jù)并不僅是只是容量大的數(shù)據(jù),大數(shù)據(jù)還擁有大價(jià)值,而且這已經(jīng)是業(yè)內(nèi)公認(rèn)的事實(shí)。大數(shù)據(jù)時(shí)代的來臨,其讓整個(gè)IT產(chǎn)業(yè)和整個(gè)社會(huì)的商業(yè)模式正在發(fā)生的巨大的變化,接下來我們來看下大數(shù)據(jù)所引領(lǐng)的變革!
大數(shù)據(jù)挑戰(zhàn)基礎(chǔ)平臺(tái)與商業(yè)模式
大數(shù)據(jù)時(shí)代臨近,企業(yè)數(shù)據(jù)呈現(xiàn)爆炸式增長,如何為了更大的發(fā)掘企業(yè)數(shù)據(jù)價(jià)值將是很多公司必須要面對(duì)的挑戰(zhàn)。首當(dāng)其沖的是大數(shù)據(jù)的快速發(fā)展對(duì)我們?cè)械?FONT face="Times New Roman">IT基礎(chǔ)設(shè)施提供了更高的挑戰(zhàn),原有的IT基礎(chǔ)設(shè)施以及很難滿足大數(shù)據(jù)時(shí)代的需求。發(fā)現(xiàn)價(jià)值的過程離不開基礎(chǔ)平臺(tái)技術(shù)的創(chuàng)新與發(fā)展。
基礎(chǔ)平臺(tái)的改變
首先大數(shù)據(jù)挑戰(zhàn)的就是企業(yè)的存儲(chǔ)系統(tǒng),大數(shù)據(jù)爆炸式的增長使得存儲(chǔ)系統(tǒng)的容量、擴(kuò)展能力、傳輸瓶頸等方面都面臨著挑戰(zhàn)。與之相連的還有服務(wù)器的計(jì)算能力,內(nèi)存的存儲(chǔ)能力等等都面臨著新的技術(shù)攻關(guān)。目前閃存技術(shù)的發(fā)展以及英特爾、IBM等公司在大數(shù)據(jù)方面都已經(jīng)投入相當(dāng)大的資金進(jìn)行研發(fā),主要也是為了解決大數(shù)據(jù)對(duì)基礎(chǔ)平臺(tái)所帶來的挑戰(zhàn)。
同樣,大數(shù)據(jù)分析同樣面臨著軟件方面的挑戰(zhàn),同時(shí)也引發(fā)數(shù)據(jù)庫、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、商業(yè)智能、人工智能、內(nèi)容/知識(shí)管理等領(lǐng)域的技術(shù)變革。Hadoop是近年大家經(jīng)常提到了一個(gè)能夠?qū)Υ罅繑?shù)據(jù)進(jìn)行分布式處理的軟件框架,用戶可以輕松地在Hadoop上開發(fā)和運(yùn)行處理海量數(shù)據(jù)的應(yīng)用程序。
商業(yè)模式的挑戰(zhàn)
大數(shù)據(jù)具有強(qiáng)大的數(shù)據(jù)價(jià)值,當(dāng)我們可以利用大數(shù)據(jù)挖掘到需要信息的時(shí)候,則需要我們根據(jù)得到的信息對(duì)企業(yè)的商業(yè)模型、產(chǎn)品和服務(wù)等方面進(jìn)行創(chuàng)新,這樣才能夠真正的讓大數(shù)據(jù)的價(jià)值得到體現(xiàn)。
如何利用大數(shù)據(jù)信息來改變商業(yè)模式最終實(shí)現(xiàn)價(jià)值呢,這里我們引用Tesco為案例。Tesco收集了海量的顧客數(shù)據(jù),并且通過對(duì)每位顧客海量數(shù)據(jù)的分析,Tesco對(duì)每位顧客的信用程度和相關(guān)風(fēng)險(xiǎn)都會(huì)有一個(gè)極為準(zhǔn)確的評(píng)估。在這個(gè)基礎(chǔ)上,Tesco推出了自己的信用卡,未來Tesco還有野心推出自己的存款服務(wù)。
編輯點(diǎn)評(píng):談到這里,可能大部分人已經(jīng)對(duì)云計(jì)算有了初步的了解,但也有可能又要問,大數(shù)據(jù)真的那么好嗎?其沒有發(fā)展上的存在的一些問題?下面我們就來談一下大數(shù)據(jù)在發(fā)展上遇到的一些問題!
隱私成為大數(shù)據(jù)亟待解決的問題
大數(shù)據(jù)分析能夠幫用戶發(fā)掘他們的價(jià)值,從而使其在市場競爭中處于更有利的地位,同時(shí)提升他們的市場生命力,但其在發(fā)展過程中仍有需要解決的問題,依然存在著這樣那樣的問題,在這些問題中我們不得不提其在隱私方面的問題。
隱私問題是大數(shù)據(jù)亟待解決的問題
大數(shù)據(jù)挖掘不但可以挖掘數(shù)字信息,同樣還能夠挖掘圖像、文本、視頻等等,如今我們甚至能夠通過數(shù)據(jù)挖掘了解一個(gè)人的整天的行動(dòng),甚至能夠預(yù)判一個(gè)即將要做的事情。但當(dāng)我們的數(shù)據(jù)挖掘關(guān)系到公民的生活問題時(shí)就會(huì)遇到一個(gè)問題,那就是隱私。
隱私是目前很多人都關(guān)注的問題,如今,電話推銷的人幾乎天天都有,這就是我們隱私被透露的結(jié)果。甚至有的犯罪分子利用從即時(shí)通訊上得到的信息,冒充孩子的家長來實(shí)施犯罪,這些都是我們需要解決的問題。
那么目前對(duì)個(gè)人隱私數(shù)據(jù)方面的保護(hù)如何呢?有,但是目前扔不完善。有的時(shí)候我們雖然將注冊(cè)信息設(shè)為不公開,但是仍然會(huì)接到各種騷擾電話。所以在這方面的保護(hù)并不完善,這主要是背后一個(gè)龐大的利益集團(tuán)在驅(qū)動(dòng)。而且現(xiàn)在相關(guān)的法律法規(guī)并不完善,讓個(gè)人信息在大數(shù)據(jù)時(shí)代泄露的時(shí)間比比皆是。
法律框架的搭建遠(yuǎn)遠(yuǎn)趕不上新技術(shù)的發(fā)展,各國對(duì)個(gè)人隱私也界定不一,為此Facebook還專門設(shè)立了首席隱私官這個(gè)職位。但是目前的措施并不能夠完全保護(hù)個(gè)人隱私的安全,個(gè)人在大數(shù)據(jù)時(shí)代似乎總是站在被分析的地位。隱私問題是大數(shù)據(jù)亟待解決的問題。
文章總結(jié):大數(shù)據(jù)時(shí)代的來臨已經(jīng)成為行業(yè)的共識(shí),如何更好分發(fā)掘大數(shù)據(jù)這塊“蛋糕”將是我們必須要考慮的事情,大數(shù)據(jù)不但影響著整個(gè)IT行業(yè)的發(fā)展,同樣影響著企業(yè)商業(yè)模式。如何了利用好大數(shù)據(jù)將是決定企業(yè)未來走向的關(guān)鍵要素。