網(wǎng)絡(luò)信息時(shí)代的高速發(fā)展,科技發(fā)達(dá),信息通達(dá),人與人之間的交流越來(lái)越密切,生活也越來(lái)越便捷了。大數(shù)據(jù)是互聯(lián)網(wǎng)科技發(fā)展到今天的必然產(chǎn)物。在以云技術(shù)為代表的革新下,那些原本很難收集和使用的數(shù)據(jù)開(kāi)始容易被收集使用了,在各行各業(yè)的不斷革新下,大數(shù)據(jù)逐步變?yōu)楝F(xiàn)實(shí)并創(chuàng)造著更多的價(jià)值。
近年來(lái),有人講大數(shù)據(jù),有人講云計(jì)算,有人講人工智能,當(dāng)一件事情幾個(gè)方向都在都在談的時(shí)候,意味著一個(gè)時(shí)代的來(lái)臨。那么,如何系統(tǒng)化地認(rèn)識(shí)大數(shù)據(jù)呢?本文將從三大層面來(lái)展開(kāi),"解構(gòu)"大數(shù)據(jù)。
第一層:理論
理論是認(rèn)知的必經(jīng)途徑,也是被廣泛認(rèn)同和傳播的基線。大數(shù)據(jù)的定義及特征是對(duì)大數(shù)據(jù)的整體描繪與定性;我們先從其定義與特征出發(fā),來(lái)具體認(rèn)知大數(shù)據(jù)。
定義:大數(shù)據(jù)(bigdata),指在一定時(shí)間范圍內(nèi)無(wú)法用常規(guī)軟件或工具進(jìn)行捕捉抓取、管理和處理的數(shù)據(jù)集,而是需要新處理模式才能更具有強(qiáng)的決策力、洞察力和流程優(yōu)化能力等的海量、多樣化和高增長(zhǎng)率的信息資產(chǎn)。
特征:業(yè)界(IBM最早定義)將大數(shù)據(jù)的特征歸納為4個(gè)"V"(量Volume,多樣Variety,價(jià)值Value,速Velocity),或者說(shuō)特點(diǎn)有四個(gè)層面:第一,海量數(shù)據(jù)量。第二,數(shù)據(jù)類型繁多。第三,價(jià)值密度低,商業(yè)價(jià)值高。第四,速度快。第四點(diǎn)也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有不同本質(zhì)。
第二層:技術(shù)
技術(shù)是大數(shù)據(jù)價(jià)值體現(xiàn)的手段和前進(jìn)的基石。那么,現(xiàn)階段和大數(shù)據(jù)相關(guān)的技術(shù)有哪些呢?這里將分別從云計(jì)算、分布式處理技術(shù)、存儲(chǔ)技術(shù)和感知技術(shù)來(lái)說(shuō)明大數(shù)據(jù)從采集、處理、存儲(chǔ)到形成結(jié)果的全部過(guò)程。
云技術(shù)
在人工智能時(shí)代,互聯(lián)網(wǎng)是基礎(chǔ)設(shè)施,云計(jì)算是公共服務(wù),那么大數(shù)據(jù)則是生產(chǎn)資料。大數(shù)據(jù),離不開(kāi)云計(jì)算,實(shí)時(shí)的大數(shù)據(jù)集分析需要分布式處理框架來(lái)向數(shù)以萬(wàn)計(jì)的電腦分配工作。再或者,我們可以打個(gè)比方來(lái)說(shuō):如果云計(jì)算充當(dāng)了工業(yè)革命時(shí)期發(fā)動(dòng)機(jī)的角色,那么大數(shù)據(jù)則是電。
分布式處理技術(shù)
分布式處理系統(tǒng)可以用用通信網(wǎng)絡(luò)將具有不同功能的或不同地點(diǎn)的,擁有不同數(shù)據(jù)的N臺(tái)計(jì)算機(jī)連接起來(lái),分布式處理系統(tǒng)的定義是指:在控制系統(tǒng)的統(tǒng)一管理控制下,協(xié)調(diào)地完成信息處理任務(wù)。
存儲(chǔ)技術(shù)
大數(shù)據(jù)可以抽象的分為大數(shù)據(jù)存儲(chǔ)和大數(shù)據(jù)分析,這兩者的關(guān)系是:大數(shù)據(jù)存儲(chǔ)的目的是支撐大數(shù)據(jù)分析。大數(shù)據(jù)存儲(chǔ)與大數(shù)據(jù)分析,其實(shí)還是倆種不同定義。大數(shù)據(jù)存儲(chǔ)致力于研發(fā)可以擴(kuò)展至PB甚至EB級(jí)別的數(shù)據(jù)存儲(chǔ)平臺(tái);大數(shù)據(jù)分析關(guān)注在最短時(shí)間內(nèi)處理大量不同類型的數(shù)據(jù)集。
感知技術(shù)
大數(shù)據(jù)的采集和感知技術(shù)的發(fā)展是緊密聯(lián)系的。以傳感器技術(shù),指紋識(shí)別技術(shù),RFID技術(shù),坐標(biāo)定位技術(shù)等為基礎(chǔ)的感知能力提升同樣是物聯(lián)網(wǎng)發(fā)展的基石。這些感知被逐漸捕獲的過(guò)程就是被數(shù)據(jù)化的過(guò)程。
第三層:實(shí)踐
實(shí)踐是大數(shù)據(jù)的最終價(jià)值體現(xiàn),具體來(lái)說(shuō),現(xiàn)在城市都在走向智能和智慧,比如,智能電網(wǎng)、智慧交通、智慧醫(yī)療、智慧環(huán)保、智慧城市,這些都依托于大數(shù)據(jù),可以說(shuō)大數(shù)據(jù)是智慧的核心能源。如在輿情監(jiān)控方面,通過(guò)搜索網(wǎng)絡(luò)關(guān)鍵詞以及語(yǔ)義智能分析,可以提高輿情分析全面性、及時(shí)性。在管理交通方面,實(shí)時(shí)挖掘道路交通信息,可有效緩解交通擁堵,并快速響應(yīng)突發(fā)狀況,為城市交通的有效運(yùn)轉(zhuǎn)提供科學(xué)依據(jù)。
此文為新浪財(cái)經(jīng)頭條(產(chǎn)經(jīng)頭條)原創(chuàng)內(nèi)容,特此聲明
【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時(shí)須獲得授權(quán)并注明來(lái)源“中國(guó)產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個(gè)人觀點(diǎn),不代表本網(wǎng)觀點(diǎn)和立場(chǎng)。版權(quán)事宜請(qǐng)聯(lián)系:010-65363056。
延伸閱讀