大數(shù)據(jù)環(huán)境下云基礎(chǔ)架構(gòu)有多重要?


時間:2013-11-08





  Jon Toigo:云和大數(shù)據(jù)在同一時段開始流行起來,因而成了同義詞。但是,二者并不是一回事兒。云是在集成處理器集群上實(shí)施的一種并行程序設(shè)計模式,主要用于數(shù)據(jù)密集型分布式應(yīng)用。云的作用就在于此。早在對大數(shù)據(jù)的熱衷之前,云就已經(jīng)存在。但后來云的意義變了,被當(dāng)作一種結(jié)構(gòu)用以建立大數(shù)據(jù)基礎(chǔ)架構(gòu)。云以谷歌的MapReduce算法為基礎(chǔ),該算法是在集群中分配應(yīng)用的一種方法。谷歌的文件系統(tǒng)、運(yùn)行系統(tǒng)、MapReduce應(yīng)用以及分布式文件系統(tǒng)(HDFS)幾乎都以Java為基礎(chǔ),從而引發(fā)了一系列問題。云也需要通過節(jié)點(diǎn)間的故障轉(zhuǎn)移來提供彈性。在眾多集群中,當(dāng)一個節(jié)點(diǎn)失效了,應(yīng)該能及時進(jìn)行故障處理并轉(zhuǎn)移到下一個集群中去。

  在以后,我并不確定有了云就可以高枕無憂了。事實(shí)上關(guān)于云已有了普遍的共識:為企業(yè)所用還需要云基礎(chǔ)架構(gòu)的許多方面起作用才行。首先,云的核心是NameNodes,儲存了與云集群相關(guān)的元數(shù)據(jù)(集群中的每臺設(shè)備、每臺設(shè)備的容量、設(shè)備的用途及其能承受的工作負(fù)載量)。這類信息并非隨處可復(fù)制,而只存在于一個地方,因而成了云基礎(chǔ)架構(gòu)中的單點(diǎn)故障。如果云集群上正進(jìn)行著重要的程序處理的話,那一定要解決這類信息。其次是JobTracker。JobTracker是管理MapReduce任務(wù)和為不同服務(wù)器安排工作負(fù)載的這樣一個組成部分,換種說法,JobTracker更接近以專門方法分析的數(shù)據(jù)。需要強(qiáng)調(diào)的是,JobTracker也是一個單點(diǎn)故障,并且只存在于集群中的一臺服務(wù)器上。這些也只是有關(guān)當(dāng)下的云架構(gòu)最明顯的問題。

  云技術(shù)本身并不簡單。如果打算部署云,需要足夠的程序。這些程序得能夠勝任工具箱里單一程序無法做到的各種事情、得知道Pig是Pig Latin的縮寫、與云運(yùn)行環(huán)境息息相關(guān)。當(dāng)然,這些程序也得知道Java、JavaScript的目標(biāo)符號語言Jaql?,F(xiàn)如今找到能勝任PHP的程序已經(jīng)不是什么難事兒了,只需找一些跨度極大的組合即可。

  因此首先是會有一些單點(diǎn)故障。其次,云需要一些在技術(shù)市場上沒有的專項(xiàng)技能。再次,會產(chǎn)生性能問題。每個已部署云的公司都已經(jīng)有了云操作方面的性能問題,因而關(guān)于其的大數(shù)據(jù)分析會一直存在。雖然一些問題與糟糕的寫入應(yīng)用代碼有關(guān),但更多的是與其架構(gòu)本身有關(guān)。很多公司在額外的服務(wù)器集群、直連存儲和額外的軟件工具上下了很大功夫,都只為改善云基礎(chǔ)架構(gòu)的速度和進(jìn)給量。

  當(dāng)然,基礎(chǔ)架構(gòu)的管理也讓人頭疼。一些人試圖以ZooKeeper技術(shù)來處理云基礎(chǔ)架構(gòu)管理,而很多廠商則力圖以他們提供的定制產(chǎn)品來處理。問題是目前還是沒有一個很好的云管理范式,似乎也沒什么指望。

  前不久,福布斯的一篇文章表達(dá)了我要分享的另一個重要的關(guān)注點(diǎn):云等同于承擔(dān)大數(shù)據(jù)項(xiàng)目的基礎(chǔ)架構(gòu)。現(xiàn)在,商人們并不明白這一過程,也不介意如何處理大數(shù)據(jù)。他們只是想要業(yè)務(wù)利潤,要它快一點(diǎn)兒。文章的作者正確地觀察到云也許非常適合處理規(guī)模數(shù)據(jù)(其文章觀點(diǎn)所在),但絕對算不上迅速而專業(yè)的分析或?qū)崟r分析學(xué)。因此,該文章也不能用于業(yè)務(wù)處理,只是起到了其下的某些價值作用,并且只是掌控數(shù)據(jù)的一種方式。

  那指向了問題的核心,最終的真正問題是:我們將大數(shù)據(jù)用于何處?很多人沒有認(rèn)識到這一問題,除了市場上那些想要使用大數(shù)據(jù)的商家們,他們的目的是使其產(chǎn)品和服務(wù)面向特定客戶群體時能更為專業(yè)化。

來源:CIO時代網(wǎng)



  版權(quán)及免責(zé)聲明:凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章,不代表本網(wǎng)觀點(diǎn)和立場。版權(quán)事宜請聯(lián)系:010-65363056。

延伸閱讀

熱點(diǎn)視頻

第六屆中國報業(yè)黨建工作座談會(1) 第六屆中國報業(yè)黨建工作座談會(1)

熱點(diǎn)新聞

熱點(diǎn)輿情

特色小鎮(zhèn)

版權(quán)所有:中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)京ICP備11041399號-2京公網(wǎng)安備11010502003583