但是對應(yīng)用程序進行性能比較則不是那么簡單的了。在同一個云計算或跨不同云計算的環(huán)境下,對運行其中的不同類型數(shù)據(jù)庫應(yīng)用程序進行性能比較將是特別具有挑戰(zhàn)性的一項工作。雅虎云計算服務(wù)基準(YCSB)是專為幫助用戶了解不同云計算數(shù)據(jù)庫性能以及在實際負載下存儲數(shù)據(jù)性能表現(xiàn)的一個測試框架。這個測試框架的源代碼可從GitHub下載獲得。
雅虎云計算服務(wù)基準工具包括了兩個重要的組成部分:一個工作負載生成器和一組生成器生成的工作負載,以及針對大量NoSQL數(shù)據(jù)庫的接口,其中包括Cassandra、DynamoDB、Hbase、MongoDB、Redis以及甲骨文公司的NoSQL數(shù)據(jù)庫。當(dāng)然,它還配有一個用于關(guān)系型數(shù)據(jù)庫的JDBC接口。
當(dāng)面臨進行應(yīng)用程序架構(gòu)決策時,諸如YCSB這樣的數(shù)據(jù)庫測試基準是特別有用的。例如,一個不再滿足性能需求的現(xiàn)有數(shù)據(jù)庫應(yīng)用程序可能會迫使你考慮擴容硬件資源或者變更基礎(chǔ)數(shù)據(jù)庫。如果額外的硬件能夠?qū)崿F(xiàn)近乎線性的性能提升(例如,雙倍的服務(wù)器可實現(xiàn)雙倍的性能),那么硬件擴容將是一個合適的選擇。但是,硬件擴容并不總是能夠幫助我們實現(xiàn)性能的線性提升,因為不讓管理員充分發(fā)揮額外硬件資源優(yōu)勢的應(yīng)用程序中還存在著其他的性能提升瓶頸。
如果你更換了你的數(shù)據(jù)庫,那么你就會有很多的選擇項,特別是如果你選擇使用NoSQL數(shù)據(jù)庫來取代之前的關(guān)系型數(shù)據(jù)庫。雖然一開始的性能提升可能并不明顯,但是一些特定類型的NoSQL數(shù)據(jù)庫將說明問題。例如,社交網(wǎng)絡(luò)分析就正好適合使用圖形數(shù)據(jù)庫。如果用戶不需要支持復(fù)雜查詢應(yīng)用,那么諸如Cassandra和Amazon DynamoDB這樣的關(guān)鍵值數(shù)據(jù)庫則可能比MongoDB這樣的文檔存儲更為適合。測試基準可以通過測試數(shù)據(jù)來幫助你決定哪一個數(shù)據(jù)庫最適合你的需求。
雅虎云計算服務(wù)基準的工作負載管理
運行YCSB的第一步就是確定你所希望測試的數(shù)據(jù)庫類型以及希望在數(shù)據(jù)庫上運行的工作負載。一旦你已經(jīng)創(chuàng)建了你的數(shù)據(jù)庫,那么你必須創(chuàng)建一個與你的目標工作負載相關(guān)的計劃。計劃的實施細節(jié)將隨數(shù)據(jù)庫類型的不同而有所變化。例如,可能在MySQL中創(chuàng)建一個數(shù)據(jù)表,而在Cassandra中創(chuàng)建一個列族和關(guān)鍵值空間。
測試基準是比較數(shù)據(jù)庫性能的一大利器,但是工作負載也必須配合你的實際生產(chǎn)負載,當(dāng)選擇數(shù)據(jù)庫時,除測試結(jié)果外還需要考慮其他的設(shè)計考量。你可以運行由YCSB提供的核心工作負載或者創(chuàng)建你自己的。核心工作負載包括一組六個具有不同讀/寫操作特性的工作負載。一些工作負載是以更新升級為主的,而另一些則是測試讀操作性能的。如果你創(chuàng)建你自己的工作負載,那么你就必須開發(fā)一個Java應(yīng)用程序,以便于擴展現(xiàn)有YCSB類生成數(shù)據(jù)并執(zhí)行讀/寫操作。
工作負載是使用參數(shù)開關(guān)進行設(shè)置的,因此你是可以在不同的線程數(shù)和單位時間運行數(shù)下測試工作負載的。它分為了兩個階段:創(chuàng)建數(shù)據(jù)的導(dǎo)入階段,和執(zhí)行特定工作負載下操作然后輸出一組性能統(tǒng)計數(shù)據(jù)的執(zhí)行階段。除了運行時間和單位時間的運行次數(shù)外,還有很多的延遲測量數(shù)據(jù),其中包括平均值、最大值、最小值、第95個百分點的延遲數(shù)和99個百分點的延遲數(shù)。
如果你有一個現(xiàn)成的應(yīng)用程序,它可能會從性能監(jiān)控工具中收集數(shù)據(jù)以確定你的應(yīng)用程序中讀、寫以及更新操作的運行數(shù)據(jù)。如果你使用了一個關(guān)系型數(shù)據(jù)庫,那么則需特別關(guān)注運行次數(shù)最頻繁和運行時間最長的查詢操作。
有很好的候選對象可供在自定義工作負載中使用。
如果你開發(fā)了一個新應(yīng)用程序,那么你應(yīng)當(dāng)在正式把應(yīng)用程序投入生產(chǎn)之前運行一系列的測試基準以便于對大量的不同的可能生產(chǎn)負載進行評估。這可以為不同條件下不同數(shù)據(jù)庫的性能表現(xiàn)評估提供有價值的信息。如果你希望了解大部分時間的中等工作負載以及設(shè)計需求中偶爾發(fā)生的高峰工作負載的運行情況,可針對兩種情況進行測試。理想情況下,你所選擇的數(shù)據(jù)庫將在所有預(yù)期的情況下性能表現(xiàn)良好。
你還應(yīng)當(dāng)根據(jù)使用頻率來選擇數(shù)據(jù)庫。如果一個數(shù)據(jù)庫在大多數(shù)預(yù)期的工作負載下能夠表現(xiàn)良好,但在一個設(shè)計范圍外或偶爾發(fā)生的工作負載下表現(xiàn)糟糕,那么你可能會選擇這個數(shù)據(jù)庫。
來源:CIO時代網(wǎng)
版權(quán)及免責(zé)聲明:凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章,不代表本網(wǎng)觀點和立場。版權(quán)事宜請聯(lián)系:010-65363056。
延伸閱讀
版權(quán)所有:中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)京ICP備11041399號-2京公網(wǎng)安備11010502003583