隨著網(wǎng)絡(luò)帶寬的高速增長,在軟件上的消耗已成為網(wǎng)絡(luò)性能的瓶頸,,而通過繞過CPU實現(xiàn)高性能傳輸?shù)腞DMA網(wǎng)絡(luò)成為分布式存儲不錯的選擇,。RDMA(RemoteDirectMemoryAccess),可以簡單理解為網(wǎng)卡完全繞過CPU實現(xiàn)兩個服務(wù)器之間的內(nèi)存數(shù)據(jù)交換,。其作為一種硬件實現(xiàn)的網(wǎng)絡(luò)傳輸技術(shù),,可以大幅提升網(wǎng)絡(luò)傳輸效率,,幫助網(wǎng)絡(luò)IO密集的業(yè)務(wù)(比如分布式存儲、分布式數(shù)據(jù)庫等)獲得更低的時延以及更高的吞吐,。初的RDMA是實現(xiàn)在IB(Infiniband)上,,由于其新的硬件技術(shù)棧成本比較高,主要用于HPC(高性能計算)等少數(shù)場景,。而新的技術(shù)發(fā)展下,,能夠?qū)崿F(xiàn)在以太網(wǎng)上使用RDMA。 難言之隱,分布式存儲軟硬件解耦究竟難在哪里?合肥四大開源分布式存儲系統(tǒng)原理
很多人可能從來沒有考慮過這個問題,,為什么需要分布式存儲,?實際上,使用分布式存儲是“被迫”的,,因為隨著互聯(lián)網(wǎng)的飛速發(fā)展,、應(yīng)用越來越豐富、用戶數(shù)量越來越多,、數(shù)據(jù)也成幾何級增長,,海量數(shù)據(jù)的存儲給本地存儲帶了巨大壓力,存儲系統(tǒng)已經(jīng)不堪重負,,處于崩潰的邊緣,,因此,必須通過其他手段分散存儲系統(tǒng)壓力,,分布式存儲和分布式文件系統(tǒng)應(yīng)運而生,。實際上,如果可能,,應(yīng)該是盡量不使用分布式的,,因為這會增加系統(tǒng)的復(fù)雜度和管理難度,然而,,雖然是這樣,,但這些終歸是可以通過其他技術(shù)來解決,而如果不使用分布式,,系統(tǒng)的可用性,、穩(wěn)定性都無法保證,更談不上系統(tǒng)的高性能了,。因此,,說分布式是被迫使用的,一點也不夸張,。 合肥四大開源分布式存儲系統(tǒng)原理如何保證分布式存儲系統(tǒng)的高性能與高可用性呢,?
那么現(xiàn)在問題來了,如果我們要選擇分布式存儲,,選擇哪種好呢,?其實它們各有各的優(yōu)勢和使用場景,,具體要看需求。(1)HDFS:主要用于大數(shù)據(jù)的存儲場景,,是Hadoop大數(shù)據(jù)架構(gòu)中的存儲組件,。HDFS在開始設(shè)計的時候,就已經(jīng)明確的它的應(yīng)用場景,,就是大數(shù)據(jù)服務(wù),。(2)Ceph:目前應(yīng)用廣的開源分布式存儲系統(tǒng),已得到眾多廠商的支持,,許多超融合系統(tǒng)的分布式存儲都是基于Ceph深度定制,。而且Ceph已經(jīng)成為LINUX系統(tǒng)和OpenStack的“標配”,用于支持各自的存儲系統(tǒng),。Ceph可以提供對象存儲,、塊設(shè)備存儲和文件系統(tǒng)存儲服務(wù)。同時支持三種不同類型的存儲服務(wù)的特性,,在分布式存儲系統(tǒng)中,,是很少見的。(3)Swift:主要面向的是對象存儲,。和Ceph提供的對象存儲服務(wù)類似,。主要用于解決非結(jié)構(gòu)化數(shù)據(jù)存儲問題。它和Ceph的對象存儲服務(wù)的主要區(qū)別是,。
自誕生以來,,分布式存儲就被視為存儲的未來,被萬眾期待,。然而分布式存儲起步于寒門,,早應(yīng)用于互聯(lián)網(wǎng)日志、企業(yè)備份歸檔,、開發(fā)測試等場景,,追求極zhi成本,性能和可靠性卻不敢恭維,。但它還算爭氣,憑借多年的打怪練級,,越來越多地開始承載自動駕駛研發(fā),、超高清編輯、運營商5G網(wǎng)絡(luò)云等企業(yè)的關(guān)鍵業(yè)務(wù),,走上變成高富帥,、贏取白富美的道路。正所謂人紅是非多,,存儲領(lǐng)域也是一樣,,坊間一直流傳著關(guān)于分布式存儲的各種流言蜚語,。好事的筆者現(xiàn)今就來探尋一番,揭開謊言背后的真相,。 分布式存儲將如何挑戰(zhàn)互聯(lián)網(wǎng)巨頭?
為了保證分布式存儲系統(tǒng)的高可靠和高可用,,數(shù)據(jù)在系統(tǒng)中一般存儲多個副本。當某個副本所在的存儲節(jié)點出現(xiàn)故障時,,分布式存儲系統(tǒng)能夠自動將服務(wù)切換到其他的副本,,從而實現(xiàn)自動容錯。分布式存儲系統(tǒng)通過復(fù)制協(xié)議將數(shù)據(jù)同步到多個存儲節(jié)點,,并確保多個副本之間的數(shù)據(jù)一致性,。客戶端將寫請求發(fā)送給主副本,,主副本將寫請求復(fù)制到其他備副本,,常見的做法是同步操作日志(CommitLog)。主副本首先將操作日志同步到備副本,,備副本回放操作日志,,完成后通知主副本。接著,,主副本修改本機,,等到所有的操作都完成后再通知客戶端寫成功。下圖中的復(fù)制協(xié)議要求主備同步成功才可以返回客戶端寫成功,,這種協(xié)議稱為強同步協(xié)議,。 分布式存儲是一種數(shù)據(jù)存儲技術(shù),通過網(wǎng)絡(luò)使用企業(yè)中的每臺機器上的磁盤空間,。揚州聯(lián)想分布式存儲企業(yè)
干貨:一文看懂分布式存儲架構(gòu),。合肥四大開源分布式存儲系統(tǒng)原理
分布式存儲系統(tǒng)中還可能使用基于寫多個存儲節(jié)點的復(fù)制協(xié)議(Replicated-writeprotocol)。比如Dynamo系統(tǒng)中的NWR復(fù)制協(xié)議,,其中,,N為副本數(shù)量,W為寫操作的副本數(shù),,R為讀操作的副本數(shù),。NWR協(xié)議中多個副本不再區(qū)分主和備,客戶端根據(jù)一定的策略往其中的W個副本寫入數(shù)據(jù),,讀取其中的R個副本,。只要W+R>N,可以保證讀到的副本中至少有一個包含了的更新,。然而,,這種協(xié)議的問題在于不同副本的操作順序可能不一致,從多個副本讀取時可能出現(xiàn)。這種方式在實際系統(tǒng)中比較少見,,不建議使用,。 合肥四大開源分布式存儲系統(tǒng)原理
江蘇魏晉元興智能科技有限公司是一家智能技術(shù)、計算機技術(shù)研發(fā),、技術(shù)咨詢,,技術(shù)轉(zhuǎn)讓:軟件開 發(fā)、銷售;信息系統(tǒng)集成服務(wù):機電產(chǎn)品,、計算機及配件,、 電線電纜、儀器儀表,、電子元器件,、機械設(shè)備、機電設(shè)備 節(jié)能設(shè)備,、辦公用品,、攝影器材、文化用品,、通訊設(shè)備,、體 育器材、消防器材銷售;綜合布線工程,、水電工程,、園林綠 化工程、室內(nèi)裝飾工程,、土石方工程設(shè)計,、施工,提供勞務(wù) 服務(wù);企業(yè)形象策劃:企業(yè)管理咨詢:家用電器銷售,、維 修;文化藝術(shù)交流活動組織,、 策劃。( 依法須經(jīng)批準的項 目,,經(jīng)相關(guān)部門批準后方可開展經(jīng)營活動)的公司,,致力于發(fā)展為創(chuàng)新務(wù)實、誠實可信的企業(yè),。公司自創(chuàng)立以來,,投身于網(wǎng)絡(luò)安全,VR,MR,,VR,,AI,視頻監(jiān)控安防,,出入口門禁失控制,是數(shù)碼、電腦的主力軍,。魏晉元興智能不斷開拓創(chuàng)新,,追求出色,以技術(shù)為先導(dǎo),,以產(chǎn)品為平臺,,以應(yīng)用為重點,以服務(wù)為保證,,不斷為客戶創(chuàng)造更高價值,,提供更優(yōu)服務(wù)。魏晉元興智能始終關(guān)注數(shù)碼,、電腦行業(yè),。滿足市場需求,提高產(chǎn)品價值,,是我們前行的力量,。