區(qū)塊鏈?zhǔn)侨绾伪3謹(jǐn)?shù)據(jù)一致性的
關(guān)于區(qū)塊鏈如何保持?jǐn)?shù)據(jù)一致性的問題,是我在區(qū)塊鏈研習(xí)社里的第四次課程,由于一致性問題涉及到區(qū)塊的結(jié)構(gòu)以及與區(qū)塊鏈的不可篡改這個(gè)重要特性,因此這一課對(duì)大家深入了解區(qū)塊鏈技術(shù)非常重要,我也有必要將之前課程的內(nèi)容進(jìn)行整理,同時(shí)再結(jié)合更詳細(xì)的說明,供大家學(xué)習(xí)。
1、什么是哈希
如果你懂一些編程,相信對(duì)這個(gè)概念非常熟悉。但是對(duì)于一些沒有編程基礎(chǔ)的人而言,對(duì)其卻相當(dāng)陌生,陌生到買了一本區(qū)塊鏈的書籍卻完全看不下去。哈希函數(shù)在區(qū)塊鏈里使用得太普遍,以至于它所有對(duì)用戶展示的內(nèi)容,比如地址,公鑰,私鑰等,都是通過哈希函數(shù)生成的,所以在這里有必要重點(diǎn)對(duì)這個(gè)概念闡述一下,即便懂得編程,聽過這個(gè)概念,希望你也能再看一遍,就當(dāng)是回顧了。
哈希,英文對(duì)應(yīng)為Hash,一般說的都是哈希函數(shù),百度百科的解釋是:
Hash,一般翻譯做“散列”,也有直接音譯為“哈?!钡?,就是把任意長(zhǎng)度的輸入(又叫做預(yù)映射, pre-image),通過散列算法,變換成固定長(zhǎng)度的輸出,該輸出就是散列值。這種轉(zhuǎn)換是一種壓縮映射,也就是,散列值的空間通常遠(yuǎn)小于輸入的空間,不同的輸入可能會(huì)散列成相同的輸出,所以不可能從散列值來唯一的確定輸入值。簡(jiǎn)單的說就是一種將任意長(zhǎng)度的消息壓縮到某一固定長(zhǎng)度的消息摘要的函數(shù)。
簡(jiǎn)單來講,就是將一個(gè)較長(zhǎng)的字符串a(chǎn)轉(zhuǎn)換為一個(gè)固定長(zhǎng)度的字符串b,然后用b這個(gè)串去代表之前的a,比如一個(gè)比特幣地址1DQe9F3agsDcr4qoTZ3Sush4e88Nv9tNxa,就是一個(gè)哈希值。經(jīng)過哈希轉(zhuǎn)換后,無法通過b還原出原來的a。
哈希算法在文件校驗(yàn)、數(shù)字簽名及鑒權(quán)協(xié)議都有很好的應(yīng)用。在Java編程里,可直接通過hashCode函數(shù)獲取一個(gè)字符串的哈希值,哈希算法是一個(gè)非常高效的算法,所以使用非常頻繁。
2、簡(jiǎn)單的判斷一致性方法
你應(yīng)該經(jīng)常下載過東西,可能對(duì)一個(gè)文件重復(fù)下載了兩次,甚至現(xiàn)在還會(huì)不小心在一些釣魚網(wǎng)站下載了一些惡意程序,那么你是如何判斷文件的一致性以及識(shí)別程序是否有問題呢?
你可能想到的方法有:1)比較文件大小,如果不一致,則說明是不同的文件;2)查看文件內(nèi)容,但是并不是所有的程序都是文本可讀的;3)查看文件的一些標(biāo)注信息是否一致,等等。但是這些方法都相當(dāng)初級(jí),對(duì)于一些高級(jí)的作弊手段無法識(shí)別,正因如此,一些良心網(wǎng)站都會(huì)提示比較文件的MD5值,很多細(xì)心的朋友應(yīng)該能發(fā)現(xiàn)這個(gè)提示,但是基本也很少按照這個(gè)提示去做,畢竟我們大部分人都習(xí)慣了在網(wǎng)上“裸奔”。
上面提到的MD5,就是一種被廣泛使用的哈希函數(shù)?,F(xiàn)在越來越多的網(wǎng)站都會(huì)公布文件的MD5值,用戶在下載文件后可自己進(jìn)行運(yùn)算并進(jìn)行比對(duì),如果一致則說明所下載文件沒被篡改過。
由于工作需要,這兩天我準(zhǔn)備下載一個(gè)mangodb,這是下載頁面的截圖,通過截圖大家應(yīng)該能有一個(gè)直觀的認(rèn)識(shí):
當(dāng)然MD5只是哈希算法的一種,上面的截圖還顯示了其他支持的方法,不過這些都是使用哈希算法的特性用于校驗(yàn)文件的一致性的。
3、區(qū)塊鏈如何保持?jǐn)?shù)據(jù)的一致性——默克樹
下面這個(gè)圖是比特幣的區(qū)塊結(jié)構(gòu)圖,它相當(dāng)重要以至于每一本區(qū)塊鏈書籍都會(huì)介紹,也希望每一個(gè)研習(xí)社的朋友能掌握:
在上表的第三行“Merkle樹的根值”正是一個(gè)哈希值,和上面提到的一樣,區(qū)塊鏈技術(shù)正是利用這個(gè)哈希值來判斷區(qū)塊的數(shù)據(jù)是否被篡改過的。
但是,事情可能還沒想的那么簡(jiǎn)單。因?yàn)橐粋€(gè)區(qū)塊可能包含幾百個(gè)甚至更多的交易,其內(nèi)容會(huì)非常多,對(duì)整體進(jìn)行哈希運(yùn)算效率是非常低下的,因此,才會(huì)出現(xiàn)上圖大家可能還相對(duì)陌生的詞“Merkle樹”,翻譯為默克樹,這才是保持一致性的關(guān)鍵。
默克樹,全稱“默克爾哈希樹”,是一種二叉或多叉的數(shù)據(jù)結(jié)構(gòu),通過對(duì)每一個(gè)葉子節(jié)點(diǎn)進(jìn)行哈希計(jì)算,并不斷往上遞歸,最后構(gòu)建成一個(gè)樹形結(jié)構(gòu)。因此默克樹是一種被廣泛用于快速歸納和對(duì)大規(guī)模數(shù)據(jù)進(jìn)行完整性校驗(yàn)的數(shù)據(jù)結(jié)構(gòu)。
在比特幣的實(shí)現(xiàn)中,不用保存每一個(gè)交易的哈希值,而是將所有交易構(gòu)建成這樣一個(gè)默克樹,并以樹的根節(jié)點(diǎn)的哈希值作為所有交易內(nèi)容的一個(gè)映射,存放于區(qū)塊的頭部結(jié)構(gòu)中,從而在保證數(shù)據(jù)完整性,防止被惡意篡改的同時(shí),極大減少了運(yùn)算量,提高了運(yùn)算效率,而且,如果一旦被篡改,還能進(jìn)行快速定位。簡(jiǎn)直是妙不可言!
下面是一張默克樹的圖,大家姑且看之,不懂也無所謂,全當(dāng)欣賞: