Redis 面試連環(huán)炮,看看你能撐到哪一步?
掃描二維碼
隨時(shí)隨地手機(jī)看文章
今天,我不自量力的面試了某大廠的java開發(fā)崗位,迎面走來(lái)一位風(fēng)塵仆仆的中年男子,手里拿著屏幕還亮著的mac
他沖著我禮貌的笑了笑,然后說(shuō)了句“不好意思,讓你久等了”,然后示意我坐下,說(shuō):“我們開始吧??戳四愕暮?jiǎn)歷,覺得你對(duì)redis應(yīng)該掌握的不錯(cuò),我們今天就來(lái)討論下redis……”。我想:“來(lái)就來(lái),兵來(lái)將擋水來(lái)土掩”。
Redis是什么
面試官:你先來(lái)說(shuō)下redis是什么吧
我:(這不就是總結(jié)下redis的定義和特點(diǎn)嘛)Redis是C語(yǔ)言開發(fā)的一個(gè)開源的(遵從BSD協(xié)議)高性能鍵值對(duì)(key-value)的內(nèi)存數(shù)據(jù)庫(kù),可以用作數(shù)據(jù)庫(kù)、緩存、消息中間件等。它是一種NoSQL(not-only sql,泛指非關(guān)系型數(shù)據(jù)庫(kù))的數(shù)據(jù)庫(kù)。
我頓了一下,接著說(shuō):Redis作為一個(gè)內(nèi)存數(shù)據(jù)庫(kù)。
性能優(yōu)秀,數(shù)據(jù)在內(nèi)存中,讀寫速度非???,支持并發(fā)10W QPS;
單進(jìn)程單線程,是線程安全的,采用IO多路復(fù)用機(jī)制;
豐富的數(shù)據(jù)類型,支持字符串(strings)、散列(hashes)、列表(lists)、集合(sets)、有序集合(sorted sets)等;
支持?jǐn)?shù)據(jù)持久化??梢詫?nèi)存中數(shù)據(jù)保存在磁盤中,重啟時(shí)加載;
主從復(fù)制,哨兵,高可用;
可以用作分布式鎖;
可以作為消息中間件使用,支持發(fā)布訂閱
五種數(shù)據(jù)類型
面試官:總結(jié)的不錯(cuò),看來(lái)是早有準(zhǔn)備啊。剛來(lái)聽你提到redis支持五種數(shù)據(jù)類型,那你能簡(jiǎn)單說(shuō)下這五種數(shù)據(jù)類型嗎?
我:當(dāng)然可以,但是在說(shuō)之前,我覺得有必要先來(lái)了解下Redis內(nèi)部?jī)?nèi)存管理是如何描述這5種數(shù)據(jù)類型的。說(shuō)著,我拿著筆給面試官畫了一張圖:
我:首先redis內(nèi)部使用一個(gè)redisObject對(duì)象來(lái)表示所有的key和value,redisObject最主要的信息如上圖所示:
type表示一個(gè)value對(duì)象具體是何種數(shù)據(jù)類型,encoding是不同數(shù)據(jù)類型在redis內(nèi)部的存儲(chǔ)方式。比如:type=string表示value存儲(chǔ)的是一個(gè)普通字符串,那么encoding可以是raw或者int。
我頓了一下,接著說(shuō):下面我簡(jiǎn)單說(shuō)下5種數(shù)據(jù)類型:
1、string是redis最基本的類型,可以理解成與memcached一模一樣的類型,一個(gè)key對(duì)應(yīng)一個(gè)value。
value不僅是string,也可以是數(shù)字。string類型是二進(jìn)制安全的,意思是redis的string類型可以包含任何數(shù)據(jù),比如jpg圖片或者序列化的對(duì)象。string類型的值最大能存儲(chǔ)512M。
2、Hash是一個(gè)鍵值(key-value)的集合。
redis的hash是一個(gè)string的key和value的映射表,Hash特別適合存儲(chǔ)對(duì)象。常用命令:hget,hset,hgetall等。
3、list列表是簡(jiǎn)單的字符串列表,按照插入順序排序。
可以添加一個(gè)元素到列表的頭部(左邊)或者尾部(右邊) 常用命令:lpush、rpush、lpop、rpop、lrange(獲取列表片段)等。
應(yīng)用場(chǎng)景:list應(yīng)用場(chǎng)景非常多,也是Redis最重要的數(shù)據(jù)結(jié)構(gòu)之一,比如twitter的關(guān)注列表,粉絲列表都可以用list結(jié)構(gòu)來(lái)實(shí)現(xiàn)。
數(shù)據(jù)結(jié)構(gòu):list就是鏈表,可以用來(lái)當(dāng)消息隊(duì)列用。redis提供了List的push和pop操作,還提供了操作某一段的api,可以直接查詢或者刪除某一段的元素。
實(shí)現(xiàn)方式:redis list的是實(shí)現(xiàn)是一個(gè)雙向鏈表,既可以支持反向查找和遍歷,更方便操作,不過帶來(lái)了額外的內(nèi)存開銷。
4、set是string類型的無(wú)序集合。
集合是通過hashtable實(shí)現(xiàn)的。set中的元素是沒有順序的,而且是沒有重復(fù)的。
常用命令:sdd、spop、smembers、sunion等。
應(yīng)用場(chǎng)景:redis set對(duì)外提供的功能和list一樣是一個(gè)列表,特殊之處在于set是自動(dòng)去重的,而且set提供了判斷某個(gè)成員是否在一個(gè)set集合中。
5、zset和set一樣是string類型元素的集合,且不允許重復(fù)的元素。
常用命令:zadd、zrange、zrem、zcard等。
使用場(chǎng)景:sorted set可以通過用戶額外提供一個(gè)優(yōu)先級(jí)(score)的參數(shù)來(lái)為成員排序,并且是插入有序的,即自動(dòng)排序。
當(dāng)你需要一個(gè)有序的并且不重復(fù)的集合列表,那么可以選擇sorted set結(jié)構(gòu)。
和set相比,sorted set關(guān)聯(lián)了一個(gè)double類型權(quán)重的參數(shù)score,使得集合中的元素能夠按照score進(jìn)行有序排列,redis正是通過分?jǐn)?shù)來(lái)為集合中的成員進(jìn)行從小到大的排序。
實(shí)現(xiàn)方式:Redis sorted set的內(nèi)部使用HashMap和跳躍表(skipList)來(lái)保證數(shù)據(jù)的存儲(chǔ)和有序,HashMap里放的是成員到score的映射,而跳躍表里存放的是所有的成員,排序依據(jù)是HashMap里存的score
使用跳躍表的結(jié)構(gòu)可以獲得比較高的查找效率,并且在實(shí)現(xiàn)上比較簡(jiǎn)單。
我:我之前總結(jié)了一張圖,關(guān)于數(shù)據(jù)類型的應(yīng)用場(chǎng)景,如果您感興趣,可以去我的掘金看。。
數(shù)據(jù)類型應(yīng)用場(chǎng)景總結(jié)
面試官:想不到你平時(shí)也下了不少工夫,那redis緩存你一定用過的吧
我:用過的。。
面試官:那你跟我說(shuō)下你是怎么用的?
我是結(jié)合spring boot使用的。一般有兩種方式,一種是直接通過RedisTemplate來(lái)使用,另一種是使用spring cache集成Redis(也就是注解的方式)。具體的代碼我就不說(shuō)了,在我的掘金中有一個(gè)demo(見下)。
Redis緩存
直接通過RedisTemplate來(lái)使用
使用spring cache集成Redis pom.xml中加入以下依賴:
<dependencies>
<dependency>
<groupId>org.springframework.boot<groupId>
<artifactId>spring-boot-starter-data-redis<artifactId>
<dependency>
<dependency>
<groupId>org.apache.commons<groupId>
<artifactId>commons-pool2<artifactId>
<dependency>
<dependency>
<groupId>org.springframework.boot<groupId>
<artifactId>spring-boot-starter-web<artifactId>
<dependency>
<dependency>
<groupId>org.springframework.session<groupId>
<artifactId>spring-session-data-redis<artifactId>
<dependency>
<dependency>
<groupId>org.projectlombok<groupId>
<artifactId>lombok<artifactId>
<optional>true<optional>
<dependency>
<dependency>
<groupId>org.springframework.boot<groupId>
<artifactId>spring-boot-starter-test<artifactId>
<scope>test<scope>
<dependency>
<dependencies< span>>
spring-boot-starter-data-redis:在spring boot 2.x以后底層不再使用Jedis,而是換成了Lettuce。
commons-pool2:用作redis連接池,如不引入啟動(dòng)會(huì)報(bào)錯(cuò)
spring-session-data-redis:spring session引入,用作共享session。配置文件application.yml的配置:
創(chuàng)建實(shí)體類User.java
RedisTemplate的使用方式
默認(rèn)情況下的模板只能支持RedisTemplate
,也就是只能存入字符串,所以自定義模板很有必要。
添加配置類RedisCacheConfig.java
測(cè)試類
然后在瀏覽器訪問,觀察后臺(tái)日志 http://localhost:8082/user/test
使用spring cache集成redis
spring cache具備很好的靈活性,不僅能夠使用SPEL(spring expression language)來(lái)定義緩存的key和各種condition,還提供了開箱即用的緩存臨時(shí)存儲(chǔ)方案,也支持和主流的專業(yè)緩存如EhCache、Redis、Guava的集成。
定義接口UserService.java
接口實(shí)現(xiàn)類UserServiceImpl.java
為了方便演示數(shù)據(jù)庫(kù)的操作,這里直接定義了一個(gè)Map
,這里的核心是三個(gè)注解@Cachable、@CachePut和@CacheEvict。
測(cè)試類:UserController
用緩存要注意,啟動(dòng)類要加上一個(gè)注解開啟緩存
1、先調(diào)用添加接口:http://localhost:8082/user/add
2、再調(diào)用查詢接口,查詢id=4的用戶信息:
可以看出,這里已經(jīng)從緩存中獲取數(shù)據(jù)了,因?yàn)樯弦徊絘dd方法已經(jīng)把id=4的用戶數(shù)據(jù)放入了redis緩存 3、調(diào)用刪除方法,刪除id=4的用戶信息,同時(shí)清除緩存
3、再次調(diào)用查詢接口,查詢id=4的用戶信息:
沒有了緩存,所以進(jìn)入了get方法,從userMap中獲取。
緩存注解
1、@Cacheable
根據(jù)方法的請(qǐng)求參數(shù)對(duì)其結(jié)果進(jìn)行緩存
key:緩存的key,可以為空,如果指定要按照SPEL表達(dá)式編寫,如果不指定,則按照方法的所有參數(shù)進(jìn)行組合。
value:緩存的名稱,必須指定至少一個(gè)(如 @Cacheable (value='user')或者@Cacheable(value={'user1','user2'}))
condition:緩存的條件,可以為空,使用SPEL編寫,返回true或者false,只有為true才進(jìn)行緩存。
2、@CachePut
根據(jù)方法的請(qǐng)求參數(shù)對(duì)其結(jié)果進(jìn)行緩存,和@Cacheable不同的是,它每次都會(huì)觸發(fā)真實(shí)方法的調(diào)用。參數(shù)描述見上。
3、@CacheEvict
根據(jù)條件對(duì)緩存進(jìn)行清空
key:同上
value:同上
condition:同上
allEntries:是否清空所有緩存內(nèi)容,缺省為false,如果指定為true,則方法調(diào)用后將立即清空所有緩存
beforeInvocation:是否在方法執(zhí)行前就清空,缺省為false,如果指定為true,則在方法還沒有執(zhí)行的時(shí)候就清空緩存。缺省情況下,如果方法執(zhí)行拋出異常,則不會(huì)清空緩存。
緩存問題
面試官:看了一下你的demo,簡(jiǎn)單易懂。那你在實(shí)際項(xiàng)目中使用緩存有遇到什么問題或者會(huì)遇到什么問題你知道嗎?
我:緩存和數(shù)據(jù)庫(kù)數(shù)據(jù)一致性問題:分布式環(huán)境下非常容易出現(xiàn)緩存和數(shù)據(jù)庫(kù)間數(shù)據(jù)一致性問題,針對(duì)這一點(diǎn),如果項(xiàng)目對(duì)緩存的要求是強(qiáng)一致性的,那么就不要使用緩存。
我們只能采取合適的策略來(lái)降低緩存和數(shù)據(jù)庫(kù)間數(shù)據(jù)不一致的概率,而無(wú)法保證兩者間的強(qiáng)一致性。合適的策略包括合適的緩存更新策略,更新數(shù)據(jù)庫(kù)后及時(shí)更新緩存、緩存失敗時(shí)增加重試機(jī)制。
面試官:Redis雪崩了解嗎?
我:我了解的,目前電商首頁(yè)以及熱點(diǎn)數(shù)據(jù)都會(huì)去做緩存,一般緩存都是定時(shí)任務(wù)去刷新,或者查不到之后去更新緩存的,定時(shí)任務(wù)刷新就有一個(gè)問題。
舉個(gè)栗子:如果首頁(yè)所有Key的失效時(shí)間都是12小時(shí),中午12點(diǎn)刷新的,我零點(diǎn)有個(gè)大促活動(dòng)大量用戶涌入,假設(shè)每秒6000個(gè)請(qǐng)求,本來(lái)緩存可以抗住每秒5000個(gè)請(qǐng)求,但是緩存中所有Key都失效了。此時(shí)6000個(gè)/秒的請(qǐng)求全部落在了數(shù)據(jù)庫(kù)上,數(shù)據(jù)庫(kù)必然扛不住,真實(shí)情況可能DBA都沒反應(yīng)過來(lái)直接掛了
此時(shí),如果沒什么特別的方案來(lái)處理,DBA很著急,重啟數(shù)據(jù)庫(kù),但是數(shù)據(jù)庫(kù)立馬又被新流量給打死了。這就是我理解的緩存雪崩。
我心想:同一時(shí)間大面積失效,瞬間Redis跟沒有一樣,那這個(gè)數(shù)量級(jí)別的請(qǐng)求直接打到數(shù)據(jù)庫(kù)幾乎是災(zāi)難性的,你想想如果掛的是一個(gè)用戶服務(wù)的庫(kù),那其他依賴他的庫(kù)所有接口幾乎都會(huì)報(bào)錯(cuò),如果沒做熔斷等策略基本上就是瞬間掛一片的節(jié)奏,你怎么重啟用戶都會(huì)把你打掛,等你重啟好的時(shí)候,用戶早睡覺去了,臨睡之前,罵罵咧咧“什么垃圾產(chǎn)品”。
面試官摸摸了自己的頭發(fā):嗯,還不錯(cuò),那這種情況你都是怎么應(yīng)對(duì)的?
我:處理緩存雪崩簡(jiǎn)單,在批量往Redis存數(shù)據(jù)的時(shí)候,把每個(gè)Key的失效時(shí)間都加個(gè)隨機(jī)值就好了,這樣可以保證數(shù)據(jù)不會(huì)再同一時(shí)間大面積失效。
setRedis(key, value, time+Math.random()*10000);
如果Redis是集群部署,將熱點(diǎn)數(shù)據(jù)均勻分布在不同的Redis庫(kù)中也能避免全部失效。或者設(shè)置熱點(diǎn)數(shù)據(jù)永不過期,有更新操作就更新緩存就好了(比如運(yùn)維更新了首頁(yè)商品,那你刷下緩存就好了,不要設(shè)置過期時(shí)間),電商首頁(yè)的數(shù)據(jù)也可以用這個(gè)操作,保險(xiǎn)。
面試官:那你了解緩存穿透和擊穿么,可以說(shuō)說(shuō)他們跟雪崩的區(qū)別嗎?
我:嗯,了解,先說(shuō)下緩存穿透吧,緩存穿透是指緩存和數(shù)據(jù)庫(kù)中都沒有的數(shù)據(jù),而用戶(黑客)不斷發(fā)起請(qǐng)求,舉個(gè)栗子:我們數(shù)據(jù)庫(kù)的id都是從1自增的,如果發(fā)起id=-1的數(shù)據(jù)或者id特別大不存在的數(shù)據(jù),這樣的不斷攻擊導(dǎo)致數(shù)據(jù)庫(kù)壓力很大,嚴(yán)重會(huì)擊垮數(shù)據(jù)庫(kù)。
我又接著說(shuō):至于緩存擊穿嘛,這個(gè)跟緩存雪崩有點(diǎn)像,但是又有一點(diǎn)不一樣,緩存雪崩是因?yàn)榇竺娣e的緩存失效,打崩了DB,而緩存擊穿不同的是緩存擊穿是指一個(gè)Key非常熱點(diǎn),在不停地扛著大量的請(qǐng)求,大并發(fā)集中對(duì)這一個(gè)點(diǎn)進(jìn)行訪問,當(dāng)這個(gè)Key在失效的瞬間,持續(xù)的大并發(fā)直接落到了數(shù)據(jù)庫(kù)上,就在這個(gè)Key的點(diǎn)上擊穿了緩存。
面試官露出欣慰的眼光:那他們分別怎么解決?
我:緩存穿透我會(huì)在接口層增加校驗(yàn),比如用戶鑒權(quán),參數(shù)做校驗(yàn),不合法的校驗(yàn)直接return,比如id做基礎(chǔ)校驗(yàn),id<=0直接攔截。
面試官:那你還有別的方法嗎?
我:我記得Redis里還有一個(gè)高級(jí)用法布隆過濾器(Bloom Filter)這個(gè)也能很好的預(yù)防緩存穿透的發(fā)生,他的原理也很簡(jiǎn)單,就是利用高效的數(shù)據(jù)結(jié)構(gòu)和算法快速判斷出你這個(gè)Key是否在數(shù)據(jù)庫(kù)中存在,不存在你return就好了,存在你就去查DB刷新KV再return。
緩存擊穿的話,設(shè)置熱點(diǎn)數(shù)據(jù)永不過期,或者加上互斥鎖就搞定了。作為暖男,代碼給你準(zhǔn)備好了,拿走不謝。
面試官:嗯嗯,還不錯(cuò)。
Redis為何這么快
面試官:redis作為緩存大家都在用,那redis一定很快咯?
我:當(dāng)然了,官方提供的數(shù)據(jù)可以達(dá)到100000+的QPS(每秒內(nèi)的查詢次數(shù)),這個(gè)數(shù)據(jù)不比Memcached差!
面試官:redis這么快,它的“多線程模型”你了解嗎?(露出邪魅一笑)
我:您是想問Redis這么快,為什么還是單線程的吧。Redis確實(shí)是單進(jìn)程單線程的模型,因?yàn)镽edis完全是基于內(nèi)存的操作,CPU不是Redis的瓶頸,Redis的瓶頸最有可能是機(jī)器內(nèi)存的大小或者網(wǎng)絡(luò)帶寬。既然單線程容易實(shí)現(xiàn),而且CPU不會(huì)成為瓶頸,那就順理成章的采用單線程的方案了(畢竟采用多線程會(huì)有很多麻煩)。
面試官:嗯,是的。那你能說(shuō)說(shuō)Redis是單線程的,為什么還能這么快嗎?
我:可以這么說(shuō)吧。第一:Redis完全基于內(nèi)存,絕大部分請(qǐng)求是純粹的內(nèi)存操作,非常迅速,數(shù)據(jù)存在內(nèi)存中,類似于HashMap,HashMap的優(yōu)勢(shì)就是查找和操作的時(shí)間復(fù)雜度是O(1)。第二:數(shù)據(jù)結(jié)構(gòu)簡(jiǎn)單,對(duì)數(shù)據(jù)操作也簡(jiǎn)單。第三:采用單線程,避免了不必要的上下文切換和競(jìng)爭(zhēng)條件,不存在多線程導(dǎo)致的CPU切換,不用去考慮各種鎖的問題,不存在加鎖釋放鎖操作,沒有死鎖問題導(dǎo)致的性能消耗。第四:使用多路復(fù)用IO模型,非阻塞IO。
Redis和Memcached的區(qū)別
面試官:嗯嗯,說(shuō)的很詳細(xì)。那你為什么選擇Redis的緩存方案而不用memcached呢
我:
1、存儲(chǔ)方式上:memcache會(huì)把數(shù)據(jù)全部存在內(nèi)存之中,斷電后會(huì)掛掉,數(shù)據(jù)不能超過內(nèi)存大小。redis有部分?jǐn)?shù)據(jù)存在硬盤上,這樣能保證數(shù)據(jù)的持久性。
2、數(shù)據(jù)支持類型上:memcache對(duì)數(shù)據(jù)類型的支持簡(jiǎn)單,只支持簡(jiǎn)單的key-value,,而redis支持五種數(shù)據(jù)類型。
3、使用底層模型不同:它們之間底層實(shí)現(xiàn)方式以及與客戶端之間通信的應(yīng)用協(xié)議不一樣。redis直接自己構(gòu)建了VM機(jī)制,因?yàn)橐话愕南到y(tǒng)調(diào)用系統(tǒng)函數(shù)的話,會(huì)浪費(fèi)一定的時(shí)間去移動(dòng)和請(qǐng)求。
4、value的大?。簉edis可以達(dá)到1GB,而memcache只有1MB。
淘汰策略
面試官:那你說(shuō)說(shuō)你知道的redis的淘汰策略有哪些?
我:Redis有六種淘汰策略
補(bǔ)充一下:Redis4.0加入了LFU(least frequency use)淘汰策略,包括volatile-lfu和allkeys-lfu,通過統(tǒng)計(jì)訪問頻率,將訪問頻率最少,即最不經(jīng)常使用的KV淘汰。
持久化
面試官:你對(duì)redis的持久化機(jī)制了解嗎?能講一下嗎?
我:redis為了保證效率,數(shù)據(jù)緩存在了內(nèi)存中,但是會(huì)周期性的把更新的數(shù)據(jù)寫入磁盤或者把修改操作寫入追加的記錄文件中,以保證數(shù)據(jù)的持久化。Redis的持久化策略有兩種:
RDB:快照形式是直接把內(nèi)存中的數(shù)據(jù)保存到一個(gè)dump的文件中,定時(shí)保存,保存策略。
AOF:把所有的對(duì)Redis的服務(wù)器進(jìn)行修改的命令都存到一個(gè)文件里,命令的集合。Redis默認(rèn)是快照RDB的持久化方式。
當(dāng)Redis重啟的時(shí)候,它會(huì)優(yōu)先使用AOF文件來(lái)還原數(shù)據(jù)集,因?yàn)锳OF文件保存的數(shù)據(jù)集通常比RDB文件所保存的數(shù)據(jù)集更完整。你甚至可以關(guān)閉持久化功能,讓數(shù)據(jù)只在服務(wù)器運(yùn)行時(shí)存。
面試官:那你再說(shuō)下RDB是怎么工作的?
我:默認(rèn)Redis是會(huì)以快照"RDB"的形式將數(shù)據(jù)持久化到磁盤的一個(gè)二進(jìn)制文件dump.rdb。工作原理簡(jiǎn)單說(shuō)一下:當(dāng)Redis需要做持久化時(shí),Redis會(huì)fork一個(gè)子進(jìn)程,子進(jìn)程將數(shù)據(jù)寫到磁盤上一個(gè)臨時(shí)RDB文件中。當(dāng)子進(jìn)程完成寫臨時(shí)文件后,將原來(lái)的RDB替換掉,這樣的好處是可以copy-on-write。
我:RDB的優(yōu)點(diǎn)是:這種文件非常適合用于備份:比如,你可以在最近的24小時(shí)內(nèi),每小時(shí)備份一次,并且在每個(gè)月的每一天也備份一個(gè)RDB文件。這樣的話,即使遇上問題,也可以隨時(shí)將數(shù)據(jù)集還原到不同的版本。RDB非常適合災(zāi)難恢復(fù)。RDB的缺點(diǎn)是:如果你需要盡量避免在服務(wù)器故障時(shí)丟失數(shù)據(jù),那么RDB不合適你。
面試官:那你要不再說(shuō)下AOF??
我:(說(shuō)就一起說(shuō)下吧)使用AOF做持久化,每一個(gè)寫命令都通過write函數(shù)追加到appendonly.aof中,配置方式如下:
appendfsync yes
appendfsync always #每次有數(shù)據(jù)修改發(fā)生時(shí)都會(huì)寫入AOF文件。
appendfsync everysec #每秒鐘同步一次,該策略為AOF的缺省策略。
AOF可以做到全程持久化,只需要在配置中開啟 appendonly yes。這樣redis每執(zhí)行一個(gè)修改數(shù)據(jù)的命令,都會(huì)把它添加到AOF文件中,當(dāng)redis重啟時(shí),將會(huì)讀取AOF文件進(jìn)行重放,恢復(fù)到redis關(guān)閉前的最后時(shí)刻。
我頓了一下,繼續(xù)說(shuō):使用AOF的優(yōu)點(diǎn)是會(huì)讓redis變得非常耐久??梢栽O(shè)置不同的fsync策略,aof的默認(rèn)策略是每秒鐘fsync一次,在這種配置下,就算發(fā)生故障停機(jī),也最多丟失一秒鐘的數(shù)據(jù)。缺點(diǎn)是對(duì)于相同的數(shù)據(jù)集來(lái)說(shuō),AOF的文件體積通常要大于RDB文件的體積。根據(jù)所使用的fsync策略,AOF的速度可能會(huì)慢于RDB。
面試官又問:你說(shuō)了這么多,那我該用哪一個(gè)呢?
我:如果你非常關(guān)心你的數(shù)據(jù),但仍然可以承受數(shù)分鐘內(nèi)的數(shù)據(jù)丟失,那么可以額只使用RDB持久。AOF將Redis執(zhí)行的每一條命令追加到磁盤中,處理巨大的寫入會(huì)降低Redis的性能,不知道你是否可以接受。
數(shù)據(jù)庫(kù)備份和災(zāi)難恢復(fù):定時(shí)生成RDB快照非常便于進(jìn)行數(shù)據(jù)庫(kù)備份,并且RDB恢復(fù)數(shù)據(jù)集的速度也要比AOF恢復(fù)的速度快。當(dāng)然了,redis支持同時(shí)開啟RDB和AOF,系統(tǒng)重啟后,redis會(huì)優(yōu)先使用AOF來(lái)恢復(fù)數(shù)據(jù),這樣丟失的數(shù)據(jù)會(huì)最少。
主從復(fù)制
面試官:redis單節(jié)點(diǎn)存在單點(diǎn)故障問題,為了解決單點(diǎn)問題,一般都需要對(duì)redis配置從節(jié)點(diǎn),然后使用哨兵來(lái)監(jiān)聽主節(jié)點(diǎn)的存活狀態(tài),如果主節(jié)點(diǎn)掛掉,從節(jié)點(diǎn)能繼續(xù)提供緩存功能,你能說(shuō)說(shuō)redis主從復(fù)制的過程和原理嗎?
我有點(diǎn)懵,這個(gè)說(shuō)來(lái)就話長(zhǎng)了。但幸好提前準(zhǔn)備了:主從配置結(jié)合哨兵模式能解決單點(diǎn)故障問題,提高redis可用性。從節(jié)點(diǎn)僅提供讀操作,主節(jié)點(diǎn)提供寫操作。對(duì)于讀多寫少的狀況,可給主節(jié)點(diǎn)配置多個(gè)從節(jié)點(diǎn),從而提高響應(yīng)效率。
我頓了一下,接著說(shuō):關(guān)于復(fù)制過程,是這樣的:
從節(jié)點(diǎn)執(zhí)行slaveof[masterIP][masterPort],保存主節(jié)點(diǎn)信息
從節(jié)點(diǎn)中的定時(shí)任務(wù)發(fā)現(xiàn)主節(jié)點(diǎn)信息,建立和主節(jié)點(diǎn)的socket連接
從節(jié)點(diǎn)發(fā)送Ping信號(hào),主節(jié)點(diǎn)返回Pong,兩邊能互相通信
連接建立后,主節(jié)點(diǎn)將所有數(shù)據(jù)發(fā)送給從節(jié)點(diǎn)(數(shù)據(jù)同步)
主節(jié)點(diǎn)把當(dāng)前的數(shù)據(jù)同步給從節(jié)點(diǎn)后,便完成了復(fù)制的建立過程。接下來(lái),主節(jié)點(diǎn)就會(huì)持續(xù)的把寫命令發(fā)送給從節(jié)點(diǎn),保證主從數(shù)據(jù)一致性。
面試官:那你能詳細(xì)說(shuō)下數(shù)據(jù)同步的過程嗎?
(我心想:這也問的太細(xì)了吧)我:可以。redis2.8之前使用sync[runId][offset]同步命令,redis2.8之后使用psync[runId][offset]命令。
兩者不同在于,sync命令僅支持全量復(fù)制過程,psync支持全量和部分復(fù)制。介紹同步之前,先介紹幾個(gè)概念:
runId:每個(gè)redis節(jié)點(diǎn)啟動(dòng)都會(huì)生成唯一的uuid,每次redis重啟后,runId都會(huì)發(fā)生變化。
offset:主節(jié)點(diǎn)和從節(jié)點(diǎn)都各自維護(hù)自己的主從復(fù)制偏移量offset,當(dāng)主節(jié)點(diǎn)有寫入命令時(shí),offset=offset+命令的字節(jié)長(zhǎng)度。從節(jié)點(diǎn)在收到主節(jié)點(diǎn)發(fā)送的命令后,也會(huì)增加自己的offset,并把自己的offset發(fā)送給主節(jié)點(diǎn)。這樣,主節(jié)點(diǎn)同時(shí)保存自己的offset和從節(jié)點(diǎn)的offset,通過對(duì)比offset來(lái)判斷主從節(jié)點(diǎn)數(shù)據(jù)是否一致。
repl_backlog_size:保存在主節(jié)點(diǎn)上的一個(gè)固定長(zhǎng)度的先進(jìn)先出隊(duì)列,默認(rèn)大小是1MB。
主節(jié)點(diǎn)發(fā)送數(shù)據(jù)給從節(jié)點(diǎn)過程中,主節(jié)點(diǎn)還會(huì)進(jìn)行一些寫操作,這時(shí)候的數(shù)據(jù)存儲(chǔ)在復(fù)制緩沖區(qū)中。從節(jié)點(diǎn)同步主節(jié)點(diǎn)數(shù)據(jù)完成后,主節(jié)點(diǎn)將緩沖區(qū)的數(shù)據(jù)繼續(xù)發(fā)送給從節(jié)點(diǎn),用于部分復(fù)制。
主節(jié)點(diǎn)響應(yīng)寫命令時(shí),不但會(huì)把命名發(fā)送給從節(jié)點(diǎn),還會(huì)寫入復(fù)制積壓緩沖區(qū),用于復(fù)制命令丟失的數(shù)據(jù)補(bǔ)救。
上面是psync的執(zhí)行流程:
從節(jié)點(diǎn)發(fā)送psync[runId][offset]命令,主節(jié)點(diǎn)有三種響應(yīng):
FULLRESYNC:第一次連接,進(jìn)行全量復(fù)制
CONTINUE:進(jìn)行部分復(fù)制
ERR:不支持psync命令,進(jìn)行全量復(fù)制
面試官:很好,那你能具體說(shuō)下全量復(fù)制和部分復(fù)制的過程嗎?
我:可以
上面是全量復(fù)制的流程。主要有以下幾步:
從節(jié)點(diǎn)發(fā)送psync ? -1命令(因?yàn)榈谝淮伟l(fā)送,不知道主節(jié)點(diǎn)的runId,所以為?,因?yàn)槭堑谝淮螐?fù)制,所以offset=-1)。
主節(jié)點(diǎn)發(fā)現(xiàn)從節(jié)點(diǎn)是第一次復(fù)制,返回FULLRESYNC {runId} {offset},runId是主節(jié)點(diǎn)的runId,offset是主節(jié)點(diǎn)目前的offset。
從節(jié)點(diǎn)接收主節(jié)點(diǎn)信息后,保存到info中。
主節(jié)點(diǎn)在發(fā)送FULLRESYNC后,啟動(dòng)bgsave命令,生成RDB文件(數(shù)據(jù)持久化)。
主節(jié)點(diǎn)發(fā)送RDB文件給從節(jié)點(diǎn)。到從節(jié)點(diǎn)加載數(shù)據(jù)完成這段期間主節(jié)點(diǎn)的寫命令放入緩沖區(qū)。
從節(jié)點(diǎn)清理自己的數(shù)據(jù)庫(kù)數(shù)據(jù)。
從節(jié)點(diǎn)加載RDB文件,將數(shù)據(jù)保存到自己的數(shù)據(jù)庫(kù)中。
-如果從節(jié)點(diǎn)開啟了AOF,從節(jié)點(diǎn)會(huì)異步重寫AOF文件。
關(guān)于部分復(fù)制有以下幾點(diǎn)說(shuō)明:
1、部分復(fù)制主要是Redis針對(duì)全量復(fù)制的過高開銷做出的一種優(yōu)化措施,使用psync[runId][offset]命令實(shí)現(xiàn)。當(dāng)從節(jié)點(diǎn)正在復(fù)制主節(jié)點(diǎn)時(shí),如果出現(xiàn)網(wǎng)絡(luò)閃斷或者命令丟失等異常情況時(shí),從節(jié)點(diǎn)會(huì)向主節(jié)點(diǎn)要求補(bǔ)發(fā)丟失的命令數(shù)據(jù),主節(jié)點(diǎn)的復(fù)制積壓緩沖區(qū)將這部分?jǐn)?shù)據(jù)直接發(fā)送給從節(jié)點(diǎn),這樣就可以保持主從節(jié)點(diǎn)復(fù)制的一致性。補(bǔ)發(fā)的這部分?jǐn)?shù)據(jù)一般遠(yuǎn)遠(yuǎn)小于全量數(shù)據(jù)。
2、主從連接中斷期間主節(jié)點(diǎn)依然響應(yīng)命令,但因復(fù)制連接中斷命令無(wú)法發(fā)送給從節(jié)點(diǎn),不過主節(jié)點(diǎn)內(nèi)的復(fù)制積壓緩沖區(qū)依然可以保存最近一段時(shí)間的寫命令數(shù)據(jù)。
3、當(dāng)主從連接恢復(fù)后,由于從節(jié)點(diǎn)之前保存了自身已復(fù)制的偏移量和主節(jié)點(diǎn)的運(yùn)行ID。因此會(huì)把它們當(dāng)做psync參數(shù)發(fā)送給主節(jié)點(diǎn),要求進(jìn)行部分復(fù)制。
4、主節(jié)點(diǎn)接收到psync命令后首先核對(duì)參數(shù)runId是否與自身一致,如果一致,說(shuō)明之前復(fù)制的是當(dāng)前主節(jié)點(diǎn);之后根據(jù)參數(shù)offset在復(fù)制積壓緩沖區(qū)中查找,如果offset之后的數(shù)據(jù)存在,則對(duì)從節(jié)點(diǎn)發(fā)送+COUTINUE命令,表示可以進(jìn)行部分復(fù)制。因?yàn)榫彌_區(qū)大小固定,若發(fā)生緩沖溢出,則進(jìn)行全量復(fù)制。
5、主節(jié)點(diǎn)根據(jù)偏移量把復(fù)制積壓緩沖區(qū)里的數(shù)據(jù)發(fā)送給從節(jié)點(diǎn),保證主從復(fù)制進(jìn)入正常狀態(tài)。
哨兵
面試官:那主從復(fù)制會(huì)存在哪些問題呢?
我:主從復(fù)制會(huì)存在以下問題:
一旦主節(jié)點(diǎn)宕機(jī),從節(jié)點(diǎn)晉升為主節(jié)點(diǎn),同時(shí)需要修改應(yīng)用方的主節(jié)點(diǎn)地址,還需要命令所有從節(jié)點(diǎn)去復(fù)制新的主節(jié)點(diǎn),整個(gè)過程需要人工干預(yù)。
主節(jié)點(diǎn)的寫能力受到單機(jī)的限制。
主節(jié)點(diǎn)的存儲(chǔ)能力受到單機(jī)的限制。
原生復(fù)制的弊端在早期的版本中也會(huì)比較突出,比如:redis復(fù)制中斷后,從節(jié)點(diǎn)會(huì)發(fā)起psync。此時(shí)如果同步不成功,則會(huì)進(jìn)行全量同步,主庫(kù)執(zhí)行全量備份的同時(shí),可能會(huì)造成毫秒或秒級(jí)的卡頓。
面試官:那比較主流的解決方案是什么呢?
我:當(dāng)然是哨兵啊。
面試官:那么問題又來(lái)了。那你說(shuō)下哨兵有哪些功能?
我:如圖,是Redis Sentinel(哨兵)的架構(gòu)圖。Redis Sentinel(哨兵)主要功能包括主節(jié)點(diǎn)存活檢測(cè)、主從運(yùn)行情況檢測(cè)、自動(dòng)故障轉(zhuǎn)移、主從切換。Redis Sentinel最小配置是一主一從。
Redis的Sentinel系統(tǒng)可以用來(lái)管理多個(gè)Redis服務(wù)器,該系統(tǒng)可以執(zhí)行以下四個(gè)任務(wù):
監(jiān)控:不斷檢查主服務(wù)器和從服務(wù)器是否正常運(yùn)行。
通知:當(dāng)被監(jiān)控的某個(gè)redis服務(wù)器出現(xiàn)問題,Sentinel通過API腳本向管理員或者其他應(yīng)用程序發(fā)出通知。
自動(dòng)故障轉(zhuǎn)移:當(dāng)主節(jié)點(diǎn)不能正常工作時(shí),Sentinel會(huì)開始一次自動(dòng)的故障轉(zhuǎn)移操作,它會(huì)將與失效主節(jié)點(diǎn)是主從關(guān)系的其中一個(gè)從節(jié)點(diǎn)升級(jí)為新的主節(jié)點(diǎn),并且將其他的從節(jié)點(diǎn)指向新的主節(jié)點(diǎn),這樣人工干預(yù)就可以免了。
配置提供者:在Redis Sentinel模式下,客戶端應(yīng)用在初始化時(shí)連接的是Sentinel節(jié)點(diǎn)集合,從中獲取主節(jié)點(diǎn)的信息。
面試官:那你能說(shuō)下哨兵的工作原理嗎?
我:話不多說(shuō),直接上圖:
1、每個(gè)Sentinel節(jié)點(diǎn)都需要定期執(zhí)行以下任務(wù):每個(gè)Sentinel以每秒一次的頻率,向它所知的主服務(wù)器、從服務(wù)器以及其他的Sentinel實(shí)例發(fā)送一個(gè)PING命令。(如上圖)
2、如果一個(gè)實(shí)例距離最后一次有效回復(fù)PING命令的時(shí)間超過down-after-milliseconds所指定的值,那么這個(gè)實(shí)例會(huì)被Sentinel標(biāo)記為主觀下線。(如上圖)
3、如果一個(gè)主服務(wù)器被標(biāo)記為主觀下線,那么正在監(jiān)視這個(gè)服務(wù)器的所有Sentinel節(jié)點(diǎn),要以每秒一次的頻率確認(rèn)主服務(wù)器的確進(jìn)入了主觀下線狀態(tài)。
4、如果一個(gè)主服務(wù)器被標(biāo)記為主觀下線,并且有足夠數(shù)量的Sentinel(至少要達(dá)到配置文件指定的數(shù)量)在指定的時(shí)間范圍內(nèi)同意這一判斷,那么這個(gè)主服務(wù)器被標(biāo)記為客觀下線。
5、一般情況下,每個(gè)Sentinel會(huì)以每10秒一次的頻率向它已知的所有主服務(wù)器和從服務(wù)器發(fā)送INFO命令,當(dāng)一個(gè)主服務(wù)器被標(biāo)記為客觀下線時(shí),Sentinel向下線主服務(wù)器的所有從服務(wù)器發(fā)送INFO命令的頻率,會(huì)從10秒一次改為每秒一次。
6、Sentinel和其他Sentinel協(xié)商客觀下線的主節(jié)點(diǎn)的狀態(tài),如果處于SDOWN狀態(tài),則投票自動(dòng)選出新的主節(jié)點(diǎn),將剩余從節(jié)點(diǎn)指向新的主節(jié)點(diǎn)進(jìn)行數(shù)據(jù)復(fù)制。
7、當(dāng)沒有足夠數(shù)量的Sentinel同意主服務(wù)器下線時(shí),主服務(wù)器的客觀下線狀態(tài)就會(huì)被移除。當(dāng)主服務(wù)器重新向Sentinel的PING命令返回有效回復(fù)時(shí),主服務(wù)器的主觀下線狀態(tài)就會(huì)被移除。
面試官:不錯(cuò),面試前沒少下工夫啊,今天Redis這關(guān)你過了,明天找個(gè)時(shí)間我們?cè)倭牧钠渌?。(露出欣慰的微笑?/span>
我:沒問題。
總結(jié)
本文在一次面試的過程中講述了Redis是什么,Redis的特點(diǎn)和功能,Redis緩存的使用,Redis為什么能這么快,Redis緩存的淘汰策略,持久化的兩種方式,Redis高可用部分的主從復(fù)制和哨兵的基本原理。
只要功夫深,鐵杵磨成針,平時(shí)準(zhǔn)備好,面試不用慌。雖然面試不一定是這樣問的,但萬(wàn)變不離其“宗”。(筆者覺得這種問答形式的博客很不錯(cuò),可讀性強(qiáng)而且讀后記的比較深刻)
End
作者:堅(jiān)持就是勝利 , 本文版權(quán)歸作者所有
https://juejin.im/post/5dccf260f265da0bf66b626d
特別推薦一個(gè)分享架構(gòu)+算法的優(yōu)質(zhì)內(nèi)容,還沒關(guān)注的小伙伴,可以長(zhǎng)按關(guān)注一下:
長(zhǎng)按訂閱更多精彩▼
如有收獲,點(diǎn)個(gè)在看,誠(chéng)摯感謝
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問題,請(qǐng)聯(lián)系我們,謝謝!