AI時(shí)代變成算法上天道德入地了嗎
隨著AI熱的興起,算法這個原本專屬于計(jì)算機(jī)行業(yè)的詞匯也開始頻繁出現(xiàn)在公眾眼里。仔細(xì)一看,算法和算力這些詞頗有神秘感。算法本來的定義是計(jì)算機(jī)專業(yè)領(lǐng)域用來解決問題的方法和思路。這個詞匯和大眾的認(rèn)知有很遙遠(yuǎn)的距離。但是AI開始介入到我們每個人的日常的時(shí)候,我們也開始被算法和模型管理了。
算法界大神,編程的藝術(shù)系列書的作者,斯坦福大學(xué)教授,圖靈機(jī)獲得者Knuth說過,算法+數(shù)據(jù)結(jié)構(gòu)+編程語言=計(jì)算機(jī)科學(xué)。這差不多說明了算法對計(jì)算機(jī)領(lǐng)域的重要性。當(dāng)然,經(jīng)典意義上的算法,和今天在AI時(shí)代大家討論的算法以及算法工程師,其實(shí)是有不同的。但是作為吃瓜群眾來說,這種不同知道和不知道都無所謂。
在我們不經(jīng)意的這幾年里,算法開始占據(jù)我們的方方面面。比如說,你每天閱讀的文章,都是經(jīng)過算法精心推薦的。你的衣食住行的信息,只要是坐落在智能手機(jī)的APP里的那些東西,背后都有一個算法的幽靈??梢赃@樣說,人類個體的生活方方面面正在被算法接管。
這種接管是好是壞呢?有人擔(dān)心人工智能會毀滅人類,有人覺得人工智能帶給人類的是更美好的未來。我想技術(shù)可能沒有正確錯誤之說,但是使用技術(shù)的人類就不好說了
博弈論上有一個非常著名的群體實(shí)驗(yàn)。其中的一個版本大致是這樣的。一群人進(jìn)場,每個人交100塊錢報(bào)名費(fèi)來玩一個游戲。游戲的規(guī)則是,每個人可以任意從0到100里面選一個數(shù)。大家都不知道對方選了什么。等到主持人把所有的人的數(shù)字都收上來之后,會根據(jù)大家選的數(shù)字取一個平均值。在現(xiàn)場所有的人里面,選的那個數(shù)字最接近平均值2/3的人將贏取所有的報(bào)名費(fèi)。如果有不止一個人,大家平分獎金。
這個游戲非常的有意思。因?yàn)榇蠹叶贾廊绻腥穗S機(jī)選的話,那么平均值大約在50,而平均值的2/3大約在33左右。所以如果自詡聰明的話,肯定會選33。更聰明的人會再想想,既然大家都可能選33,所以整體平均值肯定比50更低,所以更聰明的人會選擇更低的數(shù)字。
這個實(shí)驗(yàn)曾經(jīng)在美國各大高校做過很多次。得出來的結(jié)論有兩條:
實(shí)驗(yàn)對象的智商越高,最后的平均值越低實(shí)驗(yàn)如果重復(fù)多次,平均值總是會越來越低。
這個實(shí)驗(yàn)用來研究很多群體性的活動,尤其是有相互反饋的活動,有很大的參考意義。
因?yàn)樯碓趪猓瑢鴥?nèi)的很多信息都比較落伍。大概兩個多月前,在朋友的推薦下,我下載了著名的某某某某新聞端。這個APP號稱可以個性化的推薦最適合我的新聞。我想也許這樣的方式既可以了解國內(nèi)的動態(tài),也可以透過這個APP了解我是一個什么樣的人。
最初打開APP的時(shí)候,我看到的嚇一跳。感情人咬狗現(xiàn)在都不是新聞了。又感情自己是一個非常低俗的人。但是畢竟我是學(xué)計(jì)算機(jī)的。我知道任何算法要能夠有效的推薦,都需要數(shù)據(jù)。而我現(xiàn)在第一次登陸,是白板一個。我肚子里的蛔蟲也無法給我推薦什么,何況某某某某。
所以說某某某某推薦的實(shí)際上是當(dāng)前整個人群里面,或者根據(jù)我個人信息的某個細(xì)分人群里面的平均值。這就有意思了。原來大家其實(shí)都挺低俗的。呵呵呵呵。
我們講到過那個著名的博弈論的實(shí)驗(yàn)。那么我們是不是可以認(rèn)為某某某某的推薦系統(tǒng),也是一種群體活動。我們是不是可以進(jìn)一步認(rèn)為,這個群體活動如果重復(fù)多少次以后,其目標(biāo)函數(shù)會向某個方向收斂。
那個博弈論游戲,如果我們把獲獎的人改成平均值的1.5倍那么,最后平均值會越來越高。如果我們說平均值獲獎的話,這個游戲理論上來講,重復(fù)多少次都和重復(fù)一次結(jié)果是一樣的。這樣一來,給予參與游戲的人的獎勵函數(shù)的指向性就非常的重要了。
那么如果從整個世界范圍來看的話,這些年來人類物質(zhì)文明是極大豐富了的。AI的到來更是讓人成為衣來張口飯來伸手的二足哺乳動物。你想,前些年要閱讀新聞,還得去門戶網(wǎng)站搜索引擎那主動的搜,現(xiàn)在只需要靜靜等待被某某某某喂食,這難道不是極大的豐富嗎?
但是我們也不可否認(rèn),人類整體道德水準(zhǔn)在下降。比如我們偉大的祖國,可能20年前的人不太能夠想象20年后的今天。到底是什么造成了道德的下降,是一個很復(fù)雜的問題。但是從評價(jià)函數(shù)來看,做什么樣的事情可以獲得獎勵,那么這樣的群體活動重復(fù)多次以后,整個社會就往某個方面傾斜了。
所以我們只剩下最后一個問題,到底算法主導(dǎo)下的群體活動,帶給我們的,是一個道德體系飆升的評價(jià)函數(shù),還是一個道德落地的評價(jià)函數(shù)。這個問題,我們先不談原因。起碼從結(jié)果來看是很明顯。要不為什么我打開某某某某的時(shí)候,看到的是這樣的景象呢?
至于原因,其實(shí)我想原因也很簡單。因?yàn)樗姓莆樟怂惴ê退懔Φ娜斯ぶ悄苤鲗?dǎo)者,都是公司,都是希望并且渴望大把賺錢的。我們不能夠指望他們做雷鋒。所以他們的獎勵機(jī)制,最主要的一點(diǎn)肯定是希望用了他們的服務(wù)的人能夠盡可能多的留在他們的圈子里。最理想的狀態(tài)應(yīng)該是一天24小時(shí)一年365天不離開。
而讓人類能夠存留下來的激勵機(jī)制,最有效的肯定不是高尚的道德,更多的還是滿足人類的需求和欲望。至于后者,既容易賺錢又行之有效。何樂而不為?所以,我們可以看到某某某某之類的,新聞越來越獵奇越來越人咬狗,其營收和市值則不斷的飚升。
我的結(jié)論是AI時(shí)代,算法上天,道德入地。但愿我錯了。