當前位置：首頁 > 芯聞號 > 充電吧

Reddit高贊：機器學習領域「八宗罪」！同行評審變味，盲目崇拜盛行

時間：2020-07-20 11:02:01

關鍵字：人工智能機器學習計算機

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀] 近日，Reddit社區(qū)一篇批判機器學習領域的文章引發(fā)了熱議，獲得了3.1k的贊。作者細數(shù)了機器學習領域存在的「八宗罪」，讓科研人員對機器學習大環(huán)境有了新的思考。越來越多的科研人員都選擇進入機器學

近日，Reddit社區(qū)一篇批判機器學習領域的文章引發(fā)了熱議，獲得了3.1k的贊。作者細數(shù)了機器學習領域存在的「八宗罪」，讓科研人員對機器學習大環(huán)境有了新的思考。

越來越多的科研人員都選擇進入機器學習這個領域。

科研人員進入領域時的初衷是「偉大」的：他們相信，機器學習能夠真正的改善人們的生活。所以每年機器學習有關的頂會投稿數(shù)目幾乎是成倍的增長，這些新的科研成果似乎真的能帶來一個更好的未來。

Reddit社區(qū)一位作者卻站出來說：「The machine learning community has a toxicity problem.」

他細數(shù)了機器學習領域的「八宗罪」，讓科研人員對現(xiàn)行的機器學習大環(huán)境進行有了新的思考。這篇文章在Reddit收到了3.1k的贊。

細數(shù)機器學習「八宗罪」

一宗罪：同行評審過程被破壞了。

NeurIPS會議中接收的論文，每四篇就會有一篇被放在arXiv上。有些DeepMind 的研究人員公開追究那些批評他們 ICLR 投稿的評論者。雖然審稿人對這些知名機構的arXiv論文給出了拒絕的意見，但是最后仍然被一些頂會接收。

二宗罪：成果復現(xiàn)引發(fā)了危機。

在測試集中調整優(yōu)化超參數(shù)似乎是現(xiàn)在的標準做法。但是，即便使用技巧讓超參數(shù)得到了調優(yōu)，性能是否真正提高是一件不置可否的事情。

三宗罪：崇拜主義問題。

和斯坦福，Google或DeepMind存在聯(lián)系的每篇論文都會得到贊譽，BERT被引用的次數(shù)是ULMfit的七倍。ICML會議上，DeepMind海報吸引力遠高于別的海報。此外，盡管NeurIPS 和ICML都是頂級ML會議，前者提交量是后者的兩倍，或許僅僅是因為「神經(jīng)」這個詞語？

四宗罪：攻擊和好斗。

前幾日Yann LeCun談論偏見和公平話題時的語氣是直率的，但是攻擊他的人的語氣卻是惡毒的，并且太多太多人選擇攻擊他而忽略了事件本身。人們或許沒有意識到，逼迫LeCun離開推特其實沒有解決任何問題。

五宗罪：逃避性別歧視和種族主義。

像其他的計算機科學學科一樣，機器學習也存在著多樣性問題。不可否認的，在我們的CS系中，只有30％的本科生和15％的教授是女性。在博士學位或博士后休育兒假通常意味著學術生涯的結束。領域中的研究者選擇逃避來掩飾自己對種族主義或性別歧視的害怕，但是卻讓這個問題更嚴峻。

六宗罪：道德和倫理是任意設定的。

美國國內政治主導著所有討論，包括學術界的。計算機視覺算法的數(shù)據(jù)集幾乎不涉及超10億人口的非洲人，但沒人在乎。每個人都會在研究最后說「有更深遠的影響」，但是這樣的影響往往限定在特定人群內。

七宗罪：機械性的論文發(fā)表。

研究只是為了發(fā)表，撰寫論文的唯一目的已經(jīng)變成在簡歷中增加一行文字。論文質量？那是次要的，重點是通過同行評審。研究小組的人數(shù)多到導師不一定能知道每個博士生的名字，每年向NeurIPS提交50篇以上的論文已經(jīng)成為某些研究人員的常態(tài)。

八宗罪：語言文明在討論中是不存在的。

Schmidhuber稱Hinton為小偷，Gebru稱LeCun為白人至上主義者，Anandkumar稱Marcus為性別主義者。研究人員很容易受到攻擊，被套上「侮辱性」的帽子，但這甚至和研究本身無關。

「八宗罪」惹爭議，網(wǎng)友為機器學習「辯駁」

「盲目崇拜確實存在，但我想提出另一個假設，說明Google / DeepMind 的論文為何受到更多關注：信任」。

每天都會有大量新發(fā)表的論文，所以不可能全部讀完。使用作者進行過濾是我常用的方法，盡管有偏見，但是很有效。不是說DeepMind的研究人員比其他人更有才華，但他們承擔更多的風險。

DeepMind發(fā)表的論文通常是有效的，如果論文灌水或者不可復現(xiàn)，那將對整個公司產(chǎn)生不良影響，因此，這些組織發(fā)表的論文很可能在發(fā)布之前就經(jīng)過了更嚴格的「質量控制」流程和內部同行評審。

我自己對此感到內疚，因為我定期閱讀的是arXiv提交的新文章的「標題」。

當我看到一些有趣的東西時，我會先看作者，如果是DeepMind / Google / OpenAI / etc，我會仔細看一下。如果是一群我從未聽說過的人，我就會翻篇。為什么？因為在我看來，后一組作者更有可能「編造東西」，而且他們的錯誤沒有被注意到，因為他們沒有像DeepMind論文那樣經(jīng)歷相同的內部質量控制，我更有可能收到錯的信息。這與我崇拜DeepMind無關，由于他們的工作方式讓我更信任。

這樣做錯了嗎？也許確實有偏見，我們應該更多關注內容本身，但是有時論文太多了，誰也不想浪費時間。

也有人反駁這種偷懶的行為?！肝揖湍懿豢醋髡撸焖僮x完一堆論文」。好吧，一目十行君真的有。

關于第三宗罪也有網(wǎng)友為Google鳴不平，BERT讓語言模型變得非常易用給其他研究者做了很多鋪墊，確實該獲得更多關注，ULMfit引用量沒BERT多也很自然。

網(wǎng)友@dataism和幾個小伙伴還專門寫了一篇論文討論當前機器學習領域論文存在的幾個突出問題。

最近機器學習的進展，尤其是深度學習，引入了幾個復雜任務中超越傳統(tǒng)算法和人類的方法，從圖像中的物體檢測、語音識別到玩困難的戰(zhàn)略游戲，然而很多算法以及它們在現(xiàn)實世界中的應用，似乎存在一個循環(huán) HARKing (結果已知然后還提出假設)。

這篇文章詳細闡述了這一現(xiàn)象的算法、經(jīng)濟和社會原因以及后果。文中列舉了一些常見的操作，例如將負面結果隱去，不提泛化能力等等，感興趣的同學可以仔細讀一下，降低論文被拒的風險（我并不是在宣傳這些灌水技巧）。

還有一個比較熱的討論是關于作者學校的歧視，這在學術界很普遍，尤其是在CS / ML領域。

當你身處哈佛、斯坦福，你的論文被接受的概率就會高很多。而這些名校的錄取本身就是有財富和名譽偏見的，你可以找一堆理由否認，但數(shù)據(jù)不會說謊。

如果你的父母念過斯坦福，那么你被錄取的概率就是其他人的三倍！哈佛的情況也不例外。

父母收入在Top 1%的學生占了15.4%的比例。

「多元化與包容性」的口號在機器學習領域幾乎完全拋棄了貧窮家庭或沒有接受過高水平教育的家庭。在學術界，來自社會底層的學生被拒絕的比例可能更瘋狂。

本站聲明：本文章由作者或相關機構授權發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者，如若文章內容侵犯您的權益，請及時聯(lián)系本站刪除。

換一批

阿維塔、賽力斯已入股！華為引望可能成“中國博世”

9月2日消息，不造車的華為或將催生出更大的獨角獸公司，隨著阿維塔和賽力斯的入局，華為引望愈發(fā)顯得引人矚目。

關鍵字：阿維塔塞力斯華為

[美通社全球TMT]

Trianz與AWS達成戰(zhàn)略合作協(xié)議，徹底改變云采用和管理方式

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布，該公司與Amazon Web Services （AWS）簽訂了...

關鍵字： AWS AN BSP 數(shù)字化

[美通社全球TMT]

人工智能驅動工具SODA V將顛覆汽車市場，使汽車開發(fā)時間和成本降低90%

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產(chǎn)品SODA V，這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具，可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字：汽車人工智能智能驅動 BSP

[美通社全球TMT]

從容應對未知風險----解密亞馬遜云科技的韌性之道

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行，同時企業(yè)卻面臨越來越多業(yè)務中斷的風險，如企業(yè)系統(tǒng)復雜性的增加，頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性，提升韌性，成...

關鍵字：亞馬遜解密控制平面 BSP

[通信先鋒]

中國游戲市場開始復蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

8月30日消息，據(jù)媒體報道，騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字：騰訊編碼器 CPU

[通信先鋒]

獨立自主！華為董事：致力打造不依賴西方的技術

8月28日消息，今天上午，2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行，華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字：華為 12nm EDA 半導體

[通信先鋒]

華為張平安：數(shù)字世界話語權最終由生態(tài)繁榮決定！

8月28日消息，在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上，華為常務董事、華為云CEO張平安發(fā)表演講稱，數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字：華為 12nm 手機衛(wèi)星通信

[美通社全球TMT]

中國通信服務公布2024年中期業(yè)績

要點：有效應對環(huán)境變化，經(jīng)營業(yè)績穩(wěn)中有升落實提質增效舉措，毛利潤率延續(xù)升勢戰(zhàn)略布局成效顯著，戰(zhàn)新業(yè)務引領增長以科技創(chuàng)新為引領，提升企業(yè)核心競爭力堅持高質量發(fā)展策略，塑強核心競爭優(yōu)勢...

關鍵字：通信 BSP 電信運營商數(shù)字經(jīng)濟

[美通社全球TMT]

NVI技術創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動產(chǎn)業(yè)鏈高速發(fā)展

北京2024年8月27日 /美通社/ -- 8月21日，由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字： VI 傳輸協(xié)議音頻 BSP

[美通社全球TMT]