www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 智能硬件 > 人工智能AI
[導(dǎo)讀] 做人工智能的都是靠腦力勞動(dòng)的高級(jí)程序員嗎? 真相并不是這樣的。 目前人工智能的深度學(xué)習(xí)算法是建立在大數(shù)據(jù)的基礎(chǔ)上的,人工智能在工作過程中首先要對(duì)大數(shù)據(jù)進(jìn)行挖掘,然后再利用大數(shù)據(jù)訓(xùn)

做人工智能的都是靠腦力勞動(dòng)的高級(jí)程序員嗎?

真相并不是這樣的。

目前人工智能的深度學(xué)習(xí)算法是建立在大數(shù)據(jù)的基礎(chǔ)上的,人工智能在工作過程中首先要對(duì)大數(shù)據(jù)進(jìn)行挖掘,然后再利用大數(shù)據(jù)訓(xùn)練人工智能模型。

對(duì)于圖片數(shù)據(jù)來說,這一工作說起來好像很簡(jiǎn)單,但實(shí)際上整個(gè)工作過程并不智能,這背后隱藏著一個(gè)賺錢十分辛苦而且工作內(nèi)容非常枯燥的勞動(dòng)密集型的產(chǎn)業(yè)。

人工智能女神李飛飛開創(chuàng)“數(shù)據(jù)標(biāo)注”產(chǎn)業(yè)

2005年,當(dāng)時(shí)還沒有出名的李飛飛進(jìn)入了斯坦福大學(xué)人工智能實(shí)驗(yàn)室,選擇了當(dāng)時(shí)還很冷門的研究方向——計(jì)算機(jī)視覺圖像識(shí)別。

計(jì)算機(jī)視覺圖象識(shí)別,主要目的讓計(jì)算機(jī)讀懂圖像——對(duì)計(jì)算機(jī)來說,每一張圖片都是3個(gè)矩陣按照不同權(quán)重疊加的結(jié)果,這3個(gè)數(shù)學(xué)上的矩陣被稱為RGB顏色矩陣。

對(duì)于自動(dòng)駕駛來說,計(jì)算機(jī)要從這三個(gè)矩陣中找出紅綠燈與斑馬線的位置,難度其實(shí)是很高的。對(duì)于人工智能安防監(jiān)控來說,也是一樣的道理,基礎(chǔ)的人臉識(shí)別需要用到很復(fù)雜的算法。

這些事情看起來十分困難。因?yàn)橐層?jì)算機(jī)識(shí)別“斑馬線”、“紅綠燈”、“人臉”其實(shí)就好像我們要訓(xùn)練一只小狗,讓它過馬路的時(shí)候要走斑馬線,要看得懂紅綠燈標(biāo)志,要記得住路上行人的相貌一樣。但實(shí)際上小狗的智商遠(yuǎn)比計(jì)算機(jī)要高得多,因此訓(xùn)練計(jì)算機(jī)做機(jī)器視覺遠(yuǎn)比訓(xùn)練小狗來得困難。

在2005年,計(jì)算機(jī)可識(shí)別的物體非常稀少。李飛飛與她的研究團(tuán)隊(duì)從互聯(lián)網(wǎng)上下載了近10億張圖片,然后試圖對(duì)這些圖片進(jìn)行分類、打上標(biāo)簽,為計(jì)算機(jī)提供學(xué)習(xí)用的“題庫”。這個(gè)“題庫”后來發(fā)展為著名的ImageNet。

那么,怎么樣才可以把10億張圖片分類打上標(biāo)簽?zāi)??以一個(gè)人每天可以分類1000張圖片來計(jì)算工作量,10億張圖片需要一個(gè)人干上100萬天,也就是2740年。這是一個(gè)巨大的工作量。李飛飛曾想過雇用大學(xué)生來完成這個(gè)工作,預(yù)計(jì)支付給每人10美元一小時(shí)的工資來做人工歸類,但用她能找到的大學(xué)生來人工完成這個(gè)項(xiàng)目需要90年的時(shí)間,而且開支是一個(gè)天文數(shù)字。所以,最后李飛飛只能去找更便宜更快速的方法。

后來,李飛飛找到了一種更快速的方式,這就是亞馬遜的眾包平臺(tái)。通過眾包平臺(tái),李飛飛在網(wǎng)上雇傭到了5萬人,請(qǐng)他們?yōu)檫@10億張圖片分類、打標(biāo)簽。

到2009年,李飛飛主導(dǎo)的ImageNet數(shù)據(jù)庫就包含了1500萬張已經(jīng)標(biāo)注好的照片,這是一筆非??少F的數(shù)據(jù)財(cái)富。李飛飛把這個(gè)圖片數(shù)據(jù)庫免費(fèi)開放使用,極大地造福了全球所有致力于計(jì)算機(jī)視覺識(shí)別的研究團(tuán)隊(duì)。

李飛飛所開創(chuàng)的這個(gè)行業(yè),后來在人工智能領(lǐng)域被稱為“數(shù)據(jù)標(biāo)注”。目前,這一行業(yè)已經(jīng)在中國形成了一個(gè)勞動(dòng)密集型產(chǎn)業(yè)。

數(shù)據(jù)標(biāo)注產(chǎn)業(yè)是人工智能的“富士康”

在人工智能的光環(huán)背后,數(shù)據(jù)標(biāo)注產(chǎn)業(yè)其實(shí)由一個(gè)個(gè)類似于“富士康”的勞動(dòng)密集型工廠組成的。

在這些工廠里往往布滿了一排排的電腦,這些電腦屏幕上是各個(gè)被放大的物體圖像的細(xì)節(jié),還有一個(gè)一個(gè)標(biāo)注框。數(shù)據(jù)標(biāo)注員的工作內(nèi)容包括拉框標(biāo)點(diǎn),打標(biāo)簽,分割,批注等等。

其中對(duì)圖片最常見的分類就是打標(biāo)簽,比如有一種打標(biāo)簽的方法是描點(diǎn)標(biāo)注,一般用于細(xì)致的人臉標(biāo)注:這需要在人臉的眉毛、眼睛、鼻子、嘴巴等關(guān)鍵部位做二十多個(gè)標(biāo)記點(diǎn)——這個(gè)過程很像微軟的KINECT的骨架圖,也類似于數(shù)學(xué)上的“三角剖分”。

硅谷動(dòng)力君在網(wǎng)上查閱了做數(shù)據(jù)標(biāo)注的公司——“北京博雅海圖數(shù)據(jù)服務(wù)有限公司”。該公司是這樣介紹自己的:博雅數(shù)據(jù)相繼成立以“博雅上海”、“博雅北京”、“博雅溫哥華”三家子公司,同時(shí)又在衡水、濟(jì)南、武漢、西安等城市建立了自己的數(shù)據(jù)加工中心,目前是國內(nèi)生產(chǎn)規(guī)模較大的數(shù)據(jù)錄入服務(wù)企業(yè),現(xiàn)全職錄入員超過200人,博雅的管理人員,均從事錄入行業(yè)五年以上,具有良好的敬業(yè)精神和團(tuán)隊(duì)精神。

從“博雅海圖數(shù)據(jù)服務(wù)”的相關(guān)介紹來看,該公司在河北、山東、山西與湖北建立了自己的數(shù)據(jù)加工中心,這些數(shù)據(jù)加工中心有一部分業(yè)務(wù)就是為人工智能企業(yè)提供“數(shù)據(jù)標(biāo)注”服務(wù)。

另據(jù)報(bào)道,翊澳數(shù)據(jù)也是一家類似的數(shù)據(jù)標(biāo)注公司,其在河南的十幾個(gè)縣市里建立了類似的數(shù)據(jù)標(biāo)注工廠。為什么要在河南的縣城建立這樣的工廠呢?原來“下面這些地方場(chǎng)地租金更便宜,員工工資也低,更省成本?!彼?,這也讓這些工廠看起來像“富士康”,服務(wù)于“高科技”,但實(shí)際上卻是“勞動(dòng)密集型產(chǎn)業(yè)”。

因?yàn)閿?shù)據(jù)標(biāo)注其實(shí)沒有什么技術(shù)難度,只要有會(huì)用電腦的初中生就可以勝任這樣的工作。整個(gè)工作流程也相對(duì)單一,只需要把圖片中的事物識(shí)別出來,然后在圖片上標(biāo)記出來就可以了。但這個(gè)工作需要一個(gè)工人每天處理上千張圖片,工作內(nèi)容相對(duì)單一,眼睛也十分疲憊。所以,很多人因?yàn)槿淌懿涣巳绱烁邚?qiáng)度的視力勞動(dòng),選擇了跳槽。但也有很多工人堅(jiān)持了下來,雖然他們不一定懂得他們處理的這些圖片是怎么用到人工智能行業(yè)的,但毫無疑問的是,這些工人是人工智能產(chǎn)業(yè)鏈上“沉默的大多數(shù)”,他們給人工智能行業(yè)提供了源源不斷的原材料。

數(shù)據(jù)標(biāo)注眾包模式正在造就一個(gè)新產(chǎn)業(yè)

數(shù)據(jù)標(biāo)注眾包模式最早出現(xiàn)在美國,前面說過的人工智能女神李飛飛就是在2005年亞馬遜剛推出勞務(wù)眾包平臺(tái)(Amazon Mechanical Turk)找到那批數(shù)據(jù)標(biāo)注員的。

截至2017年底,亞馬遜的數(shù)據(jù)勞務(wù)眾包平臺(tái)注冊(cè)用戶量已經(jīng)累計(jì)超過50萬,這其實(shí)類似于美團(tuán)把很多送外賣的快遞小哥連接在了一起,亞馬遜的數(shù)據(jù)勞務(wù)眾包平臺(tái)也把眾多的數(shù)據(jù)標(biāo)注員連接在了一起。

目前在中國,還沒有出現(xiàn)面向個(gè)人的眾包數(shù)據(jù)標(biāo)注平臺(tái),但已經(jīng)出現(xiàn)了一批做數(shù)據(jù)標(biāo)注的企業(yè),這些企業(yè)相對(duì)于個(gè)人來說更加專業(yè),工作效率更高,服務(wù)質(zhì)量更有保障,所以得到了很多人工智能企業(yè)的好評(píng)。因?yàn)楹芏嗳斯ぶ悄芷髽I(yè)本身位于一二線大城市,很難承擔(dān)這種勞動(dòng)密集型工作的人員工資,于是把數(shù)據(jù)標(biāo)注這部分工作外包給數(shù)據(jù)標(biāo)注企業(yè),可以節(jié)省很多用工成本。

因此,有人高幄建瓴地總結(jié)這個(gè)產(chǎn)業(yè):沒有“人工”就沒有“智能”,這一幕很可能是人工智能產(chǎn)業(yè)發(fā)展史上的最為隱秘而壯觀的一幕。

數(shù)據(jù)標(biāo)注的工作內(nèi)容非??菰锒倚枰獦O大的耐心,這處于人工智能高科技產(chǎn)業(yè)鏈的低端,這一工作內(nèi)容看起來基本沒有技術(shù)含量。

那么,中國有哪些從事數(shù)據(jù)標(biāo)注的企業(yè)呢?除了前文提到的博雅海圖與翊澳數(shù)據(jù)這兩家公司,其他的相關(guān)公司還有BasicFinder、龍貓數(shù)據(jù)、星塵數(shù)據(jù)、愛數(shù)智慧、周同科技等。

除了圖片標(biāo)注,目前還誕生了語音標(biāo)注與視頻標(biāo)注等相關(guān)的業(yè)務(wù)方向,其原則上與圖片標(biāo)注沒有太大的區(qū)別,都是依靠大量的人力進(jìn)行工作。

另外,像京東、百度、騰訊、阿里這樣的大公司都有自己的標(biāo)注平臺(tái)和工具。

數(shù)據(jù)標(biāo)注行業(yè)的轉(zhuǎn)包現(xiàn)象與未來

數(shù)據(jù)標(biāo)注行業(yè)屬于勞動(dòng)密集型行業(yè),所以很容易出現(xiàn)層層轉(zhuǎn)包地現(xiàn)象,上游的人工智能企業(yè)會(huì)把任務(wù)交給中游的數(shù)據(jù)標(biāo)注公司,這些中游的公司會(huì)分包給下游的小公司與小作坊,有的小作坊還會(huì)進(jìn)一步分包給個(gè)人,比如在校學(xué)生或家庭主婦。轉(zhuǎn)包的中間過程產(chǎn)生了大量賺差價(jià)的“中間商”,這使得整個(gè)行業(yè)的利潤(rùn)空間越來越小,已經(jīng)不利于整個(gè)行業(yè)的發(fā)展。所以,硅谷動(dòng)力君認(rèn)為,應(yīng)該采取一定的措施禁止這種層層轉(zhuǎn)包的事情發(fā)生。

另外一方面,我們需要展望未來,目前看來,數(shù)據(jù)標(biāo)注員的工作是最不智能、最沒有技術(shù)含量的。對(duì)于未來的人工智能來說,科學(xué)家們還必須研究如何讓人工智能自主學(xué)習(xí),自主標(biāo)記,而不依賴人類對(duì)人工智能的標(biāo)注與訓(xùn)練。這種更高級(jí)的人工智能,是未來的發(fā)展方向之一。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉