10種機(jī)器學(xué)習(xí)的工具和框架
10種機(jī)器學(xué)習(xí)的工具和框架。
1.亞馬遜Sagemaker
AWS re:Invent 2017上宣布的一款重大產(chǎn)品就是正式發(fā)布的亞馬遜Sagemaker,這種新的框架簡(jiǎn)化了構(gòu)建機(jī)器學(xué)習(xí)模型并部署到云端的任務(wù)。
這項(xiàng)服務(wù)對(duì)于并不深入了解機(jī)器學(xué)習(xí)的開(kāi)發(fā)人員來(lái)說(shuō)非常有用,因?yàn)樗鼮殚_(kāi)發(fā)人員提供了一系列預(yù)先構(gòu)建的開(kāi)發(fā)環(huán)境,基于流行的Jupyter筆記本格式。如果數(shù)據(jù)科學(xué)家不希望花費(fèi)大量時(shí)間,就可以在AWS上構(gòu)建有效的機(jī)器學(xué)習(xí)系統(tǒng),并對(duì)性能進(jìn)行微調(diào),就會(huì)發(fā)現(xiàn)這項(xiàng)服務(wù)大有用處。
相關(guān)鏈接:
https://datahub.packtpub.com/machine-learning/amazon-sagemaker-machine-learning-service/
2.DSSTNEDSSTNE(通常名為Destiny)是亞馬遜提供的另一款產(chǎn)品,這種開(kāi)源庫(kù)被用于開(kāi)發(fā)機(jī)器學(xué)習(xí)模型。它的主要優(yōu)勢(shì)在于可以用來(lái)訓(xùn)練和部署處理稀疏輸入的推薦模型。使用DSSTNE開(kāi)發(fā)的模型經(jīng)訓(xùn)練后可以使用多個(gè)GPU,具有可擴(kuò)展性,并針對(duì)快速性能進(jìn)行了優(yōu)化。
該庫(kù)在GitHub上有近4000顆星,它是2018年值得關(guān)注的另一款工具!
相關(guān)鏈接:https://github.com/amzn/amazon-dsstne
3.Azure機(jī)器學(xué)習(xí)工作臺(tái)早在2014年,微軟就發(fā)布了Azure機(jī)器學(xué)習(xí)工具,將機(jī)器學(xué)習(xí)和人工智能功能放到云端。不過(guò)這嚴(yán)格來(lái)說(shuō)是一種純?cè)品?wù)。在今年9月召開(kāi)的Ignite 2017大會(huì)上,微軟宣布了下一代Azure端機(jī)器學(xué)習(xí)工具,通過(guò)Azure機(jī)器學(xué)習(xí)工作臺(tái),為眾多企業(yè)組織帶來(lái)機(jī)器學(xué)習(xí)功能。
Azure機(jī)器學(xué)習(xí)工具臺(tái)是一個(gè)跨平臺(tái)客戶軟件,它在Windows機(jī)器和蘋(píng)果機(jī)器上都可以運(yùn)行。它是為想要執(zhí)行數(shù)據(jù)操縱和處理任務(wù)的數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)開(kāi)發(fā)人員量身打造的。它為確??蓴U(kuò)展性而構(gòu)建,用戶可以從一系列廣泛的數(shù)據(jù)源獲得直觀的洞察力,并用于數(shù)據(jù)建模任務(wù)。
相關(guān)鏈接:https://azure.microsoft.com/en-in/services/machine-learning-services/
4.Neon早在2016年,英特爾宣布斥資3.5億美元收購(gòu)Nervana,打算成為人工智能市場(chǎng)的大玩家。Nervana是一家人工智能初創(chuàng)公司,一直在為機(jī)器學(xué)習(xí)開(kāi)發(fā)軟硬件。有了Neon,他們現(xiàn)在擁有一個(gè)快速、高性能的深度學(xué)習(xí)框架,專(zhuān)門(mén)為了在最近宣布的Nervana神經(jīng)網(wǎng)絡(luò)處理器上運(yùn)行而設(shè)計(jì)。
Neon在設(shè)計(jì)當(dāng)初力求易于使用,并支持與iPython筆記本集成,它支持常見(jiàn)的深度學(xué)習(xí)模型,比如CNN、RNN、LSTM及其他模型。該框架顯示出日臻完善的跡象,在GitHub上有3000多顆星。Neon勢(shì)必會(huì)在未來(lái)幾年挑戰(zhàn)幾大深度學(xué)習(xí)庫(kù)。
相關(guān)鏈接:https://github.com/NervanaSystems/neon
5.微軟DMLT企業(yè)在機(jī)器學(xué)習(xí)方面面臨的主要挑戰(zhàn)之一是,需要迅速擴(kuò)展模型,在盡量減少資源使用的同時(shí),又不犧牲性能。微軟的分布式機(jī)器學(xué)習(xí)框架(DMLT)旨在做到這一點(diǎn)。DMLT由微軟開(kāi)放源代碼,那樣它可以從社區(qū)獲得更廣泛的支持。它讓機(jī)器學(xué)習(xí)開(kāi)發(fā)人員和數(shù)據(jù)科學(xué)家拿來(lái)單機(jī)器算法后可以擴(kuò)大其規(guī)模,進(jìn)而構(gòu)建高性能分布式模型。
DMLT主要專(zhuān)注于分布式機(jī)器學(xué)習(xí)算法,讓你可以輕松地執(zhí)行諸如字嵌入、采樣和梯度提升之類(lèi)的任務(wù)。該框架目前還不支持對(duì)深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,不過(guò)我們預(yù)計(jì)這項(xiàng)功能很快就會(huì)被添加到該框架中。
相關(guān)鏈接:http://www.dmtk.io/
6.谷歌云機(jī)器學(xué)習(xí)引擎云機(jī)器學(xué)習(xí)引擎被認(rèn)為是谷歌主要的機(jī)器學(xué)習(xí)產(chǎn)品,它讓你可以比較輕松地針對(duì)各種各樣的數(shù)據(jù)來(lái)構(gòu)建機(jī)器學(xué)習(xí)模型。該平臺(tái)充分利用流行的Tensorflow機(jī)器學(xué)習(xí)框架,可用于執(zhí)行大規(guī)模預(yù)測(cè)分析。它還讓你可以使用流行的HyperTune功能,對(duì)機(jī)器學(xué)習(xí)模型的性能進(jìn)行微調(diào)和優(yōu)化。
由于無(wú)服務(wù)器架構(gòu)支持自動(dòng)監(jiān)控、配置和擴(kuò)展,機(jī)器學(xué)習(xí)引擎確保你只需要為想要訓(xùn)練哪種機(jī)器學(xué)習(xí)模型而操心。這項(xiàng)功能尤其適用于期望外出時(shí)可以構(gòu)建大規(guī)模模型的機(jī)器學(xué)習(xí)開(kāi)發(fā)人員。
相關(guān)鏈接:https://cloud.google.com/ml-engine/
7.蘋(píng)果Core MLCore ML框架由蘋(píng)果開(kāi)發(fā),旨在幫助iOS開(kāi)發(fā)人員構(gòu)建更智能的應(yīng)用程序,它是讓Siri更智能的秘訣。它充分利用CPU的功能和GPU的功能,讓開(kāi)發(fā)人員得以構(gòu)建不同類(lèi)型的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型,然后這些模型可以無(wú)縫集成到iOS應(yīng)用程序中。Core ML支持所有常用的機(jī)器學(xué)習(xí)算法,比如決策樹(shù)、支持向量機(jī)和線性模型等等。
Core ML的功能針對(duì)實(shí)際環(huán)境的諸多使用場(chǎng)合,比如自然語(yǔ)言處理和計(jì)算機(jī)視覺(jué)等,因而外出時(shí)可以在蘋(píng)果設(shè)備上分析數(shù)據(jù),無(wú)需導(dǎo)入到模型來(lái)學(xué)習(xí)。
相關(guān)鏈接:https://developer.apple.com/machine-learning/
8.蘋(píng)果Turi Create在許多情況下,iOS開(kāi)發(fā)人員想要定制希望集成到所開(kāi)發(fā)的應(yīng)用程序中的機(jī)器學(xué)習(xí)模型。為此,蘋(píng)果推出了Turi Create。該庫(kù)讓你得以專(zhuān)注于手頭的任務(wù),而不是決定使用哪種算法。那樣就可以在數(shù)據(jù)集、模型需要運(yùn)行的規(guī)模以及需要將模型部署到哪個(gè)平臺(tái)方面做到很靈活。
Turi Create用起來(lái)很方便,可用于為推薦、圖像處理、文本分類(lèi)及眾多任務(wù)構(gòu)建自定義模型。你只需要對(duì)Python有所了解,即可上手!
相關(guān)鏈接:https://github.com/apple/turicreate
9.Convnetjs深度學(xué)習(xí)不僅僅出現(xiàn)在超級(jí)計(jì)算機(jī)和機(jī)器集群上,現(xiàn)在它還切實(shí)出現(xiàn)在你的互聯(lián)網(wǎng)瀏覽器上!現(xiàn)在你使用流行的基于Javascript的Convnetjs庫(kù),就可以直接在瀏覽器上訓(xùn)練先進(jìn)的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型,不需要CPU或GPU。
該庫(kù)最初由特斯拉公司的現(xiàn)任人工智能主管安德烈?卡帕錫(Andrej Karpathy)編寫(xiě),此后被開(kāi)源,在社區(qū)的積極貢獻(xiàn)下有所擴(kuò)展。你可以直接在瀏覽器上輕松訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),甚至訓(xùn)練強(qiáng)化學(xué)習(xí)模型,這有賴于這個(gè)非常獨(dú)特而有用的庫(kù)提供支持。這個(gè)庫(kù)適合不想購(gòu)買(mǎi)專(zhuān)業(yè)硬件來(lái)訓(xùn)練計(jì)算密集型模型的那些人。Convnetjs在GitHub上有近9000顆星,它儼然是2017年的明星項(xiàng)目之一,迅速成為深度學(xué)習(xí)方面的首選庫(kù)。
相關(guān)鏈接:http://cs.stanford.edu/people/karpathy/convnetjs/
10.BigMLBigML是一家知名的機(jī)器學(xué)習(xí)公司,為開(kāi)發(fā)機(jī)器學(xué)習(xí)模型提供了一個(gè)易于使用的平臺(tái)。使用BigML的REST API,你可以在其平臺(tái)上順暢無(wú)阻地訓(xùn)練機(jī)器學(xué)習(xí)模型。它讓你可以執(zhí)行不同的任務(wù),比如異常檢測(cè)和時(shí)間序列預(yù)測(cè),還可以構(gòu)建執(zhí)行實(shí)時(shí)預(yù)測(cè)分析的應(yīng)用程序。
借助BigML,你可以在本地或在云端部署模型,可以靈活地選擇運(yùn)行機(jī)器學(xué)習(xí)模型所需要的那種環(huán)境。BigML恪守承諾,力求“使機(jī)器學(xué)習(xí)對(duì)每個(gè)人而言都異常簡(jiǎn)單”。
由于微軟、亞馬遜和谷歌都競(jìng)相成為人工智能領(lǐng)域的霸主,2018年可能會(huì)是人工智能領(lǐng)域發(fā)展迎來(lái)突破的一年。除此之外還有旨在為用戶簡(jiǎn)化機(jī)器學(xué)習(xí)的各種開(kāi)源庫(kù),還有一大堆的工具和框架需要密切關(guān)注。令人興奮的是,它們都有能力成為下一個(gè)TensorFlow,帶來(lái)下一場(chǎng)AI顛覆。