6月16日消息,中國科學(xué)院自動化研究所今天發(fā)布了該所研制的新一代AI大模型——紫東太初2.0。
全新大模型相比第一代著力提升了決策與判斷能力,實現(xiàn)了從感知、認知到?jīng)Q策的跨越,未來將在醫(yī)療、交通、工業(yè)生產(chǎn)等領(lǐng)域發(fā)揮更大作用。
第一代紫東太初AI大模型于2021年問世,由中國科學(xué)院自動化研究所和華為聯(lián)合開發(fā),區(qū)別于當(dāng)前以文本為主的大部分語言大模型,是全球首個圖文音三模態(tài)大模型,實現(xiàn)了無標(biāo)識的圖像、文字、語音的識別能力。
這次發(fā)布的“紫東太初”2.0全模態(tài)大模型,不但優(yōu)化了文本、圖片、語音的融合認知,還進一步加入了視頻、傳感信號、3D點云等識別能力。
新版本突破了多模態(tài)分組認知編碼、解碼,全模態(tài)認知等關(guān)鍵技術(shù),提升了系統(tǒng)的決策和判斷能力,打通了系統(tǒng)識別能力從感知、認知到?jīng)Q策的通路,從而拓展出更為廣泛的應(yīng)用場景。
目前,由中科院自動化所牽頭打造的多模態(tài)人工智能產(chǎn)業(yè)聯(lián)合體已陸續(xù)吸納產(chǎn)學(xué)研各界近70家成員單位。紫東太初大模型已經(jīng)在神經(jīng)外科手術(shù)導(dǎo)航、短視頻內(nèi)容審核、醫(yī)療多模態(tài)鑒別診斷、交通違規(guī)圖像研讀等多領(lǐng)域應(yīng)用。