科大訊飛將為你“量身”播放音樂(lè)
7月16日下午消息,科大訊飛發(fā)布非公開(kāi)發(fā)行股票發(fā)行情況報(bào)告暨上市公告,共向十名投資者發(fā)行1.08億股新增股份,用于新一代感知及認(rèn)知智能核心技術(shù)研發(fā)、智能語(yǔ)音人工智能開(kāi)放平臺(tái)、銷售與服務(wù)體系升級(jí)建設(shè)等項(xiàng)目。
隨著現(xiàn)代生活水平的不斷提高,人們對(duì)于娛樂(lè)化的需求也越來(lái)越多樣性,計(jì)算機(jī)技術(shù)、圖像識(shí)別技術(shù)已逐步應(yīng)用于日常生活中各個(gè)領(lǐng)域中,例如,可以在數(shù)以億萬(wàn)計(jì)的人群中迅速定位目標(biāo)人物,也可以根據(jù)人臉圖像判斷人臉表情信息。目前隨著音視頻內(nèi)容的多樣性,音視頻壓縮技術(shù)的成熟,存儲(chǔ)技術(shù)的提高,出現(xiàn)了大量根據(jù)人臉圖像推薦音樂(lè)的應(yīng)用,該應(yīng)用將音樂(lè)與圖像以一種新的形式展現(xiàn)給用戶,受到了越來(lái)越多用戶的關(guān)注與喜愛(ài)。
其實(shí)早在15年7月30日,科大訊飛就申請(qǐng)了一項(xiàng)名為“一種基于人臉的音視頻推薦方法及系統(tǒng)”的發(fā)明專利(申請(qǐng)?zhí)枺?01510467751.9),申請(qǐng)人為科大訊飛股份有限公司。
根據(jù)目前公開(kāi)的專利資料,讓我們一起來(lái)了解一下科大訊飛的這項(xiàng)音視頻推薦系統(tǒng)吧。
如上圖為音視頻推薦方法的流程圖,具體可以包括以下這些步驟。
首先,接收用戶發(fā)送的包含人臉的用戶圖像。這些用戶圖像可以是用戶使用移動(dòng)終端設(shè)備拍攝的包含人臉的圖像??梢杂校河脩舻淖耘恼?、朋友間的合照、家庭成員的全家福照片等。
其次,確定所述用戶圖像中人臉的數(shù)量,包括人臉檢測(cè)、人臉的局部特征點(diǎn)定位??梢灶A(yù)先收集大量包含人臉的用戶圖像,通過(guò)提取尺度不變特征轉(zhuǎn)換特征,訓(xùn)練人臉與非人臉的分類模型,利用該模型對(duì)用戶圖像中的人臉進(jìn)行檢測(cè)。在確定了用戶圖像中所有人臉?biāo)诘奈恢煤螅瑢?duì)該位置區(qū)域進(jìn)行人臉特征點(diǎn)檢測(cè),以確定人臉的局部特征點(diǎn) ( 如眼睛、眉毛、鼻子、嘴巴、臉部外輪廓 ) 的位置。
接著,根據(jù)用戶圖像的人臉檢測(cè)、人臉的局部特征點(diǎn)定位結(jié)果,即可確定用戶圖像中人臉的數(shù)量。如果為一個(gè),則執(zhí)行1):
1)提取包含單個(gè)人臉用戶圖像相關(guān)的特征信息:?jiǎn)蝹€(gè)人臉特征提取主要包括根據(jù)單個(gè)人臉信息獲取用戶屬性相關(guān)信息( 如年齡、性別、是否化妝等信息 )、計(jì)算明星相似度、獲取用戶圖像的拍攝時(shí)間。
如果多于一個(gè),則執(zhí)行2):
2)提取包含多個(gè)人臉的圖像特征信息:對(duì)于包含多個(gè)人臉的用戶圖像,可以提取的圖像特征信息可以有 :圖像整體氛圍、人臉親密度等。
如果不包含人臉,則不進(jìn)行音視頻推薦或推薦預(yù)先設(shè)定的通用音視頻。
最后,根據(jù)提取的圖像特征信息確定向所述用戶推薦的音視頻,并將音視頻推薦給所述用戶。
了解了科大訊飛的音視頻推薦方法后,大家是不是還是覺(jué)得很神奇,因?yàn)檫@樣的智能技術(shù)距離人們的生活還存在一定的距離,還需要產(chǎn)品的落地。不過(guò)想想音箱能夠看著你就能夠播放出你喜歡的音樂(lè),真是一件令人激動(dòng)的事情,讓我們期待這樣的產(chǎn)品的到來(lái)!