科大訊飛將為你“量身”播放音樂(lè)

時(shí)間：2019-09-04 14:51:01

關(guān)鍵字：科大訊飛

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]7月16日下午消息，科大訊飛發(fā)布非公開(kāi)發(fā)行股票發(fā)行情況報(bào)告暨上市公告，共向十名投資者發(fā)行1.08億股新增股份，用于新一代感知及認(rèn)知智能核心技術(shù)研發(fā)、智能語(yǔ)音人工智能開(kāi)放平臺(tái)、銷售與服務(wù)體系升級(jí)建設(shè)等項(xiàng)

7月16日下午消息，科大訊飛發(fā)布非公開(kāi)發(fā)行股票發(fā)行情況報(bào)告暨上市公告，共向十名投資者發(fā)行1.08億股新增股份，用于新一代感知及認(rèn)知智能核心技術(shù)研發(fā)、智能語(yǔ)音人工智能開(kāi)放平臺(tái)、銷售與服務(wù)體系升級(jí)建設(shè)等項(xiàng)目。

隨著現(xiàn)代生活水平的不斷提高，人們對(duì)于娛樂(lè)化的需求也越來(lái)越多樣性，計(jì)算機(jī)技術(shù)、圖像識(shí)別技術(shù)已逐步應(yīng)用于日常生活中各個(gè)領(lǐng)域中，例如，可以在數(shù)以億萬(wàn)計(jì)的人群中迅速定位目標(biāo)人物，也可以根據(jù)人臉圖像判斷人臉表情信息。目前隨著音視頻內(nèi)容的多樣性，音視頻壓縮技術(shù)的成熟，存儲(chǔ)技術(shù)的提高，出現(xiàn)了大量根據(jù)人臉圖像推薦音樂(lè)的應(yīng)用，該應(yīng)用將音樂(lè)與圖像以一種新的形式展現(xiàn)給用戶，受到了越來(lái)越多用戶的關(guān)注與喜愛(ài)。

其實(shí)早在15年7月30日，科大訊飛就申請(qǐng)了一項(xiàng)名為“一種基于人臉的音視頻推薦方法及系統(tǒng)”的發(fā)明專利（申請(qǐng)?zhí)枺?01510467751.9），申請(qǐng)人為科大訊飛股份有限公司。

根據(jù)目前公開(kāi)的專利資料，讓我們一起來(lái)了解一下科大訊飛的這項(xiàng)音視頻推薦系統(tǒng)吧。

如上圖為音視頻推薦方法的流程圖，具體可以包括以下這些步驟。

首先，接收用戶發(fā)送的包含人臉的用戶圖像。這些用戶圖像可以是用戶使用移動(dòng)終端設(shè)備拍攝的包含人臉的圖像?？梢杂校河脩舻淖耘恼?、朋友間的合照、家庭成員的全家福照片等。

其次，確定所述用戶圖像中人臉的數(shù)量，包括人臉檢測(cè)、人臉的局部特征點(diǎn)定位?？梢灶A(yù)先收集大量包含人臉的用戶圖像，通過(guò)提取尺度不變特征轉(zhuǎn)換特征，訓(xùn)練人臉與非人臉的分類模型，利用該模型對(duì)用戶圖像中的人臉進(jìn)行檢測(cè)。在確定了用戶圖像中所有人臉?biāo)诘奈恢煤螅瑢?duì)該位置區(qū)域進(jìn)行人臉特征點(diǎn)檢測(cè)，以確定人臉的局部特征點(diǎn) ( 如眼睛、眉毛、鼻子、嘴巴、臉部外輪廓 ) 的位置。

接著，根據(jù)用戶圖像的人臉檢測(cè)、人臉的局部特征點(diǎn)定位結(jié)果，即可確定用戶圖像中人臉的數(shù)量。如果為一個(gè)，則執(zhí)行1）：

1）提取包含單個(gè)人臉用戶圖像相關(guān)的特征信息：?jiǎn)蝹€(gè)人臉特征提取主要包括根據(jù)單個(gè)人臉信息獲取用戶屬性相關(guān)信息( 如年齡、性別、是否化妝等信息 )、計(jì)算明星相似度、獲取用戶圖像的拍攝時(shí)間。

如果多于一個(gè)，則執(zhí)行2）：

2）提取包含多個(gè)人臉的圖像特征信息：對(duì)于包含多個(gè)人臉的用戶圖像，可以提取的圖像特征信息可以有：圖像整體氛圍、人臉親密度等。

如果不包含人臉，則不進(jìn)行音視頻推薦或推薦預(yù)先設(shè)定的通用音視頻。

最后，根據(jù)提取的圖像特征信息確定向所述用戶推薦的音視頻，并將音視頻推薦給所述用戶。

了解了科大訊飛的音視頻推薦方法后，大家是不是還是覺(jué)得很神奇，因?yàn)檫@樣的智能技術(shù)距離人們的生活還存在一定的距離，還需要產(chǎn)品的落地。不過(guò)想想音箱能夠看著你就能夠播放出你喜歡的音樂(lè)，真是一件令人激動(dòng)的事情，讓我們期待這樣的產(chǎn)品的到來(lái)！