當前位置：首頁 > 智能硬件 > 智能硬件

配上AI技術(shù)后，智能手機的拍照功能能否比肩單反？

時間：2019-03-29 09:21:45

關(guān)鍵字： ai技術(shù) 卷積神經(jīng)網(wǎng)絡(luò) 智能手機

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀]智能手機攝影的長期趨勢當然是遠離現(xiàn)實主義，而轉(zhuǎn)向取得更引人注目的效果。這在計算攝影誕生之前是無法想象的。因此，我們可能會看到3D傳感技術(shù)的應(yīng)用趨向于超現(xiàn)實主義。

目前，出現(xiàn)在新一代智能手機上的3D傳感器，只是機器學(xué)習(xí)所引發(fā)的攝影技術(shù)浪潮的冰山一角，該類技術(shù)將不僅僅糾正智能手機照片的缺點，還將為攝影帶來一些令人驚嘆的新元素。

攝影在智能手機時代已經(jīng)發(fā)生了改變，不僅拍攝姿勢不同(比如自拍)，手機攝像頭捕捉光線的整個過程也變得完全不一樣了。攝像頭不再只是一個透鏡和傳感器，它們還集成了一組算法，這些算法可以立即處理圖像，瞬間就能獲得桌面軟件耗費數(shù)小時才能實現(xiàn)的照片效果，攝影已然成為計算領(lǐng)域的一門學(xué)問。

人工智能機器學(xué)習(xí)形式持續(xù)不斷的進步將會帶來更多的功能，讓今天的智能手機照片變得過時。

外媒認為，體現(xiàn)當今手機的尖端攝影技術(shù)的最新例子包括：Alphabet子公司谷歌的Pixel 3智能手機照片，以及蘋果iPhone X的照片。在Pixel 3上，谷歌使用機器學(xué)習(xí)在低光照條件下捕捉更多的細節(jié)，使得夜景看起來像白天。這些根本不是自然界中曾經(jīng)存在過的鏡頭，它們完全是超分辨率的圖片。

從2017年推出iPhone X開始，蘋果公司添加了“bokeh”，巧妙地模糊了焦點之外的元素，這并不是像傳統(tǒng)攝影那樣通過鏡頭本身的某些方面來實現(xiàn)的，而是通過在捕捉到圖像后對像素進行計算調(diào)整來實現(xiàn)的。

“移軸”相機

我們預(yù)測，2019年和2020年的突破性發(fā)展很有可能是通過操控圖像的視角來改善，希望這能糾正智能手機攝影中固有的失真問題，這些失真使得智能手機在數(shù)碼單反(DSLR)相機照片面前相形見絀。

卷積神經(jīng)網(wǎng)絡(luò)(CNN)試圖從一張圖片中重構(gòu)現(xiàn)實的過程

事實上，它們可以達到類似于“移軸”相機的效果。在移軸相機中，鏡頭所成的角度可彌補一個人站在相機前的角度，從而糾正由于個人與場景之間的角度造成的圖像失真。單反相機用戶可以在由不同的供應(yīng)商提供的各種可拆卸鏡頭中實現(xiàn)移軸功能。

一般的手機攝像頭都有一個非常小的透鏡鏡筒，因此它所捕捉到的一切東西都是扭曲的。在現(xiàn)實世界中，沒有什么形狀是恰到好處的。大多數(shù)人可能不會注意到，又或者可能不會在意，因為他們已經(jīng)習(xí)慣了Instagram上的自拍。但如果能改善這些畸變就更好了。這一點能做到的話，那么它將會是來自谷歌、蘋果等公司的下一輪智能手機主推的一個賣點。

iPhone和其它品牌的手機將越來越多地搭載帶有3D傳感器的后置攝像頭。這些傳感器由Lumentum Holdings和其他的芯片供應(yīng)商等公司制造，通過發(fā)出光束并計算它們在物體反彈后如何返回手機，來測量手機周圍環(huán)境的深度。“飛行時間”等技術(shù)可以讓手機詳細測量周圍環(huán)境的三維結(jié)構(gòu)。

那些傳感器可以利用的是，近年來為了解二維圖像和現(xiàn)實世界之間的關(guān)系而進行的大量統(tǒng)計工作。

谷歌Pixel 3智能手機上的“夜景”功能

人們做了大量的統(tǒng)計工作來實現(xiàn)移軸鏡頭那樣的物理特性，不管是有特殊攝像裝置的，還是沒有特殊攝像裝置的。例如，一項名為“隨機抽樣一致性”(RANSAC)的技術(shù)可以追溯到1981年，專門用于尋找三維世界中的地標，這些地標可以映射到二維圖像平面上的點，以便了解二維圖像與三維現(xiàn)實世界之間的關(guān)系。使用這種技術(shù)，可以更好地理解二維呈現(xiàn)是如何與現(xiàn)實世界相對應(yīng)的。

2015年，佛羅倫薩大學(xué)的一組研究人員在RANSAC技術(shù)的基礎(chǔ)上，通過對相機拍攝的照片進行逆向推理，推導(dǎo)出了一種泛傾斜變焦相機的結(jié)構(gòu)，他們能夠通過軟件來分析相機位置的不同在多大程度上引發(fā)了失真，從而有效地將控制相機的執(zhí)行機構(gòu)調(diào)至最佳狀態(tài)，他們可以將這種技術(shù)用于視頻，而不僅僅是用于靜止的圖像。

2017年，德國埃爾蘭根-紐倫堡大學(xué)和伍茲霍爾海洋學(xué)研究所的研究人員展示了一個名為CameraTransform的Python庫，該庫可讓人們通過對拍攝的圖像進行逆向計算，來估算物體在現(xiàn)實世界中的真實尺寸。

四角觀察：研究人員創(chuàng)建的一種神經(jīng)網(wǎng)絡(luò)，由編碼器和解碼器結(jié)合生成的對抗性網(wǎng)絡(luò)組成，被用于推斷圖片中被遮擋的物體

去年，德國慕尼黑工業(yè)大學(xué)和佳能公司的研究人員表示，只需拍一張圖片就可以推斷出被另一個物體遮擋的場景中有什么。這種技術(shù)被稱為“分層深度圖像”，可以通過從照片中移除一個物體來創(chuàng)建新的場景，呈現(xiàn)相機從未見過的背景，但這是通過圖像計算實現(xiàn)的。該方法使用了許多神經(jīng)網(wǎng)絡(luò)應(yīng)用中常見的編碼-解碼器方法來估計場景的深度，也使用了“生成對抗網(wǎng)絡(luò)”(GAN)來構(gòu)造場景中在拍攝照片時從未實際出現(xiàn)在視野里的部分。

所有的這些研究正在不斷涌現(xiàn)，并將在下一代配備3D傳感器的智能手機攝像頭上達到高潮，帶來一些不可思議的功能特性。這種研究應(yīng)該會帶來令人驚嘆的成果。至少，人們可以想象，用智能手機拍攝出的人像不再會出現(xiàn)怪異的面部扭曲。超分辨率的建筑圖片將有可能通過消除鏡頭上的所有扭曲而形成平行線。隨著手機變得能夠大量產(chǎn)生精確度和逼真度皆十分驚人的照片，智能手機行業(yè)將能夠在與單反相機的交鋒中取得又一場勝利。

但是，智能手機攝影的長期趨勢當然是遠離現(xiàn)實主義，而轉(zhuǎn)向取得更引人注目的效果。這在計算攝影誕生之前是無法想象的。因此，我們可能會看到3D傳感技術(shù)的應(yīng)用趨向于超現(xiàn)實主義。

舉例來說，移軸相機可以用來創(chuàng)造一些出奇漂亮的效果，比如縮小景深到一個極端的程度，這會使得風景看起來就像玩具模型，但效果還是出奇的好，有些手機應(yīng)用程序也能做到類似的事情，但將3D傳感器與人工智能技術(shù)結(jié)合起來的效果，將遠遠超出那些應(yīng)用程序所能達到的效果，Photoshop中有實現(xiàn)移軸的技術(shù)，但是每次按下快門按鈕，相機都會產(chǎn)生同樣的效果，毫無疑問會讓人更加心滿意足。

光靠人工智能可行嗎?

未來，在推進機器學(xué)習(xí)技術(shù)方面，會有另一個重要的階段。我們有可能會放棄使用3D傳感器，而僅僅使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)來推斷物體在空間中的坐標，這將節(jié)省在手機中安裝傳感器的費用。

然而，就像微軟的研究人員和學(xué)術(shù)合作者在本周發(fā)表的一份報告中所討論的那樣，目前這種只使用軟件的方法收效甚微。他們寫道，只使用軟件的方法被稱為“絕對姿態(tài)回歸”(absolute pose regression)，在經(jīng)過訓(xùn)練后它并未能推而廣之，這意味著無論卷積神經(jīng)網(wǎng)絡(luò)掌握了什么技術(shù)，在用新圖像進行測試時，它都無法準確估量幾何圖形。

該報告的作者認為，他們的研究是對純軟件方法的“一項重要的合理性檢查”。他們的結(jié)論是，“姿態(tài)回歸方法要變得切實可行，還長路漫漫。”

這項工作將如何完成呢?不僅僅依靠研究人員。它將需要許許多多的智能手機用戶的參與。有了帶有3D傳感器的新型手機，他們將能夠拍攝出令人印象深刻的3D感應(yīng)增強圖像。當他們這樣做的時候，他們的設(shè)備，或者云，將會跟蹤現(xiàn)實世界的幾何結(jié)構(gòu)與二維圖像之間的關(guān)系。

換句話說，它將利用所有的這些活動來持續(xù)進行學(xué)習(xí)，總有一天，只要有足夠的3D圖像，卷積神經(jīng)網(wǎng)絡(luò)或任何其它被使用的算法都能足夠聰明地觀察這個世界，即使沒有3D傳感器幫助提供深度感知能力，也能準確地知道這個世界是什么樣的。

本站聲明：本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系本站刪除。

換一批

阿維塔、賽力斯已入股！華為引望可能成“中國博世”

9月2日消息，不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司，隨著阿維塔和賽力斯的入局，華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字：阿維塔塞力斯華為

[美通社全球TMT]

Trianz與AWS達成戰(zhàn)略合作協(xié)議，徹底改變云采用和管理方式

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布，該公司與Amazon Web Services （AWS）簽訂了...

關(guān)鍵字： AWS AN BSP 數(shù)字化

[美通社全球TMT]

人工智能驅(qū)動工具SODA V將顛覆汽車市場，使汽車開發(fā)時間和成本降低90%

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V，這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具，可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字：汽車人工智能智能驅(qū)動 BSP

[美通社全球TMT]

從容應(yīng)對未知風險----解密亞馬遜云科技的韌性之道

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行，同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險，如企業(yè)系統(tǒng)復(fù)雜性的增加，頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性，提升韌性，成...

關(guān)鍵字：亞馬遜解密控制平面 BSP

[通信先鋒]

中國游戲市場開始復(fù)蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

8月30日消息，據(jù)媒體報道，騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字：騰訊編碼器 CPU

[通信先鋒]

獨立自主！華為董事：致力打造不依賴西方的技術(shù)

8月28日消息，今天上午，2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行，華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字：華為 12nm EDA 半導(dǎo)體

[通信先鋒]

華為張平安：數(shù)字世界話語權(quán)最終由生態(tài)繁榮決定！

8月28日消息，在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上，華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱，數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字：華為 12nm 手機衛(wèi)星通信

[美通社全球TMT]

中國通信服務(wù)公布2024年中期業(yè)績

要點：有效應(yīng)對環(huán)境變化，經(jīng)營業(yè)績穩(wěn)中有升落實提質(zhì)增效舉措，毛利潤率延續(xù)升勢戰(zhàn)略布局成效顯著，戰(zhàn)新業(yè)務(wù)引領(lǐng)增長以科技創(chuàng)新為引領(lǐng)，提升企業(yè)核心競爭力堅持高質(zhì)量發(fā)展策略，塑強核心競爭優(yōu)勢...

關(guān)鍵字：通信 BSP 電信運營商數(shù)字經(jīng)濟

[美通社全球TMT]

NVI技術(shù)創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動產(chǎn)業(yè)鏈高速發(fā)展

北京2024年8月27日 /美通社/ -- 8月21日，由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字： VI 傳輸協(xié)議音頻 BSP

[美通社全球TMT]