人臉識別是公認(rèn)的模式識別難題,在過去幾十年間,世界頂尖科研機(jī)構(gòu)和科研人員一直在為計算機(jī)全自動人臉識別而努力。最近幾年,隨著理論發(fā)展和硬件計算能力的指數(shù)增長,人臉識別迎來了又一次研究熱潮。
近日,香港中文大學(xué)教授湯曉鷗及其研究團(tuán)隊正式對外宣布,他們研發(fā)的DeepID人臉識別技術(shù)的準(zhǔn)確率超過99%,比肉眼識別更加精準(zhǔn)。在公眾一片驚呼聲中,人臉識別的謎題,是不是被徹底解決了?
厚積薄發(fā) 人臉識別技術(shù)的里程碑
香港中文大學(xué)的計算機(jī)視覺研究組開發(fā)了一個名為DeepID的深度學(xué)習(xí)模型,在LFW(業(yè)內(nèi)用于評估非受限環(huán)境下人臉識別技術(shù)的權(quán)威數(shù)據(jù)庫)上獲得了99.15%的識別率。
如果僅給出人臉的中心區(qū)域,肉眼在LFW上的識別率97.52%。此前,該研究小組曾開發(fā)了一個基于高斯過程的人臉識別技術(shù)GaussianFace,得到98.52%的識別率。這也是計算機(jī)自動識別算法的識別率首次超過肉眼。DeepID將GaussianFace人臉識別紀(jì)錄推進(jìn)一步,首次超過99%的LFW識別率。
與此同時,F(xiàn)acebook發(fā)布了另一套基于深度學(xué)習(xí)的人臉識別算法DeepFace,在LFW上取得了97.35%的識別率。
香港中文大學(xué)與Facebook最大的區(qū)別就是,DeepFace需要740多萬人臉數(shù)據(jù)作為訓(xùn)練相比,DeepID只需使用20萬張人臉數(shù)據(jù)和數(shù)臺NVIDIA K40 GPU,此外,研究組將深度學(xué)習(xí)作為團(tuán)隊的另一核心研究方向,設(shè)計包括人臉對準(zhǔn)、行人檢測、姿態(tài)估計、人體圖像分割、車型識別、大規(guī)模人群監(jiān)控、通用物體識別和檢測、互聯(lián)網(wǎng)圖像檢索等在內(nèi)的,諸多深度學(xué)習(xí)模型,深度學(xué)習(xí)試圖模仿人腦利用神經(jīng)網(wǎng)絡(luò)來感知外界。
開放自主知識產(chǎn)權(quán) 做純粹的科研組織
人臉識別技術(shù)又一次迎來了研究熱潮,很多公司都會在網(wǎng)上公布自己的結(jié)果,但很少有公司會解釋出結(jié)果的由來,只是大概說一下結(jié)構(gòu),但是細(xì)節(jié)上卻只字不提。
不說有兩個原因,一個原因就是他們抄了別人的東西;還有一個原因就是他們不想別人照著他的來做。
但對于香港中文大學(xué)而言,這樣的事情是不會發(fā)生的。湯教授的團(tuán)隊擁有非常詳細(xì)的結(jié)果,所有科研文獻(xiàn)則是全原創(chuàng)技術(shù),并在全球排名中均取得了優(yōu)異的成績。
針對這種自主知識產(chǎn)權(quán)的技術(shù)文獻(xiàn),湯教授計劃把人臉識別技術(shù)免費提供給Android、iOS及Windows Phone開發(fā)者;在這套FreeFace-SDK的幫助下,開發(fā)者能夠在手機(jī)上開發(fā)基于人臉識別的各類應(yīng)用。此外,湯曉鷗還希望利用用戶反饋進(jìn)一步提高算法的準(zhǔn)確率。
群策群力 人臉識別領(lǐng)域應(yīng)用前景光明
目前人臉識別技術(shù)已廣泛用于政府、軍隊、銀行、社會福利保障、電子商務(wù)、安全防務(wù)等領(lǐng)域。未來,隨著技術(shù)的進(jìn)一步成熟和社會認(rèn)同度的提高,人臉識別技術(shù)將應(yīng)用在更多的領(lǐng)域。
湯曉鷗認(rèn)為,我們做的研究越深,也會越意識到還有很多沒有解決的問題,很多算法需要在實際應(yīng)用中得到不斷的改進(jìn)和提高。他的實驗室已經(jīng)基于最新的技術(shù)突破制作出完整的一套人臉圖像處理系統(tǒng)SDK,包括人臉檢測,人臉關(guān)鍵點對準(zhǔn),人臉識別,表情識別,性別識別,年齡估計等各種基礎(chǔ)技術(shù)包。
在人臉識別的道路上,LFW不是終點,而只是中途的一個里程碑,未來有更多的挑戰(zhàn)等待著我們。香港理工大學(xué)將繼續(xù)前行,通過人臉技術(shù)給互聯(lián)網(wǎng)用戶帶來更多便利。