谷歌DeepMind新成果:機器看一眼就能識別物體
對于某一對象,大部分人只要看過一遍就能再次識別。但計算機視覺和語音識別算法往往需要“觀察”數(shù)千個對象,才能識別出類似的新圖片或新單詞。
對于這樣的問題,谷歌DeepMind的研究人員找到了解決方案。他們對深度學習算法做出了調(diào)整,使其可以在“觀察”一張圖片后就能識別出類似圖片,這也被稱作“一次完成學習”。該團隊利用包含多張有標記圖片的大型數(shù)據(jù)庫演示了這項技術(shù),此外還演示了這項技術(shù)在手寫文字和語言識別方面的應用。
最優(yōu)秀的算法能可靠地識別出對象,但由于對數(shù)據(jù)的需求,開發(fā)這樣的算法耗時耗力。例如,能識別道路上車輛的算法需要人工輸入數(shù)千個范例,隨后才能被用于無人駕駛汽車。收集如此多的數(shù)據(jù)往往不可行。例如,在來到陌生的家庭后,機器人不可能有大量時間去熟悉環(huán)境。


























粵公網(wǎng)安備 44030402000745號