【
儀表網 儀表下游】導讀:作為人類,很容易想象一個具有不同屬性的物體。然而盡管深度神經網絡在某些任務上取得了跟人類相當或超過人類的表現,但計算機在人類特有的“想象力”技能方面仍在做著苦苦的掙扎。
現在,南加州大學(USC)一個由計算機科學教授Laurent Itti、博士生Yunhao Ge、Sami Abu-El-Haija和Gan Xin組成的研究團隊開發出了一種人工智能,這種AI能夠通過使用類似人類的能力來想象出一個具有不同屬性的從未見過的物體。
AI的泛化問題
假設你想創建一個生成汽車圖像的AI系統。理想情況下,你可以為算法提供一些汽車的圖像,這樣它就可以從多個角度生成各種顏色的汽車。這是AI長期追求的目標之一:創造出能進行外推的模型。這意味著,只要給出幾個例子模型就應該能夠提取出基本的規則并將它們應用到它以前沒有見過的大量新例子中。但機器通常是在樣本特征上訓練的,如像素,而不會去考慮對象的屬性。
在這項新研究中,研究人員試圖用一種叫做消糾纏(disentanglement)的概念來克服這個限制。消糾纏可以用來產生深度偽造。類似地,新方法采用一組樣本圖像--而不是像傳統算法那樣一次采集一個樣本--并挖掘它們之間的相似性以實現所謂的“可控解消糾纏表征學習”。
然后,它重新組合這些知識以實現“可控的新圖像合成”或可以稱之為想象力的東西。”研究小組通過利用他們的技術生成了一個包含156萬張圖像的新數據集,這可能有助于該領域未來的研究。
醫學領域
它可以幫助醫生和生物學家發現更多有用的藥物以將藥物的功能從其他屬性中分離出來,然后重新組合從而合成新的藥物。賦予機器想象力還可以幫助創造更安全的AI,如讓自動駕駛汽車想象并避免在訓練中看不到的危險場景。
深度學習已經在許多領域展示了性能和前景,但這往往是通過淺層模仿發生的,它沒有對使每個對象獨特的單獨屬性擁有更深入的了解。這種新的分離方法,第一次真正釋放了AI系統的新想象力從而讓它們更接近人類對世界的理解。
圖像搜索
圖像搜索是近幾年用戶需求日益旺盛的信息檢索類應用,分為基于文本的和基于內容的兩類搜索方式。傳統的圖像搜索只識別圖像本身的顏色、紋理等要素,基于深度學習的圖像搜索還會計入人臉、姿態、地理位置和字符等語義特征,針對海量數據進行多維度的分析與匹配。
該技術的應用與發展,不僅是為了滿足當下用戶利用圖像匹配搜索以順利查找到相同或相似目標物的需求,更是為了通過分析用戶的需求與行為,如搜索同款、相似物比對等,確保企業的產品迭代和服務升級在后續工作中更加聚焦。
資料來源:cnBeta.COM
所有評論僅代表網友意見,與本站立場無關。