加利福尼亞州大學的電子與計算機科學專業教授努諾瓦斯康塞洛斯說,這種研究員們是通過修改一種普通的機器學習技術得到這種新方法的。 搜索引擎會自動根據圖片中的對象來標記圖片,比如“蘿卜”、“傘”或者“游泳者”。
研究員們已經通過對一種普通的機器學習技術進行修改而找到了一種識別圖片的更好的方法。
加利福尼亞州大學的研究員們聲稱他們已經找到了一種圖片搜索新方法,據說這種新方法比現有方法更好,在準確度和效率方面均有很大提高。加利福尼亞州大學的電子與計算機科學專業教授努諾瓦斯康塞洛斯說,這種研究員們是通過修改一種普通的機器學習技術得到這種新方法的。 搜索引擎會自動根據圖片中的對象來標記圖片,比如“蘿卜”、“傘”或者“游泳者”。瓦斯康塞洛斯說,由于這種方法利用詞語來標記和分類圖片,因此它與人們在網絡上使用的要害字搜索很相似。
現在,利用要害字的方式來搜索圖片有時行得通,有時行不通。這是由于大多數基于圖片的搜索都使用了元數據文本比如文件名、日期或者與圖片有關的其他基本資料來進行的,但是對于要害字搜索來說那些信息是不夠的。 計算機科學家們一直在研究,希望找到一種更好的方法來識別圖片,并且保證圖片的可搜索時間達到十年以上,但是要想讓計算機獲得圖片元數據之外的其他數據以及確定以圖片中的什么對象作為搜索的要害字一直都是個很難解決的問題,到目前為止,大部分這方面的研究工作仍未取得令人滿足的成果。
瓦斯康塞洛斯說,雖然加利福尼亞州大學的研究成果并未能完全解決這個問題,但是它提高了搜索的準確性和效率。而且這種方法弄清楚了一直以來限制人們解決這個問題的要害所在。
研究員們找到的這種方法是一種“基于內容的(content-based)”方法,它包括通過對圖片中的色彩、紋理和線條進行分析,然后確定用以描述圖片的對象。這些對象可以通過那些分析功能找出來并與其他圖片中找到的結果產生互比性。
參與這項研究項目的Google公司研究工程師佩德羅莫雷諾說,新研究成果就是建立在這些研究之上的,但是它還增加了一個中間步驟。莫雷諾解釋說,這個新增的步驟是用來得到關于圖片的語義標簽或者文字標簽的,這樣就可以通過許多特征對象而不是只依靠于數字組來識別圖片。
例如,假設有一幅圖片畫的是一直爬在草坪上的狗。通過新方法分析得出的可比性對象是狗,它可以與同類圖片中的其他對象如貓或者魚形成對比,從而區分不同的圖片。 然后計算機可以對那些對象進行統計分析,給出滿足所有特征對象的圖片。系統還可以評定搜索出的圖片與想查找的圖片之間的相似度,比如將其他畫有狗的圖片標注60%的相似度,而對帶有貓或者魚的圖片標注20%的相似度。 這樣,計算機就可以識別出圖片中畫了一只狗。莫雷諾說,這種方法的要害就是從語義的角度來定義圖片。 這好象可以大大提高圖片搜索的準確性。
研究員們使用的電腦擁有大量的素材,因為它擁有大量帶有鮮明特征對象如山脈、花朵、人物、水和虎等的圖片以及那些對象對應的語義標簽。研究員們用一些帶有尚未被標記的對象的新圖片對新方法進行測試時發現結果很不錯。 將人物標簽與利用它搜索得到的圖片進行對比時發現系統運行的情況很好,系統對一幅畫著伏在長草中的老虎的圖片進行分析后得到的對象要害字包括“貓”、“虎”、“植物”、“葉子”和“草”,而圖片的插圖說明中包括了“貓”、“虎”、“森林”和“草”等字眼。當研究員們將他們的系統標簽與更普遍的基于內容的方法進行對比時,他們發現新方法的準確度比過去的舊方法要高40%。換句話說,它會得出更少與圖片無關的要害字。
微軟圖片搜索研究員拉里澤尼克說,這項研究擴展了基于內容的搜索的限制邊界。他說:“他們現在所作的就是分析我們可以在基于圖片特征對象來進行圖片搜索方面走多遠。”但是他還是對這種新方法是否適用于更大數量的圖片搜索如網絡搜索持懷疑態度。
澤尼克補充說,加利福尼亞州大學的研究成果對于圖片中的某種簡單對象搜索非常有意義。然而,它可能不適用于其他的搜索領域如區分美國國會大廈與林肯郡州政府大樓等。 澤尼克說:“視覺問題是很難解決的,我認為沒有任何一種方法是萬能的。”
然而,Google公司從事圖片搜索研究的軟件工程師查克羅森貝格說,假如將研究員們剛剛發現的這種方法添加到搜索軟件中可能會非常有用。假如將這種方法加入到桌面搜索中,人們就可以根據圖片的相似度來搜索圖片。
加利福尼亞州大學的瓦斯康塞洛斯預計至少還需要五年的時間才能實現計算機對更復雜概念的識別,比如幸福等。但是他說,這并不是說現在所作的研究就是無用的。 現在的研究成果更象是一種輔助,而不是一個答案。
留言列表