【
中國安防展覽網 科技動態】圖像識別被認為是未來科技領域幾大關鍵產業的核心技術之一。微軟、谷歌、Facebook、亞馬遜、百度、騰訊等巨頭都在傾注大量資源推動這項功能進步。近的突破證實計算機完全有潛力在圖像識別領域追上乃至超越人類,也讓從業者的信心更加充實。隨著時間推移我們會發現自己身邊的計算設備越來越“聰明”。
谷歌新型圖像識別工具 六大特性實現突破
周三,Google宣布,他們開發了一個名為Google Cloud VisionAPI的強大圖像識別工具,對于們來說,這可能會是一個非常有用的工具,有了它,們就可以讓自己的軟件、機器人知道圖像上的信息。
功能強大的圖像檢測工具
首先,作為一個機器學習領域的技術,這個工具搭載的是我們之前給大家介紹過的智能機器學習系統Tensor Flow,Google在上個月剛剛將這個系統免費開放給們。其次,它的主要功能是去學習并識別圖片中的內容。這個工具的運行原理并不復雜,它能夠迅速將圖片分到數千種大的類別當中去,比如:船、獅子、埃菲爾鐵塔等等;然后偵測臉部相關的情緒,并識別圖片上相關的文字。在他們看來,Google Cloud Vision API有以下幾個吸引人的特性:
檢測實體:Google Cloud Vision API可以從數千種圖片分類中檢測出圖片中的實體。除此之外,更吸引人的是,你還可以根據你自己的圖片類別建立自己的元數據,這樣,你就不必受制于Google為你設定的那數千個分類,而有了更符合你自己的圖片分類。
字符識別:Google Cloud Vision API所帶的光學字符識別技術可以識別圖片上的文字內容。其中支持的語言有很多種。
安全檢測:Google Cloud Vision API的安全檢測功能可以識別出圖片中不合適的內容,此功能搭載于Google Safe Search。它可以幫助用戶避開那些令人不適的內容。
面部檢測:Google Cloud Vision API的面部識別技術可以檢測到圖片中的人像,也能具體識別出眼睛、嘴等具體的器官,而更重要的是,它還能檢測到包括開心、悲傷等在內的8中情緒。為了保護用戶的隱私,Google還承諾不會在任何的Google服務器中儲存有關面部的任何信息。
地標檢測:Google Cloud Vision API的地標檢測功能可以識別出世界上的一些自然和人文建筑與景觀,同時還會為你標出該地點的經緯度。
Logo檢測:Google Cloud Vision API的logo監測功能可以檢測出圖片中品牌的logo。
下面是一些范例:
Google的一次突破 有了這個工具,機器識別圖片的能力會大大加強。之前,你不能讓計算機自動為你篩選照片;但現在,只需輸入相應的「類別」,計算機就可以為你挑選出相應的圖片。
而們現在可以好好設計一下自己的軟件和機器人等設備了。在不久的將來,也許當我們走進家門的時候,家中的機器人可以根據你臉上的表情選擇它該說的問候語;而你在上網時也能夠更地搜尋到想要的圖片了。
當然,對Google來說,推出這個工具也很正常。在這個領域,亞馬遜和微軟都已經走了很遠了。很多朋友可能還記得微軟在之前推出的識別年齡和情緒的小工具,這些都出自于微軟專注于人工智能領域的牛津計劃。Google當然也不能落后。在之前,Google也推出過一些進行預測的API產品,但都功能有限,沒有涉及到圖像這方面,因此,這次的這個舉動對Google來說也是一次大的突破。
這個API目前在Google云平臺上提供一些有限的預覽,不過在將來,Google將會把這個功能添加進Google云儲存中。這樣可以使它的使用范圍更廣。