【中國安防展覽網 媒體導讀】毫無疑問去年的風口在直播,今年轉向人工智能,除了巨頭們不約而同的開發布會宣布自己 AI 方向的戰略布局,越來越多投資人和創業者也爭先恐后的 ALL IN 入場,其中火,也具商業價值的非計算機視覺這一領域莫屬。知道 AI 的人多,了解計算機視覺的人少,這究竟是個怎樣的行業,又有哪些“有意思”的公司?
2017 已經過去一半,我們是時候對上半年做一個總結了。我們為什么需要人工智能?
自深度學習概念引入以來,人工智能的發展速度有目共睹,信息科技的發展按照指數規模爆炸,將導致存儲能力、計算能力、芯片規模、帶寬規模暴漲,第二次自動化浪潮,AI 得以逐漸成長為了游戲高手、圍棋大師、語音轉錄專家、司機、翻譯家、圖像藝術家、鑒黃師、武器……,她正在以不可估計的力量改變著我們的生活。
人們也開始嘗試利用人工智能技術幫助改善一些勞動密集型工作,以及高精度業務,因為它能持續地像人類一樣正確描述照片上發生的事,不會感到疲倦,還能閱讀并概括出文本大意,重要的是它還在不斷的學習進步。
就像谷歌的聯合創始人拉里·佩奇早在2002年說的,谷歌不是用人工智能強化它的搜索能力,而是利用搜索來改善它的人工智能。
計算機視覺風口和難點
計算機視覺是一門研究如何使機器“看”的科學,它能夠用攝影機和電腦代替人眼對目標完成識別、跟蹤和測量等工作。
像素級的處理讓算法得以伸展,我們可以從算法的發展來看計算機視覺的變化。傳統算法大致可以分為以下4個步驟:圖像預處理、特征提取、特征篩選、推理預測與識別,毫無疑問,這需要大量的經驗,需要你對這個領域和數據特別了解,然后設計出來特征還需要大量的調試工作。而引入深度學習后,效果得到大幅度提升,一大批如“DeepID”人臉識別、“Region CNN”物體檢測、DeepTrack物體跟蹤等開源算法的出現讓技術的商用變成可能。
從成熟度曲線來看,語音更靠前一點,然后是計算機視覺,特別是安防領域,封閉的場景,有一些孤島化分布的大量數據可以用于訓練,在這些領域它是有先發優勢的。
業內典型公司盤點(排名不分先后)
相比圖像,視頻擁有更多可能,而如今像素的世界已經延伸到圖像以外,人工智能技術能夠使得從視頻中提取信息變得跟從圖像中提取信息一樣簡單。
這次我們在視頻內容識別技術領域作了一個統一整理,挑選了其中做得比較好的24家公司進行比較,它們分別來自廣告營銷、游戲、企業服務、醫療健康、金融、娛樂、電子商務等領域,均已超過A輪,并且專注于文娛類的公司數量,其中以服務于直播監測和廣告營銷為主要發力方向。
1、商湯科技
技術實力:★★★★★ 人才優勢:★★★★★ 產品商業化:★★★★★
商湯科技是一家典型的深度學習算法公司,目前是國內該領域,技術團隊規模大、商業化訂單、收入及融資額多的公司。由國內的計算機視覺專家湯曉鷗、徐立創立于2014年,其中技術團隊占比高達90%,其中包括5位微軟研究獎獲得者(Microsoft Research Fellow),兩位A-star(阿里星人才計劃),聚集了華人世界中一批深度學習和計算機視覺領域專家。
商湯科技早期專注于安防領域,現在擴展到互聯網+,應用廣泛也是受眾群體大的一個應用是為FaceU提供的的人臉檢測和跟蹤技術,能夠將Face U 的裝飾和貼紙準確的貼在人臉五官上。
之后會將攜手 Star VC 打造命名為“未來科技研究中心”的科技產業孵化器。
2、曠視科技(Face++)
技術實力:★★★★★ 人才優勢:★★★★ 產品商業化:★★★★★
這個成立于2012年的公司目前已完成C輪融資,總估值高達20億美金,是目前估值高公司,商湯科技競爭對手。
Face++專注于人臉識別技術和相關產品應用研究,面向提供服務。擁有一套非常強大的人臉檢測系統。在世界的人臉檢測(FDDB評測)、人臉關鍵點定位(300-W評測),和人臉識別(LFW評測:99.6%)獲得三個世界,在安防領域的成績也是有目共睹,為支付寶、Uber、中信銀行、萬科等企業提供 SmartID 服務。
值得關注的是,2016年7月正式加入曠視(Face++)的科學家孫劍,曾經作為微軟亞洲研究院研究員,帶領的團隊于2015年獲得圖像識別。