新一代的“谷歌”也許是依靠計算機視覺(jué)來(lái)實(shí)現搜索的公司
matthew 2016.11.15 08:45 計算機視覺(jué)概念股
看似簡(jiǎn)單的應用,背后包含了復雜的技術(shù)。對于戶(hù)外環(huán)境中建筑、店面的識別,一直是計算機視覺(jué)的難點(diǎn)。如何讓計算機看清楚,看得準?即使戶(hù)外的光線(xiàn)千變萬(wàn)化,即使環(huán)境中存在眾多干擾因素?
帶著(zhù)這些問(wèn)題,硅谷密探連線(xiàn)了Alice Who的開(kāi)發(fā)者,以色列創(chuàng )新公司Fringefy的聯(lián)合創(chuàng )始人Assif Ziv,請他介紹了Fringefy在計算機視覺(jué)技術(shù)領(lǐng)域的研發(fā)情況,以及Fringefy的愿景和方向。
獨辟蹊徑的計算機視覺(jué)技術(shù)
計算機視覺(jué)(Computer Vision)是近年來(lái)大家談的較多的話(huà)題。無(wú)人駕駛汽車(chē)、無(wú)人機等產(chǎn)品漸漸進(jìn)入大眾視野,如何讓機器能夠像人一樣,有看見(jiàn)、辨識周?chē)h(huán)境的能力,成為這些產(chǎn)品成功的關(guān)鍵。
隨著(zhù)計算機視覺(jué)技術(shù)的發(fā)展,人們開(kāi)發(fā)了不同的手段來(lái)幫助機器“看見(jiàn)”物體。大部分技術(shù)是基于同一基礎的,那就是點(diǎn)狀云(Point Cloud)。通過(guò)3D掃描物體,構建點(diǎn)狀云,然后用點(diǎn)狀云訓練機器的算法,讓機器能夠辨識出這個(gè)物體。
?
但是,這種標準的技術(shù),在室內適用,識別物體、人臉都很給力,卻不擅長(cháng)識別戶(hù)外建筑。在戶(hù)外,隨著(zhù)光線(xiàn)的變化,不但建筑反光的顏色和強度會(huì )變化,陰影會(huì )變化;此外,建筑物周?chē)男腥?、??康能?chē)輛,也會(huì )影響機器對其的識別。
舉個(gè)例子,我們在上午10點(diǎn)拍攝的咖啡的圖像,與下午4點(diǎn)再次拍攝的圖像,對于機器識別來(lái)講,可能是完全不同的兩個(gè)場(chǎng)景。并且,建筑物的體積較大,人通常并不能拍到其全貌。這也給機器識別帶來(lái)了挑戰。
而Fringefy的計算機視覺(jué)技術(shù)主要集中于應對這些挑戰。Fringefy所開(kāi)發(fā)的算法,專(zhuān)注于把握建筑的幾何形狀,而非整體和細節。也就是說(shuō),通過(guò)把握建筑的門(mén)、窗及主要結構,避開(kāi)光線(xiàn)和干擾物的影響。
Azzif的團隊已經(jīng)專(zhuān)注開(kāi)發(fā)這個(gè)技術(shù)兩年,并在美國申請了專(zhuān)利,成為同一領(lǐng)域的最前沿的公司。
首先,他們的商業(yè)模式是什么?
其實(shí),“Alice Who”APP只是Fringefy推出的一款展示用APP。Fringefy真正的商業(yè)模式,是通過(guò)提供API或SDK為客戶(hù)提供服務(wù)。
目前,Fringefy的目標客戶(hù)包含三類(lèi)。
第一類(lèi)是地區搜索引擎,如Yelp、大眾點(diǎn)評、Trip Advisor等,讓這些搜索引擎的用戶(hù),能夠非常簡(jiǎn)便的用手機攝像頭識別周?chē)h(huán)境,提供不一樣的搜索體驗。
Fringefy的第二類(lèi)目標客戶(hù)是品牌和公司,這些公司希望通過(guò)分析其用戶(hù)在社交媒體上發(fā)布的照片的地理位置,來(lái)獲得商業(yè)洞察。例如,這些公司的用戶(hù),通過(guò)社交媒體發(fā)布了自己的照片,但并沒(méi)有注明拍攝地址。Fringefy可以幫助客戶(hù)分析這個(gè)圖片,告訴客戶(hù),這是什么地方,從而幫助客戶(hù)分析其用戶(hù)的行為模式和喜好。
而第三類(lèi),當然是國防和安全行業(yè)了。以色列政府目前也是Fringefy的合作伙伴之一。
Azzif告訴硅谷密探,Fringefy成立到現在,盈利模式也經(jīng)歷了多個(gè)變化。最先是希望通過(guò)授權技術(shù)給客戶(hù)來(lái)盈利,例如收取年度授權費用。后來(lái),逐漸轉向提供API,基于客戶(hù)所消費的圖像分析服務(wù)的數量和需求來(lái)收費。
如何快速準確地進(jìn)行圖片識別?
通常,Fringefy會(huì )把用戶(hù)通過(guò)手機攝像頭捕捉到的圖像,與數據庫中的圖像進(jìn)行比較、匹配。那么,如何將一個(gè)圖像,與云上的成千上萬(wàn)張圖像比較, 并且快速、精準?背后的兩個(gè)關(guān)鍵詞是:數據庫和標簽策略。
Fringefy的數據庫來(lái)源分為兩類(lèi)。對于一些客戶(hù),例如國防安全類(lèi)的,客戶(hù)會(huì )負責提供圖像數據庫。但是Fringefy也能夠自己抓取公開(kāi)網(wǎng)絡(luò )上的圖像,快速形成圖像數據庫,例如,Yelp,Trip Advisor等網(wǎng)站上,有用戶(hù)上傳的大量圖片,包含了建筑外觀(guān),并有相應的地點(diǎn)信息。
在制作“Alice Who”APP時(shí),Fringefy建立了整個(gè)舊金山的商業(yè)類(lèi)建筑的數據庫,包括所有的餐廳、酒吧等,只用了2到3天的時(shí)間。目前,這個(gè)公開(kāi)網(wǎng)絡(luò )數據抓取的能力,還不是全自動(dòng)的。Fringefy的下一步,就是研發(fā)能全自動(dòng)的從浩瀚的網(wǎng)頁(yè)上抓取圖像,形成數據庫的解決方案。
不過(guò),如果每次都要將一個(gè)圖像與云上的成千上萬(wàn)張圖像比較、匹配,可能會(huì )減緩識別的速度。所以Fringefy配合使用了標簽(signature)策略,讓計算機算法根據某類(lèi)標簽,先進(jìn)行預篩選,然后再匹配識別,以配合現有的電腦處理的條件。
例如,地址可以作為一種標簽。當用戶(hù)在某一個(gè)地點(diǎn)用攝像頭捕捉圖像時(shí),用戶(hù)的手機會(huì )上傳地理位置信息。Fringefy就能根據這個(gè)地理位置信息,先篩選出數據庫里附近的建筑的圖像,再與用戶(hù)手機捕捉到的圖像進(jìn)行匹配,從而更快、更準的得到結果。
計算機視覺(jué)概念股:大恒科技、漢王科技、萬(wàn)訊自控、永創(chuàng )智能、勁拓股份。
計算機視覺(jué)概念股
那么問(wèn)題來(lái)了:最值得配置的計算機視覺(jué)概念股是哪只?即刻申請進(jìn)入國內首個(gè)免費的非公開(kāi)主題投資交流社區概念股論壇參與討論!
申明:本文為作者投稿或轉載,在概念股網(wǎng) http://www.medicalvoicenetwork.com/ 上發(fā)表,為其獨立觀(guān)點(diǎn)。不代表本網(wǎng)立場(chǎng),不代表本網(wǎng)贊同其觀(guān)點(diǎn),亦不對其真實(shí)性負責,投資決策請建立在獨立思考之上。