6月26日消息,據國外媒體FastCompany報道,瑞典風投公司EQT Ventures打造了一個名為Motherbrain的人工智能系統,利用機器學習技術來發現不為人知但潛力巨大的初創公司。
德國初創企業AnyDesk在創始團隊打開斯德哥爾摩的EQT Ventures發來的電子郵件時,就已經實現正現金流了。Anydesk的創始人并不是在尋找外部投資,但卻被引起了興趣。EQT Ventures成立兩年的基金有逾6.5億美元可投資,其合伙人并不是以往那些通常管理歐洲風投基金的銀行家。相反,他們都是來自歐洲科技公司(如Spotify、Huddle和Rebtel)的公司創始人或高管。
在柏林與風險投資主管阿什利·倫德斯特羅姆(Ashley Lundstrom)的一次會面上,AnyDesk的聯合創始人菲利普·威瑟(Philipp Weiser)了解到Motherbrain,它是EQT Ventures開發來發現不為人知的初創公司的一個機器學習系統。“她告訴我們,我們是最早被這種軟件發現的公司之一。”威瑟說。AnyDesk致力于銷售由一專有壓縮系統驅動的遠程桌面軟件。今年5月,它完成了由EQT Ventures領投的一輪760萬美元融資。
EQT Ventures向AnyDesk投入的資金是否會成為一個成功的投資案例,還有待觀察。但該公司已經將Motherbrain算法應用到歷史數據中,并證明它會在當下的一些最紅火的科技公司還沒有嶄露頭角之前將它們列為前景廣闊的投資候選者。例如,該系統會在Airbnb、Snapchat和Stripe僅僅獲得天使資金和種子資金的時候就看中它們,將它們標記出來。
數據驅動的投資
在加入EQT Ventures之前,亨里克·蘭德格林(Henrik Landgren)是Spotify的分析副總裁。“外面有數百萬家公司,”他說,“你怎么知道該找誰呢?過去的方法是和那些通過你的關系網絡找到你的人交談,但更現代的方法是使用最新的技術、數據和算法,主動接觸那些最有可能成為好投資的人。”
Motherbrain利用融資等金融數據、網站排名和應用排名數據、社交網絡活動等等,來對數百萬家公司進行監控。EQT Ventures會持續不斷地增加自己對那些公司的評估數據,以訓練Motherbrain聚焦好的投資機會的能力。
該軟件被用于投資過程的每一個階段,但它最重要的功能是給你提供優先次序:建議基金現在應該關注哪些公司。“AnyDesk早早被發現,是因為它們在各項數據中所表現出來的進展。”蘭德格林說,“他們之前并不是經驗豐富的融資人。他們是一個非常機智、非常聰明的團隊,他們開發的產品具有令人驚嘆的進展。”
一旦有公司進入基金的觀察范圍,Motherbrain也會加速對它的評估。即使推薦投資該公司的并不是Motherbrain本身,Motherbrain系統也會使用它的排名,系統還會包含一些有用的信息,比如競爭對手和市場規模。它甚至可以給EQT Ventures投資的公司提供幫助,因為它包含了大量關于投資者、競爭對手、新興技術和市場趨勢的數據。“例如,對于B2B公司,我們可以利用Motherbrain來幫助他們尋找銷售線索來獲得新客戶。”蘭德格林說道。
EQT Ventures并不是唯一一家使用數據分析的風險投資基金。大多數基金都至少收集基本的公司數據,并基于這些數據創建過濾器、規則或趨勢警報。投資早期階段歐洲科技公司的InReach Ventures也利用機器學習來發現好的投資標的。自2013年以來,舊金山公司SignalFire一直在使用數據驅動的投資模式。但是Motherbrain的出眾之處在于,它的系統非常先進,而且它幫助分配的資金規模也很大。
Motherbrain是如何運作的
Motherbrain結合使用非監督式和監督式深度學習算法。非監督式學習算法是在沒有任何外部指導的情況下發現數據中的重要模式。監督式學習算法需要有標記的訓練數據。例如,如果訓練數據包含被標記為“貓”或“不是貓”的動物的例子,算法就會試圖了解貓的特征,從而判斷呈現在它面前的新動物是否是貓。
在風險投資中,數據可以用來對公司進行市場行業歸類,這是任何風投公司都要進行的一項基本任務。創業公司用來描述自己的文本和其他人對它的行業歸類可以在這個過程帶來幫助,但那些數據往往是雜亂且相互矛盾的,尤其是對于新興的技術和行業。Motherbrain利用非監督式學習的方法來發現公司的類別。然后,EQT Ventures的員工給每個類別中的公司貼上標簽——例如,鑒別一個包含區塊鏈公司的類別——然后帶標簽的數據被用來訓練監督式學習算法。之后,Motherbrain會自動對新公司進行行業分類。
“這實際上是一種從非常嘈雜的數據中獲得一些有意義的信息的方法。”蘭德格林說,“如果你根據嘈雜的數據對模型進行訓練,你可以建立更少的類別,從而擁有更好的預測能力。”
公司隨著時間推移的演變——以及相關數據指標如何隨之發生變化——也是評估過程中的一個重要因素。時間序列是一組編入索引的數據點,捕捉了公司的演變過程。Motherbrain可以從時間序列數據中學習,根據具有類似指標的公司的表現,預測公司未來將會如何演變。“例如,他們融資的速度是快還是慢?”蘭德格林指出,“當你將時間序列納入考慮范圍時,網絡趨勢、應用排名以及所有那些不同的東西實際上會更加有趣。”
蘭德格林還為EQT Ventures專門為Motherbrain開發的最先進的數據基礎設施感到自豪。他有個由5人組成的專門開發團隊與谷歌密切合作,采用Kafka、Kubernetes、Google BigQuery和BigTable等技術。
“開發人員在工作時,會不斷地發現自己遇到些還沒有人問過的問題。”蘭德格林稱,“然后你會覺得坐立不安。我們正在構建一個人工智能決策平臺,用于幫助作出涉及人類和大量數據集的決策。我認為這種結合相當新穎。我們正走在前沿位置。”
大數據,大問題
Motherbrain遠非完美無缺。就像任何的機器學習系統一樣,它的預測好壞完全取決于訓練數據的好壞,而且數據總是不完整的,有時甚至完全不準確。蘭德格林說,“我們確實有看到一些沒有數據記錄的公司——它們處于‘隱身’模式——即使是Motherbrain也看不到它們,所以這將會是一個問題。”
通過將多個數據源拼接在一起,EQT Ventures試圖增加系統的覆蓋范圍和不同數據源之間的重疊。由于該公司的投資者每天都在使用Motherbrain,他們可以在發現數據源之間的差異時糾正它們。
蘭德格林也熱衷于強調,Motherbrain離做出最后的投資決定還有很長的路要走。“打造讓你能夠找到優秀公司的模型當然是好事,但這并不意味著你只需按下一個按鈕就能知道該投資誰。”蘭德格林表示,“這需要做更多別的工作,其中很大一部分就是像傳統投資者那樣去建立關系。關鍵是要知道建立什么樣的關系以及何時建立。這就是我們使用Motherbrain的目的。”
行業資訊、企業動態、業界觀點、峰會活動可發送郵件至news#citmt.cn(把#換成@)。
海報生成中...