騰訊科技獨家獲悉,云知聲CEO梁家恩不再擔任CEO一職,轉而專注負責技術領域。公司CEO由創始人黃偉擔任。
語音識別領域的明星創業公司云知聲正在經歷一場隱秘的高層架構調整。
騰訊科技獨家獲悉,云知聲CEO梁家恩不再擔任CEO一職,轉而專注負責技術領域。公司CEO由黃偉擔任,正式上任已一周有余。
云知聲的官方網站側面印證了該消息的真實性。云知聲在公司內部的新聞稿通報,云知聲榮獲中國最具投資價值企業50強的稱號,云知聲CEO黃偉出席了本次大會并領獎,新聞稿并配了黃偉領獎的照片。
在外界看來,這似乎是空降兵式的調整。在語音識別業內的知情者看來,則是語音識別產業核心人物的回歸。
“黃偉終于回歸了,終于從幕后走向了前臺”。一位語音識別的業內人士這樣感慨。
黃偉是誰?作為語音識別領域的領軍人物,他先就職于摩托羅拉和盛大創新院,建立了盛大創新院語音分院,后隨著盛大整體戰略的調整,他于2012年離職選擇創業。
對于黃偉創業的說法不一。盛大創新院員工表示,黃偉是盛大創新院高管中最早離開創新院的,他去創辦了云知聲。但在此前,云知聲官方否認黃偉在這個團隊中。
今年10月,云知聲確認完成啟明創投的A輪融資,金額達1億人民幣,此時,云知聲公司成立剛過500天。云知聲的迅速躥紅也引起了業內人士對它的關注,也牽出了黃偉與云知聲的聯系:“黃偉不是明面上的公司創始人,更多的是和云知聲私下里的關系。雖然沒有確切的證據表明兩者的關系,但實際上千絲萬縷,兩者走的非常近。”一位知情人士透露。
騰訊科技獲悉,此次黃偉正式擔任CEO,與其從盛大離職后的競業禁止協議解禁有關。“云知聲這一年的飛速成長,與黃偉的幕后操盤緊密相關。”上述人士表示。
對此安排,有知情人士透露,黃偉對資本方等較為熟悉,更容易掌控全局。梁家恩是典型的技術型人才,專注技術更為適合。“在盛大創新院時黃偉是梁家恩的領導,創業后先由梁家恩擔任CEO,黃偉在幕后。條件許可后,黃偉再走到前臺,這很順利成章。”
作為創業公司,云知聲一年的成長有目共睹。“在語音識別領域,百度已經做了一年多,云知聲也做了一年多,但是云知聲的識別技術比如識別的準確度已經比百度高出一大截。”一位語音識別的從業人士這樣評價,“在語音識別的創業公司中,云知聲是做的最好的。”
梁家恩把創業的階段性成功歸因于強大的核心技術團隊和平臺技術團隊,能夠在一年時間里,實現上市公司需要3-5年才能構建的語音識別服務平臺。“一年來,語音識別錯誤率下降60%,識別速度提高3倍以上。”云知聲CEO梁家恩對騰訊科技表示。
在這個節點上,在語音識別領域的大爆發的前夜,復盤云知聲一年的黑馬式崛起,頗有一番意味。
語音識別產業大爆發
“所有手機制造商都在投資語音、拓展語音技術領域的投資,打造更優雅的設計并 將其深入集成到手機中。”美國最大的語音識別技術公司Nuance高級副總裁邁克爾•湯普森這樣說。
在推出Siri應用兩年后,今年蘋果在麻省理工大學 (MIT)附近組建神秘辦公室,用以做Siri 語音識別技術的研發。微軟正在研發代號為“Cortana”自有語音個人助手軟件,并計劃在下一個Windows Phone平臺大升級中推出,以抗衡Google Now及Siri。至此,蘋果、谷歌(微博)、微軟、英特爾等國際巨頭均重金投入語音識別技術。
在中國市場上,語音識別技術公司也有幾大派別較力:
第一派來自互聯網巨頭在語音識別技術上的布局,比如騰訊、百度、搜狗等圍繞自己的產品生態系統做語音技術,用來為產品服務。微信的語音對講應用已經成為人們日常聯絡的必備。360也有意進軍語音識別領域,曾傳出與科大訊飛談合作事宜,但至今未有明確信息。
第二派來自專業的語音語義識別公司在移動互聯網上的延伸。比如科大訊飛去年專門成立移動互聯網事業部做移動應用,美國的Nuance在上海也設立辦事處拓展以多語種語音識別應用為主的中國市場。
第三派來自于新興的創業公司,如云知聲、思必馳等,具有互聯網公司的基因,長 勢兇猛。還有一派專做部分語音語義技術的應用,比如擅長語義解析的蟲洞(獲微軟首期云加速器項目支持)、智能360(周鴻祎做天使投資),以及做微信語音 生活搜索的出門問問(前谷歌語音識別技術員工李志飛創辦),他們自己做語音語義識別應用的一部分,另一部分技術會借助科大訊飛等廠商的技術來完成。
剛剛過去的幾個月,基于語音識別技術的角力進入前所未有的白熱化階段。 9月7日,創業公司思必馳宣布重新定義人機交互體驗的方向,高調推出基于語音識別和語義理解的人機對話。9月中旬,老牌語音技術公司科大訊飛宣布自主研發的離線語音聽寫引擎將于9月下旬正式發布,將應用于“訊飛輸入法”等產品。10月19日,云知聲在確認融資消息的同時,也發布了離線語音聽寫技術,并發布了語義云。今年10月28日,科大訊飛語音云發布三周年,訊飛語音輸入法用戶超過1億。
黃偉的故事
在這輪語音識別技術熱潮中,有個身影本該成領頭羊但卻落寞四散缺席,那就是盛大。
與科大訊飛相比,盛大當年的語音識別技術并不弱。曾經領導盛大的語音識別團隊的核心人物是黃偉。同劉慶峰一樣,黃偉畢業于中國科學技術大學,2004年加入摩托羅拉中國研究中心(MCRC)擔任資深研究員。在摩托羅拉工作期間,他帶隊開發出世界上首個手機聲紋認證系統,并完成多項語音交互產品研發。但在金融危機期間,摩托將整個語音識別團隊出售給Nuance。
黃偉拒絕被Nuance收編,于2009年7月加入盛大網絡旗下的創新院,2010年10月創建了語音分院,力圖將語音識別技術與盛大旗下的互動娛樂系統相結合,延展到用戶端。
2010年,盛大語音團隊在美國國家標準技術署(NIST)舉辦的聲紋識別評測(SRE)大賽中,力壓麻省理工、斯坦福研究中心、IBM等眾多名校、名企,在在9個單項任務中獲得5個單項第一,整體綜合指標第一。
梁家恩畢業于中國科學技術大學,隨后進入中科院自動化所工作,2011年加入 盛大創新院,在盛大語音分院工作,擔任高級研究員一職。不過,隨著2012年盛大創新院的戰略調整,語音團隊從創新院剝離到盛大掌門科技,由陳大年掌管。語音團隊的成員開始各尋出路。
盛大語音團隊的幾個人選擇了創業,同樣做語音識別,定名為“云知聲”。但云知聲更傾向于強調自己的技術積累來自于中科院自動化所,而非之前曾工作過的盛大。
黃偉在其中的角色耐人尋味。
2012年夏天,盛大創新院離職員工QQ群里,傳來了黃偉創辦云知聲的消息。一位前盛大創新院員工表示,“黃偉是盛大創新院高管中最早離開創新院的,他去創辦了云知聲。”
但云知聲官方否認黃偉在云知聲團隊中。
來自云知聲的官方消息顯示,公司創始人有兩位,一位是梁家恩,擔任公司CEO,另一位是康恒,擔任公司CTO,負責平臺業務部。
對于黃偉與公司的關系,騰訊科技曾向云知聲市場負責人求證此事。該負責人表示,“黃偉和我們公司沒有什么關系。”但他也表示,黃偉和梁家恩是師兄弟關系,也會指導云知聲的業務。
云知聲的內部人士透露,黃偉離開盛大研究院后創辦了移動互聯網應用音樂雷達,和云知聲團隊在同一座大廈辦公。網站信息顯示,兩家公司都在北京海淀區財智國際大廈C座,云知聲在15層,音樂雷達在19層。
音樂雷達的一家合作伙伴的負責人證實黃偉是音樂雷達的創始人之一,并和黃偉談過音樂方面的合作。對于外界對黃偉和云知聲之間關系的猜疑,他表示,“不出面創立公司,但可能通過代持的方式運營公司,這在圈里也比較正常。”
互聯網的節奏
對云知聲而言,過去一年來,以快取勝、唯快不破的節奏在語音識別領域快速擴張業務,打造知名度。在與其他公司的語音技術解決方案不相上下的情況下,云知聲采取先搶占市場后再優化的策略。
去年11月,云知聲和搜狗語音助手達成合作,今年3月,和錘子科技達成合作,5月和樂視TV達成合作,8月又和inwatch、易信達成合作。云知聲和科大訊飛比肩一道出現在在小米、聯想、智能360語音助手等很多合作伙伴的語音識別方案中。
梁家恩透露,從和搜狗團隊見面到第一個產品模型出來只花了兩個星期,而這個時間可能其他公司連商務條款還談不下來。樂視電視的合作也類似,從第一次和樂視團隊接觸到內部系統跑通到在發布會上發布只用了1個月的時間。
還有一個合作客戶——錘子科技。CEO羅永浩出了名的挑剔。今年,錘子ROM發布會前一周,老羅在抱怨語音識別方案遲遲未出,當晚云知聲公司CTO已經將產品集成和錘子科技團隊進行對接。最終,云知聲和科大訊飛同時入圍錘子ROM的語音解決方案。
與之前的課題研究迥然不同,梁家恩發現,創業一年來,團隊一直糾結技術層面的東西,他認為和實際業務結合更關鍵,也更重要。“做成也是技術好,做失敗也是技術好”。
自去年發布語音識別公有云以來,平臺上已經有1000個開發者加入。通過該開放平臺,“可以把門檻降得足夠低,開發者無需懂具體的語音語義技術,只需要調用云知聲的服務,就可做應用創新。”
在開放平臺背后,隱藏著云知聲的商業模式邏輯:通過語音語義平臺將各家的App聯通,用戶數據也會集中到平臺上,將各個環節貫通從而實現廣告等商業價值。
梁家恩把它比擬為一種類似Google adsense的模式,雖然每家的量很小,但是通過聚合可以產生商業利益,各個參與方可以分成。
互聯網的創業節奏讓云知聲嘗到了甜頭,接下來也有風險和挑戰。
一個是來自平臺化的風險。“騰訊、百度做語音識別都是圍繞自己的主營來設計,在生態系統內來做,也會進行開放平臺的建設。”上述語音識別的從業人士認為,相比較其他已經有穩定商業模式的公司涉足語音識別應用而言,初創公司做平臺的風險更大。
對云知聲而言,另一個隱憂是尚未有核心的移動互聯網產品。目前來看,云知聲嘗試做語音輸入法插件,但主要業務是從語音識別解決方案切入,走技術驅動路線。“創業公司必須有自己的產品和服務,沒有產品,很難承載用戶數據,商業利益挖掘更難。”
相關閱讀