清華系 NLP 公司哄搶未停:深言被曝估值已 1 億美元,此前陷王慧文收購傳聞
火熱的大模型創投潮里,又有初創公司拿錢了。
量子位獨家獲悉,清華系 AI 初創公司深言科技(DeepLang AI),快速完成新一輪高估值融資,最新市場估值約 1 億美金。并且,深言科技更新的一輪融資又火速開啟。
公開資料顯示,深言科技創始團隊幾乎均出自清華大學自然語言處理實驗室(THUNLP)。
除了面向大模型,又師出名門,深言科技最近受萬眾矚目還有一個原因 —— 此前陷王慧文的收購傳聞。
AI 科技評論報道,王慧文在收購一流科技、開啟第二輪融資的同時,對兩家孵化自清華 NLP 團隊的初創公司很感興趣,這兩家公司的核心創始團隊都屬清華孫茂松、劉知遠一脈,其中一家就是深言科技。
孵化自清華反向詞典項目
扒一扒可以發現,深言科技算是國內較早入局大模型的玩家,成立于去年年中。
公司主要面向 AI 和 NLP,目標是以自研中文大模型構建工業級中文信息處理引擎。
創始人兼 CEO 豈凡超,系清華大學電子工程系 2013 級本科,計算機科學與技術系 2017 級博士,主要研究方向為 NLP,研究工作曾在 EMNLP 等發表。
聯合創始人兼 COO 李瀟翔,清華電子工程系 2017 級博士。紅杉中國合伙人張涵也是公司董事之一。目前,歐洲科學院院士孫茂松擔任公司首席科學家。
公司公開的現有產品,包括 WantWords、WantQuotes 等。
WantWords,其實就是 2021 年 11 月在微博爆火,服務器多次被擠爆的神器反向詞典。
2019 年,豈凡超和同學合作研發該產品,支持中文及跨語言查詢,已經開源。該項目的指導教師之一,正是孫茂松。
所謂“反向”,指和常規詞典不同,不是按詞尋義,而是反過來給詞典一段描述,讓它來幫你找詞。
具體操作上,在詞典的搜索框中輸入想表達的意思,就能得到幾十上百個答案。背后的核心 AI,名為多通道逆向詞典模型,相關論文中選過 AAAI 2020。
爆火的小程序背后,似乎是 THUNLP 早就在產學研融合上布局的一盤棋 ——2022 年,豈凡超博士畢業,隨即從 THUNLP 孵化出深言科技,核心團隊均為清華碩博士背景。
同時,實驗室的反向詞典和后續推出的據意查句(WantQuotes)等,也劃歸深言名下。
扒完公司,再聊幾句孵化出團隊的 THUNLP。
它成立于上世紀 70 年代,是國內第一個開展 NLP 研究的科研單位。實驗室牽頭人是國內 NLP 研究領域的泰斗黃昌寧,孫茂松是他的學生。
反向詞典另一名項目指導教師劉知遠,則是孫茂松的弟子,同屬 THUNLP 實驗室。
實驗室此前推出的項目,頗受關注的主要有三:
-
2017 年,中文詩歌自動生成系統九歌 MixPoet,它訓練過程中學習了 80 萬首中國古詩;
-
語言表征模型 ERNIE(沒錯,和文心大模型同名),可與當時任務最優的 BERT 媲美;
-
以中文為核心的預訓練大模型清源 CPM,是智源研究院大模型悟道?文源的前身。
上述項目的研發過程中,豈凡超等人尚未畢業,仍身處 THUNLP。
大牛帶隊,高額融資推進順利
王慧文收購傳聞中涉及的另一家公司,面壁智能,也孵化自 THUNLP。
公司同樣成立于 2022 年,專注大模型加速與應用落地。
創始人兼 CTO 曾國洋在大二時加入 THUNLP,是劉知遠的學生。公司核心成員都曾參與智源研究院“悟道?文源”大模型研發,目前劉知遠擔任聯合創始人,孫茂松、劉洋擔任顧問。
△ 曾國洋
此前,面壁智能聯合 THUNLP、智源研究院發起了 OpenBMB 開源社區,推出的 BMList 大模型趨勢圖跟蹤了大模型的演化趨勢。
此外,面壁智能還針對產業落地推出了 CPM-Live 百億中文大模型直播訓練項目,以及大模型全流程加速平臺 ModelForce。
股權結構顯示,智譜 AI 也在面壁智能持股 5.22%。
關于王慧文收購傳聞的后續消息是,雷峰網從多處信源獲知,王慧文與面壁智能的接觸和交流最終以合作流產告終,“面壁智能還是綜合考慮決定獨立發展”。
像深言科技和面壁智能這般“名門出身”的 AI 初創公司,高額融資推進得十分迅速。
據爆料,前文所提智譜 AI,身家價格已經在原有基礎上翻了 3 倍不止,而 AI 大牛周明創建的瀾舟科技,也在上月中旬剛剛完成了新一輪融資。
不過,據量子位得到的消息,如火如荼的這一波創業,除了商業大佬或技術大牛帶隊號召的團隊,多數在達到 3000 萬美元后,融資進展都會放緩甚至停滯。而應用層的創業項目,估值天花板也就在幾千萬美金上下。
甚至有 VC 投資人告訴量子位,不少美元基金考慮到項目質量和技術差距,已經半放棄國內 AI 創業項目,轉身前往硅谷挖人。
看來,轟轟烈烈的 AI 創業潮里,并非所有的公司都是搶手的當紅炸子雞。
本文來自微信公眾號:量子位 (ID:QbitAI),作者:衡宇
標簽(TAG)