在電影《她》中,主人公西爾多和人工智能系統薩曼莎相戀了。她是體貼的、幽默的、忠誠的、聰慧的,無需多言,便能理解他的喜怒哀樂,恰到好處地提供情緒價值。
薩曼莎的細膩與體貼,其實源于機器學習(Machine Learning)技術:在與男主的日常溝通接觸中,這些數據和反饋幫助薩曼莎變得更「懂他」。
這部 2013 年上映的電影所想象的世界,似乎即將在十年后的今天成為現實。上個月末,OpenAI 發布 ChatGPT 后,數百萬網友沉迷于和這個聰慧 AI 的聊天對話中。就連馬斯克都為之瘋狂,稱這是「思想之樹」。
12 月 15 日,Science 雜志公布了 2022 年度科學突破,創造性人工智能位列其中。
過去一年,無論是 AI 作畫的強勢出圈,還是ChatGPT 令人驚嘆的對話流暢性,都在直接告訴我們:創造、交流、思考,不再是人類獨占的領域。
生成式 AI 讓我們看到了新一代技術革命的可能性,但距離它們能夠撐起萬億美元級別的市場,還有多遠的路要走?中文世界又何時能誕生一款媲美 ChatGPT 的大模型應用?
ChatGPT ,神功初成
GPT 的全稱,是「Generative Pre-Training」,翻譯過來就是「生成式的預訓練」。
ChatGPT,即「聊天GPT」,是 OpenAI 對 GPT-3 模型進行微調后,開發出來的聊天機器人。人們可以和它進行對話交流。
與此前不太機靈的聊天機器人前輩不同,ChatGPT 不僅上知天文下知地理,像一位博聞強識的朋友;還能夠記住聊天的上下文,真正像人類一樣根據語境進行交流。
這并不是說 ChatGPT 擁有了人類的思維。本質上這是一個大量語言數據訓練出來的概率模型,可以根據上文提示,預測下一個單詞、下一句話應該是什么。
開放使用后,用戶針對 ChatGPT 生成的回答進行反饋。這些反饋對于 ChatGPT 來說是非常重要的訓練數據,和薩曼莎一樣,ChatGPT 也會越來越善解人意,順應用戶的期望來溝通交流。
雖然,現階段 ChatGPT 的趣味性大過信息價值,但也有很多用戶將它視為下一代生產力工具,并開發出了許多用法:學代碼、寫周報、編劇本、做高數……
ChatGPT 有什么用?它自己的回答如下:文本生成、聊天機器人、問答系統、機器翻譯。
![]()
一個名為 gpt3demo 的網站收錄了使用 GPT-3 接口的所有應用,共計 432 個,包括廣告生成、指導生成式AI、博客寫作、文案寫作、瀏覽器擴展、BUG核查、A/B Test、聊天機器人、健康咨詢、客服、代碼生成、數據集生成、設計、文件提取、圖片編輯等等。
「GPT-3 是一個通用智能引擎,只要能形式化為語言的任務都可以用它來做。」復旦大學 NLP 在讀博士孫天祥說。
比如寫作。它不僅可以寫作營銷文案、周報總結,還可以模仿魯迅、胡適創作詩歌和散文、以莫扎特的風格譜曲。雖然它寫出來的文章中「廢話文學」成分略高,但邏輯清晰、文辭恰當,應用在日常文檔工作中基本沒有違和感。
國外的效率工具們,諸如 Notion、Craft、Canva 等等,都在今年陸陸續續推出了自己的 AI 輔助寫作助手。雖然他們目前使用的并非 GPT 技術,但理論上都是可以使用的。
ChatGPT 還可以寫代碼。
即刻網友 @機智的小榴蓮 用它將 Python 重構成 Go,將一種代碼快速轉換為另一種代碼;@Shenk 用它寫了一段可執行的掃雷小游戲代碼;還有很多網友把 ChatGPT 當作全知全能的助教,一邊請教一邊學習代碼。
即刻網友 @張杰伊 則認為,ChatGPT 將編程工作變成了「寫提示 - ChatGPT生成代碼 - 人工運行代碼 - 將報錯信息粘貼給 ChatGPT - ChatGPT 改 Bug - 程序運行成功」的流程,讓低代碼直接變成了零代碼。
再比如搜索。你可以問它紅燒排骨怎么做,也可以咨詢「如何舉辦一場成功的展覽」。它幾乎閱讀完成了互聯網所有浩瀚的信息,總共閱讀并記住了 5000 億個詞,模型有 1750 億個參數。
雖然 ChatGPT 學習了海量的互聯網數據,但它暫時還無法取代搜索引擎:一是時效性不足,二是準確性無法保障。
關于時效性,ChatGPT 訓練集的內容停留在 2021 年以前,對近一年來發生的事情知之甚少。胡天祥解釋,「理論上是可以做到時效性的同步,把新加進來的材料繼續訓練就可以了,但是一般這會造成災難性遺忘,也就是會忘記之前的部分學習材料,制約它時時更新的主要是成本」。
準確性不足,也是 ChatGPT 廣為詬病的一點:它很擅長一本正經地胡說八道。
OpenAI 的 CEO,Sam Altman 表示,他們正試圖阻止 ChatGPT 的隨機編造,會依靠用戶反饋來改進。
ChatGPT 本尊也明確提示,自己和搜索引擎有著不同的目的和功能,不能互相取代。但它的確長成了搜索引擎想要進化成的模樣:進一步降低信息篩選的門檻,用戶可以通過單次搜索,得到一個近乎滿意的答案。
![]()
最讓人驚奇的應用,是用 ChatGPT 指導 AI,用魔法馴服魔法。
隨著 AI 作畫的出圈,提示語生成(prompt engineering)逐漸成為一門生意。好的提示語,能夠幫助人與AI 進行更高質量的對話,引導 AI 生成更符合要求的文字或圖像。
初創公司 PromptBase 就提供了這樣的服務交易平臺,你可以花 2-5 美元購買「提示工程師」寫的一串單詞,復制到 AI 作畫或者 GPT-3 的應用中,就能生成你期待的圖像或文字。每單消費,PromptBase 會收取 20% 的傭金。
而現在,你可以讓睿智的 ChatGPT 幫你寫提示語了。經網友測試,它果然比人類更懂 AI,生成的提示語質量相當高。
商用,還有點難
ChatGPT 出口成章的能力讓人驚嘆,但在真正的商業應用前,還需要解決兩個問題:張口就來的問題和運維成本。
當被問道「紅樓夢中賈寶玉適合娶誰」時,ChatGPT 言之鑿鑿地說「賈母」;而當要求背誦觀滄海時,它更是臨時編造了一首詩,不打算對結果的準確性負責。
據 Twitter 網友的集體測試,ChatGPT 的錯誤率在 2%-5% 左右。對于一個有趣的測試版聊天機器人來說,這樣的表現無疑是優秀的;但如果要應用到嚴肅的商業場景,例如合同、公文的寫作,尤其是對于模型精度要求很高的金融行業,還需要進一步訓練輸出結果的穩定性。
Sam Altman 也表示,現階段讓它不要胡說八道有點難:「讓它與當前技術保持平衡是很棘手的。」
他們嘗試依靠用戶反饋來解決這一問題。Sam Altman說,「用戶的提問、對問題的反饋,都是非常重要的數據,這讓 OpenAI 知道真實世界里用戶的意圖分布,基于這些才能讓 ChatGPT 做得更好。」
不過,如果用戶反饋中混雜了一定程度的錯誤信息,也許會使它的準確率受到影響。「比 GPT-3 小的預訓練語言語言模型都會出現比較嚴重的偏向性,比如種族歧視、性別歧視等等,這是互聯網上的數據分布造成的。」胡天祥解釋道。
運行成本是另外一個難題:GPT-3 的計算成本比搜索引擎大得多。
每天,搜索引擎都要服務數十億個搜索請求。單次計算成本即使是微小的提升,放到這個數量級上,都是相當可觀的真金白銀。
Sam Altman 在社交媒體上稱,目前 ChatGPT 單次回答(Single Turn)的平均費用在幾美分左右(約合幾毛錢人民幣)。雖然未來還會持續降低,但業界人士普遍認為,只有當成本縮減 90% 后,才有商業應用的經濟適用性。
![]()
「不過現在看下來,他的部署速度還是挺快的了,國內部署的大模型都比它慢得多。」胡天祥認為,雖然成本的確是個制約,但其部署速度讓人看到了近期商業化落地的可能性。
中國版 OpenAI 在哪里
其實,國內不是沒有大廠在做類似的事。
根據公開資料,目前中國大模型參數量*的是阿里的 M6 大模型,達到了萬億級別;百度文心、華為的盤古大模型,也有千億的規模。
國內智源,IDEA,百度,阿里,華為,騰訊都有類似的大模型,比如 GLM,CPM,ERNIE(百度),M6(阿里),盤古(華為)等等。雖然能力尚無法與 GPT-3 比肩,但其中一部分也已經被應用在業務。只不過,它們往往被應用在內部業務中,對外的并不多,因此知名度并不高。
百度文心,是國內少數對外開放的大模型應用之一,2021 年開放給公眾使用。它可以實現視頻、歌詞、藝術作品的自動生成,已被應用于百度內部的搜索、信息流、百度地圖等產品中。
3 個月前,百度發布了 AI 助理,提供給普通用戶 AI 自動生成文字、圖片等功能,還提出為創作者帶來一套 AI 生產內容工具,更高效的生產視頻內容。這意味著,百度的 AI 產品正式開始 toC 了。
就在前幾天,由百度文心續畫的陸小曼未盡畫稿,和海派畫家續畫的同名畫作,共計以 110 萬元的高價落槌。一方面,讓人看到了 AI + 藝術的商業價值,另一方面,也能看出百度對于商業變現的迫切性。
在飛槳平臺上,我們也可以體驗類似于 ChatGPT 的功能,但顯然它的語義理解能力還有待增強。當我們問它「文心大模型是什么」時,它沒能對自己進行一個流暢的自我介紹,生成的文字也顯得前言不搭后語。
![]()
為什么國內的模型,在效果上無法媲美 OpenAI 呢?
一是中文領域的難度更大。「中文訓練數據一來確實少,二來質量低。」胡天祥說,即使是 ChatGPT 的英文處理也顯著優于中文處理。中文互聯網世界里,各大 APP 相對割裂,可供 AI 訓練的公共內容遠不及英文素材豐富。
第二,技術的進步,需要長久而持續的投入。「OpenAI 的團隊 2020 年放出 GPT-3 后就一直在維護和更新,不斷收集用戶反饋和真實的數據,慢慢形成了數據壁壘。」
千億級別的大模型,顯卡的算力成本需要在千張以上。像 GPT 這樣擁有 1750 億參數的大模型,運算一次要花 450 萬美金,跟發射一個衛星的成本差不多。商業前景不明朗,又需要不計成本的投入,對大廠來說這不劃算。
另一方面,國內大廠的科研團隊隸屬于公司,節奏緊張,很難避免商業變現的壓力;而 OpenAI 自成立之初,便將自己定位為「非營利組織」,更類似于研究院的性質,招徠*的科研人才。當然,微軟的投資給了 OpenAI 燒錢做研究的底氣。
值得注意的是,OpenAI 發布的關于 ChatGPT 的論文中,共有 8 位主要作者,其中 3 位的姓名是中文拼音。他們或許來自中國,或許是華裔。而網絡領域頂會(SIGCOMM)的期刊中,每年都會收錄幾篇來自于阿里、華為等公司的研究論文。這說明國內 AI 領域,不缺乏優秀的基礎研究者。
我們缺乏的,可能是耐心。中金基金的研究報告中曾寫道,「實力雄厚的美國互聯網巨頭對 AI 底層技術戰略性投入力度較大,但中國的 AI 產業主要受需求拉動,大多數 AI 公司布局應用層。」
好消息是,ChatGPT 的成功出圈,讓資本和業界都看到了它不可估量的商業潛力。
2022 年被很多人稱為「AIGC 元年」,此前默默無聞的大模型賽道,今年融資也多了起來,單筆融資金額高達 10 億元,聯想創投、創新工場等知名投資機構均參與其中。
這意味著,會有更多初創公司加入這場需要耐心和毅力的長跑。與大廠不同,它們或許能以更聚焦的技術輸出全情投入,為中文世界的生成式 AI 積累點滴珍貴的創新。
榜單收錄、高管收錄、融資收錄、活動收錄可發送郵件至news#citmt.cn(把#換成@)。
海報生成中...