如果你是一個(gè)網(wǎng)上沖浪老手,一定還記得2000年左右在門戶網(wǎng)站瀏覽新聞的體驗(yàn):
你需要從一堆花花綠綠的廣告當(dāng)中識(shí)別真正的內(nèi)容,并精準(zhǔn)點(diǎn)擊。看得不準(zhǔn),或者點(diǎn)得不準(zhǔn),都會(huì)讓你被即刻送往另一個(gè)不想去的網(wǎng)站。可以說(shuō),識(shí)別垃圾信息、避開(kāi)它們,是彼時(shí)網(wǎng)上沖浪的必備技能。
如今,AI的發(fā)展讓人夢(mèng)回千禧年,在亞馬遜搜索電子書(shū),要時(shí)刻警惕被AI生成的垃圾書(shū)騙。
食之無(wú)味就算了,有的垃圾書(shū)甚至想置人于死地。
比如在亞馬遜上公開(kāi)出售的電子書(shū)《野生蘑菇烹飪書(shū):從森林到餐盤,野生蘑菇烹飪完全指南》《西南地區(qū)的頂級(jí)蘑菇野外指南》,書(shū)里明晃晃寫著用“氣味和味道”識(shí)別不同的蘑菇。
聞一聞或者嘗一嘗,就能知道蘑菇的種類啦!這種話,隨便拉來(lái)一個(gè)云南人都能鑒別為一派胡言。正如蘑菇界的名言所說(shuō):所有蘑菇都是可食用的,不過(guò)有些蘑菇只能食用一次。
相關(guān)專家在接受《衛(wèi)報(bào)》采訪的時(shí)候幾乎發(fā)出尖銳爆鳴:“這似乎在鼓勵(lì)人們以品嘗作為辨別方法。絕對(duì)不應(yīng)該這么做。”
書(shū)中提到的一些蘑菇則“很刑”。比如上述烹飪指南中提到的“獅鬃菌”,雖然是可食用的,但在英國(guó)是受保護(hù)的物種。別問(wèn),問(wèn)就是獅鬃菌嘗起來(lái)像縫紉機(jī)的味道。
根據(jù)專做AI文本識(shí)別的公司Originality.ai的檢測(cè),這兩本書(shū)的樣本中人工智能檢測(cè)得分是100%,這意味著系統(tǒng)很自信這些書(shū)由如ChatGPT這樣的聊天機(jī)器人編寫。
這些書(shū)被報(bào)道之后,紐約真菌學(xué)會(huì)都出面發(fā)X(前Twitter),呼吁人們“請(qǐng)只購(gòu)買已知作者和美食家的書(shū)籍,這可能關(guān)系到生死”。
我們?cè)谌ツ?月就曾經(jīng)報(bào)道過(guò)一些人開(kāi)始通過(guò)ChatGPT等工具撰寫書(shū)籍,并放到亞馬遜等網(wǎng)站上售賣的現(xiàn)象。如今一年多過(guò)去,AI高速發(fā)展,亞馬遜顯然還沒(méi)有找到有力的方法杜絕這一現(xiàn)象,這家老牌電子書(shū)網(wǎng)站正在被AI攪亂。
A
讓我們來(lái)捋一下時(shí)間線。
2022年11月,ChatGPT橫空出世。僅僅幾個(gè)月之后,亞馬遜上就開(kāi)始出現(xiàn)一些疑似由AI撰寫的書(shū)籍。除了內(nèi)容和封面都粗制濫造之外,最明顯的反常信號(hào)是一個(gè)作者一天出版數(shù)本書(shū)。
彼時(shí)在YouTube上已經(jīng)開(kāi)始有博主在視頻教學(xué)如何用ChatGPT寫書(shū)并在亞馬遜上售賣。
從2023年年中開(kāi)始,包括VICE、WIRED(《連線》)等在內(nèi)的媒體開(kāi)始報(bào)道“AI圖書(shū)正在淹沒(méi)亞馬遜”的現(xiàn)象。
根據(jù)獨(dú)立作家凱特林·林奇(Caitlyn Lynch)2023年6月的統(tǒng)計(jì),彼時(shí)亞馬遜上“青少年浪漫”的類型下,暢銷排行榜的前100本電子書(shū)中,有約八成都是語(yǔ)無(wú)倫次的,看起來(lái)很像是AI生成的。
一直到如今,還不斷有作者站出來(lái)公開(kāi)談?wù)揂I圖書(shū)對(duì)他們個(gè)人IP的盜用與模仿。
也就是說(shuō),除了某些類型成為AI圖書(shū)的重災(zāi)區(qū)之外,一些作者——尤其是有名氣的作者——會(huì)被“影子圖書(shū)”蹭流量。這種情況大多發(fā)生在新書(shū)發(fā)售的黃金周期內(nèi),和作者相關(guān)的傳記、與新書(shū)高度相似的仿品大量出現(xiàn),試圖在宣傳期蒙騙不明真相的用戶,竊取流量。
一個(gè)新鮮的例子來(lái)自知名科技記者卡拉·斯威舍(Kara Swisher)。
卡拉在科技報(bào)道界德高望重,今年已經(jīng)62歲,幾乎把科技界大佬都采訪了個(gè)遍。包括但不限于數(shù)次深度對(duì)話史蒂夫·喬布斯、埃隆·馬斯克、馬克·扎克伯格等。
今年初,卡拉出版了一本個(gè)人回憶錄《燃燒的書(shū)(Burn Book)》。但她很快就發(fā)現(xiàn),當(dāng)她在亞馬遜檢索自己時(shí),除了自己的新書(shū),還出現(xiàn)了一些奇怪的東西。比如《卡拉·斯威舍:硅谷的斗牛犬》《卡拉·斯威舍:她如何成為硅谷最具影響力的記者》等,其中一本書(shū)的作者在一個(gè)月里就“寫”了四本傳記。
在卡拉看來(lái),這些明顯是竊取新書(shū)流量的AI圖書(shū),氣憤的她甚至給亞馬遜CEO安迪·杰西(Andy Jassy)發(fā)了一條短信:“這**是怎么回事?你在浪費(fèi)我的錢。”
美國(guó)作家協(xié)會(huì)的CEO表示,亞馬遜上的欺詐書(shū)籍其實(shí)一直都是一個(gè)問(wèn)題,但最近幾個(gè)月這個(gè)問(wèn)題愈發(fā)尖銳,可能是因?yàn)樵贏I幫助下造書(shū)成本降低:“每一本新書(shū)似乎都有配套的各種書(shū)出現(xiàn),試圖竊取銷售額。”
圖書(shū)“盜竊”不僅發(fā)生在新書(shū)作者身上。另一位作家梅勒妮·米切爾(Melanle Mitchell)在2019年發(fā)表《人工智能:思考人類指南》一書(shū),最近卻發(fā)現(xiàn)在亞馬遜搜索這本書(shū)時(shí),出現(xiàn)了去年9月發(fā)表的同名電子書(shū)。
這本同名電子書(shū)只有45頁(yè),用坑坑巴巴、笨拙的語(yǔ)言重復(fù)米切爾的觀點(diǎn),看起來(lái)是一部寫得不怎么樣的摘要。而該書(shū)作者在亞馬遜上沒(méi)有頭像,也沒(méi)有簡(jiǎn)介,名下卻有幾十本類似的書(shū),都是對(duì)其他書(shū)籍的總結(jié)式模仿。
深度偽造檢測(cè)公司Reality Defender幫米切爾檢測(cè)了一下,果然那本同名電子書(shū)有99%的可能是由AI生成的。
Reality Defender還順便檢測(cè)了一下“AI教母”李飛飛著作《我眼中的世界》在亞馬遜上的模仿者。與米切爾的模仿書(shū)不同,在亞馬遜搜索李飛飛《我眼中的世界》,會(huì)出現(xiàn)十幾本寫明自己是“摘要”的電子書(shū)。經(jīng)檢測(cè),這些書(shū)也大概率是AI生成的。不過(guò)雖然寫著自己是“摘要”,實(shí)際內(nèi)容則更像是用AI重寫了一遍原作,就像是“XXX書(shū)·兒童版”。
在《連線》雜志聯(lián)系李飛飛,告知她這一現(xiàn)象后,她回復(fù)了一個(gè)“腦袋爆炸”的emoji表情,顯然在此之前對(duì)有人在偷偷用AI模仿自己的書(shū)一無(wú)所知。
B
亞馬遜也并不是什么都沒(méi)做,但動(dòng)作顯得有些遲緩,效果也有限。
去年8月,簡(jiǎn)·弗里德曼(Jan Fridman)向亞馬遜和美國(guó)“豆瓣”Goodreads開(kāi)炮。弗里德曼是出版業(yè)的專家,曾在多家知名出版公司擔(dān)任高管,也有自己的博客,時(shí)不時(shí)發(fā)布對(duì)出版業(yè)的見(jiàn)解和實(shí)用建議。
她在自己的博客發(fā)表文章《我寧愿看到我的書(shū)被盜版,也不愿意看到這個(gè)》,表示在亞馬遜上有數(shù)本署名Jane Fridman但與她無(wú)關(guān)的書(shū)籍,更要命的是美國(guó)“豆瓣”Goodreads還將這些書(shū)籍放到了她的相關(guān)頁(yè)面。
也就是說(shuō),一個(gè)不熟悉弗里德曼的讀者,很有可能在對(duì)照了亞馬遜和Goodreads之后,認(rèn)為那些仿冒品出自她之手。而這些作品內(nèi)容拙劣,足以對(duì)弗里德曼造成名譽(yù)上的打擊。
更令弗里德曼不悅的是,當(dāng)她聯(lián)系亞馬遜和Goodreads,試圖讓其下架仿冒書(shū)籍的時(shí)候,遭到了兩個(gè)平臺(tái)的拒絕。亞馬遜要求她提供相關(guān)的商標(biāo)注冊(cè)證明,而弗里德曼被冒用的實(shí)際上是自己的名字,而她并未對(duì)自己的名字進(jìn)行商標(biāo)注冊(cè)(誰(shuí)會(huì)想到去注冊(cè)自己的名字呢)。
有意思的是,在弗里德曼發(fā)表博文公開(kāi)吐槽這件事后不久,亞馬遜和Goodreads就悉數(shù)移除了仿冒作品。
弗里德曼感嘆:“我敢肯定,這很大程度上拜賜于我在寫作和出版界的知名度與名譽(yù)。如果這些情況發(fā)生在比較小的作者身上,他們(平臺(tái))會(huì)怎么做?”
弗里德曼的發(fā)聲引發(fā)了一連串的反應(yīng)。先是美國(guó)作家協(xié)會(huì)宣布會(huì)為作者們提供幫助,而后美國(guó)聯(lián)邦貿(mào)易委員會(huì)(FTC)也發(fā)表了一篇文章,涉及生成性人工智能和圖書(shū)銷售,表明他們正在密切關(guān)注相關(guān)問(wèn)題。
去年9月,在弗里德曼發(fā)表博文后一個(gè)月,亞馬遜開(kāi)始打擊AI圖書(shū)。它修改了規(guī)則,將自助出版(Kindle Direct Program,下稱KDP)同作者每日上傳書(shū)籍的數(shù)量從無(wú)限制更改為最多三本。
KDP本就是AI圖書(shū)的重災(zāi)區(qū)。通過(guò)KDP,作者可以繞過(guò)傳統(tǒng)出版途徑,直接將作品發(fā)表在亞馬遜上并進(jìn)行銷售。理論上,亞馬遜一直都未禁止AI生成的文本銷售,而是要求作者標(biāo)明,且不能產(chǎn)生危害。
亞馬遜還聲明,正在積極監(jiān)測(cè)AI的發(fā)展以及隨后對(duì)閱讀、寫作和出版的影響。
但從今年還在不斷出現(xiàn)作家新書(shū)被AI截胡的事件來(lái)看,亞馬遜顯然做得還不夠好。
C
一個(gè)奇怪的現(xiàn)象是,雖然亞馬遜上充斥著疑似AI生成的圖書(shū),但大部分此類圖書(shū)并沒(méi)有什么銷量。
究竟是什么在推波助瀾?
人們對(duì)AI工具的確愈發(fā)熟悉,這也就促成了一些人有了想要通過(guò)AI寫書(shū)賺錢的想法。
一個(gè)有點(diǎn)驚人的數(shù)字是,Statista報(bào)告說(shuō),23%的美國(guó)作者在作品中使用了AI,近50%的受訪作者表示他們?cè)肁I作語(yǔ)法工具,還有10%的受訪者表示AI生成了他們的全部文稿。
知名媒體Vox指出,真正依靠“AI圖書(shū)”賺錢的,很可能不是那些把AI圖書(shū)放在亞馬遜上出售的“作者”,而是開(kāi)課教授“如何用AI圖書(shū)賺錢”的人。
亞馬遜的自出版業(yè)務(wù)KDP于2007年推出,早在2010年前后,關(guān)于如何利用自出版賺錢的課程如“自助出版革命”就如雨后春筍般冒出來(lái)。
在學(xué)習(xí)“自助出版革命”的若干學(xué)生中,有一對(duì)米科爾森(Mikkelsen)雙胞胎兄弟做得很成功,他們自出版了一本又一本垃圾書(shū),還創(chuàng)新地利用谷歌翻譯制作外文書(shū)籍,進(jìn)一步擴(kuò)大了銷路,收入一度達(dá)到百萬(wàn)美元。但最終,由于買家投訴,他們的KDP賬戶被封鎖,于是二人創(chuàng)業(yè),也開(kāi)始兜售相關(guān)課程。
有意思的是,他們的課程名稱一路從“有聲書(shū)影響學(xué)院”“出版生活”,到如今的“AI出版學(xué)院”。兄弟倆的課程原價(jià)6000美元,但往往會(huì)“限時(shí)打折”到2000美元左右。
上過(guò)“AI出版學(xué)院”課程的學(xué)生透露,2000美元只是敲門費(fèi)。一旦開(kāi)始上課,就會(huì)發(fā)現(xiàn)后續(xù)幾乎所有環(huán)節(jié)都會(huì)交費(fèi)。首先,兄弟倆會(huì)收取AI撰寫大綱的AI服務(wù)費(fèi),而后是人工代寫費(fèi)用(接活的代寫公司也是由兄弟倆的學(xué)生所有),接著還會(huì)有有聲書(shū)制作費(fèi)用,以及刷好評(píng)的費(fèi)用。
如果學(xué)生想要完整地跟完整個(gè)課程,費(fèi)用會(huì)從最初的2000美元激增到7800美元。
雖然交學(xué)費(fèi)前,“AI出版學(xué)院”承諾不滿意就會(huì)退款,但當(dāng)學(xué)生真的要退款時(shí),學(xué)院要求其提供完成了全部課程、出版了書(shū)籍并沒(méi)能把學(xué)費(fèi)賺回來(lái)的證明。
根據(jù)Inc.的一篇報(bào)道,米科爾森兄弟的公司收入從2019年的30萬(wàn)美元,已經(jīng)激增到了2022年的5000萬(wàn)美元。截至目前,他們的公司仍然運(yùn)營(yíng)著(畢竟好像的確沒(méi)有違法)。
AI圖書(shū)攪亂亞馬遜,“壞”的卻不是AI,而是背后無(wú)視規(guī)則無(wú)視道德的那批AI用戶。
將視角拉遠(yuǎn),我們正處在AI內(nèi)容與人類內(nèi)容混雜的時(shí)代,一場(chǎng)“AI狼人殺”時(shí)刻在互聯(lián)網(wǎng)中上演。根據(jù)互聯(lián)網(wǎng)安全公司Imperva的報(bào)告,2023年,全球互聯(lián)網(wǎng)流量中有49.6%來(lái)自機(jī)器人,而在2019年,這個(gè)數(shù)字還只有37.2%。
高效、準(zhǔn)確、全面地甄別AI內(nèi)容已經(jīng)成為一個(gè)亟待解決的難題。
行業(yè)資訊、企業(yè)動(dòng)態(tài)、業(yè)界觀點(diǎn)、峰會(huì)活動(dòng)可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...