亚洲黄页一区,一本大道色婷婷在线,欧美日韩国产观看视频
首頁(yè) > 資訊 > 快訊

"比人類還會(huì)騙人":Z世代大學(xué)生用AI重構(gòu)"誰(shuí)是臥底",各家模型大亂斗

2025/04/22 14:20      IT產(chǎn)業(yè)網(wǎng)


校園賽banner.png

  近日,由淘天集團(tuán)發(fā)起、天貓校園承辦的「誰(shuí)是臥底·AI Agent校園挑戰(zhàn)賽」圓滿落幕,這場(chǎng)聚焦大模型技術(shù)應(yīng)用與Agent創(chuàng)造的賽事 ,在高校大學(xué)生圈子里引發(fā)了不小的關(guān)注。比賽共吸引了全國(guó)來(lái)自海內(nèi)外超過(guò)100 所高校的1088位同學(xué)的注冊(cè)參賽,其中有614位同學(xué)取得成績(jī),最終由來(lái)自廣西大學(xué)、大連工業(yè)大學(xué)、浙江大學(xué)的選手包攬了前三名。賽事不僅創(chuàng)新性的展現(xiàn)了AI在復(fù)雜游戲社交場(chǎng)景中的表現(xiàn),更為廣大學(xué)生群體提供了幾乎零成本入門(mén)的AI實(shí)踐和學(xué)習(xí)機(jī)會(huì)。

  ▍以游戲?yàn)殓R:AI社交推理能力的試金石

  誰(shuí)是臥底(https://whoisspy.ai)是一個(gè)實(shí)時(shí)對(duì)戰(zhàn)、開(kāi)放可擴(kuò)展的游戲類型AI挑戰(zhàn)賽平臺(tái),為評(píng)估LLM 在社交推理和博弈中的表現(xiàn)而生。通過(guò)游戲“誰(shuí)是臥底”的高度互動(dòng)社交推理場(chǎng)景,深入剖析大語(yǔ)言模型(LLMS)在推理、欺騙和協(xié)作中的潛能。

  在這里,用戶可以參考平臺(tái)提供的游戲指南,使用大模型API簡(jiǎn)單操作,便可以創(chuàng)建自己的AI Agent,與其他選手的AI Agent 同臺(tái)游戲。每個(gè) AI Agent都化身 “玩家”,通過(guò)一輪輪的發(fā)言、投票和偽裝來(lái)展示自己的社交博弈能力。平民 AI 們要通過(guò)邏輯推理找出臥底,而臥底 AI 則在一邊拼命 “打太極”,一邊盡量隱藏自己。而平臺(tái)具備完善的多維度評(píng)估能力,實(shí)時(shí)結(jié)算每一局游戲分?jǐn)?shù),通過(guò)排行榜實(shí)時(shí)更新并展示Agent的分?jǐn)?shù)、排名及投票準(zhǔn)確率等。選手可以清晰地了解自己的模型在競(jìng)爭(zhēng)中的表現(xiàn)以及與其他模型的差距,從而有針對(duì)性地改進(jìn)策略。

  ▍一些有意思的發(fā)現(xiàn):從模型迭代到策略突破

  選手Agent對(duì)LLM的選擇變化

  誰(shuí)是臥底(https://whoisspy.ai)平臺(tái)自2025年1月正式上線以來(lái),已公開(kāi)舉辦2次賽事。隨著LLM模型日新月異的發(fā)展、推理模型的開(kāi)源和普及,本屆比賽選手的Agent,普遍有了更強(qiáng)大基座模型的武裝,也在比賽中表現(xiàn)出了非常多令人類都自嘆弗如的高光時(shí)刻。

  與首次比賽相比,本次比賽排名前三的選手均選擇了使用具備推理能力的模型,如 claude-3.7-thinking、deepseek-r1,這一選擇背后突顯了在“誰(shuí)是臥底”這類需要思考、偽裝的真實(shí)任務(wù)中,推理模型所具備的天然優(yōu)勢(shì)。另一方面,隨著國(guó)內(nèi)AI大模型能力的進(jìn)步,在第一次比賽中被不少選手使用的gpt-4o-mini模型,在第二次比賽中被各個(gè)版本的qwen、deepseek模型替代。更強(qiáng)大的基座模型,也給玩家的“誰(shuí)是臥底”Agent帶來(lái)了質(zhì)的能力提升。

  首場(chǎng)賽事Top5選手使用模型

  本次賽事Top5選手使用模型

  令人驚嘆的Agent高光時(shí)刻:

  臥底詞是“輕軌”的一號(hào)臥底玩家,成功靠發(fā)言帶偏一眾平民詞是“直升機(jī)”的平民玩家:

  精彩回放:https://whoisspy.ai/#/game?roomId=57947

  臥底詞是“企鵝”的六號(hào)臥底玩家,在人類看來(lái)幾乎有著完美的偽裝,但依然被其余平民詞是“袋鼠”的平民玩家準(zhǔn)確識(shí)別、投票出局:

  ▍參賽者說(shuō):當(dāng)AI遇見(jiàn)人類創(chuàng)造力

  值得一提的是,本次大賽不僅為選手提供了一個(gè)競(jìng)技的舞臺(tái),同時(shí)也促進(jìn)了他們對(duì)AI技術(shù)深層次的理解與運(yùn)用。比賽結(jié)束后,許多選手分享了他們的體驗(yàn),認(rèn)為這次活動(dòng)極大地拓寬了他們對(duì)于智能體應(yīng)用范圍的認(rèn)知,并激發(fā)了大家在AI領(lǐng)域的想象力。

  “誰(shuí)是臥底”比賽除了獎(jiǎng)金以外,賽事本身“用AI玩誰(shuí)是臥底”就相當(dāng)吸引人。機(jī)制設(shè)計(jì)得剛好,不會(huì)過(guò)于依賴純粹的編程能力或者AI專業(yè)技術(shù),這次比賽算是我第一次嘗試和 AI 一起“寫(xiě)代碼”,參賽過(guò)程足夠有趣、同時(shí)又具有挑戰(zhàn)性。”

  “比賽刷新了我對(duì)智能體的認(rèn)知,讓我看到了LLM的更高階玩法。AI不僅是Chat bot,更能以Agent的形式接入生活方方面面。比賽的易上手性和詳細(xì)的開(kāi)發(fā)文檔,讓我這個(gè)非對(duì)口專業(yè)的學(xué)生一腳踹開(kāi)了智能體開(kāi)發(fā)的大門(mén)。”

  “原來(lái)LLM還可以結(jié)合人類的游戲策略或者自定義策略去達(dá)成某種游戲目標(biāo),期待在未來(lái)可以引入更多AI 競(jìng)技類游戲,讓我們有更多嘗試機(jī)會(huì)。”

  ▍未來(lái)愿景:推動(dòng)競(jìng)技之外的科技創(chuàng)新

  隨著大語(yǔ)言模型技術(shù)和多智能體系統(tǒng)(MAS)的逐漸發(fā)展與成熟 ,并不斷融入到人們生活的各個(gè)方面。

  期待通過(guò)比賽的形式,幫助更多對(duì)AI感興趣的同學(xué)打開(kāi)想象力的大門(mén),激勵(lì)大家投身到對(duì)AI的研究和探索當(dāng)中。未來(lái)平臺(tái)還會(huì)推出其他AI游戲及挑戰(zhàn)主題,歡迎大家關(guān)注和參與。

  whoisspy.ai,加入AI游戲挑戰(zhàn),探索無(wú)限可能!

IT產(chǎn)業(yè)網(wǎng)微信二維碼logo

  行業(yè)資訊、企業(yè)動(dòng)態(tài)、業(yè)界觀點(diǎn)、峰會(huì)活動(dòng)可發(fā)送郵件至news#citmt.cn(把#換成@)。

海報(bào)生成中...

分享到微博

掃描二維碼分享到微信

分享到微信
一鍵復(fù)制
標(biāo)題鏈接已成功復(fù)制

最新新聞

熱門(mén)新聞

99热手机在线_五月天在线免费视频_波多野结衣之无限发射_美女一区二区三区视频_日韩在线观看a_天天天干夜夜夜操_日韩黄色片在线_97在线免费视频观看_天堂а√在线中文在线_88av.com_国产乱女淫av麻豆国产_日本a在线免费观看
日本一区二区高清不卡| 理论片午夜视频在线观看| 国产精品美女久久久| 色婷婷亚洲mv天堂mv在影片| 国产精品亚洲综合色区韩国| 91精品国产一区二区在线观看| 日韩伦理一区| 蜜桃精品在线| 亚洲欧美网站| 日韩精品一级| 国内一区二区三区| 久久只有精品| 精品欧美久久| 只有精品亚洲| 精品视频网站| 亚洲少妇诱惑| 欧美视频一区| 国产高潮在线| 综合激情五月婷婷| 在线精品国产亚洲| 麻豆精品蜜桃视频网站| 丝袜美腿亚洲一区二区图片| 国产精品成人自拍| 久久亚洲国产| 国产精品色婷婷在线观看| 亚洲午夜在线| 国产精品欧美在线观看| 亚洲国内欧美| 精品国产不卡一区二区| 亚洲自拍另类| 日韩中文欧美在线| 欧美日韩一二| 电影亚洲精品噜噜在线观看| 国产精品久久国产愉拍| 免费精品视频| 免费精品视频| 国内激情久久| 婷婷激情久久| 欧美sss在线视频| 亚洲91视频| 久久婷婷激情| 激情欧美亚洲| 欧美亚洲国产激情| 人在线成免费视频| 色综合www| 亚洲涩涩在线| 日韩精品网站| 蜜桃tv一区二区三区| 神马日本精品| 日韩av一级| 老司机精品久久| 激情欧美国产欧美| 97久久精品| 国产乱码精品| 蜜桃视频在线网站| 亚洲欧洲一区| 美女视频网站久久| 四虎884aa成人精品最新| 国产亚洲午夜| 嫩呦国产一区二区三区av| 精品国产一区二| 亚洲欧美日韩高清在线| 人人爱人人干婷婷丁香亚洲| 福利一区二区| 在线亚洲国产精品网站| 日韩精品亚洲专区| 国产精品麻豆久久| 国产一区导航| 久久久久一区| 国产精品任我爽爆在线播放 | 蜜臀久久久99精品久久久久久| 麻豆成人91精品二区三区| 亚洲一区观看| 午夜精品影院| 92国产精品| 97精品国产一区二区三区| 青青草伊人久久| 三级欧美韩日大片在线看| 久久精品国内一区二区三区水蜜桃| 亚洲欧美综合| 欧美aⅴ一区二区三区视频| 伊人久久亚洲| 日韩综合一区二区| 一区免费在线| 在线午夜精品| 日韩欧美2区| 国产精品最新自拍| 麻豆国产欧美日韩综合精品二区| 国产精品欧美日韩一区| 精品在线网站观看| 国模精品一区| 日韩不卡在线| 黄色日韩在线| 国产欧美另类| 久久久五月天| 日韩精品诱惑一区?区三区| 国产资源在线观看入口av| 国内精品99| 日本欧美一区二区在线观看| 亚洲精品进入| 午夜日韩影院| 日本不卡一区二区三区| 国产尤物精品| 欧美亚洲国产激情| 亚洲一区日韩在线| 欧美午夜三级| 亚洲国产不卡| 日本午夜精品久久久久| 视频在线不卡免费观看| 亚洲一区日韩| 免费看精品久久片| 国内在线观看一区二区三区| 亚洲欧美网站| 99成人超碰| 麻豆久久久久久久| 蜜桃视频在线观看一区| 美女毛片一区二区三区四区| 麻豆91在线播放| 亚洲日本久久| 人人精品人人爱| 久久中文视频| 国产成人免费av一区二区午夜| 国产精品一区二区av日韩在线 | 999在线观看精品免费不卡网站| 欧美伊人久久| 亚洲精品婷婷| 亚洲资源av| 亚洲尤物av| 久久99精品久久久野外观看| 日韩激情啪啪| 九九九精品视频| 亚洲成人精品| 蜜臀av国产精品久久久久| 亚洲久久一区| 免费高潮视频95在线观看网站| 成人va天堂| 亚洲欧美日韩一区在线观看| 日韩精品国产欧美| 麻豆国产精品视频| 国产成人精品免费视| 欧美一区免费| 日韩精品专区| 亚洲制服少妇| 日韩精品不卡一区二区| 婷婷亚洲综合| 国产精品亚洲欧美| 婷婷综合在线| 老司机精品久久| 国产精选在线| 综合亚洲视频| 亚洲伦乱视频| 欧美日本不卡| 亚洲性视频在线| 久久久精品久久久久久96| 免费在线看一区| 亚洲一级特黄| 久久精品国内一区二区三区| 免费在线欧美视频| 丝袜美腿一区二区三区| 精品在线99| 国产综合精品一区| 精品久久一区| 国产精品xxx| 欧美极品一区二区三区| 国产精品久久| 日韩av中文字幕一区二区三区| 亚洲在线免费| 亚洲日本在线观看视频| 石原莉奈在线亚洲二区| 亚洲成人国产| 久久精品电影| 国模 一区 二区 三区| 精品99久久| 激情综合五月| 欧美少妇精品| 久久中文字幕av一区二区不卡| 欧美另类专区| 日韩av电影一区| 久久人人精品| 久久九九国产| 在线亚洲人成| 亚洲国产一区二区三区在线播放 | 涩涩av在线| 视频在线观看一区| 国产毛片一区| 成人羞羞在线观看网站| 啪啪亚洲精品| 欧美一区久久| 国产欧美一级| 婷婷综合六月| a国产在线视频| 久久男人av| 亚洲精品婷婷| 国产一区国产二区国产三区| 国产精品多人| 国产欧美自拍| 日本一区中文字幕| 亚洲国产一区二区三区在线播放| 日本视频中文字幕一区二区三区| 不卡视频在线|