萬眾期待的R2還沒來,但R1又變得更強(qiáng)了。
繼兩個(gè)月以前發(fā)布DeepSeek-V3-0324模型后,DeepSeek傳來最新動作——完成了R1模型的小版本試升級。升級后的模型在官方網(wǎng)站、APP、小程序測試(打開深度思考)就能體驗(yàn),API接口和使用方式保持不變,這意味著用戶無需切換和進(jìn)行任何操作,就可以感受和體驗(yàn)最新的R1模型。
與此前發(fā)布DeepSeek-V3-0324時(shí)同步披露模型細(xì)節(jié),介紹包括推理、前端開發(fā)、中文寫作、中文搜索等幾個(gè)方面的能力優(yōu)化不同,此次更新,DeepSeek官方并沒有公布版本更新的具體內(nèi)容。
但這一低調(diào)的“小版本試升級”背后,可能是一次“核彈級”的能力升級。據(jù)用戶實(shí)測,更新后的R1編程能力有了明顯提升,無論是網(wǎng)頁生成、小游戲制作,還是復(fù)雜的繪圖板Bug修復(fù)、圖片畫廊燈箱效果,R1都展現(xiàn)了極強(qiáng)的代碼生成、理解和修正能力,甚至可以與最近發(fā)布的編程新王Claude4相媲美。
例如,有用戶使用更新后的DeepSeekR1創(chuàng)建一個(gè)世界時(shí)鐘面板,要求展示不同時(shí)區(qū)的當(dāng)前時(shí)間并支持時(shí)區(qū)切換。更新版R1在審美和代碼完成度上較之前的版本又上了一個(gè)臺階,制作出了效果相當(dāng)驚艷的世界時(shí)鐘面板。
此外,DeepSeek還出色地完成了包括制作"貪吃蛇"游戲前端頁面、生成動態(tài)的星空夜景、創(chuàng)建一個(gè)科技資訊網(wǎng)站等多項(xiàng)任務(wù)。此外,還有網(wǎng)友在著名代碼測試平臺LiveCodeBench中表示,更新后的R1帶來了遠(yuǎn)超預(yù)期的能力提升,與OpenAI最新的o3模型高版本不相上下。
對于大模型而言,編程能力具有極為重要的價(jià)值,也是各個(gè)頂尖大模型廠商競相追逐的焦點(diǎn)。4月底,據(jù)外媒報(bào)道,OpenAI正在推進(jìn)對AI輔助編程創(chuàng)業(yè)公司W(wǎng)indsurf的一筆30億美元收購,若收購能順利達(dá)成,將成為OpenAI迄今為止最昂貴的一次收購行動。業(yè)內(nèi)人士分析,這一動作表明OpenAI旨在提升編程能力短板,從而與微軟、Anthropic等具備強(qiáng)大編程能力的競爭對手抗衡。
此外,近期多家廠商都推出了新版模型,重點(diǎn)都放在編程能力的升級上。例如,谷歌5月初正式推出Gemini2.5Pro“I/O”特別版,回應(yīng)開發(fā)者社區(qū)對實(shí)際編程和界面設(shè)計(jì)效能的強(qiáng)烈需求,谷歌DeepMind首席執(zhí)行官更是盛贊其為“我們迄今構(gòu)建的最強(qiáng)編程模型”。Anthropic公司在5月23日推出了ClaudeOpus4和ClaudeSonnet4新一代語言模型,在結(jié)構(gòu)化推理、軟件工程和自主代理行為等領(lǐng)域?qū)崿F(xiàn)重大進(jìn)步,更是以“自動寫代碼7小時(shí)”而刷新世界紀(jì)錄,被譽(yù)為新“編程王”。
自從在今年春節(jié)前后爆火后,DeepSeek一直保持著低調(diào)的作風(fēng),而業(yè)界則一直關(guān)注并討論DeepSeek何時(shí)將推出R2模型。4月底,有傳聞稱,其R2大模型的參數(shù)規(guī)模被曝達(dá)到驚人的1.2萬億,相比前代R1的6710億參數(shù)幾乎翻倍。此外,此前市場普遍推測R2將在5月份推出,但未獲得官方證實(shí),截至目前R2模型亦還未有推出跡象。
有分析指出,雖然DeepSeek低調(diào)地表示這是“小版本試升級”,但其模型能力的提升,放在OpenAI、谷歌、Anthropic等大模型公司,基本都會以全新一代的整數(shù)模型來命名并進(jìn)行高調(diào)發(fā)布。DeepSeekR1升級版本編程能力的提升,展現(xiàn)了追趕國際一線水平的強(qiáng)大競爭力,意味著國內(nèi)開發(fā)者可以直接使用,同時(shí)能獲得更低成本、更適合中國用戶需求的服務(wù)。
校對:姚遠(yuǎn)