2025年初,全球人工智能領(lǐng)域的聚光燈突然轉(zhuǎn)向一家名不見經(jīng)傳的中國初創(chuàng)公司——杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(DeepSeek)。這家企業(yè)憑借一款名為“DeepSeekV3”的大語言模型引發(fā)全球轟動。
DeepSeek的故事始于中國杭州的一間共享辦公室,深度求索公司成立于2023年7月17日,由知名量化資管巨頭幻方量化創(chuàng)立。創(chuàng)始團隊由梁文鋒等幾位年輕科學(xué)家組成,創(chuàng)業(yè)初期立下DeepSeek的理想主義:開源、降本與AI普惠。
2024年1月5日發(fā)布DeepSeek LLM,這是深度求索的第一個大模型。2024年12月26日晚,DeepSeek正式上線全新系列模型DeepSeek-V3首個版本并同步開源。這個大模型有6710億參數(shù),激活參數(shù)為370億,在14.8萬億token(詞元)上進行了預(yù)訓(xùn)練。在沒有預(yù)熱、沒有炒作的情況下,“DeepSeek-V3”模型迅速走紅,達到了令人咋舌的程度。
官方數(shù)據(jù)顯示,該模型多項評測成績超越了頭部開源模型,它在性能上與世界頂尖的閉源模型GPT-4o不分伯仲。令A(yù)I界感到不可思議的是這款大模型的訓(xùn)練成本極其低廉。官方技術(shù)論文披露,DeepSeek-V3在預(yù)訓(xùn)練階段僅使用2048塊GPU訓(xùn)練了2個月,且只花費557.6萬美元。而GPT-4o的模型訓(xùn)練成本約為1億美元。憑借獨有的技術(shù)架構(gòu)與算法優(yōu)化,DeepSeek大幅削減模型研發(fā)與運維成本,實現(xiàn)低成本高回報。以達成與OpenAI o1模型相當(dāng)性能為例,耗費資金僅為其3%-5%,這引起了硅谷的巨大轟動。要知道,OpenAI一直在巨虧——僅去年就“燒”掉了50億美元。其2023年至2028年預(yù)計累計虧損高達440億美元,2026年的支出可能攀升至95億美元。
Meta CEO扎克伯格則評價說,DeepSeek展現(xiàn)出的技術(shù)實力和性能令人印象深刻,并指出中美之間的AI差距已經(jīng)微乎其微。
Meta首席AI科學(xué)家Yann Lecun表示,DeepSeek-R1面世與其說意味著中國公司在AI領(lǐng)域正在超越美國公司,不如說意味著開源大模型正在超越閉源。他在社交媒體直言:“西方公司該醒醒了,中國同行正在定義新的游戲規(guī)則?!?/p>
前谷歌首席執(zhí)行官埃里克·施密特表示,DeepSeek的崛起標志著全球人工智能競賽的“轉(zhuǎn)折點”,證明中國可以用更少的資源與大型科技公司競爭。
微軟首席執(zhí)行官薩提亞?納德拉在瑞士達沃斯的世界經(jīng)濟論壇上表示:“DeepSeek的新模型令人印象深刻,尤其是在如何高效開發(fā)開源模型并進行推理計算方面,它的計算效率非常出色。我們應(yīng)當(dāng)非常、非常認真地對待來自中國的這些技術(shù)進展?!?/p>
英偉達在聲明中指出,DeepSeek在人工智能技術(shù)的創(chuàng)新與應(yīng)用方面,展現(xiàn)了難以置信的成就。
DeepSeek的確在全球技術(shù)領(lǐng)域豎起了一個重要的里程碑。中國科學(xué)家以超人的智慧應(yīng)對美國對中國高端芯片的封殺,以低功能芯片和低成本殺入世界頂級AI大模型的巔峰。
DeepSeek以令人稱奇的使用體驗帶來強勁的擴散效應(yīng),在蘋果AppStore應(yīng)用商店美國區(qū)登頂,超越了長期霸榜的ChatGPT。有報道說,目前160多個國家或地區(qū)下載榜同時登頂!僅俄羅斯就有超過500萬人下載使用。隨著人們下載使用體驗感的提升,相信這款大模型的全球下載量將越來越多,前途不可限量。
DeepSeek異軍突起,實力盡顯鋒芒。中國用戶面對DeepSeek這種強大的人工智能,從質(zhì)疑、體驗到全民狂歡似乎是一夜之間。的確,AI已經(jīng)把未來送到了每個人的家門口。今日頭條和小紅書等各大平臺上處處都是使用這一大模型的體驗和指令輸出范例,稱奇者比比皆是。
DeepSeek的成功,不僅象征著中國在AI領(lǐng)域科技實力的大幅提升,更顯現(xiàn)著中國在全球未來科技競爭中話語權(quán)份量在增強?!督鹑跁r報》將其描述為“震驚國際科技界的黑馬”,認為其性能已與資金雄厚的OpenAI等美國競爭對手的模型相媲美。《經(jīng)濟學(xué)人》表示,認為中國AI技術(shù)在成本效益方面的快速突破,已經(jīng)開始動搖美國的技術(shù)優(yōu)勢。
BBC則報道稱,中國新推出的人工智能應(yīng)用程序DeepSeek以驚人的速度震撼了科技行業(yè)、市場以及美國在人工智能領(lǐng)域的優(yōu)越感。
據(jù)報道,DeepSeek大模型遭遇了史上最大規(guī)模網(wǎng)絡(luò)攻擊,溯源顯示攻擊源來自美國。1月28日凌晨,DeepSeek官網(wǎng)的服務(wù)狀態(tài)頁面發(fā)布了一份緊急聲明,指出其線上服務(wù)近期遭遇了大規(guī)模的惡意攻擊。由于此次攻擊的影響,新用戶的注冊過程變得異常繁忙,甚至有時無法完成,DeepSeek迅速調(diào)整了服務(wù)器的配置和策略,加強了網(wǎng)絡(luò)安全防護,有效地抵御了攻擊的進一步蔓延。他們與多家知名的網(wǎng)絡(luò)安全公司建立了緊密的合作關(guān)系,共同應(yīng)對這次攻擊。
DeepSeek正全力加快AI智能生態(tài)的發(fā)展和豐富,加快從工具到生態(tài)的躍進。近日,DeepSeek團隊正式發(fā)布了兩款多模態(tài)框架——Janus-Pro和JanusFlow。其中,Janus-Pro是一款統(tǒng)一多模態(tài)理解與生成的創(chuàng)新框架,通過解耦視覺編碼的方式,極大提升了模型在不同任務(wù)中的適配性與性能,不僅展示了DeepSeek在技術(shù)創(chuàng)新方面的實力,也為用戶提供了更加多樣化和高效化的AI服務(wù)。
從“無名之輩”到“現(xiàn)象級AI公司”,從技術(shù)自信到生態(tài)布局,DeepSeek的崛起已超越商業(yè)范疇。以技術(shù)奇點重新定義AI賽道的底層邏輯和大模型范式,已經(jīng)打破從技術(shù)、產(chǎn)業(yè)到資本市場對AI發(fā)展的固有認知,掀起了一場前所未有的技術(shù)變革,它正在演繹的是未來科技智慧之戰(zhàn),或者說是技術(shù)理想主義與國家使命的演進。中國科技正在為人類命運共同體提供數(shù)字時代的創(chuàng)新范例,這是一場技術(shù)理想主義與國家宏大戰(zhàn)略的共振,更是一個古老文明在智能時代的強勢宣言。
AI來自于人類的智慧,并將催化智慧之光。智能文明時代需要更多的深度求索公司,相信中國科技界會涌現(xiàn)出更多的創(chuàng)新“黑馬”!(中國日報網(wǎng)特約撰稿人:鞠傳江)
?