我想看一级黄色片_欧美性爱无遮挡电影_色丁香视频网站中文字幕_视频一区 视频二区 国产,日本三级理论日本电影,午夜不卡免费大片,国产午夜视频在线观看,18禁无遮拦无码国产在线播放,在线视频不卡国产在线视频不卡 ,,欧美一及黄片,日韩国产另类

首頁 500強(qiáng) 活動 榜單 商業(yè) 科技 商潮 專題 品牌中心
雜志訂閱

量化私募巨頭殺入AI腹地

劉蘭香
2025-01-06

A股投資者貢獻(xiàn)幾何,?

文本設(shè)置
小號
默認(rèn)
大號
Plus(0條)

歲末年初,,中國資本市場和AI以一種出人意料的方式被勾連起來:A股在2024年最后一個交易日和2025年前三個交易日持續(xù)下跌,,同時中國一個以較低成本達(dá)到與硅谷最先進(jìn)AI幾乎同樣效果的全新大模型橫空出世,而其脫胎于被指責(zé)對股市下跌推波助瀾的量化私募基金之一,。

2024年12月26日,,中國AI初創(chuàng)企業(yè)DeepSeek(深度求索)官方微信公眾號推文稱,旗下全新系列模型DeepSeek-V3首個版本上線并同步開源,其為自研MoE模型,,671B參數(shù),,激活37B,在14.8T token上進(jìn)行了預(yù)訓(xùn)練,;DeepSeek-V3多項評測成績超越了Qwen2.5-72B和Llama-3.1-405B等其他開源模型,,并在性能上和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

該模型一經(jīng)發(fā)布可謂震撼了整個AI圈,,在硅谷掀起的討論度甚至高過國內(nèi),。谷歌前CEO埃里克·施密特(Eric Schmidt)近期在訪談中表示:“中國現(xiàn)在手握兩款看起來是史上最強(qiáng)的AI模型,而且它們是完全開源的,,一個是超級強(qiáng)大的問題求解器,,另一個是大語言模型,在某些情況下它與Llama-3的4000億參數(shù)效果相當(dāng)甚至更勝一籌,,這讓我很震驚,,之前我一直以為他們在這方面落后了兩三年,現(xiàn)在看來只落后了不到一年,?!彼鞔_指出DeepSeek就是中國正在快速追趕美國領(lǐng)先AI模型的一個最新例證。

可能同樣令施密特震驚的是,,DeepSeek這家公司成立的時間不到兩年,,且未如月之暗面、智譜AI,、Minimax等一眾AI初創(chuàng)公司一樣“投靠”大廠,。根據(jù)企查查的數(shù)據(jù),DeepSeek由幻方量化創(chuàng)始人梁文鋒牽頭創(chuàng)立于2023年7月,,是一家通用人工智能模型AGI研發(fā)商,,專注于開發(fā)先進(jìn)的大語言模型(LLM)和相關(guān)技術(shù),以滿足人工智能領(lǐng)域的各種需求,。

眾所周知,,大模型是一個極其“燒錢”的游戲,但梁文鋒曾在接受“暗涌Waves”采訪時表示,,大模型業(yè)務(wù)短期內(nèi)沒有融資計劃,,面臨的問題從來不是錢,而是高端芯片的獲取問題,。

幻方量化為中國量化私募巨頭,,旗下包含浙江九章資產(chǎn)和寧波幻方量化兩家公司,分別成立于2015年和2016年,,公司管理規(guī)模在2021年時曾達(dá)到千億元,,最新管理規(guī)模已降到200~300億元,,據(jù)業(yè)內(nèi)人士透露這也是其主動控制規(guī)模的一個結(jié)果。至于控制規(guī)模是因基金管理人的能力遇到瓶頸還是由于公司創(chuàng)始人希望將更多精力投入到AI領(lǐng)域,,則不得而知,。

從公開信息來看,,幻方量化與深度求索之間并無直接的股權(quán)關(guān)系,,兩家公司各自在獨立運(yùn)營和發(fā)展。不過,,早在2023年4月,,幻方量化就宣布成立新組織,集中資源和力量,,探索AGI的本質(zhì),,并稱多年以來該公司堅持把營收的大部分投入人工智能領(lǐng)域,建設(shè)領(lǐng)先的AI硬件基礎(chǔ)設(shè)施,,進(jìn)行大規(guī)模的研究,,探索人類未知的奧秘,這足以表明深度求索是幻方量化直接孵化出來的一家AI公司,,而兩家公司共同的創(chuàng)始人梁文鋒則發(fā)揮著關(guān)鍵的橋梁作用,。

在被問及為何一家量化私募要入局大模型時,梁文鋒表示,,“我們做大模型,,其實跟量化和金融都沒有直接關(guān)系,當(dāng)時我們嘗試了很多場景,,最終切入了足夠復(fù)雜的金融,,而通用人工智能可能是下一個最難的事之一,所以對我們來說,,這是一個怎么做的問題,,而不是為什么做的問題。過去很多年,,中國公司習(xí)慣了別人做技術(shù)創(chuàng)新,,我們拿過來做應(yīng)用變現(xiàn),但這并非是一種理所當(dāng)然,。這一波浪潮里,,我們的出發(fā)點,就不是趁機(jī)賺一筆,,而是走到技術(shù)的前沿,,去推動整個生態(tài)發(fā)展?!?/p>

DeepSeek-V3除了令硅谷大佬側(cè)目,,其領(lǐng)先性還被獨立評測網(wǎng)站Artificial Analysis“蓋章認(rèn)證”,。Artificial Analysis對DeepSeek-V3就質(zhì)量、價格,、性能等關(guān)鍵指標(biāo)與其他人工智能模型進(jìn)行對比后得出了結(jié)論:“DeepSeek-V3模型超越了迄今為止發(fā)布的所有開放權(quán)重模型,,并且擊敗了OpenAI的GPT-4o(8月),并接近Anthropic的Claude 3.5 Sonnet(10月),。目前唯一仍然領(lǐng)先于DeepSeek的模型是谷歌的Gemini 2.0 Flash和OpenAI的o1系列模型,。領(lǐng)先于阿里巴巴的Qwen2.5 72B,DeepSeek現(xiàn)在是中國的AI領(lǐng)先者,?!?/p>

在殺入AI腹地之前,梁文鋒對AI確實鐘情已久,。在幻方量化的官網(wǎng)首頁C位有一句話:“使用AI進(jìn)行投資的對沖基金”,。從2019年開始,幻方量化更是加大投資于深度學(xué)習(xí)訓(xùn)練平臺,,先后推出了“螢火一號”和“螢火二號”,,前者投資2億元,搭載了1100塊GPU,,后者于2021年推出時將投入增加到10億元,,搭載了約1萬張英偉達(dá)A100顯卡,這也是當(dāng)時最先進(jìn)的GPU之一,。到2022年,,OpenAI發(fā)布了ChatGPT的公開測試版本,掀開AI新篇章,,也給擁有較強(qiáng)算力儲備和技術(shù)平臺的幻方帶來了抓住這波AI熱潮的最佳機(jī)遇,。

如果說算力儲備讓幻方對國內(nèi)大模型玩家擁有一定優(yōu)勢,那么基于算法優(yōu)化的訓(xùn)練成本優(yōu)勢或是其在迎戰(zhàn)國際領(lǐng)先玩家時的主要殺手锏,。

在DeepSeek研究團(tuán)隊同步公開的技術(shù)論文中,,一個細(xì)節(jié)引發(fā)廣泛關(guān)注:DeepSeek-V3整個訓(xùn)練過程僅用了不到280萬個GPU小時,按每GPU小時2美元計算,,模型全部訓(xùn)練成本僅為557.6萬美元(約4000萬元人民幣),,這一成本不到Llama-3405B超6000萬美元訓(xùn)練成本的十分之一,幾乎是GPT-4o訓(xùn)練成本的二十分之一(據(jù)Anthropic CEO達(dá)里奧·阿莫迪不久前透露的數(shù)據(jù),,GPT-4o訓(xùn)練成本約為1億美元),。

Meta的AI研究科學(xué)家田淵棟稱,DeepSeek“在非常有限的預(yù)算下實現(xiàn)強(qiáng)勁表現(xiàn),,這是一項了不起的工作”,。

這一成本優(yōu)勢在2024年5月發(fā)布DeepSeek-V2開源模型時就已初步展露:DeepSeek-V2 的推理成本僅為每百萬tokens 1元,遠(yuǎn)低于Llama370B和GPT-4 Turbo等,。而最新面世的DeepSeek-V3的API定價進(jìn)一步下降,,輸入每百萬tokens 0.5元(緩存命中)/2元(緩存未命中),,輸出每百萬tokens 8元,性價比不僅進(jìn)一步碾壓美國領(lǐng)先AI模型,,且在價格戰(zhàn)已烽煙四起的國產(chǎn)模型中也相當(dāng)有競爭力,。

目前來看,DeepSeek在邁向“國產(chǎn)大模型之光”的路途上,,主要挑戰(zhàn)除了梁文鋒直言的“高端芯片的獲取問題”,,可能還有量化私募在國內(nèi)所受的毀遠(yuǎn)大于譽(yù)的境況。有市場人士質(zhì)疑,,如此強(qiáng)大的模型是否會變成資本市場上更鋒利的鐮刀,?但反過來說,,如果投資者確實被量化“收割”,,可能也是在以另一種方式在推動中國AI的發(fā)展。(財富中文網(wǎng))

財富中文網(wǎng)所刊載內(nèi)容之知識產(chǎn)權(quán)為財富媒體知識產(chǎn)權(quán)有限公司及/或相關(guān)權(quán)利人專屬所有或持有,。未經(jīng)許可,,禁止進(jìn)行轉(zhuǎn)載、摘編,、復(fù)制及建立鏡像等任何使用,。
0條Plus
精彩評論
評論

撰寫或查看更多評論

請打開財富Plus APP

前往打開
熱讀文章