OpenAI新模型GPT-4o有哪些突破,？

2024-05-14 08:00

文本設(shè)置

小號(hào)

默認(rèn)

大號(hào)

Plus(0條)

5月13日,，OpenAI開(kāi)啟春季更新活動(dòng)，通過(guò)線上直播向全球演示ChatGPT和GPT-4更新的功能,。未能參加直播活動(dòng)的OpenAI首席執(zhí)行官山姆·奧特曼在社交平臺(tái)X上發(fā)帖：“我們的新模型：GPT-4o是我們迄今為止最優(yōu)秀的模型,。它既智能又快速，并且是原生多模態(tài)模型?！?a style="color:#b6b6be;white-space: nowrap;" class="article-link" id="newSpecialLink" target="_blank" rel="noopener" data-find-id="732"> | 相關(guān)閱讀（騰訊科技）

小宸

心理咨詢師

熬夜看完OpenAI發(fā)布會(huì),，準(zhǔn)確地講這是一次偽裝成春季update的智能交互變革，貌似一小步的一大步,。OpenAI再次制造了一波焦慮——
1.從之前讀文看圖以及遲滯感明顯的語(yǔ)音交互,，到GPt-4o的實(shí)時(shí)多模態(tài)自然交互，知道的人知道這意味著什么,，大模型從此呆瓜變＂真人”,，能看能說(shuō)能思考的自然交互，讓智能瞬間變得人人隨時(shí)隨地唾手可得,。不能低估交互,，能力、場(chǎng)景,、用戶基數(shù)瞬間幾何級(jí)放大,；

2.百分百可以肯定不只是GPT4的后端能力+前端Chatbot聊天機(jī)器人，多模態(tài)自然交互這部分是GPT-5能力的選擇性釋放,，OpenAI在控制節(jié)奏,，不會(huì)也不愿一次性把GPT全都放出來(lái)，之前表達(dá)過(guò)這種觀點(diǎn),；

3.沖擊就是：一批基于GPT做語(yǔ)音等多模態(tài)自然交互的,，一批基于家庭做情感陪伴的，包括一批基于機(jī)器人做具身智能交互界面的,，智能硬件底層邏輯需要進(jìn)一步重構(gòu),，手機(jī)廠商自研模型還需努力，包括一批做情緒計(jì)算的,，助手,、教育、翻譯等更危了......想套殼GPT或OTT的,，基本都會(huì)被GPT反過(guò)來(lái)蓋帽,。

4.Siri呆若木雞，Claude相形失色,，Gemini反正不會(huì)......客觀而言,，其它閉源開(kāi)源還沒(méi)這么能打的。不過(guò)就GPT4動(dòng)不動(dòng)卡殼掉鏈子的那副表現(xiàn),，GPT-4o的用戶體驗(yàn)從流暢度來(lái)說(shuō)好不到哪里去,，能到發(fā)布會(huì)演示水平的一丟丟就不錯(cuò)了。

5.GPT-4o免費(fèi)可限量用,，付費(fèi)可多用,，和GPT3.5以及最近部分免費(fèi)一樣，典型的敞口漏斗營(yíng)銷策略，不過(guò)還沒(méi)充分拉開(kāi)梯度,，導(dǎo)致需求量較大的非開(kāi)發(fā)者非企業(yè)用戶經(jīng)常受限的情況在GPT-4o估計(jì)會(huì)更嚴(yán)重,。

6.重新理解攝像頭，重新機(jī)器視覺(jué),、聽(tīng)覺(jué),。手機(jī)等移動(dòng)終端和碎片場(chǎng)景下的應(yīng)用爆發(fā)力，將不輸AI PC等生產(chǎn)力場(chǎng)景,，甚至移動(dòng)引爆會(huì)走在前面,。這就不是幾億而是幾十億用戶的問(wèn)題了。

如果預(yù)估OpenAI手里還沒(méi)打出來(lái)的幾張牌,，直覺(jué)會(huì)認(rèn)為競(jìng)爭(zhēng)對(duì)手一時(shí)不好追,，競(jìng)品在一些基準(zhǔn)測(cè)試成績(jī)接近GPT4是當(dāng)下的競(jìng)爭(zhēng)尺度和維度之一，但接下來(lái)維度實(shí)際有好幾個(gè)（轉(zhuǎn)自胡延平朋友圈）

不再猶豫

從今天起,，關(guān)心糧食和蔬菜

幾點(diǎn)：
1,、能解數(shù)學(xué)題，這個(gè)沒(méi)有重點(diǎn)被展開(kāi),，但我一直覺(jué)得這是真正的底層邏輯能力,，這涉及意義系統(tǒng)與形式系統(tǒng)的映射，說(shuō)白了就是有抽象能力了,，畢竟除了人之外的生命只有具象能力,。
2、情緒感知與共情,。人的情緒是內(nèi)在生化反應(yīng)與外界環(huán)境互動(dòng)的結(jié)果,，機(jī)器對(duì)情緒的處理應(yīng)該還是模擬，算感知不算共情,，但做到這個(gè)程度可以以假亂真,。
3、隨時(shí)打斷,。算力支撐與算法優(yōu)化沒(méi)的說(shuō)。
4,、4o,。這個(gè)o，代表omni,，本意可能是多模態(tài),，支持聲音文本視頻多語(yǔ)言等等所具有的通用性。但總給人感覺(jué)暗示Omniscient, omnipresent, omnipotent的祂,。

獨(dú)步風(fēng)云

這次OpenAI發(fā)布會(huì)的重點(diǎn)應(yīng)該在多模態(tài)模型GPT-4o,，它有幾大特點(diǎn)：多模態(tài)、無(wú)延遲、可在桌面運(yùn)行,。最重要的是它能處理包括文字,、音頻、圖像在內(nèi)的信息流,，而且能夠識(shí)別人類的情感,，作出情感上的回應(yīng)。作為一個(gè)多模態(tài)模型,，OpenAI又開(kāi)創(chuàng)了一個(gè)新紀(jì)元,，使人工智能從語(yǔ)言互動(dòng)提升到了語(yǔ)音視頻互動(dòng)，相信國(guó)內(nèi)的大模型廠商也會(huì)跟上步伐,。
另外,，外界期待的OpenAI搜索引擎并未發(fā)布，此前奧特曼已經(jīng)宣布過(guò),，這對(duì)谷歌而言是個(gè)大利好,。

評(píng)論

撰寫(xiě)或查看更多評(píng)論

請(qǐng)打開(kāi)財(cái)富Plus APP

前往打開(kāi)

熱讀文章

關(guān)注我們

OpenAI新模型GPT-4o有哪些突破,？

小宸

不再猶豫

獨(dú)步風(fēng)云

撰寫(xiě)或查看更多評(píng)論