最近一周,全球AI領域迎來了交鋒時刻。
當地時間5月13日,,OpenAI通過直播發(fā)布了GPT-4系列新模型GPT-4o,以及ChatGPT的桌面版本,。未親臨直播現場的OpenAI首席執(zhí)行官山姆·奧特曼在X上發(fā)帖稱:“我們的新模型:GPT-4o,是我們目前最好的模型,,它智能且快速,,還是原生多模態(tài)模型?!?/p>
OpenAI首席技術官米拉·穆拉蒂介紹道,,GPT-4o將面向包括免費用戶在內的所有用戶,它較上一代產品更快,,改進了文本,、視頻和語音功能,提高50種不同語言ChatGPT的服務質量,。GPT-4o還將通過OpenAI的API提供支持,,開發(fā)者可以使用新模型構建應用程序。
直播時,,穆拉蒂與兩位技術人員對GPT-4o進行了現場測試,。新模型減少了人機對話的遲滯感,在過程中,,人們可以隨時打斷GPT-4o的輸出,,情緒傳達實現進步,再結合視頻功能,,讓機器更像一個能看能聽的真實存在的人,。
如果說之前的GPT是基于數據,在理性分析層面給人以技術跨越的震撼,,那么這次GPT-4o呈現出與人類相似的感性層面的補充,,讓人感嘆科幻電影情節(jié)已經發(fā)生。
OpenAI在這次迭代中,,沒有滿足外界對GPT-4.5或GPT-5的期待,,但“o”相較數字,更直接地表達了一種進化,。據OpenAI官網介紹,,這里的“o”代表“omni”,意為“全能”,,源自拉丁語,。而在英語中,它常被用作詞根,,可以聯(lián)想到“全知全能”和“無處不在”,。
值得注意的是,,GPT-4o發(fā)布時間點卡在了谷歌I/O開發(fā)者大會的前一天。而在往后的一個月中,,微軟Build年度開發(fā)者大會和蘋果WWDC也即將先后召開,。
當地時間5月14日,谷歌在I/O開發(fā)者大會中公布AI新進展,,在前一天OpenAI的鋪墊下,,市場自然會以更高的眼光審視這家老牌巨頭的新產品。
OpenAI確實通過這次布景簡單且短暫的直播成功向谷歌施壓——開發(fā)者現場的實時對話展示,,讓人不禁聯(lián)想到谷歌大模型Gemini此前發(fā)布的展示視頻被指剪輯,、夸大宣傳。該模型在實際應用中,,并未達到其宣傳中的效果,。對此,谷歌承認道,,演示視頻經過編輯,,為簡潔起見,延遲已減少,,Gemini輸出也已縮短,。2024年的I/O開發(fā)者大會成為谷歌的關鍵挽尊機會。
其實,,谷歌首席執(zhí)行官桑達爾·皮查伊早在七八年前就在I/O開發(fā)者大會上表態(tài),,要從“移動優(yōu)先”轉為“AI優(yōu)先”,但在提前看清方向的條件下,,谷歌并沒有延續(xù)領先優(yōu)勢,。在上一代互聯(lián)網時代習慣處在領先地位的谷歌,經歷過去一年圍繞AI的挑戰(zhàn)后,,似乎變成了追趕者,。它需要向外界釋放有關最新技術的積極信號。
這次I/O開發(fā)者大會上,,谷歌亮出了能與GPT-4o相抗衡的Project Astra,,該項目展示了多模態(tài)理解和實時對話能力。通過演示能夠看出,,Astra的延遲較GPT-4o更長,,且情感多樣性還有待提高。
同時,,谷歌還推出了對標Sora的視頻生成模型Veo,。今年2月,與Gemini 1.5 Pro被幾乎同時推出的Sora搶盡風頭。
在搜索引擎方面,,谷歌主動實現自我革命,,在搜索功能中推出AI概覽(AI Overviews),歸納總結搜索結果,。谷歌稱,,搜索將具備多步驟推理能力,并支持視頻形式的解決方案搜索,。與此同時,,谷歌將擁有100萬tokens長的上下文窗口的Gemini 1.5 Pro擴展至200萬tokens級別,這意味著大模型能夠處理更多信息,,擁有更全面的理解能力,。
由于ChatGPT自2022年末走入大眾視野后,,就對搜索領域形成了直接威脅,,因此市場曾推測,OpenAI會在這次發(fā)布會上推出基于ChatGPT的搜索引擎,。但該公司目前并未宣布邁出這一步,。
OpenAI和谷歌的研發(fā)競賽陷入膠著,這對包括蘋果和亞馬遜在內的公司形成了威脅,。它們需要跟上日益加快的步伐,,至少不能落后太多,否則Siri和Alexa都會陷入尷尬,。由于蘋果的AI研發(fā)進度并不明朗,,已經有傳言稱其正在與OpenAI談判,以求在短期內獲得技術許可,,將最先進的AI技術應用于蘋果產品,。
AI競爭已經從基建向應用與生態(tài)搭建蔓延。
谷歌在企業(yè)應用和消費者應用方面的積累,,為其建立AI生態(tài)圈提供了天然優(yōu)勢,。 或許OpenAI注意到了這一點。今年1月,,OpenAI推出個性化AI應用商店GPT Store,,用戶可以通過其發(fā)現和構建GPT。目前GPT Store主要針對付費版本開放,。這一功能被認為可能成為下一個Apple Store,。從去年年底宣布,到今年年初問世,,歷時兩個月,,期間經歷了奧特曼被意外罷免再復職的風波。
截至目前,GPT Store還只是一個渠道,,距離大眾通過OpenAI潛力所構想的生態(tài)建立還有很大差距,。但隨著GPT-4o的技術迭代,對于AI應用的想象得以進一步豐富,,不能排除OpenAI正在為生態(tài)搭建架構的可能,。
在OpenAI此次發(fā)布會的最后,穆拉蒂說道:“今天我們專注于免費用戶,、新模式,,和新產品,但我們也非常關心下一個前沿領域,。很快,,我們將向大家更新下一個大事件的進展?!?/p>
這不得不使人猜測,,OpenAI對于實際進展有所保留。在激烈競爭之下,,保留底牌或許已經成為各大巨頭的習慣,。OpenAI的“下一個大事件”的官宣時間,或許在后續(xù)微軟和蘋果的發(fā)布會之后,,或許會找另外一個時間節(jié)點,。畢竟奧特曼一直擅長在正確的時間釋放正確的信息。OpenAI此前的技術曝光節(jié)奏都取得了不錯的效果,。(財富中文網)