全面進化!GPT-4來了!
萬眾矚目的ChatGPT-4,真的來了。
北京時間3月15日凌晨,OpenAI發(fā)布了最新版本的GPT-4,瞬間引發(fā)全球市場的關(guān)注。
從目前官方解讀以及大量機構(gòu)的評測來看,“超出預期”依然是這一版GPT給人帶來的最大體驗,具體而言,多模態(tài)的引入以及推理能力的大幅提升,讓GPT在“智能”層面有明顯躍遷。
目前,ChatGPT的Plus訂閱用戶已經(jīng)可以使用GPT-4,其他用戶需要排隊申請內(nèi)測。在應用方面,微軟表示,新必應搜索引擎正在運行GPT-4。OpenAI還在官網(wǎng)展示了給摩根士丹利、多鄰國、By My Eyes等應用GPT-4的案例。
多模態(tài)“更上一層樓”
美東時間3月14日,OpenAI宣布推出大型的多模態(tài)模型GPT-4?!癎PT-4比以往任何版本更具創(chuàng)造性和協(xié)作性”,并且“有更廣泛的常識和解決問題的能力,可以更準確地解決難題”。OpenAI的CEO Sam Altman說:“這是我們迄今為止功能最強大的模型?!?
“我們創(chuàng)建了GPT-4,這是OpenAI努力擴展深度學習的最新里程碑。GPT-4是一個大型多模態(tài)模型(接受圖像和文本輸入,提供文本輸出),雖然在許多現(xiàn)實世界場景中的能力不如人類,但在各種專業(yè)和學術(shù)基準上表現(xiàn)出人類水平?!監(jiān)penAI介紹道。
GPT-4比上一個版本強在哪?OpenAI稱,雖然這兩個版本在隨意的談話中看起來很相似,但“當任務的復雜性達到足夠的閾值時,差異就會出現(xiàn)”,GPT-4更可靠、更有創(chuàng)意,并且能夠處理更細微的指令。
多模態(tài)的引入,讓此次發(fā)布的GPT相較上一代綜合體感明顯“更上一層樓”。
OpenAI稱,GPT-4比以往任何時候都更具創(chuàng)造性和協(xié)作性。它可以在創(chuàng)意和技術(shù)寫作任務上與用戶一起生成、編輯和迭代,比如創(chuàng)作歌曲、編寫劇本或?qū)W習用戶的寫作風格。
GPT-4可接受圖像作為輸入,并生成字幕、分類和分析。以上圖為例,輸入牛奶、雞蛋、面粉等食材的圖片,GPT-4可以識別圖片元素并輸出食材用途參考。
圖片笑點在哪里?GPT-4可以按順序描述出每一格的內(nèi)容,并總結(jié)出笑點。
此外,在文本內(nèi)容長度上,GPT-4能夠處理超過25000個單詞的文本,支持長篇內(nèi)容創(chuàng)作、延續(xù)對話以及文檔搜索和分析等應用場景。
“篇幅的拓展讓GPT的應用場景進一步擴大?!币晃换ヂ?lián)網(wǎng)行業(yè)人士表示,這意味著GPT在To B端的能力進一步加強。
此外,上周,微軟德國公司的首席技術(shù)官安德烈亞斯·布勞恩(Andreas Braun)在GPT-4的預告中強調(diào)了其多模態(tài)特征,包括視頻方面的可能性。但這一點尚未在已知信息中體現(xiàn)。
強推理實現(xiàn)能力躍遷
除了引入的多模態(tài)技術(shù)外,另一個頗引人矚目的升級,便是此次GPT-4所展現(xiàn)出的強大推理能力。
盡管在體感上,GPT-4在與人閑談上感覺與上一代差異不大。
但在其發(fā)布會上,OpenAI將之引入各類考試的測試中,結(jié)果卻頗為令人驚訝。
實驗表明,GPT-4在各種專業(yè)測試和學術(shù)基準上的表現(xiàn)與人類水平相當。
例如,GPT-4通過了模擬律師考試,且分數(shù)在應試者的前10%左右;相比之下,上一代GPT的得分在倒數(shù)10%左右。
英偉達AI科學家Jim Fan點評稱,GPT-4最強的其實就是推理能力。它在GRE、SAT、法學院考試上的得分,幾乎和人類考生沒有區(qū)別。也就是說,GPT-4可以全靠自己考進斯坦福了。
而這種強大的推理能力最驚艷的亮相,或許就是在生成代碼上。
在此次發(fā)布會上,OpenAI總裁Greg Brockman在現(xiàn)場演示了GPT-4在這方面的能力。他直接在紙上畫了一個潦草的示意圖,拍照發(fā)給GPT,并要求其按照這個布局寫網(wǎng)頁代碼。
幾乎只需要數(shù)秒鐘的時間,相應的代碼就完成了生成。
此外,發(fā)布會還展示了一個GPT-4的使用場景,那就是把程序運行出錯的信息甚至錯誤信息截圖提交給GPT-4,僅憑這部分圖片信息,GPT-4都能自動查出錯誤。
“這對于整個編程行業(yè)來說是具有顛覆性意義的。”前述互聯(lián)網(wǎng)人士表示,未來大量基礎性的編程都將由人工智能接手。據(jù)他透露,目前國內(nèi)許多的互聯(lián)網(wǎng)公司已經(jīng)引入GPT,輔助編寫程序,“以后這種替代的比例會進一步提高。”
也正因如此,此次發(fā)布會上,OpenAI也明確表示,將在ChatGPT Plus上提供GPT-4,并將其作為API提供給開發(fā)人員構(gòu)建應用程序和服務。
安全性再受關(guān)注
人工智能性能的大幅提升,在令人欣喜的同時,也不免引發(fā)大眾的擔憂。
在一片關(guān)于GPT-4性能的熱議中,也有人擔心,如此智能要是被用在非法的地方,將會帶來怎樣的后果。
已經(jīng)火遍全球的ChatGPT最顯著的局限性之一就是“一本正經(jīng)地胡說八道”。也就是說,ChatGPT回答語言連貫自然、邏輯通順,但它的回答內(nèi)容不基于事實,而是基于語言模型。這使得人們驚艷于其對話水平的同時,無法信賴其提供的內(nèi)容。
在此次發(fā)布上,OpenAI稱,他們花了6個月的時間使用對抗性測試程序和ChatGPT的經(jīng)驗教訓對GPT-4進行迭代調(diào)整,從而在真實性、可控性等方面取得了有史以來最好的結(jié)果。
在OpenAI的內(nèi)部評估中,與上一代GPT相比,GPT-4響應不允許的內(nèi)容的可能性降低了82%,生成事實回復的可能性提高了40%。
并且OpenAI加入了更多人類反饋,包括ChatGPT用戶提交的反饋,以改進GPT-4的行為。OpenAI還與包括AI安全和安全性在內(nèi)的50多個領(lǐng)域的專家合作,進行早期反饋。
此外,基礎設施方面,OpenAI表示GPT-4是在Microsoft Azure AI超級計算機上訓練的。Azure的AI優(yōu)化基礎設施也使OpenAI能夠?qū)PT-4交付給全球用戶。
OpenAI也坦承,GPT-4仍然有許多已知的局限性,OpenAI正在努力解決這些問題,例如社會偏見等。
在GPT-4發(fā)布之后,“ChatGPT之父”Sam Altman表示:“它仍然是有缺陷的,仍然是有限的,在你花了更多的時間第一次使用它時,它似乎比實際情況更令人印象深刻?!?
? Copyright 2013 南京奧特賽人工智能技術(shù)研發(fā)有限公司 版權(quán)所有 備案號:蘇ICP備19032300號-1 蘇公網(wǎng)安備32011602010459 技術(shù)支持:科威鯨網(wǎng)絡