iphone怎么打丶 蘋果手機(jī)怎么打
2024-05-14
更新時間:2024-05-14 08:18:10作者:未知
財聯(lián)社5月14日訊(編輯 趙昊)北京時間周二(5月14日)凌晨,美國人工智能研究公司OpenAI在線上舉辦了“春季更新”活動。
整體來看,活動主要分為兩大部分:推出新旗艦?zāi)P汀癎PT-4o”,以及在ChatGPT中免費提供更多功能。
GPT-4o登場
OpenAI在活動中發(fā)布了新旗艦?zāi)P汀癎PT-4o”,“可以實時對音頻、視覺和文本進(jìn)行推理?!睋?jù)介紹,新模型使ChatGPT能夠處理50種不同的語言,同時提高了速度和質(zhì)量。
GPT-4o的“o”代表“omni”。該詞意為“全能”,源自拉丁語“omnis”。在英語中“omni”常被用作詞根,用來表示“全部”或“所有”的概念。
OpenAI在活動中發(fā)布了新旗艦?zāi)P汀癎PT-4o”圖為OpenAI的X截圖
新聞稿稱,GPT-4o是邁向更自然人機(jī)交互的一步,它可以接受文本、音頻和圖像三者組合作為輸入,并生成文本、音頻和圖像的任意組合輸出,“與現(xiàn)有模型相比,GPT-4o在圖像和音頻理解方面尤其出色?!?/p>
在GPT-4o之前,用戶使用語音模式與ChatGPT對話時,GPT-3.5的平均延遲為2.8秒,GPT-4為5.4秒,音頻在輸入時還會由于處理方式丟失大量信息,讓GPT-4無法直接觀察音調(diào)、說話的人和背景噪音,也無法輸出笑聲、歌唱聲和表達(dá)情感。
與之相比,GPT-4o可以在232毫秒內(nèi)對音頻輸入做出反應(yīng),與人類在對話中的反應(yīng)時間相近。在錄播視頻中,兩位高管做出了演示:機(jī)器人能夠從急促的喘氣聲中理解“緊張”的含義,并且指導(dǎo)他進(jìn)行深呼吸,還可以根據(jù)用戶要求變換語調(diào)。
兩位高管做出了演示:機(jī)器人能夠從急促的喘氣聲中理解“緊張”的含義
圖像輸入方面,演示視頻顯示,OpenAI高管啟動攝像頭要求實時完成一個一元方程題,ChatGPT輕松完成了任務(wù);另外,高管還展示了ChatGPT桌面版對代碼和電腦桌面(一張氣溫圖表)進(jìn)行實時解讀的能力。
OpenAI新聞稿稱,“我們跨文本、視覺和音頻端到端地訓(xùn)練了一個新模型,這意味著所有輸入和輸出都由同一神經(jīng)網(wǎng)絡(luò)處理。由于GPT-4o是我們第一個結(jié)合所有這些模式的模型,因此我們?nèi)匀恢皇菧\嘗輒止地探索該模型的功能及其局限性?!?/p>
圖為多種模型的各種數(shù)據(jù)對比
性能方面,根據(jù)傳統(tǒng)基準(zhǔn)測試,GPT-4o在文本、推理和編碼等方面實現(xiàn)了與GPT-4 Turbo級別相當(dāng)?shù)男阅?,同時在多語言、音頻和視覺功能方面的表現(xiàn)分?jǐn)?shù)也創(chuàng)下了新高。
更多工具免費解鎖
OpenAI表示,“我們開始向ChatGPT Plus和Team用戶推出GPT-4o,并且很快就會向企業(yè)用戶推出。我們今天還開始推出ChatGPT Free,但有使用限額。 Plus用戶的消息限額將比免費用戶高出5倍,團(tuán)隊和企業(yè)用戶的限額會再高一些。”
新聞稿稱,即使是ChatGPT Free(免費)用戶也可以有機(jī)會體驗GPT-4o,但當(dāng)達(dá)到限額時,ChatGPT將自動切換到GPT-3.5。
另外,OpenAI還推出適用于macOS的ChatGPT桌面應(yīng)用程序,通過簡單的鍵盤快捷鍵(Option + Space)可以立即向ChatGPT提問,還可以直接在應(yīng)用程序中截取屏幕截圖與機(jī)器人進(jìn)行討論。
OpenAI還推出適用于macOS的ChatGPT桌面應(yīng)用程序
在直播活動尾聲時,OpenAI首席技術(shù)官Mira Murati說道,“感謝杰出的OpenAI團(tuán)隊,也感謝Jensen(黃仁勛)和英偉達(dá)團(tuán)隊為我們帶來了最先進(jìn)的GPU,使今天的演示成為可能?!?/p>