當(dāng)前位置：首頁 > 新聞 > 熱點(diǎn)資訊 > OpenAI推出新一代語音交互模型GPT-realtime

OpenAI推出新一代語音交互模型GPT-realtime

2025-09-01 21:54:20 標(biāo)簽：OpenAI

　　OpenAI近日正式發(fā)布其最新研發(fā)的語音交互模型GPT-realtime。作為一款專注于語音AI智能體的多模態(tài)系統(tǒng)，該產(chǎn)品在語音自然度、情感表達(dá)和交互流暢性方面實(shí)現(xiàn)重大突破，可廣泛應(yīng)用于客服、教育、金融及醫(yī)療等多個(gè)專業(yè)領(lǐng)域。

　　技術(shù)亮點(diǎn)方面，GPT-realtime具備三大核心優(yōu)勢(shì)：

　　語音表現(xiàn)力顯著提升，能夠精準(zhǔn)模擬人類語調(diào)變化、情感波動(dòng)和語速調(diào)整

　　新增圖像理解能力，支持與語音或文本對(duì)話的智能融合

　　在復(fù)雜指令處理、工具調(diào)用精度等關(guān)鍵指標(biāo)上達(dá)到行業(yè)領(lǐng)先水平

　　特別值得注意的是，該模型在特殊場(chǎng)景下的表現(xiàn)尤為突出：

　　可準(zhǔn)確處理重復(fù)字符與數(shù)字的發(fā)音

　　完美實(shí)現(xiàn)法律聲明等專業(yè)文本的逐字朗讀

　　支持多語言語句間的無縫切換

　　在交互體驗(yàn)上，GPT-realtime展現(xiàn)出卓越的上下文理解能力，能敏銳捕捉對(duì)話中的非語言線索(如笑聲)，并實(shí)時(shí)調(diào)整語音輸出風(fēng)格。用戶可自定義包括"帶法國口音的友好語調(diào)"或"語速較快的專業(yè)語調(diào)"等多樣化表達(dá)方式。

　　語音庫方面，本次更新新增"Cedar"和"Marin"兩種語音風(fēng)格，同時(shí)對(duì)現(xiàn)有的八種語音效果進(jìn)行了全面優(yōu)化升級(jí)。

推薦內(nèi)容

?甲骨文OpenAI“星門”擴(kuò)建告吹場(chǎng)地轉(zhuǎn)租Meta?
　　據(jù)最新報(bào)道，科技巨頭甲骨文與人工智能領(lǐng)域領(lǐng)跑者OpenAI，近日已確定終止位于美國得克薩斯州阿比林市名為“星門”的數(shù)據(jù)中心擴(kuò)建計(jì)劃。不過，雙方此前達(dá)成的全面合作協(xié)議將繼續(xù)有效，未來仍計(jì)劃在美國境內(nèi)共同建設(shè)總計(jì)容量達(dá)4.5吉瓦的數(shù)據(jù)中心資源群。
2026-03-09
OpenAI聯(lián)手五角大樓引發(fā)擔(dān)憂，Claude意外贏得用戶青睞?
近期，隨著OpenAI宣布與美國國防部建立合作，這一消息在社交媒體迅速引發(fā)了用戶層面的消極反應(yīng)，“取消ChatGPT”的討論熱度也持續(xù)走高。
2026-03-04
?OpenAI刷新薪酬紀(jì)錄：2025年員工平均收入達(dá)150萬美元
　　據(jù)相關(guān)報(bào)道，領(lǐng)先的人工智能公司OpenAI在2025年為其員工創(chuàng)造了一項(xiàng)新的薪酬紀(jì)錄，其薪酬水平在科技創(chuàng)業(yè)公司中堪稱史無前例。
2026-01-06
OpenAI將推ChatGPT成人模式 2026年初上線?
根據(jù)The Verge最新報(bào)道，OpenAI應(yīng)用部門CEO Fidji Simo在GPT-5.2媒體簡(jiǎn)報(bào)會(huì)上透露，ChatGPT計(jì)劃于2026年第一季度推出成人內(nèi)容功能。
2025-12-12
?美國再現(xiàn)對(duì)OpenAI訴訟案牽涉自殺事件
　　據(jù)美國華盛頓當(dāng)?shù)叵ⅲ?1月6日再次發(fā)生針對(duì)人工智能領(lǐng)軍企業(yè)OpenAI的訴訟案件。此次訴訟由一位自殺者家屬提起，指控該公司旗下的ChatGPT產(chǎn)品導(dǎo)致其親屬自殺身亡。值得注意的是，這已經(jīng)是近期發(fā)生的第四起類似訴訟案件。
2025-11-10