GPT-realtime還新增了Marin與Cedar兩種極具特色的語音,同時對原有的8種語音也進行了全面升級。
觀點網訊:8月29日消息,OpenAI發布語音模型GPT-realtime。
據介紹,GPT-realtime是一個專用于語音AIAgent的多模态模型,能夠生成更加自然流暢的語音,完美模仿人類豐富多樣的語調、情感以及語速,支持圖像理解並将其與語音或文本對話相結合使用,非常适用于客服、教育、金融、醫療等領域打造語音智能體。
GPT-realtime還新增了Marin與Cedar兩種極具特色的語音,同時對原有的8種語音也進行了全面升級。與傳統純語音模型不同的是,GPT-realtime還具備智力、推理和理解能力,例如,能夠敏銳捕捉笑聲等非語言信号,在句子中間自如地切換語言,並根據場景需求靈活調整語氣。
免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。
審校:
