驅動中國2024年5月13日消息,在科技界持續(xù)熱炒的人工智能領域,OpenAI公司即將于北京時間5月14日凌晨1點舉行一場備受矚目的線上發(fā)布會。雖然該公司CEO阿爾特曼明確表示,此次發(fā)布的不會是之前盛傳的GPT-5模型,但最新的泄露信息顯示,新的ChatGPT語音功能和GPT4-Lite引擎有望成為此次發(fā)布會的主角。
近期,有關OpenAI的研究進展和技術動態(tài)不斷被媒體披露。從曝光的信息來看,OpenAI正在密集測試一款名為GPT4-Lite的新模型,并考慮將其作為搜索引擎原型的基礎。據悉,這一模型可能是對速度更快的GPT4進行的優(yōu)化,且代碼已悄然上傳至互聯網。
此外,OpenAI的搜索引擎設置中還出現了多個選項,包括是否開啟自動建議、選擇語言模型、選擇搜索引擎等。其中,除了已知的GPT3.5和GPT4模型外,新出現的GPT4-Lite引起了廣泛關注。同時,與微軟合作的Bing搜索引擎也名列其中,而Sydney和Fortis兩個選項的真實身份尚未揭曉,但推測可能與早期的Bing AI“里人格”有關。
在內部搜索方面,代碼中的“拉布拉多”一詞暗示了可能使用了RAG技術(Retrieval Augmented Generation),意味著該功能或許能夠檢索ChatGPT內的聊天記錄。這些傳統搜索引擎常用功能,如查詢天氣、體育比賽信息等,SearchGPT似乎也有意涉足。
最引人注目的是,OpenAI可能將推出一項新的語音功能,它不僅能理解人類語音中的停頓和語氣,還能判斷提問時的情緒色彩。結合之前申請的“Voice Engine”商標,外界普遍猜測OpenAI正開發(fā)一種端到端的神經網絡,它能直接根據語音輸入預測語音輸出,無需經過語音到文本的轉換過程。
這項技術的推出,預示著未來的對話將更加流暢,延遲大幅降低,讓人聯想到電影《她》中的AI伴侶薩曼莎。阿爾特曼形容這項即將發(fā)布的功能“感覺像魔法”,而總裁菠蘿曼也公開為其造勢。
盡管發(fā)布會上的內容尚未完全明朗,但OpenAI的這些最新技術動向已經引發(fā)了業(yè)界的廣泛討論。從搜索引擎的原型到語音識別技術的進步,OpenAI的創(chuàng)新步伐顯示出其在人工智能領域的領導力量。隨著發(fā)布會的臨近,外界對于OpenAI將如何改變當前人工智能應用和服務的期待日益高漲。