
OpenAI發布了最新大語言模型GPT-5。OpenAI在上周四表示,新款生成式AI模型將免費提供給消費者使用,并為廣受歡迎的聊天機器人ChatGPT的最新版本提供支持,它代表了“我們迄今為止最智能、最快速、最實用的模型,其內置的思考能力讓每個人都輕松擁有專家級智能”。
如果你想知道OpenAI為何對該模型如此自信,以及與該公司之前的GPT模型(或與Claude、Gemini或Llama等競爭對手的AI模型)相比,GPT-5有哪些更出眾的特性或不同之處,下文簡要介紹了GPT-5中一些最重要的新特性和功能:
更容易使用
OpenAI 產品的近期版本曾強迫用戶為不同任務選擇要使用的模型類型——是選擇 OpenAI的o系列“推理”模型用于復雜研究,還是選擇標準GPT模型快速得出結果。GPT-5 使用了一個“實時路由器”來自動化這一過程,為合適的任務挑選合適的工具,因此用戶無需再手動選擇。
專屬個性
ChatGPT將允許用戶在與它互動時從四種預設的“個性”中選擇,分別是:“憤世嫉俗者”、“機器人”、“傾聽者”和“書呆子”。這些個性旨在讓使用聊天機器人的感覺更自然、更符合語境。如果你想要多一點諷刺,就選擇“憤世嫉俗者”;而如果你是為了工作使用,“高效而直率”的“機器人”個性可能更合適。
更少幻覺
OpenAI聲稱GPT-5不太可能編造信息或產生“幻覺”。據OpenAI稱,在啟用網絡搜索并使用匿名提示的測試中,GPT-5出現事實錯誤的可能性比GPT-4o低 45%;在“思考”時,GPT-5出錯的可能性比OpenAI o3低80%。但這仍未根除幻覺現象,正如Mashable網站所解釋的那樣,這意味著在處理常見任務時,GPT-5每十次仍會出現一次幻覺。
更出色的寫手
據OpenAI稱,GPT-5的寫作能力遠超前代模型,能創作出更具“吸引力、更能引起共鳴、具有文學深度和韻律”的文字。該公司并列對比了GPT-5與GPT-4o在婚禮祝酒詞和詩歌創作等領域的文筆表現。
更優秀的編程工具
雖然之前的GPT版本已具備軟件編程能力,但OpenAI表示,GPT-5使其“氛圍編程”功能在易用性和成熟度上均有所提升,允許用戶通過單一提示“創建美觀且響應迅速的網站、應用程序和游戲”。
智能體能力
GPT-5與谷歌郵箱(Gmail)和谷歌日歷(Google Calendar)集成,可協助處理日程安排、提醒、郵件跟進和其他效率管理任務。(此功能初期將僅限于該公司付費“專業版”會員使用。)
健康領域
大語言模型已成為人們獲取醫療信息和健康建議的一種流行方式。OpenAI表示,在HealthBench測試中,GPT-5的得分高于其任何前代模型,并且它的表現更像“一個積極的思考伙伴,會主動標記潛在問題,并通過提問來生成更有幫助的答案”。當然,OpenAI 也指出它并不能替代專業醫療人士。
效果因人而異
以上只是部分新特性和改進,它們將為消費者和企業提供大量機會來試驗最新模型,并將其與當前常用的模型進行比較。該模型究竟是代表了一次重大飛躍,還是一次迭代改進,在未來幾天和幾周內,隨著外部專家對該模型的測試以及真實用戶的使用體驗,情況會逐漸明朗。路透社采訪的早期測試者表示,從GPT-4到GPT-5的改進“不如”從GPT-3到GPT-4的改進幅度大。AI專家、常持懷疑態度的加里·馬庫斯表示:“粉絲們仍會找到值得欣喜之處,但GPT-5并非人們期待已久的巨大飛躍。” (財富中文網)
譯者:劉進龍
審校:汪皓
OpenAI發布了最新大語言模型GPT-5。OpenAI在上周四表示,新款生成式AI模型將免費提供給消費者使用,并為廣受歡迎的聊天機器人ChatGPT的最新版本提供支持,它代表了“我們迄今為止最智能、最快速、最實用的模型,其內置的思考能力讓每個人都輕松擁有專家級智能”。
如果你想知道OpenAI為何對該模型如此自信,以及與該公司之前的GPT模型(或與Claude、Gemini或Llama等競爭對手的AI模型)相比,GPT-5有哪些更出眾的特性或不同之處,下文簡要介紹了GPT-5中一些最重要的新特性和功能:
更容易使用
OpenAI 產品的近期版本曾強迫用戶為不同任務選擇要使用的模型類型——是選擇 OpenAI的o系列“推理”模型用于復雜研究,還是選擇標準GPT模型快速得出結果。GPT-5 使用了一個“實時路由器”來自動化這一過程,為合適的任務挑選合適的工具,因此用戶無需再手動選擇。
專屬個性
ChatGPT將允許用戶在與它互動時從四種預設的“個性”中選擇,分別是:“憤世嫉俗者”、“機器人”、“傾聽者”和“書呆子”。這些個性旨在讓使用聊天機器人的感覺更自然、更符合語境。如果你想要多一點諷刺,就選擇“憤世嫉俗者”;而如果你是為了工作使用,“高效而直率”的“機器人”個性可能更合適。
更少幻覺
OpenAI聲稱GPT-5不太可能編造信息或產生“幻覺”。據OpenAI稱,在啟用網絡搜索并使用匿名提示的測試中,GPT-5出現事實錯誤的可能性比GPT-4o低 45%;在“思考”時,GPT-5出錯的可能性比OpenAI o3低80%。但這仍未根除幻覺現象,正如Mashable網站所解釋的那樣,這意味著在處理常見任務時,GPT-5每十次仍會出現一次幻覺。
更出色的寫手
據OpenAI稱,GPT-5的寫作能力遠超前代模型,能創作出更具“吸引力、更能引起共鳴、具有文學深度和韻律”的文字。該公司并列對比了GPT-5與GPT-4o在婚禮祝酒詞和詩歌創作等領域的文筆表現。
更優秀的編程工具
雖然之前的GPT版本已具備軟件編程能力,但OpenAI表示,GPT-5使其“氛圍編程”功能在易用性和成熟度上均有所提升,允許用戶通過單一提示“創建美觀且響應迅速的網站、應用程序和游戲”。
智能體能力
GPT-5與谷歌郵箱(Gmail)和谷歌日歷(Google Calendar)集成,可協助處理日程安排、提醒、郵件跟進和其他效率管理任務。(此功能初期將僅限于該公司付費“專業版”會員使用。)
健康領域
大語言模型已成為人們獲取醫療信息和健康建議的一種流行方式。OpenAI表示,在HealthBench測試中,GPT-5的得分高于其任何前代模型,并且它的表現更像“一個積極的思考伙伴,會主動標記潛在問題,并通過提問來生成更有幫助的答案”。當然,OpenAI 也指出它并不能替代專業醫療人士。
效果因人而異
以上只是部分新特性和改進,它們將為消費者和企業提供大量機會來試驗最新模型,并將其與當前常用的模型進行比較。該模型究竟是代表了一次重大飛躍,還是一次迭代改進,在未來幾天和幾周內,隨著外部專家對該模型的測試以及真實用戶的使用體驗,情況會逐漸明朗。路透社采訪的早期測試者表示,從GPT-4到GPT-5的改進“不如”從GPT-3到GPT-4的改進幅度大。AI專家、常持懷疑態度的加里·馬庫斯表示:“粉絲們仍會找到值得欣喜之處,但GPT-5并非人們期待已久的巨大飛躍。” (財富中文網)
譯者:劉進龍
審校:汪皓
OpenAI has released its new LLM model GPT-5. The new generative AI model, which will be available to consumers for free and power the newest version of the popular ChatGPT bot, represents “our smartest, fastest, most useful model yet, with built-in thinking that puts expert-level intelligence in everyone’s hands,” OpenAI said on Thursday.
If you’re wondering what all the hoopla is about, and what makes GPT-5 better, or different, than the company’s previous GPT models (or from rival AI models like Claude, Gemini, or Llama), here’s a quick rundown of some of the most important new features and functions available in GPT-5:
Easier to use
Recent versions of OpenAI products have forced users to choose the type of model they wanted to use for different tasks – OpenAI’s o family of “reasoning” model for complicated research, or the standard GPT for speedy results. GPT-5 uses a “real time router” that automates the process, picking the right tool for the right job so you don’t have to.
Special personalities
ChatGPT will now let users choose from four different pre-set “personalities” when they interact with it: “cynic,” “robot,” “listener,” and “nerd.” These personalities are intended to make using the chatbot feel more natural and context-appropriate. If you want a bit more sarcasm, choose cynic, whereas if you’re using it for work, the “efficient and blunt” robot persona might be better.
Fewer hallucinations
OpenAI claims that GPT-5 is less prone to inventing information, or hallucinating. According to OpenAI, GPT-5 was 45% less likely to contain a factual error than GPT-4o in tests in which it had web search enabled and used anonymized prompts; when “thinking”, GPT-5 was 80% less likely to contain an error than OpenAI o3. But that still doesn’t eradicate hallucinations, and as Mashable explains, it means that GPT-5 will still hallucinate one out of every ten times on common tasks.
A better writer
According to OpenAI, GPT-5 is a much better writer than its predecessors, producing more “compelling, resonant writing with literary depth and rhythm.” The company provided side-by-side comparisons of GPT-5’s penmanship versus GPT-4o for things like wedding toasts and poems.
A better coder
While previous versions of GPT had software coding capabilities, OpenAI says GPT-5 brings improved ease and sophistication to its “vibe coding” functionality, allowing users to “create beautiful and responsive websites, apps, and games” in a single prompt.
Agentic capabilities
GPT-5 integrates with Gmail and Google Calendar to assist with scheduling, reminders, email follow ups, and other productivity tasks. (This capability will be initially limited to users of the company’s paid “pro” membership.)
Health
LLMs have become a popular way for people to get medical information and health advice. OpenAI says GPT-5 scores higher than any of its previous models on the HealthBench test, and that it acts more like “an active thought partner, proactively flagging potential concerns and asking questions to give more helpful answers.” Of course, OpenAI also points out that it does not replace a medical professional.
Your mileage may vary
Those are just a few of the new features and improvements, which will provide plenty of opportunity for consumers and businesses to experiment with the latest model and compare it to their current go-to models. Whether it represents a major leap forward, or more of an iterative improvement will become clear in the days and weeks ahead as outside experts test the model and real world users play around with it. Early testers interviewed by Reuters said the improvement from GPT-4 to GPT-5 is “not as large” as the one from GPT-3 to GPT-4. AI expert and often-skeptic Gary Marcus says: “Fans will still find something to rejoice in, but GPT-5 is not the huge leap forward people long expected.”