GPT-4的十大優點和缺陷
OpenAI已經升級了在線聊天機器人的技術,取得了顯著的進展。GPT-4更加精確,但仍然會判斷失準。一款新版本的人工智能聊天機器人技術
OpenAI已經升級了在線聊天機器人的技術,取得了顯著的進展。GPT-4更加精確,但仍然會判斷失準。
一款新版本的人工智能聊天機器人技術已經超越了其前身。它是眾多領域的專家,甚至讓醫生們對其醫療建議感到驚嘆。它可以描述圖像,同時也能講出幾個有趣的笑話。然而,這個名為GPT-4的人工智能系統仍然存在一些怪癖并且會犯一些相同的習慣性錯誤,這些問題也曾困擾著ChatGPT聊天機器人的研究人員。盡管它是一個非常好的測試者,但這個來自舊金山初創公司OpenAI的系統仍然沒有達到匹配人類智能的邊緣。以下是GPT-4的簡要指南:
1.更能理解用戶意圖
當A.I.專家、風險投資公司Page One Ventures的合作伙伴Chris Nicholson在近期下午使用GPT-4時,他告訴這個機器人他是一個英語演講者,不懂西班牙語。
他要求提供一個能教他基礎的教學大綱,這個機器人提供了一個詳細而有組織的教學大綱。它甚至提供了各種各樣的學習和記憶西班牙單詞的技巧(雖然不是所有的建議都很準確)。
2.回答更加準確
當A.I.研究員和教授Oren Etzioni第一次嘗試新的機器人時,他提出了一個簡單的問題:“Oren Etzioni和Eli Etzioni之間的關系是什么?”機器人正確地回答了。ChatGPT先前版本對該問題的回答總是錯誤的。得到正確答案表明這個新聊天機器人的知識范圍更廣。但是依然還是存在一些錯誤。
3.它可以詳細地描述圖像。
GPT-4除了文本,還有了對圖像的回應能力。OpenAI的總裁兼聯合創始人Greg Brockman展示了系統如何詳細地描述哈勃太空望遠鏡中的一張圖片。描述長達幾段。它還可以回答有關圖像的問題。如果給出冰箱內部的照片,它可以建議幾種可以使用手頭的食材制作的餐點。
3.它增加了嚴謹的專業知識。
在最近的一個晚上,北卡羅來納大學教堂山分校的醫學副教授和心臟病學家Anil Gehi向聊天機器人描述了他前一天看到的一位患者的病史,包括患者住院后經歷的并發癥。描述中包含了幾個普通人不會認識的醫學術語。當Gehi博士詢問他應該如何治療患者時,聊天機器人給出了完美的答案。“這正是我們治療患者的方式,”他說。
盡管聊天機器人仍然需要像Gehi博士這樣的專家來判斷其回答并執行醫療程序,但它可以展示出在很多領域的專業知識,從計算機編程到會計學。
4.它也會誤判
盡管GPT-4具有非常出色的能力,但在匹配人類智能之前還有很長的路要走。它會犯錯誤,其響應也并不總是準確的。然而,它在精度、準確性、圖像描述和專業知識方面的改進是人工智能發展中令人印象深刻的步驟。
?5.可以精確地對文章進行總結
如果在摘要中加入一句隨機的話并詢問機器人是否準確,它會指出加入的句子。這是一項非常出色的技能,能夠對文本進行高質量的總結和對比,需要對文本的理解和表達的能力,這是一種先進的智能形式。
6.它似乎正在養成一種幽默感
Etzioni博士讓新的機器人給出“關于歌手麥當娜的新穎笑話。”回答給他留下了深刻印象,并讓他發笑。如果你知道麥當娜最受歡迎的歌曲,也許你也會感到驚喜。
7.可以推理,但有時會失準。
Etzioni博士給新機器人出了一個謎題:想象一個無限寬的門口。軍用坦克和汽車哪個更有可能通過它?
系統似乎做出了適當的回答。但它沒有考慮門口的高度,這也可能阻止坦克或汽車通過。
OpenAI的首席執行官Sam Altman表示,新機器人可以進行“一點點”推理。但在許多情況下,它的推理能力會崩潰。ChatGPT的上一個版本在處理這個問題時表現得更好,因為它認識到高度和寬度都很重要。
8.可以在標準化測試中得高分。
OpenAI表示,新系統可以在41個州和地區的統一法律考試中獲得前10%左右的成績,符合資格的律師。根據該公司的測試,它還可以在SAT考試中獲得1300分(滿分1600分),并在生物學、微積分、宏觀經濟學、心理學、統計學和歷史的高中AP考試中獲得5分(滿分5分)。
技術的先前版本未能通過統一法律考試,并且在大多數AP考試中得分遠低于現在的水平,為了展示其測試技能,Brockman先生在最近的一個下午向新機器人提供了一個長段落的法律考試問題,涉及一位經營柴油卡車維修業務的男子。結果答案是正確的,但充斥著法律術語。因此,Brockman先生要求機器人用通俗易懂的語言解釋答案時,它也做到了這一點。
9.無法對未來進行假設
雖然新機器人似乎可以對已經發生的事情進行推理,但當被要求對未來做出假設時,它的表現就不那么熟練了。它似乎是在借鑒別人的說法,而不是提出全新的猜測。當Etzioni博士問新機器人,“在未來十年內,自然語言處理研究中需要解決哪些重要問題?”時,它無法提出全新的想法。
10.有時候也會產生「機器幻覺」
新機器人仍然會編造東西。被稱為“幻覺”的問題困擾著所有領先的聊天機器人。由于這些系統不了解什么是真實的,什么是虛假的,它們可能會生成完全錯誤的文本。當被問及描述最新癌癥研究的網站地址時,它有時會生成不存在的網址。。









