巴克萊：最先進AI模型媲美人類專家　能力加快提升

新聞/財經

熱門

即時

本地

兩岸

國際

財經

體育

立法會道一號

交通消息

來源：巴克萊網頁

巴克萊：最先進AI模型媲美人類專家　能力加快提升

國際, 財經

發佈時間 2025-10-06 11:14 最後更新時間 2025-10-06 11:14

OpenAI最新發布的評測工具GDPval-v0，首次量化AI在執行具有經濟價值工作任務方面的能力，顯示AI正迅速追趕甚至逼近人類專業人員水平。巴克萊表示，最先進的AI模型已在眾多職業任務中，達到和人類專家相當的能力，而且這種能力提升速度正在加快。

OpenAI最新的評估工具，涵蓋美國GDP佔比較大的9個商業領域中，44個職業約1300項具體工作任務，從法律文書到工程藍圖，再到護理計劃等真實工作交付成果。

結果顯示，當前最頂尖的AI模型在執行許多職業任務時，能力已與人類專業人士相當，巴克萊最新的研究報告指，Anthropic的Claude Opus 4.1在與人類專家對比中，取得47.6%的「勝利或平局」比率，位居榜首。

巴克萊分析師指，AI模型的「勝率」在過去15個月中，線性提升約4倍，預計在未來12至24個月內，AI將在大多數工作相關任務上超越人類。分析認為，這一突破為評估AI投資回報率提供關鍵數據支撐。

OpenAI的評測工具，由平均擁有超過14年行業經驗的資深專業人士設計，涵蓋科技服務、金融保險、醫療保健、信息業、製造業等1230個專業任務。同傳統基準測試不同，OpenAI的任務並非簡單文本問答，而是包含參考文件和上下文的複雜場景，要求AI交付多樣化成果，包括文檔、幻燈片、圖表和電子表格等。巴克萊指出，這種設計更貼近現實工作環境的複雜性。

評測採用盲測方式，由行業專家對AI和人類生成的工作成果進行排名，從難度、代表性、完成時間和整體質量等維度，進行綜合評估。巴克萊分析顯示，Claude Opus 4.1以47.6%的勝率領先，GPT-5-high緊隨其後，達到38.8%，o3 high為34.1%。

從行業看，AI在零售貿易（56%勝率）、批發貿易（53%）和政府部門（52%）的表現，超過人類專家，但在信息技術行業表現相對較弱（39%）。

職業層面上，AI在櫃台和租賃文員（80%）、運輸接收和庫存文員（76%）以及軟件開發人員（70%）任務中表現最佳，而在工業工程師（17%）和影視編輯（17%）任務中表現較差。

而各模型亦表現出不同特點：Claude Opus 4.1在美學表現(格式和布局)方面表現出色，GPT-5在遵循指令和執行準確計算方面最為精準。

巴克萊指，GPT-5的模型仍會犯一些災難性錯誤（2.7%），但47.7%的失誤被歸類為「可接受但不佳」，22.9%的情況下模型表現甚至優於人類。巴克萊分析師認為，AI模型的原始智能，特別是GPT-5，已達到超越人類專家的水平。通過更多後期訓練，包括微調和強化學習，AI全面超越行業專家的時代已為時不遠。

上一篇：日本川崎兩列列車相撞車卡脫軌　無人受傷

下一篇：接連有中國遊客於澳洲登山死亡　中使館籲以安全為重

更多新聞

特朗普：美方將參與國際原子能機構對伊朗核查行動

國際 2026-06-25

美國總統特朗普表示，美方人員將參與國際原子能機構對伊朗核設施的核查行動。特朗普接受霍士新聞訪問，回應伊朗指目前並未允許國際原子能機構查驗受襲核設施，指伊朗會達成協議，寫成書面文件，但之後又會出爾反爾，聲稱並非事實。特朗普強調，伊朗已經同意核查人員進入，但他同時表示，並不急於讓核查人員立即進駐伊朗。

王毅促鞏固中東停火止戰局面盡快恢復霍峽正常通航

國際 2026-06-24

中共中央政治局委員、外長王毅，晚上應約同巴基斯坦副總理兼外長達爾通電話。王毅感謝達爾第一時間通報伊朗同美國新階段談判情況，指伊美簽署諒解備忘錄是國際社會共同努力的結果，巴方發揮了關鍵和獨特作用。和平進程剛開始，今後仍有很長甚至曲折艱難的路要走，下階段應重點做好三件事，包括鞏固全面停火止戰局面，絕不能重燃戰火；盡快恢復霍爾木茲海峽正常通航，確保全球產供鏈穩定；以及支持中東國家盡快改善彼此關係，探討新...

魯比奧展開中東三國行程就美伊諒解備忘錄協調

國際 2026-06-24

美國國務卿魯比奧展開中東三國訪問行程，首站停留阿聯酋，與總統穆罕默德及當地政府層會晤，討論美國與伊朗簽署的諒解備忘錄、確保霍爾木茲海峽全面安全通航的努力，以及維護地區和平與穩定的重要性，魯比奧重申美國致力維護阿聯酋安全。魯比奧其後轉往科威特，出席美國大使館有限度重開的升旗儀式，因伊朗戰事關係，美國駐科特大使館已關閉3個月；魯比奧最後一站會出訪巴林。阿聯酋、科威特和巴林都設有美國軍事基地，巴...

卡利巴夫：伊美簽署諒解備忘錄　表明美國戰敗

國際 2026-06-24

伊朗議會議長卡利巴夫指，伊朗和美國簽署諒解備忘錄，表明美國戰敗，達成這項諒解備忘錄是伊朗抵抗的結果。卡利巴夫在阿塞拜疆首都巴庫出席伊斯蘭合作組織成員國議會聯盟會議致辭時說，侵略者本以為可以通過軍事壓力、封鎖、心理戰和恐怖襲擊迫使伊朗人民退縮並改變地區局勢，但伊朗人民證明，試圖以武力將自身意志強加於獨立國家的時代已經結束。卡利巴夫表示，伊朗準備與多個伊斯蘭國家，特別是波斯灣國家建立安全協議，開展...

特朗普警告伊朗不要向通過霍峽船隻徵費　否則終止談判

國際 2026-06-24

美國總統特朗普警告伊朗，如果開始向通過霍爾木茲海峽的船隻收取費用，美國將終止談判。特朗普在社交平台發文說，伊朗已告知美國，德黑蘭不會對通過霍爾木茲海峽的船隻徵收任何通行費、保險費或任何其他形式的費用，如果信息不實，美伊談判將立即終止。特朗普重申，美國沒有向伊朗提供任何資金，還未解凍任何資金，美方將解凍部分控制的伊朗資金，用於向美國農民和牧場主購買玉米、小麥、大豆等農產品。伊朗早前否認會用解凍資...

2日本國民在中國涉走私違禁品被捕　中方：違法被依法拘留

國際 2026-06-24

日本內閣官房長官木原稔證實，2名日本公民上月25和28日在遼寧大連市被中方海關部門拘捕，涉嫌走私違禁品，當局已向日本駐外使領館通報。木原稔以私隱為由，拒絕透露案件詳情，指當局將從保護國民的角度出發，與當事人及相關方保持聯繫，適當回應。日本傳媒報道，在大連被捕的日本人，涉嫌將中國規管出口的稀土相關物品帶到中國境外，因此被相關部門拘捕。他和另一名被捕的人士，都是日本重型電機巨頭於中國分公司的職員。...

伊朗：IAEA實地核查　須在最終協議框架及解除制裁

國際 2026-06-24

美國和伊朗正展開60日停戰備忘後續談判，美國總統特朗普早前表示，伊朗完全同意接受核設施檢查。伊朗副外長加里巴巴迪在社交網站發文說，日前在瑞士期間，國際原子能機構（IAEA）總幹事格羅西曾提出會面請求，但最終未有成事，德黑蘭暫時沒有計劃允許IAEA人員進入並檢查遇襲的核設施和材料，這些議題只會在最終協議框架內，且必須以對方實際終止所有制裁為前提，才會審議並作決定。

阿曼與國際海事組織在霍峽設臨時航運通道

國際 2026-06-24

阿曼海事安全中心表示，正與國際海事組織合作，在霍爾木茲海峽設立一條供船舶通行的臨時航運通道，強調符合國際法，以及美國與伊朗日前達成的諒解備忘錄，確保海峽航行自由、暢通無阻，亦不會徵收通行費：計劃使用通道的船隻須與國際海事組織協調。阿曼與伊朗代表昨日在馬斯喀特會談後，同意設立聯合工作組，商討制定霍爾木茲海峽通航管理框架，將以國際標準為基礎，就通航管理模式、配套服務供給、相關費用事宜磋商達成共識。...

法國發現伊波拉個案　患者是醫生剛由民主剛果返回

國際 2026-06-24

法國發現一宗伊波拉病毒輸入個案，患者是一名剛果民主共和國返回的醫生。法國總理府表示，正密切關注情況。

巴基斯坦：美伊下周二恢復技術性談判

國際 2026-06-24

巴基斯坦外交部表示，美國和伊朗的技術性談判將於下周二恢復。作為美伊調解方的巴基斯坦及卡塔爾發表聯合聲明，指在諒解備忘錄的基礎上，各方同意設立一個高級別委員會，負責監督談判進程。由伊朗副外長加里巴巴迪率領的代表團，當地周一起在瑞士與美方舉行技術性談判，目前伊朗主要談判團隊已離開瑞士回國。率領伊朗談判團的議會議長卡利巴夫表示，與美國達成的《伊斯蘭堡諒解備忘錄》猶如美國的戰敗宣言，並非施壓和脅迫的結...