AI大模型之間的比拼越來越激烈,港大一個研究團隊近日進行研究,讓多個大語言模型在真實美股市場中,進行約3個星期的自主交易,發現不同模型展現出獨特的交易風格與績效表現,其中DeepSeek以超過10%的收益率脫穎而出。
研究團隊在「AI-Trader」的開源項目中,分別給予AI大模型GPT、Claude、Gemini、Qwen 、DeepSeek 1萬美金,在納斯達克100成分股交易。團隊從10月1日開始追蹤,至上周五收市為止,讓多個AI模型在完全無人工干預的環境下進行美股交易。
港大計算與數據科學學院博士生范天宇接受本台專訪時指,人類在今次過程中只是觀眾,團隊只是將所有相關工具提供給AI模型,讓它們自主調用資源、分析市場並執行交易。
在為期三周的觀察期中,各模型表現懸殊,DeepSeek獲得了超過10%的收益率,排行第二的Claude亦錄得4%,GPT就錄得逾3%回報,至於同為國產模型的Qwen亦升逾2%,4個模型都跑贏追蹤「納斯達克100 指數」ETF「QQQ」,只有Gemini錄得虧損2.27%。他指,DeepSeek表現如成熟交易者,注重風險管理,在該買的時候買,該賣的時候賣,屬於穩健型,又觀察到DeepSeek查找外部資料的行為較多,傾向依靠實時資訊而非模型固有知識。至於Gemini表現偏激進,會在某些時候大手買入,亦會在市場下跌時清盤。
研究團隊導師、港大計算機科學系助理教授黃超指,從收益曲線看到,各模型在觀察初期差異不大,但後期逐漸拉開差距,模型會慢慢適應市場動態,調整交易策略。他指,部分中國模型風格中庸,基本上跟著大市走,收益曲線也和指數差不多,而Gemini太在乎短期波動,交易不夠穩健,有點像散戶的「追升殺跌」行為。
范天宇亦透露,團隊計劃將實驗持續至年底並進行升級,考慮提高交易頻率到一小時間隔,並研究同時進行買賣美股及港股,指港股是連接國際和內地的重要市場,相信結果也是比較有趣。
黃超指,現時市場對於大模型在AI金融交易的能力仍然比較空白,想透過這個探索觸發整個市場的關注,今次研究選擇美股市場,是因為美股相對成熟,他希望鼓勵更健康的投資方式,這也是AI更擅長的領域。他提醒,單憑3星期的結果暫時不能判斷哪一個模型擅長於金融交易,強調股票交易是長期過程,今次研究絕對不構成任何投資建議。
另外,紐約一位電腦工程師兼金融從業員,亦在Alpha arena的平台,測試多個模型以1萬美元,在今個月18號開始交易比特幣,截至星期一傍晚,表現最好的是DeepSeekV3.1,賺1倍2;其次是Qwen3 Max,賺8成;Claude Sonnet 4.5賺2成2;Grok4賺約1成;Germini 2.5 pro和GPT 都蝕大約6成。
記者:李芷澄