首頁
快訊
活動
項目
專欄
專題
技術支持
輸入關鍵詞搜索
下載APP
解鎖更多資訊
OpenAI開源HealthBench,60個國家合力開發5000段真實對話
TechFlame
7小時前
TechFlame
7小時前
TechFlame報道,OpenAI開源了一個專門面向醫療大模型的測試評估集——HealthBench。與以往測試集不同的是,該測試集的5000段核心測試對話,全部由來自60個國家/地區的26個專業262名醫生打造,極大增強了該測試集的難度、真實性以及豐富度。並且採用了多輪對話測試,而不是簡單的答題或選擇題模式。根據測試數據顯示,大模型在醫療保健領域的表現有了顯著提升。例如,從之前的GPT-3.5Turbo的16%到GPT-4o的32%,再到o3的60%,整體性能有了顯著進步。尤其是小型模型的進步更爲突出,GPT-4.1nano不僅在性能上超越了GPT-4o,而且成本降低了25倍。
來源鏈接
最新快訊
2025.05.13 星期二
更多
2025-05-13 05:16
紐約期金日內漲幅達1.00%,現報3260.30美元/盎司
2025-05-13 05:05
Upbit 24 小時交易量上升 85.4%,其中 XRP、DOGE、BTC、ETH、LAYER 交易量排行前五
2025-05-13 05:02
ZKsync Developers:ZKsync 和 Matter Labs X 賬戶仍處於被盜狀態,請勿互動
2025-05-13 04:55
現貨黃金站上3250美元/盎司,日內漲0.49%
2025-05-13 04:49
野村:中美達成關稅協議超預期 將中國股票升至“戰術性增持”
推薦閱讀
更多
紐約期金日內漲幅達1.00%,現報3260.30美元/盎司
TechFlame.21分鐘前
Upbit 24 小時交易量上升 85.4%,其中 XRP、DOGE、BTC、ETH、LAYER 交易量排行前五
TechFlame.32分鐘前
ZKsync Developers:ZKsync 和 Matter Labs X 賬戶仍處於被盜狀態,請勿互動
TechFlame.35分鐘前
現貨黃金站上3250美元/盎司,日內漲0.49%
TechFlame.42分鐘前
野村:中美達成關稅協議超預期 將中國股票升至“戰術性增持”
TechFlame.47分鐘前