×

掃碼關注微信公眾號

>

挖貝網> 產業> 詳情

山海大模型SuperBench榜單名列前茅，期待云知聲上市新征程

2024/10/21 17:08:41 企業供稿

近日，國內人工智能領域的權威機構——清華大學基礎模型研究中心，正式發布了SuperBench九月綜合榜單。此次評測匯集全球24個大模型，經過多輪激烈角逐，山海大模型憑借其在多項評測中的優異表現，再次證明其全球大模型比拼名列前茅的綜合實力。

作為國內大模型測評的權威基準，SuperBench由清華大學人工智能研究院基礎模型研究中心攜手多家知名機構共同打造，旨在為大模型領域提供一套科學、客觀的測評體系。本次評測數據集全面覆蓋語義、對齊、代碼、智能體、安全、數理邏輯和指令遵循等七大類別，共計32個子類，全方位評估大模型的各項能力。

在備受關注的人類對齊能力評測中，山海大模型3.0以8.21分的高分脫穎而出，排名全球第五、國內第二。特別是在中文語言方面，山海大模型與o1-preview并列全球第二，得分高達8.41，充分展示其在中文語言處理領域的深厚實力。在細分評測項中，山海大模型更是屢創佳績，基本任務、綜合問答、文本寫作三項均進入前三，并在文本寫作評測中榮獲桂冠。

智能體能力評測中，山海大模型同樣不負眾望，以3.44分排名全球第七、國內第五。尤其是在網絡購物評測中，其得分遠超70，位列全球第二，彰顯出其在智能體應用方面的顯著優勢。

安全和價值觀能力評測方面，山海大模型3.0以89.4分的高分位居全球第二。在倫理道德、攻擊冒犯、身體健康、隱私財產等關鍵評測項中，它均表現出色，位列前三，并在身體健康和隱私財產評測中奪得榜首，充分體現了其在保障用戶安全和維護正確價值觀方面的堅定承諾。

自2023年5月問世以來，山海大模型已在多個權威評測中屢獲殊榮，包括OpenCompass大模型評測、SuperCLUE中文大模型基準測評、MedBench評測、Flageval大模型評測等多個權威評測，充分展現其業界領先的通用能力和行業大模型實力。此次SuperBench評測再次印證了山海大模型的綜合實力和技術創新能力。

未來，山海大模型將繼續深耕智慧醫療、智慧座艙、智慧交通、智慧營銷等多個領域，推動大模型技術的創新發展和產業升級，為各行各業帶來更加高效、智能的解決方案！

SuperBench

相關閱讀

推薦閱讀

快訊更多

10-21 20:59 | 鷺燕醫藥2024年前三季度凈利2.57億合營企業投資收益減少
10-21 20:59 | 孚日股份2024年前三季度凈利3.37億同比增長36.94% 家紡差異化產品毛利率上升
10-21 20:59 | 杭州銀行2024年前三季度凈利138.7億同比增長18.63% 利息凈收入增長
10-21 20:59 | 信立泰2024年前三季度凈利5.1億同比增長6.37% 創新產品收入提升
10-21 20:58 | 中國平安2024年前三季度凈利1191.82億同比增長36.1% 壽險及健康險、財產保險業務增長
10-21 20:16 | 科華生物2024年前三季度虧損1.22億同比虧損增加受部分產品市場需求下滑
10-21 20:15 | 全聚德2024年前三季度營收10.84億凈利7045.16萬
10-21 20:15 | 海順新材2024年前三季度凈利7972.23萬同比增長5.14% 其他收益同比增長
10-21 20:15 | 艾德生物2024年前三季度凈利2.27億同比增長30.82% 本期收入增長
10-21 20:15 | 雙塔食品2024年前三季度凈利6294.02萬同比增長1060.85% 財務費用較上年同期增長

專題更多

国产私拍大尺度在线视频_中文字幕无线码一区二区_精品中文字幕无码_91伊人久久大香线蕉