AUDUSD
0.6268
(-0.27%)
DXY
107.75
(0.11%)
EURUSD
1.0387
(-0.15%)
GBPUSD
1.2486
(-0.14%)
USCL
71.33
(0.42%)
USDCNH
7.2871
(0.06%)
USDJPY
152.438
(-0.1%)
XAUUSD
2869.69
(0.08%)
注册 / 登录

快讯

当前位置:首页 > 快讯

【又一中国模型赶超OpenAI!Qwen2.5-Max数学编程能力全球出众】亚洲财富网数据2月4日讯,4日凌晨,三方基准测试平

【又一中国模型赶超OpenAI!Qwen2.5-Max数学编程能力全球出众】亚洲财富网数据2月4日讯,4日凌晨,三方基准测试平台Chatbot Arena公布了最新的大模型盲测榜单,一周前阿里云通义团队刚发布的Qwen2.5-Max超越DeepSeek V3、OpenAI o1-mini和Claude-3.5-Sonnet等模型,以1332分位列全球第七名,也是非推理类的中国大模型冠军。同时,Qwen2.5-Max在数学和编程等单项能力上排名第一,在硬提示(Hard prompts)方面排名第二。据了解,Chatbot Arena是由LMSYS Org推出的大模型性能测试平台,目前集成了190多种模型。该榜单采用匿名方式将大模型两两组队,交给用户进行盲测,用户根据真实对话体验对模型能力进行投票。ChatBot Arena官方评价称,Qwen2.5-Max在多个领域表现强劲,特别是专业技术向的,例如编程、数学、硬提示等。

相关新闻

实时行情

  • 资产
    现价
    涨跌
  • 美元指数DXY
    107.75
    +0.12(0.11%)
  • 欧元/美元EURUSD
    1.0387
    -0.0016(-0.15%)
  • WTI原油USCL
    71.33
    +0.3(0.42%)
  • 离岸人民币USDCNH
    7.2871
    +0.0043(0.06%)
  • 美元/日元USDJPY
    152.438
    -0.1598(-0.1%)
  • 现货黄金XAUUSD
    2869.69
    +2.39(0.08%)

财经日历

查看更多 >>
2025-02-06 星期三
  • 14:45
    1月季调后失业率
    前值: 2.6
    预期: 2.7
    今值: --
  • 14:45
    1月未季调失业率
    前值: 2.8
    预期: 2.9
    今值: --
  • 15:00
    12月季调后工厂订单同比
    前值: -1.7
    预期: -10.5
    今值: --
  • 15:00
    12月季调后工厂订单环比
    前值: -5.4
    预期: 2
    今值: --
  • 17:30
    1月建筑业PMI
    前值: 53.3
    预期: 53.5
    今值: --
  • 18:00
    12月零售销售同比
    前值: 1.2
    预期: 1.9
    今值: --
广告合作