AUDUSD
0.6358
(0.02%)
DXY
106.57
(-0.08%)
EURUSD
1.0479
(0.18%)
GBPUSD
1.2637
(0.02%)
USCL
70.73
(0.47%)
USDCNH
7.2509
(-0.05%)
USDJPY
149.7565
(0.3%)
XAUUSD
2947.82
(0.4%)
注册 / 登录

快讯

当前位置:首页 > 快讯

【OpenAI员工公开指责Grok3的基准测试结果具有误导性】亚洲财富网数据2月23日讯,近日,OpenAI的一名员工公开指责

【OpenAI员工公开指责Grok3的基准测试结果具有误导性】亚洲财富网数据2月23日讯,近日,OpenAI的一名员工公开指责埃隆・马斯克旗下的xAI公司,称其发布的最新AI模型Grok3的基准测试结果具有误导性。对此,xAI的联合创始人伊戈尔・巴布什金(Igor Babushkin)则坚称公司并无不当。xAI的图表显示,Grok3的两个版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表现超过了OpenAI当前最强的可用模型o3-mini-high。然而,OpenAI的员工很快在X平台上指出,xAI的图表并未包含o3-mini-high在“cons@64”条件下的AIME 2025得分。巴布什金在X平台上辩称,OpenAI过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。

相关新闻

实时行情

  • 资产
    现价
    涨跌
  • 美元指数DXY
    106.57
    -0.08(-0.08%)
  • 欧元/美元EURUSD
    1.0479
    +0.0019(0.18%)
  • WTI原油USCL
    70.73
    +0.33(0.47%)
  • 离岸人民币USDCNH
    7.2509
    -0.0038(-0.05%)
  • 美元/日元USDJPY
    149.7565
    +0.4517(0.3%)
  • 现货黄金XAUUSD
    2947.82
    +11.82(0.4%)

财经日历

查看更多 >>
2025-02-25 星期一
  • 07:50
    1月企业服务价格指数同比
    前值: 2.9
    预期: 3.1
    今值: --
  • 12:02
    俄美第二轮会谈
    前值: --
    预期: --
    今值: --
  • 12:02
    2月一年期中期借贷便利(MLF)中标利率
    前值: 2
    预期: --
    今值: --
  • 12:02
    2月一年期中期借贷便利(MLF)操作规模(亿元)
    前值: 200
    预期: --
    今值: --
  • 15:00
    四季度未季调GDP同比终值
    前值: -0.4
    预期: -0.4
    今值: --
  • 15:00
    四季度工作日调整后GDP同比终值
    前值: -0.2
    预期: -0.2
    今值: --

最热文章

广告合作