AUDUSD
0.6324
(-0.32%)
DXY
106.47
(0.18%)
EURUSD
1.0497
(-0.17%)
GBPUSD
1.26507
(-0.13%)
USCL
69.17
(0.35%)
USDCNH
7.2598
(0.08%)
USDJPY
149.4265
(0.27%)
XAUUSD
2914.12
(-0.04%)
注册 / 登录

快讯

当前位置:首页 > 快讯

【OpenAI员工公开指责Grok3的基准测试结果具有误导性】亚洲财富网数据2月23日讯,近日,OpenAI的一名员工公开指责

【OpenAI员工公开指责Grok3的基准测试结果具有误导性】亚洲财富网数据2月23日讯,近日,OpenAI的一名员工公开指责埃隆・马斯克旗下的xAI公司,称其发布的最新AI模型Grok3的基准测试结果具有误导性。对此,xAI的联合创始人伊戈尔・巴布什金(Igor Babushkin)则坚称公司并无不当。xAI的图表显示,Grok3的两个版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表现超过了OpenAI当前最强的可用模型o3-mini-high。然而,OpenAI的员工很快在X平台上指出,xAI的图表并未包含o3-mini-high在“cons@64”条件下的AIME 2025得分。巴布什金在X平台上辩称,OpenAI过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。

相关新闻

实时行情

  • 资产
    现价
    涨跌
  • 美元指数DXY
    106.47
    +0.19(0.18%)
  • 欧元/美元EURUSD
    1.0497
    -0.0018(-0.17%)
  • WTI原油USCL
    69.17
    +0.24(0.35%)
  • 离岸人民币USDCNH
    7.2598
    +0.0056(0.08%)
  • 美元/日元USDJPY
    149.4265
    +0.3987(0.27%)
  • 现货黄金XAUUSD
    2914.12
    -1.11(-0.04%)

财经日历

查看更多 >>
2025-02-26 星期二
  • 20:00
    2月21日当周MBA抵押贷款申请活动指数周环比
    前值: -6.6
    预期: --
    今值: --
  • 23:00
    1月新屋销售环比
    前值: 3.6
    预期: -2.6
    今值: --
  • 23:00
    1月新屋销售(万户)
    前值: 69.8
    预期: 68
    今值: --
  • 23:30
    2月21日当周EIA精炼厂设备利用率变化
    前值: -0.1
    预期: -0.2
    今值: --
  • 23:30
    2月21日当周EIA精炼油库存变动(万桶)
    前值: -205.1
    预期: -276.2
    今值: --
  • 23:30
    2月21日当周EIA汽油库存变动(万桶)
    前值: -15.1
    预期: -140
    今值: --

最热文章

广告合作