字节跳动基於云雀模型开发的AI工具豆包大模型团队宣布开源SuperGPQA,具备高区分度的知识推理基准测试。该数据集覆盖285个研究生级学科,包括26,529道专业问题,涵盖主流学科,并纳入轻工业、农业及服务科学等长尾学科,填补长尾知识评估领域的空白。(ta/a) 相关内容人民币即期收升94点 报7.2547兑一美元