来源 :深交所互动易2024-02-27
cninfo1115485问科大讯飞(002230)11月报告显示讯飞星火V3文本生成、语言理解、知识问答、逻辑、数学、代码评分分别为70.74、77.23、72.90、62.64、61.80、68.90,年会报告显示V3.5评分为78.04、84.84、77.56、72.14、75.63、68.34,分别提升7.3、7.6、4.7、9.5、13.8、-0.6,与V3.5发布会中的提升数据7.3、7.6、4.7、9.5、9.8、8.0为什么有出入?
2024-02-13 11:47:36
科大讯飞答cninfo1115485
您好,星火大模型代码能力测试样本均来源于OpenAI构建的代码生成能力公开测试集HumanEval。星火大模型持续升级,相关数据指标持续在迭代中,谢谢您的关注。
2024-02-27 21:53:42