“大模型已经进入到关键应用落地、更复杂的深水区。”10月24日,在第七届世界声博会暨2024科大讯飞全球1024开发者节(下称“开发者节”)上,科大讯飞董事长刘庆峰对现下AI大模型的发展阶段作出了这一判断。
从2023年的“百模大战”到今年的大模型应用元年,再到大模型应用深水区,科大讯飞的星火大模型经过了多次迭代升级。当天,科大讯飞宣布再次升级了自身底座大模型的能力,其最新发布的星火大模型4.0Turbo,根据真实数据背靠背的测试,在七大核心能力全面超过GPT-4Turbo,数学和代码能力超越GPT-4o。
同时,科大讯飞首发10项基于讯飞星火底座能力的硬核产品与创新应用:定义多模AIUI标准,发布超拟人数字人;发布星火多语言大模型、讯飞星火医学影像大模型、汽车端侧星火大模型;发布首个基于“问题链”的高中数学智能教师系统、星火智慧黑板2.0、AI作业过滤器等;发布星火智办一体机、智能座舱人机交互效果评测机器人VIAS以及科大讯飞多语种AI翻译透明屏。
大模型既要“顶天”也要“立地”,面向大模型应用“深水区”,科大讯飞的解题思路是,在推出新模型时,必须要有对应的场景让市场看得见摸得着。
从市场表现看,据智能超参数根据公开招标信息整理统计,今年1-9月,大模型相关中标项目共计653个,中标厂商中,科大讯飞、百度、智谱AI的中标数量都达到了双位数,在通用大模型厂商中分列前三位。其中排名第一的科大讯飞中标项目达到38个,中标项目披露的中标金额为2.16亿元。38个中标项目,主要分布在通信、金融、能源、教科等行业,以央国企客户为主。
能取得这一良好成绩,一方面离不开科大讯飞持续拓宽大模型的能力,另一方面,也归结于这家公司对大模型的落地路径有着清晰的思考。
联合与自主
刘庆峰表示,截至2024年10月,科大讯飞已与各头部企业共建20多个行业大模型,覆盖300+应用场景,合作伙伴包括中国海油、中国绿能等。
此前于10月14日,中国海油携手科大讯飞、中国电信发布“海能”人工智能模型,并推出具有海油特色的5个专业场景模型和6个通用场景模型。其中,专业场景模型针对海上油田稳产增产、安全钻井、海工制造、设备维护、LNG(液化天然气)贸易、油气销售等场景,构建数据驱动、业务协同的新模式,进一步提升产业数智化水平。通用场景模型针对招标采办、员工健康、辅助办公等需求推出智能应用,助力业务管理和办公效率提升。
除了中国海油,科大讯飞还与中国移动、华为合作,为中国石油打造能源化工领域“昆仑大模型”,与中国绿发共同建设首个绿色产业行业大模型“泰山大模型”。
上述项目中的一个特点是,科大讯飞会通过与合作伙伴携手,发挥各自优势,共同拓展大模型落地项目。在一场投资者会议上,科大讯飞曾对与运营商的合作模式作出诠释:在中国海油、中国石油两个大模型项目中,都是由运营商统筹负责项目落地实施,为各应用场景中不同模型(包括自研模型和讯飞星火)的组合运用提供算力保障,讯飞主要负责底座大模型的研发及上层应用构建,通过强强联合,满足能源化工企业在实际应用中的需求。
在开发者节上,刘庆峰也介绍了科大讯飞成为央国企首选的自身禀赋。
具体流程方面,企业部署大模型,首先需要建算力,可以自己搭建,也可以通过租赁取得。有了算力后,企业需要考虑更高效、高质地整理数据,从而训练模型。在这之后,企业要建立各种尺寸的模型,落地到真正看得见、摸得着的应用场景。最后,企业大模型的安全性,以及能否在运营中产生可以用统计数据证明的应用成效同样重要。
刘庆峰指出,很多企业只能做到第三步的训练模型,而科大讯飞会为企业大模型提供调查规划到执行落地的全套解决方案。
例如,基于大模型底层能力学习,科大讯飞拥有专门的数据清洗工具链,其自动清洗的数据合格率是96.2%,刘庆峰说,有的大模型企业的合格率只有30%到40%。
同时,科大讯飞建立了SFT数据工具链,问答对自动构建合格率到82%。自动构建后,人工再审查,人机协同可以把效率提升到90%。科大讯飞的央国企客户数据显示,原先至少需要1到2个月时间来构建50万条高质量数据,现在两周能完成。
安全方面,依靠国产算力集群训练的星火大模型具有独特优势。在开发者节上,刘庆峰宣布,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动,这将带来新模型新算法的持续适配和智算集群规模的再次跃迁。
去年10月24日,首个国产万卡算力集群“飞星一号”平台上线。刘庆峰说,一年以来,团队攻克了很多“疑难杂症”,解决了500多次基础软硬件问题和模型适配问题。
商业化寻路
训练通用大模型需要投入大量的数据、算力,对大模型企业而言是一笔高昂的成本。此前已有媒体报道称,一些国内大模型公司正在预训练和产品化之间做取舍。
科大讯飞的方法是,一方面坚定对大模型的研发投入,另一方面也要有序推进市场化落地。在2024年第三季度业绩说明会上,科大讯飞介绍了其已经得到初步验证的星火大模型商业化路径:
一是在消费者、教育、医疗、汽车等已有场景中加快规模化落地,这一商业价值闭环已得到初步验证;二是以大模型为切入点,在运营商、金融、能源、交通等重点行业做深做透,在与央国企的战略合作深度运营中打开增量空间;三是通过先发优势,打造iFlyCode、招采、会议、文档、翻译等标准化产品,通过企业市场的规模化推广实现商业价值。
C端是科大讯飞近几年的主要发力方向之一,科大讯飞也在致力于利用大模型赋能相关产品。
今年前三季度,科大讯飞学习机销量增长超过100%,消费者与开放平台业务收入增长44%。
本次开发者节上,科大讯飞宣布首次发布AI作业过滤器,预计在11月中旬在部分学习机机型上灰度上线,将通过主动的AI筛选给孩子减负。
刘庆峰给出了一组数据:同样知识的学习,孩子练习量可以减少45%,作业时间减少28%,留下来的是更适合且应该掌握的作业。学完之后,孩子的错题解决率可以提升20%。
再以汽车行业为例,作为汽车出口大国,今年前三季度,中国汽车出口469万辆,同比增长26%。此次大会上,科大讯飞首次发布了星火多语言大模型,除中英文外,可支持俄、日、阿、法等8个语种。升级后的星火多语言大模型将全面赋能国内的汽车产业,助攻企业出海。
科大讯飞还首发了汽车端侧星火大模型,据悉,今年第四季度起,奇瑞、广汽、长城等多款搭载星火端侧大模型的车型将上市开售。
值得一提的是,由于企业数据本身具有独特性,大模型的通用应用一直是业界难题。在探索大模型应用的过程中,科大讯飞尝试通过先在头部企业落地,再在行业内进行推广,或者是在不同行业之间相互借鉴。
例如,星火大模型的代码能力经交通银行等测试,在业界处于领先水平,在软件行业加快落地,自iFlyCode发布以来,已在软通动力、交通银行、北路智控等100多家机构对接应用。
刘庆峰表示,在大模型的应用场景中,科大讯飞已经形成了可以相互借鉴和复用的规模化效应。