来源 :科创板日报2024-01-10
ChatGPT的横空出世,带来2023年全球大模型热潮。
在2024年新年之际,财联社、《科创板日报》联合上海市人工智能行业协会,邀请人工智能领军者与行业精英推出“2024·AI领先者心声”系列报道,回顾过去的一年,展望新的一年AI大模型发展的机遇与挑战。
星环科技创始人孙元浩向《科创板日报》记者表示:
2023年作为大模型元年,AI行业重新洗牌,各行业应用+大模型的模式纷纷落地,行业主管部门也纷纷牵头大模型语料的组建,聚焦高质量语料的积累、开放共享及安全治理,逐步完善大模型生态构建,确保大模型更好地应用落地。
针对垂直类的专家型应用场景,仅用思维链、微调及外挂行业知识库方式是无法满足实际业务需求的,企业至少需要对通用大模型做二次预训练及微调,才能实现一款专家级别的大语言模型。
孙元浩“2024·AI领先者心声”全文如下:
2023年作为大模型元年,AI行业重新洗牌,各行业应用+大模型的模式纷纷落地,行业主管部门也纷纷牵头大模型语料的组建,聚焦高质量语料的积累、开放共享及安全治理,逐步完善大模型生态构建,确保大模型更好地应用落地。
在企业大模型应用方面,针对如知识问答、智能客服等水平类场景的通用型应用,当前有几种主流方法:通用或领域大模型+思维链等提示词、外挂行业知识库,使用检索增强生成技术进行知识问答和内容生成。
使用思维链的方式省去了重新训练模型的时间及成本,并使得模型可以完成专业知识获取等通用任务。这样打补丁的方式虽然让大模型拥有了行业知识库的补充,但由于模型本身并不具备行业知识,依旧无法实现需要复杂推理的任务,内容生成的丰富度也不够。
针对垂直类的专家型应用场景,仅用思维链、微调及外挂行业知识库方式是无法满足实际业务需求的,企业至少需要对通用大模型做二次预训练及微调,才能实现一款专家级别的大语言模型。
在大模型落地企业的一些特定场景中,会对其领域专业程度有着很高要求,如在专业知识方面需要大模型具备海量的领域术语、专业知识、逻辑思维等,在最新资讯方面需对于诸如企业内外部的实时新闻、宏观统计数据、企业内部经营情况等了如指掌。因此,有些企业选择基于领域数据集从头开始训练一款领域大模型,让大模型在面向专有领域拥有更好的表现和更低的容错率。
ChatGPT仅用2个月时间就突破了1亿的月活用户,成为史上用户增长最快的应用。在大模型的浪潮之下,我们正在见证新一轮工业革命的迸发。不难相信,未来每个领域都会有数以几十万甚至百万计的领域大模型涌现,而目前我国模型的数量还远远不够。
根据Hugging Face官网(一款全球流行的大模型和数据集汇集网站)的模型数量显示,截止2024年1月8日,已有超过45.9万个预训练模型、9.3万个数据集。而根据北京市经济和信息化局数据统计,截止2023年10月,中国国内公开的大模型数量为238个。由此可见,我国的模型数量还远远不能满足上层丰富的业务应用的需求。
而星环科技在研发过程中,发现金融行业对于大模型准确性及实时性等有很高要求,仅做模型微调的工作并不能满足要求。因此,我们联合行业合作伙伴的高质量金融语料及数据集,结合预训练、微调、强化学习、检索增强生成等技术手段,研发出了金融大模型无涯。其可以实时获取最新的行情数据、卫星遥感数据、产业链上下游数据,从而实现领域洞察,为从业者提供专业智能投研辅助决策。