10月24日,亚马逊云科技在北京举办了生成式AI构建者大会。会上,亚马逊云科技大中华区产品部总经理陈晓建从应用场景、工具和基础设施、数据基座、AI原生应用构建和生成式AI服务这五个层面,解读了亚马逊云科技全面的云原生技术栈,以及亚马逊云科技如何助力企业降低生成式AI应用开发门槛,加速实现端到端的生成式AI应用构建。
▲陈晓建解读亚马逊云科技五个层面的云原生技术栈
西门子集团、金山办公软件以及科思创中国作为亚马逊云科技中国区生成式AI创新的代表客户,也分享了各自的创新案例。
会后,智东西与少数媒体对陈晓建、亚马逊云科技技术专家团队总监王晓野进行了采访。
当智东西问道,从亚马逊云科技与企业客户的接触来看,目前有哪些行业和领域对生成式AI应用的需求量较大?生成式AI落地行业主要有哪些挑战?亚马逊云科技是如何帮助企业客户应对这些挑战的?
陈晓建称,目前各行各业对生成式AI都有着一定需求,从亚马逊云科技与客户的接触来看,有一些比较有代表性的行业。
一是数字营销行业,易点天下借助亚马逊云科技驱动的生成式AI帮助电商客户将出图时间从5天缩短至2小时,通过SaaS为出海客户提供AI模特与AI数字虚拟人等服务。
二是工业设计领域,以海尔创新设计中心为例,其基于亚马逊云科技服务器部署了大量自动化设计软件,使得产品设计、UI设计等相关业务操作周期缩短了20%。
三是游戏行业,创梦天地利用亚马逊云科技游戏AIGC专业版API,快速上线了AI绘图频道和多种特色风格,积累了数万名频道内用户使用AI生图服务,为后续IP推广活动打下基础。
在落地层面,亚马逊云科技提供包含基础模型、数据与算力基础设施以及开发工具在内的全面云原生技术栈,帮助企业实现端到端的应用构建。以基础模型API服务Bedrock为例,由于其无服务器化,客户无需管理基础设施,只需调用API即可使用。
一、多半效益来自4类应用场景,Bedrock提供6大基础模型
根据麦肯锡咨询2023年6月发布的生成式AI生产力前沿技术报告,在生成式AI技术带来的经济效益中,大约3/4来自四类主要的职能:营销与销售、产品与研发、软件工程和客户运营。
陈晓建称,典型的应用场景带给企业的业务价值主要包含三个方面:增强客户体验、提升员工生产力与创造力、优化业务流程。
围绕不同的应用场景,亚马逊云科技为企业客户提供不同的工具帮助其创新业务模式。
10月7日,亚马逊云科技正式发布Amazon Bedrock,同时宣布接入Meta的Llama 2 13B和70B。目前,Bedrock提供来自Meta、Anthropic、Stability AI、AI21 Labs、Cohere等第三方开发商的模型,以及亚马逊自研的Amazon Titan,共6种基础模型。
▲Bedrock提供的6种基础模型
陈晓建称,Bedrock是企业使用基础模型构建和扩展生成式AI应用程序的最简单方法,它是一项无服务器服务,提供了广泛的模型选择、数据隐私,并且能够自定义模型,无需管理任何基础设施。
▲陈晓建解读Bedrock微调功能
然而,单独的基础模型具有局限性,无法完成需要与外部系统交互并且没有最新知识来源的复杂任务。这些功能本身虽然很简单,但开发人员必须经过多个步骤才能实现这些功能。
Bedrock代理功能支持通过API(应用程序编程接口)安全地连接到公司数据,自动将数据转换为机器可读的格式,并增加相关信息以生成最准确的回答。然后,代理可以自动调用API来满足用户的请求,无需任何手动编码。
金山办公的AI研发总监刘强谈道,今年起,WPS开始将大语言模型的能力全面引入产品,在构建过程中,遇到基础模型性能有限、数据隐私与安全难以保障、高额管理成本等障碍。
作为Bedrock的第一批试用用户,金山办公第一时间与亚马逊云科技展开了对接与测试。
Bedrock中支持的领先大语言模型在多个文字处理场景中符合金山办公的需求,在数据安全层面也给金山办公提供了充分的支持,极大地提高了金山办公的内部开发效率。
▲刘强解读构建生成式AI应用几大挑战
基础设施方面,陈晓建称高性价比的基础设施是生成式AI应用构建的关键。
亚马逊云科技持续对全球基础设施进行深度投资,为客户提供广泛的加速器、GPU选择,例如基于英传达最新GPU芯片H100 Tensor Core的Amazon EC2 P5实例,与上一代相比速度快6倍,训练成本节省40%。
▲陈晓建解读亚马逊云科技基于英伟达GPU芯片实例
基于亚马逊云科技自研的机器学习推理芯片Amazon Inferentia2推出的Amazon EC2 Inf2实例,与其他类似的EC2实例相比性价比高40%;基于自研机器学习训练芯片Amazon Trainium推出的Amazon EC2 Trn1实例,与同类实例相比训练成本节省达50%。
▲陈晓建解读亚马逊云科技自研芯片实例
二、构建专门数据库,DataZone实现跨组织数据共享与治理
数据是将通用的生成式AI转变为了解企业业务和客户的生成式AI的关键差异化因素。
陈晓建称,面向生成式AI构建强大的数据“基座”,需要一套全面的服务,以便能够存储用于构建和微调模型的各种类型的数据;需要服务间的集成,以打破数据孤岛,确保能够随时访问所有数据;还需要在构建生成式AI应用程序的整个生命周期中,确保数据安全并对其进行管理。
▲陈晓建解读面向生成式AI如何构建强大的数据“基座”
在全面服务方面,亚马逊云科技针对生成式AI领域的用户个人信息、会话信息管理、私域知识库等应用场景都提供了专门构建的数据库。针对检索增强生成(RAG)需要处理的向量数据,亚马逊云科技推出了向量数据库功能。
▲陈晓建解读亚马逊云科技多种数据库
在数据集成方面,数据的抽取(Extract)、转换(Transform)、加载(Load)——简称ETL,是端到端数据旅程迫切需要解决的问题,亚马逊云科技提出“Zero-ETL”的愿景,通过深化服务之间的集成,帮助企业执行分析和机器学习,且无需移动数据。
▲陈晓建亚马逊云科技深度集成数据服务
在数据治理方面,亚马逊云科技提供Amazon DataZone数据治理服务,让客户能够跨组织边界发现、访问、共享和治理大规模数据,并减少企业内部成员访问数据和使用分析工具时繁重的工作量。
▲陈晓建解读Amazon DataZone数据治理服务
西门子集团IT数据分析与AI负责人李朝明解读了西门子与亚马逊云科技在企业数据上的合作,通过AI与数据能力的全面能力提升来构建基于生成式AI的企业知识聊天机器人。
面对西门子中国IT面对的企业内部信息分散、数据信息传递能力不足、知识运营能力缺乏等业务难题,亚马逊云科技助力西门子打造了业务知识一体化解决方案“小禹”,由于根植于坚实的数据底座,“小禹”从立项到上线仅用了2个月。
▲李朝明解读西门子业务知识一体化解决方案“小禹”
三、云原生服务加速AI应用构建,编程助手CodeWhisperer将推自定义功能
生成式AI的出现,给传统云原生应用开发架构提出了新的机遇与挑战。
陈晓建在采访中谈道,生成式AI是云原生的技术,可以说,云计算是应用生成式AI最好的方式。
而相比之下,公有云比私有云更适合面向企业,能够提供强大的算力、基础设施资源、端到端的服务等。
在应用层面,亚马逊云科技认为,编程将是生成式AI技术得到快速应用的领域之一。
亚马逊云科技提供的Amazon CodeWhisperer是一款AI编码伙伴,可在基础模型高级选项中使用,实时生成代码建议,从根本上提高开发人员的生产力。
据测试,与未使用的参与者相比,使用CodeWhisperer的参与者完成任务的速度平均快57%,成功率高27%。
陈晓建称,CodeWhisperer即将推出自定义功能,允许客户使用私有代码库安全地定制代码建议,这些私有代码库可涵盖内部API、数据库、最佳实践和架构模式等。
▲陈晓建解读CodeWhisperer自定义功能
科思创中国云开发运维团队负责人俞宙谈道,科思创中国在日常开发中有两个核心任务:项目框架搭建和存量代码优化。
在实践中过程中,重复性、机械化的范式生成、惯用算法引用和企业级API接口定制是科思创中国面临的主要挑战。在亚马逊云科技CodeWhisperer的加持下,科思创中国的日常代码开发效率提升50%,开源代码应用追踪器的准确性也显著提高。
▲俞宙解读科思创中国在日常开发中的两个核心任务
亚马逊云科技还为Amazon QuickSight推出了生成式BI(商务智能)功能,使业务分析师能够轻松地在几秒钟内快速编写和微调新的视觉效果,并使用自然语言将其添加到仪表板中,还可以在QuickSight中创建分析报告。
▲陈晓建解读QuickSight分析报告生成功能
结语:生成式AI≠大模型,模型外的服务或成为新战场
目前,生成式AI应用落地已经从热火朝天的“百模大战”,步入到了少数优秀模型脱颖而出,工具链百花齐放,以及企业主管认真寻找生成式AI落地场景的新阶段。开发生成式AI应用是一个充满挑战的系统工程,而不是单纯的产品和服务拼接。
正如陈晓建所说,生成式AI不仅仅是大模型,整个生成式AI应用就像是浮在海面的冰山,露在海面上方能被大多数人看到的冰山一角就像是基础模型,而在冰川的底部,同样需要大量的基础模型以外的服务来支撑。