序号 |
代码 |
股票简称 |
加入日期 |
入选理由 |
1 |
688500 |
慧辰股份 |
2024-10-11 |
2024年9月27日公司投资者关系活动记录表披露:在算法模型领域,经过十余年服务超大型客户及公共服务领域的沉淀形成了行业知识库、算法模型库与大量专业数据分析报告等,为公司AI模型的训练提供了丰富的训练语料库,形成了面向领域场景的多个大模型生成技术,慧辰大模型内容生成算法、语音合成算法及数字人算法已经通过国家网信办互联网信息服务算法备案。具体在服务商业消费与营销类场景的产品,包括“慧AI”、“AIGC+洞察创新”、“AIGC+数字营销”、“AIGC+客户体验”、“AI数字分身”等,可全面赋能客户的商业运营。
|
2 |
601360 |
三六零 |
2024-09-11 |
针对世界前沿的AI技术和AI安全难题,360躬身入局大模型。依托多年人工智能技术积累及搜索浏览器等场景优势,360推出自研千亿参数的认知型通用大模型“360智脑”,可覆盖大模型应用所有场景,综合能力位列国内大模型第一梯队。同时,公司基于“360智脑”底层能力推出了税务大模型、安全万事通大模型、医疗大模型、保险行业知识大模型、政务大模型,问题识别准确率、回答准确率均达到95%以上。基于360智脑的能力将自有两大优势场景“360浏览器”“360搜索”颠覆式升级为“360AI浏览器”“360AI搜索”,市场反响强烈。2023年12月,在全国信息技术标准化技术委员会人工智能分委会全体会议上,国内首个官方“大模型标准符合性评测”结果公布,360智脑成为首批通过评测的四款国产大模型之一。依靠360浏览器、360搜索等高频流量入口,形成了10T+优质文本数据及海量图文视频数据,内容覆盖全球多个语种、涉猎金融、法律、房产、体育、医药等全行业范围,形式包括文档、书籍、散文、诗歌等,为大模型训练提供了大规模、多样性、高质量的训练语料。
|
3 |
002195 |
岩山科技 |
2024-06-26 |
2024年4月26日公司在互动平台披露:公司有自己的AI语料库,用于AIGC大模型的训练语料主要基于公司旗下上海二三四五网络科技有限公司拥有的数据及通过互联网获取的公开信息,经过大量数据清洗、整理工作而产生。
|
4 |
603888 |
新华网 |
2024-05-07 |
2024年4月29日公司在互动平台披露:新华网正积极布局人工智能大模型及其深度应用,拥有丰富权威的新闻和传媒数据作为专属大模型语料库建设基础,我司AIGC-Safe平台亦在通过采集大量国内外生成式视频内容训练AI鉴别模型。语料库建设会随着新华网在人工智能大模型领域应用场景的开发有序推进。
|
5 |
300785 |
值得买 |
2024-04-28 |
2024年4月8日公司在互动平台披露:公司已经在消费内容社区“什么值得买”中部分商品详情页面接入了Kimi,为用户提供商品提炼总结服务。未来,我们还将根据对此次接入情况的评估,决定是否将Kimi接入到更多的场景中。此外,公司拥有大量优质的消费内容和消费数据,是一个非常好的语料资源,我们双方团队正在合作,将我们脱敏后的消费内容和消费数据的API开放给Kimi,帮助Kimi提升在消费类问答中的表现。
|
6 |
603721 |
中广天择 |
2024-04-28 |
在人工智能快速发展的背景下,公司利用自身优势创新业务发展,首先是公司拥有大量优质自有版权的音视频版权数据,其次是公司具备强大的渠道能力,利用现有500+城市广电合作客户资源开展行业版权数据资源整合,在行业主管部门的支持下,打造中国广电行业优质版权的垂类数据集,在此基础上,积极建设AI模型训练的算料综合服务和交易平台。通过汇聚音视频版权数据,将进行清洗、标注、加工等技术处理后的版权数据集销售给AI大模型,实现版权数据的确权、加工和交易。
|
7 |
002343 |
慈文传媒 |
2024-04-20 |
2024年4月17日公司在互动平台披露:公司与多家AIGC公司就慈文传媒20多年来积累的丰富的视频语料数据库正在磋商相关合作,双方就对应的价格、合作的模式、授权的界定范围等均正在进行洽谈。
|
8 |
002878 |
元隆雅图 |
2024-04-08 |
2024年3月29日公司在互动平台披露,公司基于新媒体营销业务长期积累的爆品文案,可以作为AIGC模型训练的语料。
|
9 |
600373 |
中文传媒 |
2024-04-08 |
在图书市场方面,据开卷数据显示,公司全年在综合零售市场实洋占有率为2.96%,实洋排名第4,实洋品种效率为1.89,同比上升3位,取得近年来最好水平。在“走出去”方面,公司积极谋划出访工作,向世界讲好江西故事,深度融入国外市场,高位推进合作项目,全年实现版权输出489项,涉及38个语种,37个国家和地区,其中17个项目入选“2023年经典中国国际出版工程”和“2023年丝路书香工程”,文化输出彰显实力。在教材教辅方面,公司顺利中标2023—2025年义务教育阶段免费教科书单一来源采购项目,夯实了未来三年经营发展基础。旗下发行集团在全国新华发行系统总体经济规模排名中位居第四,连续8年稳居全国同行业第一阵营,印发集团获评国家新闻出版署首批“国家印刷示范企业”称号,连续第9年荣登“中国印刷包装企业100强”排行榜,连续3年位列全国印刷集团总体经济规模综合评价第二位。
|
10 |
600839 |
四川长虹 |
2024-04-08 |
2023年报披露:智能电视方面,本集团聚焦“多模态交互、画质”等核心技术,形成了屏幕、芯片、内容、传输等关键环节的全链路8K完整解决方案,先后推出全球首台“超脑”AI大模型电视,全球首台星闪电视、全球首款超两万分区Mini LED ARTIST星箔电视、8K高清和288Hz高刷电视、200英寸巨幕激光影院等。2024年3月8日公司在投资者互动平台表示,公司“长虹超脑”AI系统将人工智能大语言模型应用于电视领域。2023年11月20日公司微信公众号披露,全球首个基于大模型智慧家电AI平台长虹云帆发布。发布会现场长虹还发布了一款有超级连接能力的电视--全球首台星闪电视。2023年2月17日长虹公司微信公众号披露:长虹宣布接入百度文心一言能力,打造大屏8K人工智能全系产品和服务。2024年4月1日公司在互动平台披露:公司有自建的AI语料库,主要用于AI相关算法、产品场景的研究应用。
|
11 |
300341 |
麦克奥迪 |
2024-04-08 |
公司旗下的数字医疗业务板块所属的质控中心数据库已经积累了超过1,260万例DNA倍体宫颈筛查诊断标本,以及其他组织的DNA倍体标本40多万例,典型病例的数字病理切片超过100万张。这些宝贵的数据资源将成为人工智能(AI)产品开发的重要基础。公司在病理领域始终专注于解决行业内的痛点问题,以远程质控平台为基石,推动病理科的数字化转型,并致力于挖掘数字病理云平台的数据价值。在此基础上,智慧光学业务板块将开发相应的硬件设备,并与软件应用相结合开发AI人工智能辅助诊断产品。这将有效提升公司运营近十年的远程数字病理会诊系统的服务效能,使得远程会诊服务更加高效。
|
12 |
300369 |
绿盟科技 |
2024-04-03 |
2024年3月29日公司在互动平台披露:训练数据的来源、质量、多样性等因素在安全行业大模型的研发过程中起着至关重要的作用。公司经过多年的积累和转化,形成覆盖运营、攻防等多个方面的高质量语料数据体系,确保训练数据具备高质量、全面性和实时性,并做好数据隐私和安全保护以确保数据的合法获取和使用。
|
13 |
300413 |
芒果超媒 |
2024-04-03 |
2024年3月27日公司在互动平台披露:公司丰富的版权内容数据资产为“芒果大模型”(行业垂类大模型)的研发提供了高质量的训练语料。我们非常重视这些数据的价值开发,并将分类整理的数据用于“芒果大模型”的训练。近期,我们推出的国内首个AI导演“爱芒”,就是基于“芒果大模型”衍生的细分场景推理模型创新应用。爱芒在湖南卫视、芒果TV播出的《我们仨》节目中首秀,承担助理导演的职责,负责与艺人沟通确定节目行程、撰写分镜头脚本、创作文案、设计节目游戏、完成vlog剪辑等等。
|
14 |
300418 |
昆仑万维 |
2024-04-01 |
公司2020年开始关注大模型和AIGC领域,目前已成功构建了包括AI大模型、AI搜索、AI音乐、AI视频、AI社交、AI游戏等在内的多元AI业务矩阵,部分业务已实现商业化落地,位列国内人工智能行业第一梯队。2023年4月,公司发布自主研发的“天工1.0”大模型。公司从数十万亿数据中清洗筛选出3万亿单词数据,成功突破了中文语料库的质量瓶颈,确保了优质的中文语料资源,让天工在理解中文语境、词汇和语法特点上具有显著优势,从而更准确地把握中文用户的意图。2024年4月17日,在天工大模型发布一周年之际,公司正式将天工大模型迭代至3.0版本。“天工3.0”采用4,000亿参数MoE架构,是目前全球模型参数最大、性能最强的开源MoE模型之一。在MMBench等多项权威多模态测评结果中,“天工3.0”超越GPT4V,多项评测指标达到全球领先水平。
|
15 |
002362 |
汉王科技 |
2024-04-01 |
2023年内,公司启动语音识别、语音合成、声纹识别的技术研发,并低成本高效率的取得技术突破,形成包括文字、图像、语音、视频在内的多模态数据在内的识别核心技术体系。基于大模型实际场景落地的出发点,结合公司资金、技术、资源等实际情况及对行业数据、行业背景知识理解的优势,公司聚焦AI行业大模型的研发,并于2023年10月12日发布具有“数据私有化、算力低成本化、深度专业化、知识实时化、生成精准化”五化特质的汉王天地大模型,旨在解决客户在应用大模型时对成本负担、数据安全、生成准确性等疑虑。目前,汉王天地大模型已经通过国家《生成式人工智能服务管理暂行办法》备案。目前汉王天地大模型已应用在公司智能办公本、智能电纸学习本系列产品的部分功能模块中,赋能产品实现话稿整理、会议纪要生成、智能判题等功能,未来公司更多智能硬件亦将搭载AI模型,帮助用户实现更多的AI功能。公司自研的古汉语大模型,构建了包括古籍句读、文言文转白话文、信息抽取、古籍档案智能著录等AI工具,同时将大模型语义理解能力与专业知识库的数据融合,大幅提升古汉语大模型的定向问答能力。经过人机多维度的对比评测,公司古汉语大模型在古籍的信息抽取与整理、历史人文知识问答以及古文翻译、诗词写作、对联等古文理解、演绎等能力上的综合表现优于通用大模型。2023年内,古汉语大模型在某省级档案馆落地应用,并入选北京市人工智能行业大模型创新应用白皮书。
|
16 |
000156 |
华数传媒 |
2024-03-27 |
公司拥有庞大的版权节目资源,与800多家内容供应商合作,拥有百万小时的数字化节目内容媒体资源库,包括电影、电视剧、综合资讯节目、娱乐综艺、原创动漫和音乐节目等,同时着眼优质内容聚合、垂直领域细分与本地内容运营。公司已上线求索4K超高清频道、央视4K轮播频道、4K超高清点播专区,打造真正的4K超高清家庭影院。丰富的媒体资源储备为与运营商和终端厂商的长期合作奠定了基础,为用户提供多样化的收视内容。
|
17 |
002649 |
博彦科技 |
2024-03-25 |
2023年7月28日公司在互动易平台披露:公司为部分客户提供AI大模型训练相关的语料、数据标注、数据训练等服务。
|
18 |
300229 |
拓尔思 |
2024-03-24 |
公司采集的公开信源数据通过加工处理,通过不同专业模型转化成不同领域的知识数据,实现数据从资源性到经营性的数据资产变现,形成了三大数据资产平台:数家(媒体资讯)、网察(舆情)、数星(产业大脑)的格局。2023年,在数据资源方面,公司对数百万个采集点进行了采集清理,保证了采集源的高度权威可信。在数据流通方面,公司数据服务类OpenAPI已在北京、上海、深圳、郑州、湖南、浙江等地的数据交易所挂牌,贵阳大数据交易所与西部数据交易中心的数据服务上架正在同步推进中。在数据服务方面,公司大力开拓大模型预训练数据集服务业务,以数据推送服务方式为全国大模型服务厂商提供优质的中文预训练数据集。目前,公司拥有规模位列业界前茅的、经过领域知识加工的权威高质量公开数据2000亿+,涵盖近10年来的报刊数据、互联网主流新闻数据、新闻资讯客户端数据、政府类门户网站数据、权威第三方平台数据及行业资讯数据等。公司已为小米、云之声、云天励飞、蚂蚁集团、上海人工智能实验室等头部大模型厂商提供了训练数据集销售服务。在数据资产管理方面,公司积极加强与上海数据交易所的交流。
|
19 |
002401 |
中远海科 |
2024-03-24 |
2024年1月4日公司在互动平台披露,目前公司的船视宝数据产品在上海数据交易所挂牌,上海数据交易所搭建了良好的数据要素交易平台生态的功能,公司积极借助上海数据交易所的平台进一步推动公司相关服务的宣传营销和市场推广。
|
20 |
603000 |
人民网 |
2024-03-24 |
针对大模型存在的意识形态风险,实验室研发构建生成式AI内容安全评估体系,对国内主要的大模型进行多轮次评估。建设主流价值语料库,已完成3千多万篇基础语料、10万余对问答语料,并在部分大模型厂家得到应用验证,大幅提高了大模型的安全性。初步构建由“舆图-网络-决策”构成的境内外舆论传播认知技术体系。推出系列智能技术应用,包括“谛听”舆论安全风控平台、“天目”智能识别系统、“智晓助”涉政智能风控平台、“写易”写稿助手等。依托内容安全能力,人民网在以智能科技服务党政机关、教育医疗、企事业单位方面构建了独特优势,为公司内容风控、内容聚合分发、内容运营等业务全面赋能。2023年,成功推出大模型内容安全评估体系,建成主流价值语料库,推出面向党政应用的智能写作、 问答大模型“写易”,中标国务院办公厅2023年至2024年国家政务服务平台和国家“互联网+监管”系统运营服务项目,为中华全国总工会研发的智能写作平台成功上线。
|
21 |
300609 |
汇纳科技 |
2024-03-24 |
2023年9月20日公司在互动平台上披露:公司实体商业数据库包括商业环境、商圈概况、商场基础信息、商场品牌库、互联网数据等多维度数据,其数据来源主要基于公司独有的多年线下客流数据积累,以及公司通过团队自采、业务合作、数据采购与AI建模客流投射等多种方式获得的各维度数据。基于上述数据库,公司针对零售门店开发了包含门店网络规划、选址评估、运营状态监测、未来表现预测以及市场变化趋势分析等数据服务产品,目前签已约Apple、Adidas、Under Armour等多个国际一线品牌。
|
22 |
300654 |
世纪天鸿 |
2024-03-24 |
凭借强大的内容研发能力,公司具备快速应对考试改革与教材变化的能力,并可以为大模型训练提供优质语料。同作为大模型训练三个必备要素之一的“语料”,公司基于近30年所积累的专业化、场景化的教育内容,成为无论是通用大模型还是垂直领域精准模型都必不可少的来源之一。作为公司在探索人工智能在智慧教育场景的落地与应用,实现教育内容人工智能升级的重要实践,公司所投资的笔神作文在AI作文批改领域持续突破,目前笔神作文APP注册学生用户超过1600万,月活用户180万,作文社区每月投稿量超过30万篇,积累了500多万篇的优质的作文语料。笔神作文的语料库积累了4年时间,超过30万篇基于人工反馈的专业微调数据,作为全国领先的中小学生作文学习平台和投稿社区。
|
23 |
300364 |
中文在线 |
2024-03-24 |
随着人工智能技术的不断发展和广泛应用,涵盖了文本、图像、音频、可视化等多种形式的AIGC多模态融合将成为内容生产的新趋势。目前,公司在AI大模型、AI多模态方面已积极开展技术建设并进行了商业化落地。公司于2023年10月发布了公司自己的AI大模型“中文逍遥”1.0版本,可实现一键生成万字小说、一张图写一部小说、一次读懂100万字小说等。公司可用于AI大模型训练的数据集已超过60TB,主要由小说和出版物组成,这为公司的AI模型提供了巨大的优势。在AI多模态方面,公司基于多年来各类IP衍生品制作技术的基础以及海量数字内容的优势,在有声书、漫画、动漫、视频等多模态领域进行了技术布局和商业化落地。公司从2021年开始使用“AI主播”进行优质内容的生产,直接输入文本,通过由神经网络搭建的黑盒部分,输出合成高质量仿真音频(有声书),加速了网络文学到音频内容的生产能力,“AI主播”录制的有声书时长已超过18万小时。通过AI技术的支持,公司已成功将超过2500万字的小说IP内容转化为外语版本,并成功推向海外市场。
|
24 |
000681 |
视觉中国 |
2024-03-24 |
2023年6月2日公司在互动平台披露,公司抓住AIGC的发展机遇期,并确定了“AI+内容+场景”发展战略,结合自身的交易场景、优质合规数据以及全球创作者社区等核心优势,专注“以客户为中心”的AIGC技术创新,以客户为中心来落地AIGC产品。AI对各行各业都有广泛的应用价值,公司主业主要在视觉内容与服务,主要在营销传播场景服务党政媒体、广告营销、品牌企业以及互联网平台企业。2022年度公司拥有的数字版权交易平台,主要为客户提供超过4亿的图片、视频、音乐海量优质、安全合规的版权素材服务。2023年3月,公司率先在全球版权素材行业推出了基于自然语言理解的AI智能搜索,客户不仅可以通过“关键字”进行搜索,也可以使用自然语言进行搜索,大大提升了客户获取优质内容的效率;5月上线AI创意工具,提供模特转换、插画转化等功能提高用户体验与工作效率。今后,公司将通过提供“AI智能搜索+AI灵感生成”的组合服务体系,将AI灵感生成服务集成到已有工作流中更好地服务客户。另外,训练数据集的质量、类型、合规性、风格都会决定AI生成的内容质量。公司拥有数以亿计的专业级且获版权许可的优质图片、视频音乐素材,是市场上少有的高质量素材的图像库之一,有助于确保模型生成内容安全合规,可用于商业用途的内容,不将风险转嫁给客户。公司将充分发挥海量、高质量、版权合规的数据集价值,与算力、算法战略合作伙伴一起合作打造专有的垂类AIGC视觉图像模型,共同探索全新的商业模式。
|
25 |
002908 |
德生科技 |
2024-03-24 |
2024年3月6日公司投资者关系活动记录表披露:2023年底公司基于一卡通场景的服务积累,推出基于民生行业大模型的便民服务站(数字公务员),并已在青岛、南昌、东莞等地市试点,在推行过程中得到政府、银行的高度认可。服务站是政府服务、银行服务、及公司业务的核心引擎,通过人机交互的方式,服务下沉到基层。目前服务站训练的方向主要跟就业、社保、五险一金相关,根据不同地市的模型需求,也会包含其他个性化运营。公司智能知识运营服务已在全国60多个地市部署,为公司训练大模型积累了大量的语料,公司将在此基础上持续升级训练,目前已有近十个地市有明确的需求,订单量正在逐步增加。
|
26 |
300133 |
华策影视 |
2024-03-24 |
公司现有超5万小时正版影视版权库和150万分钟(估算约2万TB)高清/超高清的原始拍摄素材,在垂直领域的多模态模型训练上具备极佳的利用潜力。自研“有风”行业垂直模型,涵盖“AI编剧助手”“ AI剧本评估助手”等文生文功能,已内部使用,可将一部120万字的小说评估报告生成时长从5至7天缩短到15至30分钟。已经上线“AIGC多语种智能翻译工作流”,可生成并输出法语、西班牙语、阿拉伯语、日语等多个语种翻译并同步输出多语种的剧情介绍流畅音频。该功能已经在国际影视合作区CDramarights云平台上全面应用。已经上线“AI视频分析检索功能”,可以对视频中的人、物等特定元素进行自动标签,快速锁定相关素材。正在内测“AI剧照”、“多语种有声配音”、“AI适配动画”等功能。并基于分镜头创作设计需要,形成了满足、适配影视工作流所需时长的4秒文生视频能力。正在不断累积3D数字资产库建设。2023年,公司加大对剧组置景进行3D扫描的力度,现已储备有约700个可用于广告、影视剧拍摄制作的数字资产场景。
|
27 |
300182 |
捷成股份 |
2024-03-24 |
作为国内领先的数字版权分销商、全媒体文化传播服务提供商、数字生活内容运营商,公司集版权采购、数字分销、内容运营于一身,携手国内外千余家出品公司,积累了10万余小时的影视、动漫、节目版权内容,面向广电、互联网新媒体、运营商等媒体渠道进行数字化发行,全面覆盖数字电视、OTT、IPTV、电脑、平板、手机、户外流媒体等全媒体终端。一个由“海量数字内容矩阵”、“全产业媒体发行集群”和“全媒体终端交互式覆盖”形成的“云”、“端”、“场”一体化的运营模式,带来了上中下游全产业融合式服务的文化传播生态。在人工智能快速发展的背景下,影视拍摄过程中大量的素材可以通过清洗、标注、加工等技术处理形成数据集成,作为AI模型训练的优质训练语料。公司作为国内领先的数字版权分销商,积累了海量的影视、动漫、综艺节目、纪录片内容,具备极佳的利用潜力。
|
28 |
300226 |
上海钢联 |
2024-03-24 |
公司围绕大宗商品点(品种)、线(产业链)、面(大宗商品相关行业)、体(产业数据库)的数据研发路线,探索多种数据模态,构建大宗商品产业知识图谱,力争打造大而全的大宗商品及相关产业数据库。公司通过人工采集与系统自动化采集相结合的方式,汇聚大宗商品的生产、供应及销售、价格等数据,并融合外部企业提供的遥感卫星数据,采用图像语音识别、人工智能建模分析预测等技术,形成了一套覆盖黑色金属、有色金属、建筑材料、能源化工、新能源、新材料、再生资源、农产品等8大领域100多个产业链的产业数据库。目前已建设大类数据库22个,二类数据库66个,涉及细分品种8000多个,影响价格变动的多维度数据共计超10TB。
|
29 |
603533 |
掌阅科技 |
2024-03-24 |
公司通过多年的积累,数字内容资源丰富,品类众多,包括图书、有声读物、杂志、漫画、自出版、视频等多种类型,对优质重磅书始终保持了较高的覆盖比例,能够满足用户各种类别、各种场景的阅读需求。公司为了让用户享受高品质的正版阅读体验,持续引进精品数字内容,经过多年积累,已经和上千家出版公司、文学网站等建立了良好合作关系,建立了广泛的直接内容采购网络;大力发展“掌阅文学”内容孵化生态体系,通过挖掘、签约、培养、推荐、衍生增值等手段输出了大量优质内容,不断丰富内容创作生态圈;视频内容生产制作运营能力快速形成。
|
30 |
600100 |
同方股份 |
2024-03-24 |
在知识内容与服务领域,同方知网继续深耕于大规模集成化数字出版、超大型中外文知识资源数据库建设及数字出版、知识管理和智能信息处理技术研发,不断加快产品服务模式创新和技术革新,引领行业发展。2024年上半年,国家知识产权局中国专利信息中心与同方知网签署战略合作协议,双方将共同开展项目合作、数据对接及相关产品研发,为知识产权和科技信息服务等领域提供切实有效的解决方案;同方知网中标由中国科学技术协会科学技术创新部组织实施的“2024年度科技期刊双语传播工程”项目;同方知网策划开展“数字阅读”进机关、进校园、进法检、进企业、进医院等系列公益活动,累计为100余家机构开通新时代智慧党建学习平台等党政行业数据库阅读服务。针对企业科研人员,同方知网联合中国电子学会等8家行业组织发起“知识赋能创新发展”科技创新知识服务季活动,为180余家企业科研人员、科研管理人员提供高效知识服务。同方知网将知识传播与健康事业深度融合,推广中国医院知识总库CHKD、临床诊疗知识库、医药知识资源总库等专业知识库数字阅读体验。
|
31 |
601858 |
中国科传 |
2024-03-24 |
多年来,公司以中国科学院为依托,积累了优质的学术内容资源,形成了专业化的资源获取能力,在内容建设方面形成了独到优势。目前,公司年出版新书超过3000种,已累计出版图书超过5万种,出版领域涉及科学(S)、技术(T)、医学(M)、教育(E)、人文社科(H)等多个学科,是国内学科分布最全、出版规模最大的综合性科技出版机构。公司作为国家级的科技期刊出版基地,目前出版期刊568种,有143种被SCI、ESCI收录,其中59种期刊处于Q1区,4种期刊国际同学科期刊排名第一,28种期刊居国际同学科期刊排名前10%。权威性、专业性的优质内容资源优势以及强大的内容产品策划生产能力为公司的持续发展乃至未来的产业转型升级奠定了坚实基础。
|
32 |
605186 |
健麾信息 |
2024-03-24 |
2024年3月21日公司在互动平台上披露:截至目前,公司累积的处方单数据已高达数十亿条,增长速度在10%左右。这些数据主要源自国内各大医院药房部门的处方药发药记录。全国百强医院中超过半数都是公司的合作伙伴,共同构建了强大的合作网络,确保了数据的专业性和参考价值。同时,公司拥有成熟的数据脱敏技术,能够在保护用户隐私的同时,确保脱敏后的数据可用于支持国内大型模型的训练工作。
|
33 |
688787 |
海天瑞声 |
2024-03-24 |
2024年3月15日公司在互动平台上披露:公司是专业的人工智能训练数据服务提供商,目前正在围绕AIGC/大模型数据服务领域进行投入、建设。一方面,公司将基于现有商业模式,开发大模型相关的专业训练数据集,该数据集建成后,将提供可供大模型训练和评测的不少于10个品类的专业数据集,显著提升行业内面向大模型训练数据集的类别和质量,协助实现公共数据、社会数据等各类高价值数据资源汇聚,实现基于大模型通用能力和垂直领域数据的训练学习。另一方面,公司计划将研发设计数据生产垂直大模型,公司全栈自研的数据生产垂直大模型,将可辅助完成面向多个下游任务的数据设计与处理规则,形成包括数据清洗方案设计、指令方案设计、指令泛化与迁移、指令数据验证、多模态数据方案等在内的多项生成能力,以及在上述方案下的原始数据及标注成果生成能力。 公司已与相关客户签订了大模型训练数据集相关的业务合同或意向订单。此外,公司已与其他大模型领域的知名机构签署了合作协议,未来拟围绕人工智能大模型数据处理技术、大模型数据集供给和大模型评测等方面进行合作。
|