chaguwang.cn-查股网.中国
查股网.CN
金山办公(688111)内幕信息消息披露
 
个股最新内幕信息查询:    
 

金山办公陷“信任危机” AI训练数据合法来源受关注

http://www.chaguwang.cn  2023-11-23  金山办公内幕信息

来源 :未来网2023-11-23

  金山办公或许正在陷入一场信任危机。11月18日晚,WPS官方微博连夜回应:“郑重声明,所有用户文档不会被用于任何AI训练目的,也不会在未经用户同意的情况下用于任何场景”。

  起因为日前有用户发现,《WPS隐私协议》中提到:“将对您主动上传的文档材料,在采取脱敏处理后作为AI训练的基础材料使用”。此消息一经爆出,网友纷纷对WPS使用用户文档数据训练AI担忧,担心wps的这种做法对用户个人隐私保护产生侵害。

  

  WPS官微截图

  对此,人民日报发文评论称,“必须将保护用户隐私和信息安全置于更重要的位置。越是一切都可以数字化、被收集、能分析,越要划出底线,筑起信息安全的堤坝,给用户选择甚至说‘不’的权利。”

  WPS AI公测“惹事”金山办公忙道歉

  11月16日,金山办公宣布旗下具备大语言模型能力的人工智能办公应用WPS AI开启公测,AI功能面向全体用户陆续开放体验。

  

  WPS官微截图

  随后,有网友注意到《WPS隐私政策》中提到:“为提升您使用我们提供的包括但不限于在线文档美化、在线PPT美化、在线表格美化的AI功能的准确性,我们将对您主动上传的文档材料,在采取脱敏处理后作为AI训练的基础材料使用”。

  

  媒体报道截图

  该网友质疑WPS涉及使用用户隐私问题。也有不少网友跟帖质疑“是否不经用户知情同意便取用用户上传的文件,成为训练AI的数据?”“这样‘喂’AI经过我的同意了吗?”

  对于用户的疑问,WPS官微连夜发布公告解释称,在细致审查后,深感之前版本的表述为用户造成了困扰。

  WPS方面还称,已经更新了《WPS 隐私政策》,去除了容易引起误解的表述,并确保其内容与其实际操作严格对应。

  同时还声明,所有用户文档不会被用于任何 AI 训练目的,也不会在未经用户同意的情况下用于任何场景。

  为进一步加强用户信任,WPS还宣布将定期进行隐私政策的审查,并通过第三方独立机构进行合规性审核。

  但是很多网友对此回应却并不买账,也有网友认为官方致歉难以让用户信服,有网友表示,“问题来了,有着大量的资源无法使用,自己又没有能力获取外部资源,它能守身如玉吗?”还有网友质疑,信息脱敏后就不是个人信息的范畴了吗?

  

  网友微博评论截图

  针对网友提出的“脱敏”后信息的归属问题,北京交通大学法学院副教授蔡曦蕾向未来网记者表示,根据我国的法律,关于脱敏后个人数据的归属并没有明确规定。然而,在实践中,通常认为脱敏后的数据所有权归属于企业。“脱敏”这个词在相关的法律法规、规范、标准中通常作为保护数据安全的技术手段或技术措施出现,结合《中华人民共和国个人信息保护法》,主要有“匿名化”和“去标识化”两种方式。

  蔡曦蕾解释道,“匿名化”的个人信息是经过处理无法识别特定自然人且不能再行复原的信息,不再属于个人信息,不受个人信息保护的相关原则及安全保障要求所约束;“去标识化”后的信息因其仍可能结合其他信息识别或关联到特定自然人,仍属于个人信息的范畴,其中可能会有危害个人隐私的内容,“去标识化”后的信息应受《中华人民共和国个人信息保护法》、《中华人民共和国网络安全法》、《中华人民共和国民法典》等中关于个人信息保护条款的约束。

  “信任危机”早有端倪

  事实上,这并不是金山办公WPS首次陷入用户个人隐私保护质疑。

  2022年7月11日,有网友在社交媒体爆料称,“WPS似乎有某种敏感词和谐功能,除了保存在云盘上的文件,本地文件也会被锁死”。根据部分网友反馈的图片,不能打开的文件提示弹窗为“文件已被禁止访问”,原因是“可能包含违禁内容。已停止访问”。

  当日下午,WPS官方账号作出回应,表示是这位用户分享的在线文档链接涉嫌违规,因此WPS依法禁止了他人访问该链接,而之前关于“WPS删除用户本地文件”的说法是谣传。

  对上述问题,金山办公虽都给予了回应,但公众似乎并不买账,多家媒体暗指其回应“混淆视听”,对于大众所关心的隐私问题,以及当事人无法打开文档等问题,金山办公并未给出正面明确的答复。

  2020年9月,广东省通信管理局披露的一批存在侵害用户权益问题的App中就有WPS Office,WPS Office 12.6.1版本涉及征得用户同意前就开始收集个人信息或打开可收集个人信息的权限等多个问题。

  资料显示,金山办公的产品体系,月活跃设备的数量接近6亿,其中WPS的PC版和移动版占比都在一半左右。海量的信息与隐私数据存储在金山办公,背后的审核合规性、隐私安全性等问题不容小觑。

  对此,北京市京师律师事务所合伙人、律师钟兰安接受未来网记者采访时表示,即便互联网企业已充分告知用户,对用户上传的信息进行收集,并且明示了用途、途径、使用范围、是否牟利等,但在脱敏过程中存在不当或脱敏泄露用户的个人信息,涉嫌侵害用户隐私,存在违法行为。因此,即便告知用户也不能成为企业的免责事由。

  公测前股东“提桶跑路”

  今年4月,金山办公推出了类ChatGPT式应用WPS AI,定位为大语言模型应用方,并同时锚定AIGC(内容创作)、Copilot(智慧助手)、Insight(知识洞察)三个战略方向发展。

  据媒体报道,在2023年上半年推出了新的WPS Office春季版本后,金山办公研发团队几乎全部投入到AI中,有三分之二的人员都在做AI研发。

  随着AI概念的加持,金山办公的股价与市值也随之上涨。今年6月,曾一度冲高至529.77元/股,刷新历史纪录,市值超2400亿元。

  据最新财报显示,金山办公在第三季度实现营业收入约为10.982亿元,同比增长9.4%。归属于母公司所有者净利润约为2.94亿元,同比增长0.18%;归属于母公司所有者扣除非经常性损益净利润2.843亿元,同比增长13.36%。

  硬币的另一面,一些大股东却选择了高位减持。

  7月21日,金山办公发布公告称,控股股东Kingsoft WPS Corporation Limited(金山办公应用软件有限公司,下文简称:WPS香港)、持股5%以上股东天津奇文五维企业管理咨询合伙企业(有限合伙)以及天津奇文一维企业管理咨询合伙企业(有限合伙)等8个持股5%以下股东(后二者合称:奇文N维)已通过询价转让、大宗交易、集中竞价的方式累计减持公司约2193.65万股,占公司目前总股本的4.73%。其中,奇文N维合计减持比例接近4%。

  信息显示,天津奇文五维企业管理咨询合伙企业(有限合伙)的实际控制人是北京金山奇文企业管理咨询有限责任公司(下文简称:金山奇文),而金山奇文的法人代表正是小米集团创始人雷军。

  对于股东减持,10月13日,金山办公在互动平台表示,公司大股东减持是出于面对人工智能的新机遇新挑战、做好资金储备的考虑,目前未有下一步减持计划。

  此时被曝光涉及用户个人信息被使用和“隐私政策”等问题,似乎一定程度上也显示出这款产品仍需“打磨”。

  专家:数据的质量对模型智能水平影响超60%合法来源是关键

  2023年8月15日起施行的《生成式人工智能服务管理暂行办法》明确了训练数据处理活动和数据标注等要求。其中第七条生成式人工智能服务提供者(以下称提供者)应当依法开展预训练、优化训练等训练数据处理活动,规定须遵守使用具有合法来源的数据和基础模型;涉及知识产权的,不得侵害他人依法享有的知识产权;涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形。

  清华大学新闻学院元宇宙文化实验室主任、教授沈阳表示,具有AI大模型的公司使用用户提交的数据来进行AI训练,需要非常慎重。首先脱敏数据是不是真正脱敏无从得知。其次是一旦使用不可撤销,大模型授权把用户的数据作为语料提供给AI大模型来学习,将不可逆。“一方面是合法取得用户的授权使用,另外一方面要把可撤销权还给用户。”沈阳表示。

  除个人隐私泄漏外,沈阳还表示担忧,如果用户上传的文件属于在细分领域中应用的行业知识或专著,AI大模型通过学习并将信息提供给了他人,造成引用或雷同等学术伦理问题,导致用户在发表前便已经失去知识产权。

  钟兰安也表示,用户未发表的论文等文件一旦作为AI学习的语料,造成大面积的引用或雷同,则构成了对权利人的著作权的侵犯,侵害了他人的知识产权。根据我国《著作权法》规定,我国公民的著作权自作品创作完成之日起自动产生,不论其是否发表。

  此外,沈阳坦言,用作训练AI的语料对于质量的要求也相当高。并不是任何信息都可以用作训练AI,普通用户的上传语料是否真正符合AI学习的标准还有待考究。事实上,数据的质量对模型智能水平影响最高,差不多要超过60%。只有高质量的语料才是AI大模型训练的主要来源。

  对此,未来网向金山办公方面致函,截至发稿并未收到回复,未来网将持续关注。

有问题请联系 767871486@qq.com 商务合作广告联系 QQ:767871486
www.chaguwang.cn 查股网