来源 :界面新闻2023-03-13
拓尔思近期披露投资者关系活动记录表显示,目前公司积累了1300亿条基础数据,日均增加1亿条,以上数据全部来源于互联网公开数据。拓尔思数据中心目前拥有3大专业IDC机房,上千台高端机架式服务器完成对互联网公开数据的7*24小时不间断采集,同时租用了阿里云及微软云的服务器实现全球数据采集。数据中心监测的采集站点包括80万余家新闻网站、3000余个资讯APP、1200余家国内报刊、20余个第三方平台、79语种50万余个其他站点。每日数据量高达1亿多条,几乎涵盖了全量的微博新增数据,网站覆盖度及数据存储量均明显高于业内水平。