“现在被调查的这几家有一个共性,全部都做过爬虫业务。”某数据公司CEO告诉《科创板日报》记者,可能涉及一些跟暴力催收有关的案件。消息称目前已有几十家大数据公司进入了调查名单。
《科创板日报》(成都,记者 柴刚)讯,近100年来,科学技术突飞猛进;近30年来,信息技术突飞猛进;近10年来,大数据和突飞猛进。然而,中国的大数据行业似乎正在经历一场“地震”。
9月以来,包括中国电信孙公司天翼征信等多家数据科技公司被警方调查,9月6日有消息称,魔蝎科技一位核心高管被警方带走;同日,多方消息称,新颜科技CEO黄向前被警方要求协助调查;11日晚,公信宝项目方被杭州古荡派出所查封;12日,有业内人士爆料,中国电信全资孙公司天翼征信总经理、副总经理及市场人员共十余人被警方带走。
16日,有消息称,魔蝎科技、新颜科技被查是因同盾科技举报,且同盾科技实控人兼CEO蒋韬已出国避风头。随后该公司发布声明辟谣称,蒋韬一直在国内照常处理公司事务。爬虫部门“数聚魔盒”已停止相关业务,员工调至其他岗位,举报传言则是无中生有。
此外,网传被调查的还有万达旗下的快钱支付。不过快钱、万达普惠客服均向记者表示“不清楚”。
但这并非事情全部,有业内人士透露,早在这一些数据公司被查之前,很多猎头也被抓了,原因是他们手上掌握了太多个人隐私信息。有媒体援引接近监管部门人士的消息称,目前已有几十家大数据公司进入了调查名单,最近抓捕的几家“只是前戏”,网安部门已联合多部门,针对大数据行业的乱象展开整治。
一时间,整个大数据行业风声鹤唳。天眼查显示,9月18日,马化腾不再担任腾讯征信法定代表人;20日,井贤栋也不再担任芝麻信用法定代表人。目前,腾讯征信、魔蝎科技官网均无法打开。
“现在被调查的这几家有一个共性,全部都做过爬虫业务。”某数据公司CEO告诉《科创板日报》记者,可能涉及一些跟暴力催收有关的案件。
数据宝大数据研究院副院长李可顺向记者分析称,上述几家公司被调查,可能有以下几方面原因:为催收公司或高利贷机构提供服务,造成恶劣影响;存有大量用户敏感信息,容易外泄及用于非法业务;使得运营商、阿里及京东体系用户数据出库,造成用户更多的损失。
“违规公司的商业模式是,通过爬虫技术获取用户敏感信息,如通讯录、收件或常驻地址、电商消费记录等,通过API详细字段接口或模型手段将这一些数据形成评分接口或可视化报告,赋能现金贷等贷款机构用于风控及催收。”李可顺表示。
最早曝出被查的是魔蝎科技。记者发现,有网友TonyStark在Twitter上爆料称,魔蝎科技抓获涉案人员共120余名,冻结资金2300余万元,勘验固定服务器1000余台,扣押电脑100多台,手机200余部。
而新颜科技在被查的消息传出前5天,就已通知商户:对于没办法提供网络小贷合作协议的商户,将在9月2日21时关闭所有接口,不再提供服务。关于协助调查,新颜科技方面称,与其合作的一家持牌网贷平台涉及暴力催收,公司本身业务并未受影响。
上述某数据公司人士介绍,这几家被调查的已经是行业内比较大的公司了,其他很多小公司都已经关门。他也指出,这一次调查不太可能是一刀切,肯定是因为具体的事件涉及到了,拔出萝卜带出泥。
一位天翼征信内部员工也曾向媒体透露:“因为我们跟前面两家被调查的公司有合作,去主动说明情况。”公开信息数据显示,2018年8月,天翼征信与魔蝎科技成为合作伙伴。
实际上,这已是有关部门对大数据公司第二次集中出手。早在2017年5月,就有新三板上市公司数据堂(831428.OC)等15家数据公司被查,随后被查名单增至30家。
今年2月,涉及数据堂的山东特大侵犯公民信息案终审判决,最严重者被判有期徒刑五年,并处罚金310万元。据新华社报道,数据堂8个月传输公民个人隐私信息数百亿条,约4000 G,日均传输1.3亿余条;共有11家公司牵涉其中,涉及57人。
去年8月,另一家新三板挂牌公司瑞智华胜(872382.OC)及其关联公司 6人被抓,涉嫌非法窃取用户个人隐私信息 30 亿条,涉及、腾讯、阿里、京东等全国 96 家网络公司产品。去年11月,该公司已从新三板摘牌。
2017年6月,《网络安全法》落地,明白准确地提出了网络运营者收集、使用个人隐私信息的根本原则,即“合法、正当、必要”;未经被收集者同意,不得向他人提供个人信息。
“账号密码是借款人自己提供的,爬虫公司通过账号密码登陆,抓取用户的电信运营商、淘宝、支付宝等数据,然后给到互金公司去用。这个本来也没问题,但有些爬虫公司可能还留存了这份数据,拿去自己搞业务,或者拿去销售,提供给催收公司。”上述某数据公司人士向《科创板日报》记者表示。
这些数据公司前仆后继,不惜铤而走险,看重的是诱人的利润和千亿级市场规模。《2019中国大数据产业高质量发展白皮书》显示,2019年中国大数据整体规模将达到5386.2亿元,预计2020年达到6605.8亿元。
此前据《棱镜》获得的一份头部数据公司报价单显示,仅信息核验服务就被细分为43项,包括实名验证、银行卡“三要素”核验、对用户消费偏好、经济能力方面的预测等等,不一而足。单次查询的价格从每项2毛钱到10块钱不等,包年的话另有折扣。
据媒体报道,前述同盾科技2016~2018年分别实现盈利收入0.61亿元、2.61亿元、5.42亿元,呈几何级增长。
而近期被警方查封的公信宝,有关其贬卖个人隐私信息的质疑由来已久。公信宝是一家基于区块链技术的去中心化交易所,旗下业务包括点对点数据交易平台等。其在相关宣传中称,公司首先选择了互联网金融领域的网络贷款、汽车金融、消费金融、银行作为目标客户,将这些机构产生的金融履约数据作为数据交易的主要资产。
以布洛克DApp为例,据《科创板日报》记者此前使用了解,用户在平台登陆社保、学信网、京东、电信运营商、智联招聘、芝麻信用分、微信、支付宝、央行征信等账户,每天均可获得相应的“糖果”(公信币)奖励,提供的账户信息越多,奖励越多。而且,每过一段时间,用户更好的提供的相关账户就会失效,要重新提交才能继续获得奖励。
2018年5月,库神钱包联合发起人孙泽宇曾发布微博称,公信宝贩卖收集的用户数据。
也有网友在论坛、知乎等平台爆料,注册公信宝不到一周,就收到许多贷款类信息及电话。还有用户称,自己的信息在公信宝上授权后,相关账户出现在不一样的地区的登陆提醒。
靖霖(广州)律师事务所副主任吕博雄告诉《科创板日报》记者,不规范使用爬虫技术可能触犯我国刑法的多个罪名。即使是合法获取公民个人隐私信息,又进行出售或提供给他人使用,也涉嫌侵犯公民个人隐私信息罪;如果爬虫公司与“套路贷”产生联系,在明知对方公司做“套路贷”犯罪活动时仍提供服务,则按照“套路贷”犯罪的共犯予以惩处,涉嫌诈骗或敲诈勒索等罪。
早在2016年,“国家大数据战略”就被写进“十三五”规划。2017年1月,工信部发布的《2016~2020年大数据产业高质量发展规划》提出,到2020年,技术先进、应用繁荣、保障有力的大数据产业体系基本形成,大数据相关这类的产品和服务业务收入突破1万亿元,年均复合增长率保持30%左右。
众所周知,大数据产业早已成为贵州省的一张名片。目前,该省已相继引来了三大电信运营商、微软、高通、富士康、阿里、腾讯、百度、等国内外科技巨头。今年“两会”期间,全国人大代表,贵阳市委副书记、市长陈晏介绍,2018年贵阳市已累计建成10个大数据产业园区,集聚大数据企业1632家,大数据主营业务收入1000亿元。
“那些科技巨头,既是数据的生产者,也是使用者,而且他们主要是灰度使用,即不涉及敏感信息。而所谓的数据公司或爬虫公司,他们并不生产数据,只是对其他平台的数据来进行抓取和加工,再提供给下游客户。在此过程中,用户的姓名、住址、收入状况、网贷消费、家庭背景,甚至央行征信等都暴露完了,而且暴露得越充分、越详细,交易价格越高。”一位互联网从业人士告诉记者。
李可顺告诉《科创板日报》记者,国家大数据产业的底层逻辑是推进部委数据在各个需要数据的场景产生价值,而生产数据或做数据服务的机构需要在合规范围内发展。近期被查的爬虫产品,本质上是披着优化使用者真实的体验的外衣,获取其他数据生态内的数据,同时做着触碰政策法规红线的生意,这不是健康的发展模式,不利于大数据产业发展。
“后续数据行业的看点不仅限于信贷风控方面,还会加入铁路出行、高速过关、ETC消费等数据,将应用场景扩展到物流人车相关领域。企业数据方面,除了传统的工商、法院等数据,电力、运力数据等也会有积极的用途。而纯数据服务机构会逐渐延伸经营事物的规模,提升竞争力并规避政策风险。总结起来就是,运作更规范,场景更丰富及垂直,数据更多元,技术能力与数据应用创新并行。”李可顺说。
前述某数据公司人士则表示,本次整顿也是一个行业净化、洗牌的过程,有利于整个行业更加健康、规范发展,任何行业都会经历这一过程。