你是不是有过这样的疑惑:刚跟朋友聊完理财、美妆、买房、贷款等日常话题,怎么就收到包括抖音、腾讯新闻甚至一些视频网站推送的与聊天内容相关的广告?
对于个人隐私,人们从未如当下这般焦虑。今年的“3&Middot;15晚会&Rdquo;曝光了智联招聘、前程无忧、猎聘网等由于缺乏管理,大量个人简历泄露,被倒卖形成黑色产业。此外,内存优化大师、超强清理大师、手机管家PRo打着清理内存的名义,却通过技术手段不断获取手机中的信息,包括应用列表、定位信息、通讯录等。
近期,证券时报记者深入多个数据交易千人QQ群发现,各行各业的用户隐私数据被肆意贩卖,触目惊心。不时有人在群里喊单,“出一手GM(股民)、WD(网贷)、BJ(保健)信息,拼多多、淘宝、京东一手网购数据,需要数据的联系我&hellIP;&hellIP;&Rdquo;这些数据按照行业划分被明码标价。甚至还有采集个人信息的系统展示,号称可以采集全国老板的私人联系方式。还有五花八门爬取数据的软件,“爬&Rdquo;上网站,“嵌&Rdquo;入app,“铲&Rdquo;下数据。
整个数据交易过程中,内鬼、黑客、爬虫软件开发商、清洗者、加工者、料商、买家等寄生于此,催生出一个“年产值&Rdquo;上千亿的数据黑市。
app权限申请泛滥
2020年网飞出品的纪录片《监视资本主义:智能陷阱》中,形象地向人们展示了这样一幅场景:社交软件后台“三名工作人员&Rdquo;正在紧张地分析眼前这个年轻人,他在每张图片下停留多长时间,什么样的情感更能让人产生共鸣,什么样的广告会吸引他点开。这三个人一个叫停留目标,根据停留的时间帮你选择下一个推送内容,让你一直滑动屏幕;一个叫增长目标,让你尽可能多地邀请你的朋友加入增加社交依赖;一个叫广告目标,确保你在对某物感兴趣时精准为你送上一条下单链接。
这一切行为的背后就是所谓的算法模型,精准算法的背后正是依托海量数据作为支撑,将人数据化。
那么,这些数据从何而来?
获取权限,是大小商家通过app或者小程序收集用户隐私数据的第一步。当你在安装一款app时,上万字的用户协议,呈现在你巴掌大的手机屏幕上,你会逐字看还是快速按下“同意&Rdquo;?“不同意&Rdquo;很可能导致app退出无法使用。
app越界索权的现象已是不争的事实。以美图秀秀为例,实难想象,一款P图软件要获取一个人这么多信息,包括搜索记录、浏览记录,甚至是日历、地理位置。仔细阅读美图秀秀个人信息保护政策发现,若将美图秀秀内容分享至第三方平台时,还会读取用户的应用列表信息。美图秀秀还会向游戏合作伙伴提供身份证号信息,甚至还会向合作伙伴共享用户的付款信息。
条款中还声明,基于现代移动互联网产品互联互通的特性,产品可能接入美图关联公司或外部合作伙伴上线的其他产品或功能,比如在使用钱包功能时,美图可能从第三方获取用户的手机号、授信额度、还款金额、放款成功状态、逾期状态等。
这意味着,只要用户使用美图软件并授权,美图秀秀不仅可从自家app上获取用户信息,还会从第三方平台上进一步获取用户更为详细具体的信息。
“这种行为其实十分普遍,国内用户可能对个人信息的保护意识并没有很强烈,这给了企业很大的选择度,行业称之为‘占坑&Rsquo;。有些数据现在不需要,但并不代表以后不需要,在获取用户授权后抓取到的用户信息当然越多越好。&Rdquo;某金融科技公司大数据风控架构师肖强称。
证券时报记者从衣、食、住、行、社交、娱乐、理财等方面对25款app相关权限获取进行统计,发现和用户社交圈紧密相关的通讯录权限已经成为app权限标配。除此之外,这些app还会通过一些特定功能读取通讯地址、手机存储、照片、甚至记录面部识别、日历还有通话记录,手机app权限申请已经到了泛滥成灾的地步。
稍微值得欣慰的是,app过度申请权限收集数据正在被加强监管。
3月22日,国家网信办、工信部、公安部、国家市场监督管理总局联合印发《常见类型移动互联网应用程序必要个人信息范围规定》,明确了地图导航、即时通信、网络购物等39类常见必要个人信息范围,要求运营商不得因用户不同意提供非必要个人信息,而拒绝用户使用app基本功能服务。
不过,肖强向记者表示,“可能大家都知道app在收集个人隐私数据,但除此之外,用户的数据还可能同时被隐藏在app里的第三方SDK(软件开发工具包)收集。&Rdquo;
SDK收集的用户信息可以详细到什么程度?北京网贷协会数据安全专家韩洪慧表示,“SDK一旦嵌入,如果你注册登录了这个app,并默认授权,所有的行为数据都能记录,它会在不知不觉中爬取手机通讯录、聊天记录、银行账号的密码口令、短信、通讯录、位置信息等。&Rdquo;
因此,用户授权app采集个人信息,但往往并不知道自己的个人信息在何时、以何种方式被共享给了第三方SDK。很多app“隐私政策&Rdquo;的内容关于共享的相关表述中,最常见的是“可能会将用户的个人信息分享给第三方&Rdquo;。但是,几乎没有app会在隐私政策中详细列举所谓的“第三方&Rdquo;究竟包括哪些。
对于个人信息安全的忧虑,折射出的是用户日益敏感的神经,更是用户缺乏对个人数据的知情权和主动权的表现。SDK对于用户来说,犹如一颗隐藏的“定时炸弹&Rdquo;,危险性不言而喻。
SDK提供商泄露和滥用用户信息非常隐蔽,甚至成为了泄露用户隐私的源头之一。
谁窃取了用户隐私?
数腾科技一位销售经理向记者表示,他们有自己特殊渠道去拿取一些数据,其中最为主要的渠道就是通过第三方SDK获取数据。
“这个渠道拿到的数据会更精确,类似漏斗模式,会把数据按照需求进行筛选。比如说网贷行业的用户数据,用户登录XX普惠,使用此款app就要授权,一旦授权SDK就会收集这个用户的所有登录痕迹。其他消费金融公司如果也使用了这家SDK软件开发包,同样也能共享。&Rdquo;
记者进一步追问具体是跟哪家SDK友商合作时,该经理以“敏感信息&Rdquo;为由拒绝透露。
无法忽视的是,用户个人信息通过网络倒卖非常猖獗。近期记者潜入多个千人QQ群,发现群里不时有人喊单出售来自各行各业的公民个人信息。
记者以买家身份接触了一位QQ名为“空城&Rdquo;的卖家,并提出先测试数据真实性为由,要求对方提供股民个人信息数据。
为证明自己的数据来源,“空城&Rdquo;给记者提供了一张数据来源截图,收集的股民个人信息来自各大证券公司app,广发证券、中投证券、国泰君安等都中招。
正如“空城&Rdquo;所说,QQ群里的确有部分人在卖数据的时候打着“公司内部信息&Rdquo;旗号公开倒卖数据。“内鬼&Rdquo;监守自盗是个人信息流入黑产的重要渠道之一。可以接触到大量个人信息的职业,并非高门槛,岗位职级也不需要太高,泄露源可能来自各层级。
2020年,公安机关打击利用工作之便窃取、泄露公民个人信息的违法犯罪行为,各行业内部都有涉案人员,查获重点行业内部涉案人员500余名,而这不过是冰山一角。
除了“内鬼&Rdquo;泄密,还有通过各种技术手段窃取公民隐私。
在调查采访过程中,黑市数据交易市场非常活跃且采集数据软件五花八门,其中一款名为汇容客的app,号称“全网最全大数据获客软件&Rdquo;。其销售经理向记者称,“我们这款软件是全自动采集,只要搜索关键词,就能在各大网站、三大地图、三大运营商搜索出你想要的客户资源和群体,不仅是获客功能,我们还能提供营销素材,带货视频等,每档功能都会对应不同价格。&Rdquo;
当记者问及跟哪三大地图合作时,该销售经理称主要是腾讯地图、高德地图以及百度地图,并且是经过授权使用他们的数据接口,并向记者发来跟三大地图运营商盖章的合同协议。
就此记者向百度、腾讯以及高德公司求证是否授权汇容客使用平台用户数据,对方均一致表示不清楚这家公司,也不会将API(数据接口)随意授权。腾讯内部相关人士向记者称,这个章是假的,字体不一样。
为力证此款软件的数据爬取能力,上述销售经理称可以帮忙后台注册后先测试。随后记者下载了此款app,发现这款软件可以按照地理位置、行业、客户类型等进行搜索,然后导出相应的用户数据,并且一键添加微信。
“因为只是体验所以你不会看到客户手机号,这也是我们公司为了维护其他会员权益。我们会跟一些第三方SDK合作,也会跟一些大的互联网公司进行API数据接口对接,我们跟腾讯、百度、华为、阿里、抖音、快手、美团、饿了么都有战略级合作关系,资源高度整合。&Rdquo;该销售经理称。
记者发现汇容客软件上显示数据来源主要为地图数据、工商数据、抖音、快手、阿里巴巴、美团、饿了么、京东互联网巨头。
针对软件所提及的数据来源,证券时报记者向腾讯、阿里、美团、京东等都一一核实,多数均表示并没有将API数据接口跟名为汇容客的第三方共享,仅快手表示不回应。阿里公关进一步称,集团不可能允许该公司通过API接口爬取调用蚂蚁用户信息,目前已经在深入调查此事。
“能从这些网站爬取到用户数据肯定是用了相关一些技术,其实爬虫技术并不神秘,‘爬&Rsquo;上网页,‘铲&Rsquo;下数据,然后再进行加工清洗。这类软件众多,大部分是在全网进行无差别爬取客户资料,后面通过加工进行精准分类。由此还延伸出职业清洗数据和标注的人。&Rdquo;专门编写爬虫代码的阿强