内容分为两个部分,一是“聊得最多的10个对话”,这下面大多是一些指令内容,像“声音小一点”、“打开微信”。另一部分则是“撩得最多的10个对话”,而这里面更多的会涉及一些稍显私密的内容,比如“怎么样才能追到吴亦凡”、“不想上班怎么办”、“我帅吗”。
说实话,后者让身为小爱同学用户的我也觉得不是很舒服。
诚然,雷军发布的这张图是来自于小爱同学产生的大数据,其中也没有透露出个体用户的信息。但小爱同学是一个时时刻刻都放在家里的内容,随时随地都有唤醒的可能,而使用的场景的是复杂多变。小爱同学记录下了与用户较为私密的对话,又作为一条数据纳入了语料库,让人以后在使用小爱同学时,不得不多留出一个心眼。
在使用小爱同学前,每个用户都会收到是否加入“用户体验计划”的提醒,用户一旦参与该计划,也就默认了接受隐私政策里的内容。而隐私政策中,也明确指出了小米会将用户信息(其中可能包含个人信息)用于语音识别、语义判断、文字转音频功能。
从理论上来说,小爱在保证信息安全性的前提下,记录与用户的对话,并没有什么问题。
但关键的是,隐私政策中提到用户信息中可能会包含个人信息。而这并不合理。
用户数据与用户隐私永远是互联网产品的头等大事。有些产品打着大数据的幌子,大肆收集用户个人信息,用于商业用途,而小爱同学记录的数据,暴露出小米离用户隐私这条“安全线”已经很近了。
为什么说小爱同学的隐私政策不合理呢?
问题就在企业收集用户数据,与规避个人信息并不冲突。而小爱同学的隐私政策中明确指出了其手机的用户信息会包含个人信息,完全是流氓条款。
我们先来看看苹果公司是怎么解决这个问题的。2016年6月的全球开发者大会上,苹果公司首次提出了差分隐私技术的概念。差分隐私技术的原理就是对用户的数据进行加密,将加密后的数据上传到服务器上进行收集,根据这些数据,苹果公司只能计算出用户群体的行为模式,却无法解析单条数据中的个体信息。
苹果公司在官方邮件中对这个技术做了专业的解释:
从iOS 10开始,苹果将使用差分隐私技术在不影响个人隐私的前提下帮助发现大批量用户的使用模式。为了掩盖个人身份,差分隐私会像个人使用模式的小样本中注入数学噪音。随着更多的用户呈现出相同的模式,总体模式就会开始显现,这可以用来增强用户体验。
差分隐私技术,也成为了在保证企业在保证用户隐私的前提下,得以顺利进行大数据研究的重要技术。
技术爆发带来了大量新产品,这些新产品的使用机制复杂多样,用户往往在不经意间就出卖了自己的隐私。除了前文提到的AI设备,VR眼睛、基因监测以及各种物联网设备都有泄露用户隐私的可能性。但我们能放弃这些产品吗?李彦宏曾经说过,中国用户对隐私问题没那么敏感,一定程度上愿用隐私换方便和效率。用户购买一款产品时,基于对企业的信任,将隐私信息交给企业,企业及应当对得起用户的信任,否则受损失的不仅是用户,还有企业的公信力。
相当一部分企业已经意识到了这一点。
比如在AI设备出现之前,手机输入法是一直被诟病泄露用户隐私的产品。搜狗输入法在与用户经过多轮的博弈后,也壮士断腕,舍弃了一部分用户数据。搜狗CEO王小川在今年1月的搜狗全球伙伴合作大会上说,“对于用户数据而言,首先要保证在收集后要在一个生态或者一个公司甚至一个产品里使用,而不再通过交换之类的方式‘往外走’。其次是有一些敏感的用户数据,我都不敢收集上来,其实不是我不敢用,我是怕没用好给泄露了。”
小爱同学的“前辈”——亚马逊Echo也曾卷入一桩泄露用户隐私的官司中:俄勒冈州一对夫妻的对话被录制下来发送给了他们的熟人·,而隐私泄漏的原因,竟是Echo接收到了“发送信息”的指令。
鉴于用户隐私问题迟迟得不到妥善解决,欧盟宣布从今年5月25日起,由28个国家的监管机构强制执行《通用数据保护条例》(GDPR)。这个被称为“欧洲最严隐私法”的条例,对包括公司、公共机构、慈善机构都有巨大影响。
在“欧洲最严隐私法”的影响下,苹果、谷歌、推特、微软都修改了自家的隐私政策。
前车之覆,后车之鉴。搜狗和亚马逊都在用户隐私上碰壁,而作为小米同业竞争对手的苹果又在解决用户隐私问题上给出了相当漂亮的答案。雷军确实应该好好考虑下,如何做好用户隐私,起码不要像这次一样,泄露用户跟小爱同学之间的“情话”。
15日深夜删除了这条微博的雷军显然是意识到了,这条微博不恰当的内容。但用户隐私的问题,雷军真的意识到了吗?