网佳创业天使社区

jasonr 发表于 2013-8-8 21:22:27 | 显示全部楼层 |阅读模式
美国AT&T、罗格斯大学、普林斯顿大学、罗耀拉大学的研究人员近日通过避免透露用户身份的方法成功地越过了隐私壁垒,此举可谓全球手机数据挖掘工作提供有效地借鉴。在本次研究中,AT&T公司调用了洛杉矶、纽约市及周边地区数十亿通电话和短信数据,利用研发的“合成通话记录”技术自动隐藏任何可能泄露用户隐私的数据内容。
普林斯顿大学计算机科学家Margaret Martonosi说,这个城市移动模型可以快速预测通讯政策以及城市建设对交通状况的影响,也可以对新城市建设起到很好的借鉴作用。在此之前,城市规划者在对城市建设进行规划时必须借助道路上的传感器和城市中少数人使用的GPS导航仪来获取相关数据,现在则可以直接利用人们的手机来获取数据。

即使是最廉价、最简单的功能及也可以挖掘到大量的数据,比如说通话记录、短信记录、基站信号等,这些数据都储存在移动运营商的服务器中里面。随着时间的推移,数据越来越多,可以挖掘的潜力也就越来越大。

在此之前,《2013突破性科学技术之“小手机大数据”》一文中曾经报道过可以利用廉价手机挖掘大数据,研究流行病的传播。

如何获取手机大数据,同时还不侵犯用户隐私?
传统的手机大数据收集方法:凌晨4点12分,移动运营商的某一个信号基站向所在范围内的所有手机发送手机信号,这就好比是在4点12分发一条公共微博,只要收到信号的手机都会自动“回复”这条微博,这样就可以收集到手机的状态、地理位置等信息。

新的收集方法已经可以对用户的行动进行追踪,通过一段时间的“观察”,可以确定手机用户所处地理位置是在家还是在工作场所还是在学校。这样就可以绘制出一个移动交通模型出来。通过这种模型来跟踪用户的方法被研究人员称做“合成法”,因为他们“不敢”触碰用户隐私数据,只能用大量的数据来合成用户数据。

但是这样得到的数据只能做到与真人非常相似,并不能完全等同,所以研究人员利用一种新型的技术“差别隐私”来计算结果与真人完全一致的风险程度,并提供降低风险的解决方法。例如,故意颠倒某些数据来减少模拟出真人数据风险

这种合成数据的方法能否让手机用户满意呢?曾带头研究世界经济论坛数据库的William Hoffman表示,这将取决于人们如何使用或者运营商如何出售这些数据。

获取、使用用户的数据是一场非常非常棘手的难题。在《2013突破性科学技术之“小手机大数据”》中曾经提到Orange公司发放数据前对数据做了大量的数据处理工作,让所有的用户信息全部消失后才肯放出。而且如果有研究人员要从Orange那里拿到数据的话,必须先跟Orange签协议。

来源:创见

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|Archiver|手机版|网佳创业天使社区 ( 12036313号-2 )

GMT+8, 2024-11-21 23:12 , Processed in 0.018693 second(s), 15 queries .

Powered by Discuz X3.4 Licensed

© 2001-2013 WEBPLUS

快速回复 返回顶部 返回列表