Facebook独家数据,支持研究:社交媒体社会影响力有多大?

2019-04-30 23:29发布

Facebook宣布,第一批能够访问受隐私保护的Facebook数据的研究人员产生。这些具有特殊“权力”的研究人士将成为首批最接近Facebook网民真实数据的科学家。因为全球数以亿计网民的小秘密有可能被他们带进数据实验室。

Facebook的选择无疑是正确的,企业需要与非营利性或者研究性组织合作,共同研究新科技如何影响人类。

Facebook希望这一举措能够加深公众对社交媒体在公众参与政府换届选举方面的作用的理解,并帮助Facebook和其他公司改进他们的产品和管理。在过去两年中,Facebook在监控和采取行动防止滥用平台方面取得了重大进展。Facebook知道自己不能单独完成这项工作,而且所取得的大部分进展都得益于外部合作伙伴的大力支持,包括政府,协会与社团,公益组织,和学术界人士。随着Facebook不断提高应对当前威胁和预测新威胁的能力,这一举措将加深Facebook与世界各地大学的合作。

为了支持这项工作,在过去几个月中,Facebook已经开始构建首个数据共享基础架构,以便以安全的方式为研究人员提供访问Facebook数据的权限,从而保护人们的隐私。Facebook咨询了一些国家领先的外部隐私顾问和Social Science One隐私委员会,以获取有关如何最好地确保共享数据集隐私的建议,并严格测试Facebook的基础设施以确保其安全。其中一些步骤包括构建一个从数据集中删除个人身份信息的流程,并且只允许研究人员通过利用双因素身份验证和VPN的安全门户访问数据集。除了构建自定义基础架构,Facebook还测试差异隐私的应用,这会在原始数据集中增加统计噪声,以确保在不影响结果可靠性的情况下无法重新识别个人。它还限制了研究人员可以运行的查询数量,这可以确保不会反复查询系统以规避隐私措施。相信通过让Facebook安全可靠地向研究社区解锁更多数据集,这项测试将带来其他好处。

既然Facebook的数据泄露捅了马蜂窝,自然有许多利益相关者都渴望尽快提供数据。Facebook表示正在推进这一重要举措,但Facebook也致力于采取必要的时间来整合最高的隐私保护并构建以安全方式提供数据的数据基础架构。再这些措施保护,选定的研究人员将获得以下数据:

CrowdTangle: CrowdTangle允许研究人员在社交媒体平台上跟踪新闻项目和其他公共帖子的受欢迎程度。CrowdTangle API将允许研究人员访问公共Facebook和Instagram数据,其中包括来自公共页面,公共组和经过验证的配置文件的帖子。从今天开始,Facebook提供在最初一轮授权中选择的研究人员,以及社会科学一委员会成员,访问此API。

广告图书馆API:广告图书馆API提供有关美国,英国,巴西,印度,乌克兰,以色列和欧盟的Facebook政治或问题相关广告的数据。从今天开始,研究人员可以访问API。Facebook和Social Science One也在努力提供有关API的反馈,以帮助其更有用于研究目的。

Facebook URL数据集: URL数据集将被聚合和匿名,以防止研究人员识别任何个人Facebook用户。该数据集包括已经在Facebook上由至少100个独立的Facebook用户共享的URL,这些用户平均已经使用公共隐私设置发布了URL。此数据集包括URL链接和有关给定URL的总份额的信息,URL中内容的文本摘要,参与统计信息(例如共享URL的顶级国家/地区)以及与Facebook的事实检查评级相关的信息第三方事实核查合作伙伴。有关此数据集中包含内容的更多详细信息,请参阅URL Codebook。在访问此数据集之前,研究人员必须参加在6月份就这些数据和研究工具领导的培训课程。在接下来的几个月中,Facebook将继续探索如何根据对隐私的承诺扩大向研究人员提供的数据范围。

Facebook公司向Social Science One和SSRC组织,以及学术和隐私社区的许多专家,他们为支持这一前所未有的合作伙伴关系所做的辛勤工作和持续投资做出的贡献来致谢。Facebook公司也向领先基金会资助这项研究的承诺致谢,其中包括约翰和劳拉·阿诺德基金会,民主基金,威廉和弗洛拉·休利特基金会,约翰S.和詹姆斯·奈特基金会,查尔斯·科赫基金会,奥米迪亚网络,以及斯隆基金会和儿童投资基金会。

Facebook公司的态度真是史上最好的态度,但是谁让你犯错在先。从大数据中找到社交媒体对当今社会的作用力,影响力是极具现实意义的研究领域,Facebook公司审慎开放数据供全球学者研究的态度与方向是十分正确的,也期待其尽早公布研究结果。

据《亲爱的数据》了解到,包括清华大学、德国哥廷根大学在内的学者,已经纷纷开展“社会科学中大数据的研究方法”,并发表不少前沿论文,日后详细向各位读者解读。

(完)

亲爱的数据

出品:谭婧

美编:陈泓宇

文章来源: https://www.toutiao.com/group/6685643876532748813/