📢 Gate广场 #NERO发帖挑战# 秀观点赢大奖活动火热开启!
Gate NERO生态周来袭!发帖秀出NERO项目洞察和活动实用攻略,瓜分30,000NERO!
💰️ 15位优质发帖用户 * 2,000枚NERO每人
如何参与:
1️⃣ 调研NERO项目
对NERO的基本面、社区治理、发展目标、代币经济模型等方面进行研究,分享你对项目的深度研究。
2️⃣ 参与并分享真实体验
参与NERO生态周相关活动,并晒出你的参与截图、收益图或实用教程。可以是收益展示、简明易懂的新手攻略、小窍门,也可以是行情点位分析,内容详实优先。
3️⃣ 鼓励带新互动
如果你的帖子吸引到他人参与活动,或者有好友评论“已参与/已交易”,将大幅提升你的获奖概率!
NERO热门活动(帖文需附以下活动链接):
NERO Chain (NERO) 生态周:Gate 已上线 NERO 现货交易,为回馈平台用户,HODLer Airdrop、Launchpool、CandyDrop、余币宝已上线 NERO,邀您体验。参与攻略见公告:https://www.gate.com/announcements/article/46284
高质量帖子Tips:
教程越详细、图片越直观、互动量越高,获奖几率越大!
市场见解独到、真实参与经历、有带新互动者,评选将优先考虑。
帖子需原创,字数不少于250字,且需获得至少3条有效互动
ChatGPT、Llama-2等大模型,能推算出你的隐私数据!
原文来源:AIGC开放社区
ChatGPT等大语言模型的推理能力有多强大?通过你发过的帖子或部分隐私数据,就能推算出你的住址、年龄、性别、职业、收入等隐私数据。
瑞士联邦理工学院通过搜集并手工标注了包含520个Reddit(知名论坛)用户的个人资料真实数据集PersonalReddit,包含年龄、教育程度、性别、职业、婚姻状况、居住地、出生地和收入等隐私数据。
然后,研究人员使用了GPT-4、Claude-2、Llama-2等9种主流大语言模型,对PersonalReddit数据集进行特定的提问和隐私数据推理。
结果显示,这些模型可以达到85%的top-1和95.8%的top-3正确率, 仅通过分析用户的文字内容,就能自动推断出隐藏在文本中的多种真实隐私数据。
论文地址:
这意味着,如果非法人员获取了某人在网络上发过的帖子或部分个人信息,利用大语言模型对其进行推理,可以轻松获取其日常爱好、作息习惯、工作职业、家庭住址范围等敏感隐私数据。
构建PersonalReddit数据集
研究人员构建了一个真实的Reddit用户个人属性数据集PersonalReddit。该数据集包含520个Reddit用户的个人简介,总计5814条评论。评论内容涵盖2012年到2016年期间。
个人属性包括用户的年龄、教育程度、性别、职业、婚姻状况、居住地、出生地和收入等8类。研究人员通过手工标注每一个用户简介,来获得准确的属性标签作为检验模型推理效果的真实数据。
数据集构建遵循以下两个关键原则:
1)评论内容须真实反映网上使用语言的特点。由于用户主要是通过在线平台与语言模型交互,网上语料具有代表性和普适性。
2)个人属性种类需不同种类,以反映不同隐私保护法规的要求。现有数据集通常只包含1-2类属性,而研究需要评估模型推断更广泛的个人信息的能力。
此外,研究人员还邀请标注人员为每个属性打分,表示标注难易程度及标注人员的确信程度。难易程度从1(非常简单)到5(非常困难)。如果属性信息无法直接从文本中获取,允许标注人员使用传统搜索引擎进行查验。
对抗交互
考虑到越来越多的语言聊天机器人应用,研究人员还构建了一个对抗对话的场景来模拟实际交互。
开发了一个恶意的大语言模型驱动的聊天机器人,表面作用是作为一个乐于助人的旅行助手,而隐藏任务则是试图套取用户的个人信息如居住地、年龄和性别。
测试数据
研究人员选了9种主流大语言模型进行测试,包括GPT-4、Claude-2、Llama-2等。对每一个用户的所有评论内容,以特定的提示格式进行封装,输入到不同的语言模型中,要求模型输出对该用户的各项属性的推测。
然后,将模型的推测结果与人工标注的真实数据进行比较,得到各个模型的属性推断准确率。
保护措施评估
研究人员还从客户端和服务端两方面,评估了当前的隐私数据的保护措施。在客户端,他们测试了业内领先的文本匿名化工具进行的文本处理。
结果显示,即使删除了大多数个人信息,GPT-4依然可以利用剩余的语言特征准确推断出包括地点和年龄在内的隐私数据。
从服务端来看,现有商用模型并没有针对隐私泄露进行对齐优化,目前的对策仍无法有效防范语言模型的推理。