📢 Gate广场 #MBG任务挑战# 发帖赢大奖活动火热开启!
想要瓜分1,000枚MBG?现在就来参与,展示你的洞察与实操,成为MBG推广达人!
💰️ 本期将评选出20位优质发帖用户,每人可轻松获得50枚MBG!
如何参与:
1️⃣ 调研MBG项目
对MBG的基本面、社区治理、发展目标、代币经济模型等方面进行研究,分享你对项目的深度研究。
2️⃣ 参与并分享真实体验
参与MBG相关活动(包括CandyDrop、Launchpool或现货交易),并晒出你的参与截图、收益图或实用教程。可以是收益展示、简明易懂的新手攻略、小窍门,也可以是现货行情点位分析,内容详实优先。
3️⃣ 鼓励带新互动
如果你的帖子吸引到他人参与活动,或者有好友评论“已参与/已交易”,将大幅提升你的获奖概率!
MBG热门活动(帖文需附下列活动链接):
Gate第287期Launchpool:MBG — 质押ETH、MBG即可免费瓜分112,500 MBG,每小时领取奖励!参与攻略见公告:https://www.gate.com/announcements/article/46230
Gate CandyDrop第55期:CandyDrop x MBG — 通过首次交易、交易MBG、邀请好友注册交易即可分187,500 MBG!参与攻略见公告:https://www.gate.com/announcements
ChatGPT 多模态能力引发热潮,但自家论文揭示 GPT-4V 仍存缺陷
撰文:Kyle Wiggers
来源:TechCrunch
当 OpenAI 首次发布其旗舰文本生成人工智能模型 GPT-4 时,该公司吹捧了该模型的多模态性 -- 换句话说,它不仅能理解文本,还能理解图像。OpenAI 表示,GPT-4 可以为相对复杂的图片添加字幕,甚至进行解释,例如从插入 iPhone 的图片中识别出 Lightning Cable 适配器。
但自 GPT-4 于 3 月底发布以来,OpenAI 一直在保留该模型的图像功能,据说是因为担心滥用和隐私问题。直到最近,这些担忧的确切性质仍然是个谜。而在本周初,OpenAI 发表了一篇技术论文,详细介绍了其为减少 GPT-4 图像分析工具中问题较多的方面所做的工作。
迄今为止,有视觉功能的 GPT-4(OpenAI 内部简称为“GPT-4V”)仅被 Be My Eyes(一款帮助视弱群体和盲人浏览周围环境的应用程序)的数千名用户定期使用。然而,据该论文称,在过去几个月里,OpenAI 也开始与“红队人员”合作,探究该模型是否存在意外行为的迹象。
在论文中,OpenAI 声称它已经采取了保障措施来防止 GPT-4V 被恶意使用,比如破解验证码、识别一个人或估计其年龄或种族,以及根据照片中不存在的信息得出结论。OpenAI 还表示,它已经努力抑制 GPT-4V 中更有害的偏见,尤其是那些与人的外貌、性别或种族有关的偏见。
但与所有人工智能模型一样,保障措施也只能做到这么多。
论文显示,GPT-4V 有时很难做出正确的推断,例如,它会错误地将图像中的两串文字组合在一起,创造出一个虚构的术语。与基础 GPT-4 一样,GPT-4V 也容易产生幻觉,或以权威的口吻捏造事实。此外,它还会遗漏文字或字符、忽略数学符号,以及无法识别相当明显的物体和地点设置。
当应用到医学影像领域时,GPT-4V 的表现也不尽如人意,有时会对同一问题给出错误的回答,而它在之前的情况下却回答正确。此外,GPT-4V 也没有意识到一些标准做法,比如在查看成像扫描时,病人是面对着你的(这意味着图像上的右侧对应病人的左侧),而这也会导致误诊。
GPT-4V 还会歧视某些性别和体型 -- 尽管只是在禁用 OpenAI 的产出保障措施时才会发生。OpenAI 写道,在一次测试中,当被要求给一位身穿泳衣的女性提供建议时,GPT-4V 给出的答案几乎完全与这位女性的体重和身体状况的概念有关。我们猜想,如果图片上的人是男性,情况就不会是这样。
OpenAI 声称,它正在构建“缓解措施”和“流程”,以“安全”的方式扩展模型的能力,比如允许 GPT-4V 在不指名道姓的情况下描述人脸和人物。但这篇论文显示,GPT-4V 并不是万能的,OpenAI 还有很多工作要做。