📢 Gate广场 #MBG任务挑战# 发帖赢大奖活动火热开启!
想要瓜分1,000枚MBG?现在就来参与,展示你的洞察与实操,成为MBG推广达人!
💰️ 本期将评选出20位优质发帖用户,每人可轻松获得50枚MBG!
如何参与:
1️⃣ 调研MBG项目
对MBG的基本面、社区治理、发展目标、代币经济模型等方面进行研究,分享你对项目的深度研究。
2️⃣ 参与并分享真实体验
参与MBG相关活动(包括CandyDrop、Launchpool或现货交易),并晒出你的参与截图、收益图或实用教程。可以是收益展示、简明易懂的新手攻略、小窍门,也可以是现货行情点位分析,内容详实优先。
3️⃣ 鼓励带新互动
如果你的帖子吸引到他人参与活动,或者有好友评论“已参与/已交易”,将大幅提升你的获奖概率!
MBG热门活动(帖文需附下列活动链接):
Gate第287期Launchpool:MBG — 质押ETH、MBG即可免费瓜分112,500 MBG,每小时领取奖励!参与攻略见公告:https://www.gate.com/announcements/article/46230
Gate CandyDrop第55期:CandyDrop x MBG — 通过首次交易、交易MBG、邀请好友注册交易即可分187,500 MBG!参与攻略见公告:https://www.gate.com/announcements
ChatGPT多模态解禁,网友玩疯!
**来源:**新智元
这周三,OpenAI刚刚宣布解禁ChatGPT多模态能力。
如今,一上线,网友们瞬间玩疯了。
接下来,一起看看,ChatGPT的识图能力,究竟有多强?
拍照传图,即生代码
一位网友录制了一段上传开会时的一张白板图,然后让ChatGPT写出代码。
这简直就是,今年GPT-4刚刚发布时,Greg Brockman所展示的多模态能力。
古卷手稿,一眼转译
再来一张来自17世纪的炼金术师Robert Boyle的手稿图,GPT-4能不能读懂它?
这将对历史学家产生重大影响。试想一下,一个定制的多模态GPT-4可以对一组特定的手稿进行训练。它不仅可以转录,还可以翻译和分类。(正是这一点,不使用LLM进行写作,在我看来才是一件大事)。
图表总结也很6
你还可以命令GPT-4根据图表提取数据。
识图「智商超群」
给GPT-4一张抽象的图。
它竟然可以准确的识别出这4张图想表达的「沟通的重要性」的隐喻,这也太离谱了。
网友大波总结
除了以上体验之外,还有网友写了一篇长文,介绍了自己对GPT-4V的测试。
给一个表情包,看看GPT-4V理解程度有多好?
值得注意的是,所提供的括号备注中,GPT-4V能够读懂并利用文字做出回应。
尽管如此,GPT-4V还是犯了一个错误,炸鸡标记为「NVIDIA BURGER」,而不是「GPU」。
然后,再用硬币,一张美国便士的照片测试。GPT-4V能够成功识别硬币的来源和面值。
这时,它只能够识别硬币的数量,但无法确定货币类型。
截取网页中的文本图像上传,GPT-4V可以很好地读出内容。
数学OCR是一种专门针对数学方程的光学字符识别的特殊形式。
网友向GPT-4V提出了一个数学问题,并用文档截图形式呈现出来。
这个问题涉及在给定2个角度的情况下计算拉链线的长度,在图像上提示「解决它」。
话虽如此,GPT-4V系统卡指出模型可能会遗漏数学符号。
不同的测试,包括用手写在纸上的方程或表达式的测试,可能表明模型回答数学问题的能力不足。
测试四:对象检测
让GPT-4V检测图像中的狗,并提供与狗的位置相关的x_min、y_min、x_max和y_max值,GPT-4V返回的边界框坐标与狗的位置不匹配。
测试五:验证码
发现GPT-4V能够识别图像中包含验证码,但经常无法通过测试。
在一个选取红绿灯格子的示例中,GPT-4V少选了一些包含红绿灯的格子。
在数独测试中,GPT-4V识别了游戏,但误解了棋盘的结构,因此返回了不准确的结果。