📢 Gate广场 #MBG任务挑战# 发帖赢大奖活动火热开启!
想要瓜分1,000枚MBG?现在就来参与,展示你的洞察与实操,成为MBG推广达人!
💰️ 本期将评选出20位优质发帖用户,每人可轻松获得50枚MBG!
如何参与:
1️⃣ 调研MBG项目
对MBG的基本面、社区治理、发展目标、代币经济模型等方面进行研究,分享你对项目的深度研究。
2️⃣ 参与并分享真实体验
参与MBG相关活动(包括CandyDrop、Launchpool或现货交易),并晒出你的参与截图、收益图或实用教程。可以是收益展示、简明易懂的新手攻略、小窍门,也可以是现货行情点位分析,内容详实优先。
3️⃣ 鼓励带新互动
如果你的帖子吸引到他人参与活动,或者有好友评论“已参与/已交易”,将大幅提升你的获奖概率!
MBG热门活动(帖文需附下列活动链接):
Gate第287期Launchpool:MBG — 质押ETH、MBG即可免费瓜分112,500 MBG,每小时领取奖励!参与攻略见公告:https://www.gate.com/announcements/article/46230
Gate CandyDrop第55期:CandyDrop x MBG — 通过首次交易、交易MBG、邀请好友注册交易即可分187,500 MBG!参与攻略见公告:https://www.gate.com/announcements
幻觉处理国内最优!530亿参数Baichuan2推理能力飙升100%,首次开放API商用
原文来源:新智元
百川大模型,昨日全面升级!
就在9月25日,百川智能正式发布了全新升级的530亿参数大模型——Baichuan2-53B。
这一次,它的数学和逻辑推理能力显著提升。
更重要的是,通过高质量数据体系和搜索增强,Baichuan2-53B的幻觉大大降低,是目前国内幻觉问题最低的大模型。
不仅如此,作为首批通过备案的大模型企业,百川智能还开放了Baichuan2-53B API接口。
这意味着,百川智能正式进军To B领域,从此将开启商业化进程。
幻觉处理,国内遥遥领先
最值得一提的是,新升级的Baichuan2-53B,在「幻觉」处理上已经在国内行业遥遥领先了。
简单讲,「幻觉」就是LLM在没有任何已知事实支撑下,常常会一本正经地胡说八道。
那么,为什么大模型会出现「幻觉」?
4月,OpenAI联合创始人兼研究科学家John Schulman在UC伯克利的演讲中,详细阐述了大模型难以攻克的难题。
在Schulman看来,LLM黑盒内部隐藏着一个「知识图谱」。如果这个架构中没有的知识,仅通过SFT教大模型(即行为克隆)知识,实则在教它输出幻觉。
在高质量数据构建上,Baichuan2-53B独创了一套数据质量体系。
以低质、优质为标准将数据进行分类,确保Baichuan2-53B始终使用优质数据进行预训练。
这一综合体系通过深入理解用户指令,精确驱动查询词的搜索,最终结合大语言模型技术,优化模型结果生成的可靠性,实现更精确、更智能的模型回答结果,减少模型幻觉。
比如,在解释「勾三股四弦五」这个问题上,GPT-4显然是在胡说八道。
经过FacTool评测后的结果显示,Baichuan2-53B的综合得分为140.5,在主流基础大模型中仅排在GPT-4之后,处于国内领先水平。
能力升级,推理100% up
其实,Baichuan2-53B已经是百川智能发布的第6款大模型了。
4月10日百川智能成立后,就一直在以惊人的速度创新,迭代的速度竟然达到了平均每28天就推出一款大模型!
早在8月8日Baichuan2-53B刚发布时,它就表现出了优异的知识问答、文学创作才能。
如果要问,评价一款大模型是否领先的重要指标是什么,相信「数学和逻辑推理能力」,会是诸多业内人士给出的答案。
这次,在Baichuan-53B的基础上,Baichuan2-53B就重点强化了数学和逻辑推理的能力,并且,还对整体能力进行了全面升级。
具体来说,它的逻辑推理能力提升100%,数学能力提升31%,语言理解能力提升29%,文本创作提升18%,知识问答提升9%。
数学能力大升级的Baichuan2-53B,做起数学应用题来当然是不在话下。
比如,两个数的和是572,其中一个加数个位上是0,去掉0后,就与第二个加数相同。那么,这两个数分别是?
Baichuan2-53B列出了方程式,假设一个加数是10A,另一个为B,然后根据已知条件,得出正解。
Baichuan2-53B毫不费力,直接得出「星期四」!
现有两个空水壶,容积分别为5升和6升。问如何只有这2个水壶,从池塘里取得3升的水?
Baichuan2-53B行云流水地开始作答,6步内给出了正确答案。
时效问题
而在时效性这方面,Baichuan2-53B的表现可谓十分优异。
杭州亚运会刚刚开幕,年龄最小的选手竟然仅有9岁。Baichuan2-53B在最新的问题上,也答对了。
此次电影节,是否有中国电影和演员获奖?
Baichuan2-53B立刻回答出,李鸿其的《爱是一把枪》获得了最佳长片首作,梁朝伟获得了终身成就金狮奖。
对此,Baichuan2-53B也是了如指掌。
不仅如此,这次Baichuan2-53B还正式开放了API接口,可以让企业和开发者将模型集成到自己的应用和服务中。
API地址:
这项服务是否有门槛呢?
可以说,几乎没有。Baichuan2-53B的API接口相当便捷易用,只需要简单的配置和集成,就可以接入了。
而且,它对OpenAI的接口高度兼容,这样就可以让客户快速迁移,无论是模型的部署成本还是转换成本,都大大降低。
总之,现在无论是智能客服、智能写作还是智能推荐,都能得到大模型的能力加持。
要说企业用户最关注的,莫过于安全合规问题了。
对此也无需担心。
作为首批通过《生成式人工智能服务管理暂行办法》备案的大模型企业,百川智能为Baichuan2-53B打造了覆盖大模型预训练、精调、推理全周期的安全增强,可以说,全流程都在安全保障之下。
而借助着Baichuan2-53B丰富强大的模型能力,企业用户不仅可以让已有业务升级、减低成本,还能探索更多的应用场景。
可以相信,就在此刻,已经有一大波令人印象深刻的创新,正在土壤中被酝酿了。
参考资料: