當然,我認爲你會明顯感受到與RL相關的新單子出現/美感/一致性。但當然,這也爲各種損害和損失打開了大門。


我甚至認爲RL可以使模型在“模擬”方面比基礎模型更出色!(例如,通過使它們具備自我糾正的能力)
THINK-3.82%
GET0.71%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 6
  • 轉發
  • 分享
留言
0/400
空投疯子老王vip
· 5小時前
rl效果好但是危险啊
回復0
TokenVelocityvip
· 5小時前
rl开挂了属于是
回復0
鲸落见证者vip
· 5小時前
模型自我修正也许比人靠谱
回復0
SelfCustodyIssuesvip
· 5小時前
rt可真是正反两面都分析得头头是道 懂得都懂
回復0
假如我在链上vip
· 5小時前
又一个牺牲安全性的决定
回復0
数据酸菜鱼vip
· 5小時前
只会训练 代码不会写
回復0
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)