📢 Gate廣場 #NERO发帖挑战# 秀觀點贏大獎活動火熱開啓!
Gate NERO生態周來襲!發帖秀出NERO項目洞察和活動實用攻略,瓜分30,000NERO!
💰️ 15位優質發帖用戶 * 2,000枚NERO每人
如何參與:
1️⃣ 調研NERO項目
對NERO的基本面、社區治理、發展目標、代幣經濟模型等方面進行研究,分享你對項目的深度研究。
2️⃣ 參與並分享真實體驗
參與NERO生態周相關活動,並曬出你的參與截圖、收益圖或實用教程。可以是收益展示、簡明易懂的新手攻略、小竅門,也可以是行情點位分析,內容詳實優先。
3️⃣ 鼓勵帶新互動
如果你的帖子吸引到他人參與活動,或者有好友評論“已參與/已交易”,將大幅提升你的獲獎概率!
NERO熱門活動(帖文需附以下活動連結):
NERO Chain (NERO) 生態周:Gate 已上線 NERO 現貨交易,爲回饋平台用戶,HODLer Airdrop、Launchpool、CandyDrop、餘幣寶已上線 NERO,邀您體驗。參與攻略見公告:https://www.gate.com/announcements/article/46284
高質量帖子Tips:
教程越詳細、圖片越直觀、互動量越高,獲獎幾率越大!
市場見解獨到、真實參與經歷、有帶新互動者,評選將優先考慮。
帖子需原創,字數不少於250字,且需獲得至少3條有效互動
DeepMind讓大模型學會歸納和演繹,GPT-4準確率提升13.7%
當前,大型語言模型(LLM)在推理任務上表現出令人驚豔的能力,特別是在給出一些樣例和中間步驟時。 然而, 方法往往依賴於 LLM 中的隱性知識,當隱性知識存在錯誤或者與任務不一致時,LLM 就會給出錯誤的回答。
現在,來自谷歌、Mila 研究所等研究機構的研究者聯合探索了一種新方法 —— 讓 LLM 學習推理規則,並提出一種名為假設到理論(Hypotheses-to-Theories,HtT)的新框架。 這種新方法不僅改進了多步推理,還具有可解釋、可遷移等優勢。
對數值推理和關係推理問題的實驗表明,HtT 改進了現有的 方法,準確率提升了 11-27%。 學到的規則也可以遷移到不同的模型或同一問題的不同形式。
方法簡介
總的來說,HtT 框架包含兩個階段 —— 歸納階段和演繹階段,類似於傳統機器學習中的訓練和測試。
有了良好的規則庫,下一步該研究如何應用這些規則來解決問題。 為此,在演繹階段,該研究在 中添加規則庫,並要求 LLM 從規則庫中檢索規則來進行演繹,將隱式推理轉換為顯式推理。
然而,該研究發現,即使是非常強大的 LLM(例如 GPT-4)也很難在每一步都檢索到正確的規則。 為此,該研究開發了 XML tagging trick,來增強 LLM 的上下文檢索能力。
為了評估 HtT,該研究針對兩個多步驟推理問題進行了基準測試。 實驗結果表明,HtT 改進了少樣本 方法。 作者還進行了廣泛的消融研究,以提供對 HtT 更全面的瞭解。
他們在數值推理和關係推理問題上評估新方法。 在數值推理中,他們觀察到 GPT-4 的準確率提高了 21.0%。 在關係推理中,GPT-4 的準確性提高了 13.7%,GPT-3.5 則獲益更多,性能提高了一倍。 性能增益主要來自於規則幻覺的減少。
值得一提的是,使用 GPT4 的規則,GPT3.5 上的 CoT 性能提高了 27.2%,是 CoT 性能的兩倍多,接近 GPT4 上的 CoT 性能。 因此,作者認為 HtT 可以作為從強 LLM 到弱 LLM 的一種新的知識蒸餾形式。