阿里雲開源AI模型挑戰Meta Llama 2

在此之前,Meta 於7 月發布了自己的開源LLM Llama 2。

阿里雲,中國科技巨頭的雲計算部門阿里巴巴集團, 有介紹兩個開源人工智能(人工智能)名為Gwen-7B 和Gwen-7B-Chat 的語言模型。每個模型擁有多達70億個參數,成為中國第一家開源LLM的大型企業。在8 月3 日的官方新聞稿中,該公司表示,這兩種開源語言模型各自構建了多達70 億個參數,使其成為人工智能領域的有力競爭者。

此前,Meta 在7 月份發布了自己的開源LLM Llama 2。阿里巴巴的Gwen 模型每個都有70 億個參數,而Meta 的Llama 2(其開源模型Llama 的商業版本)擁有700 億個參數,使其成為全球最大的開源LLM 之一。上週,阿里雲合伙的與Meta 合作,讓Llama 可供中國企業使用,使這些公司能夠創建定制的人工智能應用程序。

阿里雲免費提供新的人工智能模型

阿里雲部門此前已於四月份推出了名為“統一前文”的LLM,提供具有不同參數數量的多個版本。新開源的Gwen-7B 和Gwen-7B-Chat 是統一錢文的較小版本,旨在滿足尋求利用人工智能力量的中小型企業的需求。

該公司的目標是讓用戶(包括全球學術研究人員和商業機構)免費訪問這兩個模型的代碼、模型權重和文檔。然而,月活躍用戶超過1 億的實體需要獲得阿里巴巴的許可才能使用這些模型。同樣,Meta 的Llama 2 也要求擁有超過7 億用戶的公司獲得該公司的許可。

這些大型語言模型的開源是幫助人工智能技術民主化的努力的一部分。通過免費提供這些模型,更多的企業和開發人員將能夠使用它們來開發新的人工智能應用程序。

LLM AI模型可以處理大量數據並生成各種格式的內容,包括文本、圖像、音頻和視頻。這些工具是ChatGPT 等人工智能聊天機器人的支柱,推動創新並增強跨多個領域的用戶體驗。

中國當局鼓勵人工智能在國內發展

雖然阿里雲尚未透露Tongyi Qianwen的高參數版本,但此舉標誌著中國在人工智能領域追趕美國的重大進步。中國政府積極鼓勵阿里巴巴、騰訊、華為等本土企業開發有競爭力、“可控”的人工智能模型,挑戰美國人工智能技術的霸主地位。

阿里雲LLM的開源,有望提升我國LLM的技術能力和行業應用。此外,這些工具還將簡化企業的模型訓練和部署流程,降低人工智能應用門檻,以更高的效率創建針對特定行業的LLMs。

與此同時,除了阿里巴巴和Meta之外,谷歌和微軟等其他科技巨頭也在研究各種應用程序的大型語言模型,包括文本生成、語言翻譯和問答系統。

全球人工智能格局正在經歷激烈的競爭和快速的創新,推動了人工智能技術在包括加密貨幣在內的各個行業的增長和採用。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)