Це сталося після того, як у липні Meta випустила власний LLM з відкритим кодом, Llama 2.
Alibaba Cloud, підрозділ хмарних обчислень китайського технологічного гіганта Alibaba Group, представив дві мовні моделі штучного інтелекту (ШІ) з відкритим кодом Gwen-7B і Gwen-7B-Chat. Кожна модель має до 7 мільярдів параметрів, ставши першим великомасштабним підприємством у Китаї з відкритим вихідним кодом LLM. В офіційному прес-релізі від 3 серпня компанія заявила, що дві мовні моделі з відкритим вихідним кодом створено з до 7 мільярдів параметрів кожна, що робить їх серйозними суперниками в просторі ШІ.
Це сталося після того, як у липні Meta випустила власну LLM з відкритим кодом, Llama 2. Кожна з моделей Gwen від Alibaba має 7 мільярдів параметрів, тоді як Llama 2 від Meta (комерційна версія їх моделі Llama з відкритим кодом) має 70 мільярдів параметрів, що робить її однією з найбільших LLM з відкритим кодом у світі. Минулого тижня Alibaba Cloud співпрацює з Meta, щоб зробити Llama доступним для китайських компаній, дозволяючи цим компаніям створювати спеціальні програми AI.
Aliyun безкоштовно надає нові моделі штучного інтелекту
Раніше підрозділ Alibaba Cloud запустив LLM під назвою «Unified Qianwen» у квітні, пропонуючи кілька версій з різною кількістю параметрів. Нещодавні Gwen-7B і Gwen-7B-Chat — це зменшені версії Unified Qian Wen, розроблені для задоволення потреб малих і середніх підприємств, які прагнуть використовувати потужність штучного інтелекту.
Мета компанії — надати користувачам, зокрема академічним дослідникам і комерційним організаціям у всьому світі, вільний доступ до коду, вагових коефіцієнтів моделей і документації для обох моделей. Однак організаціям із понад 100 мільйонами активних користувачів щомісяця потрібна ліцензія від Alibaba для використання цих моделей. Так само Llama 2 від Meta вимагає ліцензії від компанії з понад 700 мільйонами користувачів.
Відкритий вихідний код цих великих мовних моделей є частиною зусиль, спрямованих на демократизацію технології ШІ. Зробивши ці моделі у вільному доступі, більше компаній і розробників зможуть використовувати їх для розробки нових програм ШІ.
Моделі LLM AI можуть обробляти великі обсяги даних і створювати вміст у різних форматах, включаючи текст, зображення, аудіо та відео. Ці інструменти є основою чат-ботів зі штучним інтелектом, таких як ChatGPT, заохочують інновації та покращують взаємодію з користувачами в багатьох доменах.
Китайська влада заохочує розвиток штучного інтелекту всередині країни
Хоча Alibaba Cloud ще не показала версію Tongyi Qianwen з високими параметрами, цей крок знаменує великий крок вперед для Китаю, щоб наздогнати Сполучені Штати у сфері штучного інтелекту. Уряд Китаю активно заохочує місцеві компанії, такі як Alibaba, Tencent і Huawei, розробляти конкурентоспроможні та «керовані» моделі штучного інтелекту, щоб кинути виклик домінуванню американських технологій штучного інтелекту.
Очікується, що відкритий вихідний код Alibaba Cloud LLM покращить технічні можливості та галузеві програми LLM у моїй країні. Крім того, ці інструменти спростять модельне навчання та процес розгортання підприємств, знизять поріг застосування штучного інтелекту та створять галузеві LLM з вищою ефективністю.
Тим часом, крім Alibaba і Meta, інші технологічні гіганти, такі як Google і Microsoft, також працюють над широкомасштабними мовними моделями для різних програм, включаючи генерацію тексту, мовний переклад і системи відповідей на запитання.
Глобальний ландшафт штучного інтелекту переживає гостру конкуренцію та швидкі інновації, що сприяє зростанню та впровадженню технологій штучного інтелекту в різних галузях, включаючи криптовалюти.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Alibaba Cloud Open Source AI Model Challenge Meta Llama 2
Це сталося після того, як у липні Meta випустила власний LLM з відкритим кодом, Llama 2.
Alibaba Cloud, підрозділ хмарних обчислень китайського технологічного гіганта Alibaba Group, представив дві мовні моделі штучного інтелекту (ШІ) з відкритим кодом Gwen-7B і Gwen-7B-Chat. Кожна модель має до 7 мільярдів параметрів, ставши першим великомасштабним підприємством у Китаї з відкритим вихідним кодом LLM. В офіційному прес-релізі від 3 серпня компанія заявила, що дві мовні моделі з відкритим вихідним кодом створено з до 7 мільярдів параметрів кожна, що робить їх серйозними суперниками в просторі ШІ.
Це сталося після того, як у липні Meta випустила власну LLM з відкритим кодом, Llama 2. Кожна з моделей Gwen від Alibaba має 7 мільярдів параметрів, тоді як Llama 2 від Meta (комерційна версія їх моделі Llama з відкритим кодом) має 70 мільярдів параметрів, що робить її однією з найбільших LLM з відкритим кодом у світі. Минулого тижня Alibaba Cloud співпрацює з Meta, щоб зробити Llama доступним для китайських компаній, дозволяючи цим компаніям створювати спеціальні програми AI.
Aliyun безкоштовно надає нові моделі штучного інтелекту
Раніше підрозділ Alibaba Cloud запустив LLM під назвою «Unified Qianwen» у квітні, пропонуючи кілька версій з різною кількістю параметрів. Нещодавні Gwen-7B і Gwen-7B-Chat — це зменшені версії Unified Qian Wen, розроблені для задоволення потреб малих і середніх підприємств, які прагнуть використовувати потужність штучного інтелекту.
Мета компанії — надати користувачам, зокрема академічним дослідникам і комерційним організаціям у всьому світі, вільний доступ до коду, вагових коефіцієнтів моделей і документації для обох моделей. Однак організаціям із понад 100 мільйонами активних користувачів щомісяця потрібна ліцензія від Alibaba для використання цих моделей. Так само Llama 2 від Meta вимагає ліцензії від компанії з понад 700 мільйонами користувачів.
Відкритий вихідний код цих великих мовних моделей є частиною зусиль, спрямованих на демократизацію технології ШІ. Зробивши ці моделі у вільному доступі, більше компаній і розробників зможуть використовувати їх для розробки нових програм ШІ.
Моделі LLM AI можуть обробляти великі обсяги даних і створювати вміст у різних форматах, включаючи текст, зображення, аудіо та відео. Ці інструменти є основою чат-ботів зі штучним інтелектом, таких як ChatGPT, заохочують інновації та покращують взаємодію з користувачами в багатьох доменах.
Китайська влада заохочує розвиток штучного інтелекту всередині країни
Хоча Alibaba Cloud ще не показала версію Tongyi Qianwen з високими параметрами, цей крок знаменує великий крок вперед для Китаю, щоб наздогнати Сполучені Штати у сфері штучного інтелекту. Уряд Китаю активно заохочує місцеві компанії, такі як Alibaba, Tencent і Huawei, розробляти конкурентоспроможні та «керовані» моделі штучного інтелекту, щоб кинути виклик домінуванню американських технологій штучного інтелекту.
Очікується, що відкритий вихідний код Alibaba Cloud LLM покращить технічні можливості та галузеві програми LLM у моїй країні. Крім того, ці інструменти спростять модельне навчання та процес розгортання підприємств, знизять поріг застосування штучного інтелекту та створять галузеві LLM з вищою ефективністю.
Тим часом, крім Alibaba і Meta, інші технологічні гіганти, такі як Google і Microsoft, також працюють над широкомасштабними мовними моделями для різних програм, включаючи генерацію тексту, мовний переклад і системи відповідей на запитання.
Глобальний ландшафт штучного інтелекту переживає гостру конкуренцію та швидкі інновації, що сприяє зростанню та впровадженню технологій штучного інтелекту в різних галузях, включаючи криптовалюти.