Alibaba Cloud Open Source AI Model Challenge Meta Llama 2

2023-08-04 05:58:43

Це сталося після того, як у липні Meta випустила власний LLM з відкритим кодом, Llama 2.

Alibaba Cloud, підрозділ хмарних обчислень китайського технологічного гіганта Alibaba Group, представив дві мовні моделі штучного інтелекту (ШІ) з відкритим кодом Gwen-7B і Gwen-7B-Chat. Кожна модель має до 7 мільярдів параметрів, ставши першим великомасштабним підприємством у Китаї з відкритим вихідним кодом LLM. В офіційному прес-релізі від 3 серпня компанія заявила, що дві мовні моделі з відкритим вихідним кодом створено з до 7 мільярдів параметрів кожна, що робить їх серйозними суперниками в просторі ШІ.

Це сталося після того, як у липні Meta випустила власну LLM з відкритим кодом, Llama 2. Кожна з моделей Gwen від Alibaba має 7 мільярдів параметрів, тоді як Llama 2 від Meta (комерційна версія їх моделі Llama з відкритим кодом) має 70 мільярдів параметрів, що робить її однією з найбільших LLM з відкритим кодом у світі. Минулого тижня Alibaba Cloud співпрацює з Meta, щоб зробити Llama доступним для китайських компаній, дозволяючи цим компаніям створювати спеціальні програми AI.

Aliyun безкоштовно надає нові моделі штучного інтелекту

Раніше підрозділ Alibaba Cloud запустив LLM під назвою «Unified Qianwen» у квітні, пропонуючи кілька версій з різною кількістю параметрів. Нещодавні Gwen-7B і Gwen-7B-Chat — це зменшені версії Unified Qian Wen, розроблені для задоволення потреб малих і середніх підприємств, які прагнуть використовувати потужність штучного інтелекту.

Мета компанії — надати користувачам, зокрема академічним дослідникам і комерційним організаціям у всьому світі, вільний доступ до коду, вагових коефіцієнтів моделей і документації для обох моделей. Однак організаціям із понад 100 мільйонами активних користувачів щомісяця потрібна ліцензія від Alibaba для використання цих моделей. Так само Llama 2 від Meta вимагає ліцензії від компанії з понад 700 мільйонами користувачів.

Відкритий вихідний код цих великих мовних моделей є частиною зусиль, спрямованих на демократизацію технології ШІ. Зробивши ці моделі у вільному доступі, більше компаній і розробників зможуть використовувати їх для розробки нових програм ШІ.

Моделі LLM AI можуть обробляти великі обсяги даних і створювати вміст у різних форматах, включаючи текст, зображення, аудіо та відео. Ці інструменти є основою чат-ботів зі штучним інтелектом, таких як ChatGPT, заохочують інновації та покращують взаємодію з користувачами в багатьох доменах.

Китайська влада заохочує розвиток штучного інтелекту всередині країни

Хоча Alibaba Cloud ще не показала версію Tongyi Qianwen з високими параметрами, цей крок знаменує великий крок вперед для Китаю, щоб наздогнати Сполучені Штати у сфері штучного інтелекту. Уряд Китаю активно заохочує місцеві компанії, такі як Alibaba, Tencent і Huawei, розробляти конкурентоспроможні та «керовані» моделі штучного інтелекту, щоб кинути виклик домінуванню американських технологій штучного інтелекту.

Очікується, що відкритий вихідний код Alibaba Cloud LLM покращить технічні можливості та галузеві програми LLM у моїй країні. Крім того, ці інструменти спростять модельне навчання та процес розгортання підприємств, знизять поріг застосування штучного інтелекту та створять галузеві LLM з вищою ефективністю.

Тим часом, крім Alibaba і Meta, інші технологічні гіганти, такі як Google і Microsoft, також працюють над широкомасштабними мовними моделями для різних програм, включаючи генерацію тексту, мовний переклад і системи відповідей на запитання.

Глобальний ландшафт штучного інтелекту переживає гостру конкуренцію та швидкі інновації, що сприяє зростанню та впровадженню технологій штучного інтелекту в різних галузях, включаючи криптовалюти.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

1 лайків

Нагородити
1
Прокоментувати
Поділіться

Прокоментувати

0/400

Немає коментарів

Тема
Gate 2025 Q2 Report Released
2k Популярність
Gate Derivatives Volume Hits New High
4k Популярність
CPI Data Incoming
2k Популярність
4Join Gate VIP to Win MacBook
29k Популярність
5MicroStrategy Buys More Bitcoin
496 Популярність
6BTC Hits New High
94k Популярність
7My Gate Moments
26k Популярність
8VIP Exclusive Airdrop Carnival
26k Популярність
9Fed June Meeting Minutes
7k Популярність
10Gate Alpha Trading Share
14k Популярність

Закріпити

карта сайту