Модель, схожа на ChatGPT, яка зібрала 100 мільйонів доларів, має відкритий код! Доступно для комерційного використання, 8 моделей

Джерело: AIGC Open Community

Джерело зображення: створено Unbounded AI‌

Минулого вівторка «Відкрита спільнота AIGC» представила Writer, генеративну платформу ШІ, яка зібрала 100 мільйонів доларів США. Здатність компанії отримати загальне фінансування в 126 мільйонів доларів США лише за три роки та стати одним із головних конкурентів ChatGPT невіддільна від її чудової технології.Це також повністю доводить, що її модель має успішні випадки застосування та визнана капіталом та користувачами.

Наразі Writer має відкритий вихідний код для великої мовної моделі Palmyra, яку він використовує на huggingface.Є 8 моделей, а саме мала, базова, 20b-чат, Instruct-20b, med-20b тощо, які є комерційно доступними та підтримують точні дані. тюнінг.

Адреса відкритого джерела:

Адреса безкоштовної пробної онлайн-версії:

**Технічні переваги Palmyra включають: **Невеликі параметри та потужні функції, які дуже корисні для малих і середніх підприємств і окремих розробників без обчислювальних ресурсів; компанія пройшла навчання з написання бізнес-інформації та маркетингових даних, головним чином для корпоративних користувачів; підприємства - рівень безпеки даних, вбудовані кілька захисних огорож;

Окрім генерування тексту, він також може видобувати резюме вмісту відео, PDF-файлів та аудіо; він підтримує точне налаштування даних, а підприємства можуть створювати власного помічника "ChatGPT" тощо.

Наступна «Відкрита спільнота AIGC» представляє кілька спеціальних моделей Palmyra:

InstructPalmyra-20b

Це модель налаштування інструкцій, побудована на основі базової моделі Palmyra-20b, яка підтримує розширену обробку природної мови та індивідуальні потреби.

Модель InstructPalmyra-20b була ретельно навчена на великому наборі даних із приблизно 70 000 записів команд-відповідей. Ці записи створено професійною технічною командою Writer з моделювання та тонкого налаштування мови.

InstructPalmyra-20b має чудову здатність обробляти складні інструкції та генерувати точні контекстні відповіді. Це робить його ідеальною моделлю для розробки широкого спектру програм, таких як віртуальні помічники, підтримка клієнтів, створення контенту тощо.

Крім того, комплексне навчання моделі дозволяє їй адаптуватися та добре працювати в різних умовах і контекстах, що ще більше розширює її потенційні випадки використання.

Пальміра-з-20б

Palmyra-Med — це модель Writer, розроблена спеціально для задоволення потреб галузі охорони здоров’я, з інструкціями, налаштованими на основі медичних даних.

Palmyra-Med досягла найвищих результатів під час тестування на провідне біомедичне запитання, відповідаючи на PubMedQA, із показником точності 81,1%, перевершивши GPT-4 і медичних тестувальників на людях.

Він може забезпечувати такі функції, як переклад професійної медичної термінології, отримання зведення медичних нотаток, аналіз масивних медичних даних і автоматичне генерування медичної інформації.

Palmyra Large 20B

Palmyra-Large — це модель причинно-наслідкового декодера, створена Writer, яка вдосконалена Palmyra-Index-Data та навчена на 800 мільярдах даних у високоякісному корпусі.

Palmyra Large використовує ціль моделювання причинної мови (CLM) під час попереднього навчання моделі. Подібно до GPT-3, тому він попередньо навчений з метою самостійного моделювання причинно-наслідкової мови.

Ця модель працює дуже швидко та споживає дуже мало ресурсів. Вона підходить для бізнес-сценаріїв, таких як медичне обслуговування, маркетинг, маркетинг, ІТ, дизайн та людські ресурси для створення індивідуальних помічників ШІ.

Оцінка ефективності

Palmyra отримала найвищу оцінку на Stanford HELM, перевершивши відомі моделі з відкритим кодом, такі як Falcon 40B і LLaMA-30B. HELM — це дуже відома платформа тестування бенчмарків від Центру дослідження фундаментальних моделей Стенфордського університету.

Palmyra посіла перше місце в кількох важливих тестах, набравши 60,9% у Massive Multi-Task Language Understanding (MMLU), 89,6% у BoolQ і 79,0% у NaturalQuestions.

Palmyra зайняла друге місце в двох інших ключових тестах із результатом контекстуальних запитань і відповідей 49,7% і результатом TruthfulQA 61,6%. Загальна продуктивність дуже висока.

Коротше кажучи, Palmyra дуже гідна для розробників, які хочуть комерціалізувати великі мовні моделі, щоб вивчити її архітектуру та функції моделі та навчитися її успішного досвіду.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити