Модель, подобная ChatGPT, которая собрала 100 миллионов долларов, имеет открытый исходный код! Доступно для коммерческого использования, 8 моделей.

Первоисточник: Открытое сообщество AIGC.

Источник изображения: Создано Unbounded AI‌

В прошлый вторник «Открытое сообщество AIGC» представило Writer, генеративную платформу искусственного интеллекта, которая собрала 100 миллионов долларов США. Способность компании получить общий объем финансирования в размере 126 миллионов долларов США всего за три года и стать одним из основных конкурентов ChatGPT неотделима от ее превосходной технологии. Это также полностью доказывает, что ее модель имеет успешные примеры применения и признана капиталом и пользователями.

В настоящее время Writer выложил в открытый доступ исходный код большой языковой модели Palmyra, которую он использует на HuggingFace. Существует 8 моделей, а именно small, base, 20b-chat, Instruct-20b, med-20b и т. д., которые коммерчески доступны и поддерживают точные данные. тюнинг.

Адрес открытого исходного кода:

Адрес бесплатной пробной онлайн-версии:

**Технические особенности Palmyra включают в себя: **Небольшие параметры и мощные функции, которые очень полезны для малых и средних предприятий и индивидуальных разработчиков без вычислительных ресурсов; он прошел обучение деловому написанию и маркетинговым данным, в основном для корпоративных пользователей; корпоративные пользователи -уровень безопасности данных, встроенные несколько ограждений безопасности;

Помимо генерации текста, он также может извлекать сводки содержимого видео, PDF-файлов и аудио; он поддерживает точную настройку данных, а предприятия могут создать своего собственного помощника «ChatGPT» и т. д.

Следующее «Открытое сообщество AIGC» представляет несколько специальных моделей Пальмиры:

Инструктировать Пальмира-20б

Это модель настройки инструкций, созданная на основе базовой модели Palmyra-20b и поддерживающая расширенную обработку естественного языка и индивидуальные потребности.

Модель InstructPalmyra-20b была тщательно обучена на обширном наборе данных, содержащем около 70 000 записей команд-ответов. Эти записи создаются профессиональной технической командой Writer по языковому моделированию и точной настройке.

InstructPalmyra-20b обладает превосходной способностью обрабатывать сложные инструкции и генерировать точные, контекстуальные ответы. Это делает его идеальной моделью для разработки широкого спектра приложений, таких как виртуальные помощники, поддержка клиентов, создание контента и многое другое.

Кроме того, комплексное обучение модели позволяет ей адаптироваться и хорошо работать в различных условиях и контекстах, что еще больше расширяет потенциальные варианты ее использования.

Пальмира-с-20б

Palmyra-Med — это модель Writer, созданная специально для нужд отрасли здравоохранения, с инструкциями, точно настроенными на основе медицинских данных.

Palmyra-Med получила высшие баллы при тестировании по ведущим биомедицинским вопросам, отвечая на PubMedQA, с уровнем точности 81,1%, опередив GPT-4 и людей, прошедших медицинскую подготовку.

Он может выполнять такие функции, как перевод профессиональной медицинской терминологии, извлечение сводных медицинских записей, анализ огромных медицинских данных и автоматическое генерирование медицинских заключений.

Пальмира Большая 20Б

Palmyra-Large — это модель причинного декодера, созданная Writer, дополненная Palmyra-Index-Data и обученная на 800 миллиардах данных в высококачественном корпусе.

Palmyra Large использует цель моделирования причинного языка (CLM) во время предварительного обучения модели. Таким образом, подобно GPT-3, он предварительно обучается с целью самостоятельного моделирования причинного языка.

Эта модель работает очень быстро и потребляет очень мало ресурсов.Она подходит для таких бизнес-сценариев, как здравоохранение, маркетинг, маркетинг, ИТ, дизайн и человеческие ресурсы, для создания индивидуальных помощников ИИ.

Оценка эффективности

Palmyra получила высший балл на Stanford HELM, превзойдя известные модели с открытым исходным кодом, такие как Falcon 40B и LLaMA-30B. HELM — очень известная платформа эталонного тестирования от Центра фундаментальных исследований моделей Стэнфордского университета.

Пальмира заняла первое место по нескольким важным тестам, набрав 60,9% по Массивному многозадачному пониманию языка (MMLU), 89,6% по BoolQ и 79,0% по NaturalQuestions.

Palmyra заняла второе место в двух других ключевых тестах с оценкой контекстных вопросов и ответов 49,7% и оценкой TruthfulQA 61,6%.Общая производительность очень высока.

Короче говоря, Palmyra очень подходит для разработчиков, которые хотят коммерциализировать большие языковые модели, чтобы изучить архитектуру и функции ее модели и перенять ее успешный опыт.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить