O modelo semelhante ao ChatGPT que arrecadou US$ 100 milhões é de código aberto! Disponível para uso comercial, 8 modelos

Fonte original: Comunidade Aberta AIGC

Fonte da imagem: gerada por Unbounded AI‌

Na última terça-feira, a "AIGC Open Community" apresentou o Writer, uma plataforma generativa de IA que arrecadou US$ 100 milhões. A capacidade da empresa de obter um financiamento total de US$ 126 milhões em apenas três anos e se tornar um dos principais concorrentes do ChatGPT é inseparável de sua excelente tecnologia. Também prova plenamente que seu modelo tem casos de aplicação de sucesso e foi reconhecido pelo capital e pelos usuários.

Atualmente, o Writer abriu o código-fonte do grande modelo de linguagem Palmyra que usa no huggingface.Existem 8 modelos, nomeadamente small, base, 20b-chat, Instruct-20b, med-20b, etc., que estão comercialmente disponíveis e suportam dados finos. sintonia.

Endereço de código aberto:

Endereço de teste gratuito online:

**Os destaques técnicos do Palmyra incluem: **Parâmetros pequenos e funções poderosas, que são muito úteis para pequenas e médias empresas e desenvolvedores individuais sem recursos computacionais; recebeu treinamento em redação comercial e dados de marketing, principalmente para usuários corporativos; empresa -nível de segurança de dados, vários guarda-corpos de segurança integrados;

Além de gerar texto, também pode extrair resumos de conteúdo de vídeos, PDFs e áudios; suporta ajuste fino de dados e as empresas podem criar seu próprio assistente "ChatGPT", etc.

A seguinte "Comunidade Aberta AIGC" apresenta vários modelos especiais de Palmyra:

InstruirPalmyra-20b

Este é um modelo de ajuste de instrução construído no modelo básico Palmyra-20b, suportando processamento avançado de linguagem natural e necessidades personalizadas.

O modelo InstructPalmyra-20b foi meticulosamente treinado em um extenso conjunto de dados de aproximadamente 70.000 registros de comando-resposta. Esses registros são gerados pela modelagem de linguagem profissional do Writer e pela equipe técnica de ajuste fino.

O InstructPalmyra-20b possui uma excelente capacidade de processar instruções complexas e gerar respostas contextuais precisas. Isso o torna um modelo ideal para desenvolver uma ampla gama de aplicações, como assistentes virtuais, suporte ao cliente, geração de conteúdo e muito mais.

Além disso, o treinamento abrangente do modelo permite que ele se adapte e tenha um bom desempenho em diferentes condições e contextos, ampliando ainda mais seus possíveis casos de uso.

Palmira-com-20b

Palmyra-Med é o modelo do Writer construído especificamente para atender às necessidades do setor de saúde, com instruções ajustadas com base em dados médicos.

Palmyra-Med alcançou pontuações máximas quando testado nas principais questões biomédicas que respondem ao PubMedQA, com uma taxa de precisão de 81,1%, superando o GPT-4 e testadores humanos com treinamento médico.

Ele pode fornecer funções como tradução de terminologia médica profissional, extração de resumos de notas médicas, análise de dados médicos massivos e geração automática de insights médicos.

Palmyra Grande 20B

Palmyra-Large é um modelo de decodificador causal construído pelo Writer, aprimorado pelo Palmyra-Index-Data e treinado em 800 bilhões de dados em um corpus de alta qualidade.

Palmyra Large usa um objetivo de modelagem de linguagem causal (CLM) durante o pré-treinamento do modelo. Semelhante ao GPT-3, é, portanto, pré-treinado com o objetivo de modelagem de linguagem causal auto-supervisionada.

Este modelo é executado muito rapidamente e consome poucos recursos, sendo adequado para cenários de negócios como assistência médica, marketing, marketing, TI, design e recursos humanos para criar assistentes de IA personalizados.

Avaliação de desempenho

Palmyra recebeu a pontuação mais alta no Stanford HELM, superando modelos de código aberto bem conhecidos, como Falcon 40B e LLaMA-30B. HELM é uma plataforma de teste de benchmark muito conhecida do Centro de Pesquisa de Modelos Fundamentais da Universidade de Stanford.

Palmyra ficou em primeiro lugar em vários testes importantes, pontuando 60,9% no Massive Multi-Task Language Understanding (MMLU), 89,6% no BoolQ e 79,0% no NaturalQuestions.

Palmyra ficou em segundo lugar em dois outros testes importantes, com uma pontuação de perguntas e respostas contextuais de 49,7% e uma pontuação de TruthfulQA de 61,6%.O desempenho geral é muito forte.

Resumindo, Palmyra é muito valioso para desenvolvedores que desejam comercializar grandes modelos de linguagem para estudar sua arquitetura e funções de modelo e aprender com sua experiência bem-sucedida.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)