Na última terça-feira, a "AIGC Open Community" apresentou o Writer, uma plataforma generativa de IA que arrecadou US$ 100 milhões. A capacidade da empresa de obter um financiamento total de US$ 126 milhões em apenas três anos e se tornar um dos principais concorrentes do ChatGPT é inseparável de sua excelente tecnologia. Também prova plenamente que seu modelo tem casos de aplicação de sucesso e foi reconhecido pelo capital e pelos usuários.
Atualmente, o Writer abriu o código-fonte do grande modelo de linguagem Palmyra que usa no huggingface.Existem 8 modelos, nomeadamente small, base, 20b-chat, Instruct-20b, med-20b, etc., que estão comercialmente disponíveis e suportam dados finos. sintonia.
Endereço de código aberto:
Endereço de teste gratuito online:
**Os destaques técnicos do Palmyra incluem: **Parâmetros pequenos e funções poderosas, que são muito úteis para pequenas e médias empresas e desenvolvedores individuais sem recursos computacionais; recebeu treinamento em redação comercial e dados de marketing, principalmente para usuários corporativos; empresa -nível de segurança de dados, vários guarda-corpos de segurança integrados;
Além de gerar texto, também pode extrair resumos de conteúdo de vídeos, PDFs e áudios; suporta ajuste fino de dados e as empresas podem criar seu próprio assistente "ChatGPT", etc.
A seguinte "Comunidade Aberta AIGC" apresenta vários modelos especiais de Palmyra:
InstruirPalmyra-20b
Este é um modelo de ajuste de instrução construído no modelo básico Palmyra-20b, suportando processamento avançado de linguagem natural e necessidades personalizadas.
O modelo InstructPalmyra-20b foi meticulosamente treinado em um extenso conjunto de dados de aproximadamente 70.000 registros de comando-resposta. Esses registros são gerados pela modelagem de linguagem profissional do Writer e pela equipe técnica de ajuste fino.
O InstructPalmyra-20b possui uma excelente capacidade de processar instruções complexas e gerar respostas contextuais precisas. Isso o torna um modelo ideal para desenvolver uma ampla gama de aplicações, como assistentes virtuais, suporte ao cliente, geração de conteúdo e muito mais.
Além disso, o treinamento abrangente do modelo permite que ele se adapte e tenha um bom desempenho em diferentes condições e contextos, ampliando ainda mais seus possíveis casos de uso.
Palmira-com-20b
Palmyra-Med é o modelo do Writer construído especificamente para atender às necessidades do setor de saúde, com instruções ajustadas com base em dados médicos.
Palmyra-Med alcançou pontuações máximas quando testado nas principais questões biomédicas que respondem ao PubMedQA, com uma taxa de precisão de 81,1%, superando o GPT-4 e testadores humanos com treinamento médico.
Ele pode fornecer funções como tradução de terminologia médica profissional, extração de resumos de notas médicas, análise de dados médicos massivos e geração automática de insights médicos.
Palmyra Grande 20B
Palmyra-Large é um modelo de decodificador causal construído pelo Writer, aprimorado pelo Palmyra-Index-Data e treinado em 800 bilhões de dados em um corpus de alta qualidade.
Palmyra Large usa um objetivo de modelagem de linguagem causal (CLM) durante o pré-treinamento do modelo. Semelhante ao GPT-3, é, portanto, pré-treinado com o objetivo de modelagem de linguagem causal auto-supervisionada.
Este modelo é executado muito rapidamente e consome poucos recursos, sendo adequado para cenários de negócios como assistência médica, marketing, marketing, TI, design e recursos humanos para criar assistentes de IA personalizados.
Avaliação de desempenho
Palmyra recebeu a pontuação mais alta no Stanford HELM, superando modelos de código aberto bem conhecidos, como Falcon 40B e LLaMA-30B. HELM é uma plataforma de teste de benchmark muito conhecida do Centro de Pesquisa de Modelos Fundamentais da Universidade de Stanford.
Palmyra ficou em primeiro lugar em vários testes importantes, pontuando 60,9% no Massive Multi-Task Language Understanding (MMLU), 89,6% no BoolQ e 79,0% no NaturalQuestions.
Palmyra ficou em segundo lugar em dois outros testes importantes, com uma pontuação de perguntas e respostas contextuais de 49,7% e uma pontuação de TruthfulQA de 61,6%.O desempenho geral é muito forte.
Resumindo, Palmyra é muito valioso para desenvolvedores que desejam comercializar grandes modelos de linguagem para estudar sua arquitetura e funções de modelo e aprender com sua experiência bem-sucedida.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
O modelo semelhante ao ChatGPT que arrecadou US$ 100 milhões é de código aberto! Disponível para uso comercial, 8 modelos
Fonte original: Comunidade Aberta AIGC
Na última terça-feira, a "AIGC Open Community" apresentou o Writer, uma plataforma generativa de IA que arrecadou US$ 100 milhões. A capacidade da empresa de obter um financiamento total de US$ 126 milhões em apenas três anos e se tornar um dos principais concorrentes do ChatGPT é inseparável de sua excelente tecnologia. Também prova plenamente que seu modelo tem casos de aplicação de sucesso e foi reconhecido pelo capital e pelos usuários.
Atualmente, o Writer abriu o código-fonte do grande modelo de linguagem Palmyra que usa no huggingface.Existem 8 modelos, nomeadamente small, base, 20b-chat, Instruct-20b, med-20b, etc., que estão comercialmente disponíveis e suportam dados finos. sintonia.
Endereço de código aberto:
Endereço de teste gratuito online:
Além de gerar texto, também pode extrair resumos de conteúdo de vídeos, PDFs e áudios; suporta ajuste fino de dados e as empresas podem criar seu próprio assistente "ChatGPT", etc.
InstruirPalmyra-20b
Este é um modelo de ajuste de instrução construído no modelo básico Palmyra-20b, suportando processamento avançado de linguagem natural e necessidades personalizadas.
O modelo InstructPalmyra-20b foi meticulosamente treinado em um extenso conjunto de dados de aproximadamente 70.000 registros de comando-resposta. Esses registros são gerados pela modelagem de linguagem profissional do Writer e pela equipe técnica de ajuste fino.
Além disso, o treinamento abrangente do modelo permite que ele se adapte e tenha um bom desempenho em diferentes condições e contextos, ampliando ainda mais seus possíveis casos de uso.
Palmira-com-20b
Palmyra-Med é o modelo do Writer construído especificamente para atender às necessidades do setor de saúde, com instruções ajustadas com base em dados médicos.
Palmyra-Med alcançou pontuações máximas quando testado nas principais questões biomédicas que respondem ao PubMedQA, com uma taxa de precisão de 81,1%, superando o GPT-4 e testadores humanos com treinamento médico.
Palmyra Grande 20B
Palmyra-Large é um modelo de decodificador causal construído pelo Writer, aprimorado pelo Palmyra-Index-Data e treinado em 800 bilhões de dados em um corpus de alta qualidade.
Palmyra Large usa um objetivo de modelagem de linguagem causal (CLM) durante o pré-treinamento do modelo. Semelhante ao GPT-3, é, portanto, pré-treinado com o objetivo de modelagem de linguagem causal auto-supervisionada.
Avaliação de desempenho
Palmyra recebeu a pontuação mais alta no Stanford HELM, superando modelos de código aberto bem conhecidos, como Falcon 40B e LLaMA-30B. HELM é uma plataforma de teste de benchmark muito conhecida do Centro de Pesquisa de Modelos Fundamentais da Universidade de Stanford.
Palmyra ficou em segundo lugar em dois outros testes importantes, com uma pontuação de perguntas e respostas contextuais de 49,7% e uma pontuação de TruthfulQA de 61,6%.O desempenho geral é muito forte.
Resumindo, Palmyra é muito valioso para desenvolvedores que desejam comercializar grandes modelos de linguagem para estudar sua arquitetura e funções de modelo e aprender com sua experiência bem-sucedida.