¡El modelo similar a ChatGPT que recaudó 100 millones de dólares es de código abierto! Disponible para uso comercial, 8 modelos.

Fuente original: Comunidad Abierta AIGC

Fuente de la imagen: Generada por Unbounded AI‌

El martes pasado, "AIGC Open Community" presentó Writer, una plataforma de inteligencia artificial generativa que recaudó 100 millones de dólares. La capacidad de la empresa para obtener una financiación total de 126 millones de dólares en sólo tres años y convertirse en uno de los principales competidores de ChatGPT es inseparable de su excelente tecnología y demuestra plenamente que su modelo tiene casos de aplicación exitosos y ha sido reconocido por el capital y los usuarios.

Actualmente, Writer ha abierto el modelo de lenguaje grande Palmyra que utiliza en huggingface. Hay 8 modelos, a saber, pequeño, base, 20b-chat, Instruct-20b, med-20b, etc., que están disponibles comercialmente y admiten datos finos. Afinación.

Dirección de código abierto:

Dirección de prueba gratuita en línea:

** Los aspectos técnicos más destacados de Palmyra incluyen: ** Pequeños parámetros y funciones potentes, que son muy útiles para pequeñas y medianas empresas y desarrolladores individuales sin recursos informáticos; ha recibido capacitación en redacción comercial y datos de marketing, principalmente para usuarios empresariales; empresa -Seguridad de datos de nivel, múltiples barandillas de seguridad integradas;

Además de generar texto, también puede extraer resúmenes de contenido de videos, PDF y audios; admite el ajuste de datos y las empresas pueden crear su propio asistente "ChatGPT", etc.

La siguiente "Comunidad abierta AIGC" presenta varios modelos especiales de Palmyra:

Instruir a Palmyra-20b

Este es un modelo de ajuste de instrucciones construido sobre el modelo básico Palmyra-20b, que admite el procesamiento avanzado del lenguaje natural y las necesidades personalizadas.

El modelo InstructPalmyra-20b fue entrenado meticulosamente en un extenso conjunto de datos de aproximadamente 70.000 registros de comando-respuesta. Estos registros son generados por el equipo técnico profesional de modelado y ajuste del lenguaje de Writer.

InstructPalmyra-20b tiene una excelente capacidad para procesar instrucciones complejas y generar respuestas contextuales precisas. Esto lo convierte en un modelo ideal para desarrollar una amplia gama de aplicaciones como asistentes virtuales, atención al cliente, generación de contenido y más.

Además, la formación integral del modelo le permite adaptarse y funcionar bien en diferentes condiciones y contextos, ampliando aún más sus posibles casos de uso.

Palmira-con-20b

Palmyra-Med es el modelo de Writer creado específicamente para satisfacer las necesidades de la industria de la salud, con instrucciones ajustadas en función de datos médicos.

Palmyra-Med obtuvo las máximas puntuaciones cuando se probó en las principales preguntas biomédicas que respondían PubMedQA, con una tasa de precisión del 81,1 %, superando a GPT-4 y a los evaluadores humanos con formación médica.

Puede proporcionar funciones como traducir terminología médica profesional, extraer resúmenes de notas médicas, analizar datos médicos masivos y generar automáticamente conocimientos médicos.

Palmira Grande 20B

Palmyra-Large es un modelo decodificador causal creado por Writer, mejorado por Palmyra-Index-Data y entrenado con 800 mil millones de datos en un corpus de alta calidad.

Palmyra Large utiliza un objetivo de modelado de lenguaje causal (CLM) durante el entrenamiento previo del modelo. Al igual que GPT-3, está preentrenado con el objetivo de modelar el lenguaje causal de forma autosupervisada.

Este modelo se ejecuta muy rápido y consume muy pocos recursos, y es adecuado para escenarios comerciales como atención médica, marketing, marketing, TI, diseño y recursos humanos para crear asistentes de IA personalizados.

Evaluación del desempeño

Palmyra recibió la puntuación más alta en Stanford HELM, superando a modelos de código abierto conocidos como Falcon 40B y LLaMA-30B. HELM es una plataforma de pruebas de referencia muy conocida del Centro de Investigación de Modelos Fundamentales de la Universidad de Stanford.

Palmyra ocupó el primer lugar en varias pruebas importantes, con una puntuación del 60,9 % en comprensión masiva del lenguaje multitarea (MMLU), del 89,6 % en BoolQ y del 79,0 % en NaturalQuestions.

Palmyra ocupó el segundo lugar en otras dos pruebas clave, con una puntuación de preguntas y respuestas contextuales del 49,7 % y una puntuación de TruthfulQA del 61,6 %. El rendimiento general es muy sólido.

En resumen, Palmyra es muy digno para que los desarrolladores que quieran comercializar modelos de lenguaje grandes estudien la arquitectura y las funciones de su modelo y aprendan de su experiencia exitosa.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)