Desde la segunda mitad de este año, Kuaishou ha estado desarrollando con frecuencia grandes negocios de modelos.
GenAI New World conoció de primera mano que el último progreso de Kuaishou en el campo de AIGC: el modelo de gráfico Vincent "Kolors" de desarrollo propio se ha lanzado completamente dentro de la empresa para pruebas internas.
Tras el lanzamiento del modelo de lenguaje grande "KwaiYii" el mes pasado, Kuaishou lanzó el modelo de gráfico Wensheng grande "Kolors" en menos de un mes. Posteriormente, se agregó el territorio de "Vincent Pictures".
GenAI New World aprendió de los miembros de investigación y desarrollo del equipo del proyecto Ketu que el modelo grande "Ketu" Wenshengtu tiene tres características sobresalientes, a saber, una poderosa comprensión del texto, una caracterización rica en detalles y una transformación de estilos diversos.
Desde el diseño de la página de inicio de la versión de prueba de la plataforma interna del modelo grande "Ketu", podemos ver que ya tiene un prototipo de producto maduro.
Página de inicio beta de la plataforma interna del modelo grande "Ketu"
Aunque el modelo grande "Ketu" aún no ha comenzado las pruebas externas, todavía podemos vislumbrar su rendimiento específico gracias a la función "AI Game Review" lanzada por la aplicación Kuaishou hace dos días.
"AI Game Review" se lanzó para pruebas internas en el sitio principal de Kuaishou el 15 de septiembre, con soporte técnico proporcionado por el modelo grande "Ketu" Wenshengtu.
Justo cuando pensábamos que esta era otra herramienta Wenshengtu puramente para creadores de videos cortos y que aparecería en el backend de edición de video, Kuaishou sorprendentemente puso la función "Revisión de reproducción AI" en el área de comentarios.
En otras palabras, cuando comentes un determinado vídeo corto en el futuro, es posible que ya no necesites buscar minuciosamente un paquete de imagen/emoticón adecuado: Kuaishou puede generar uno directamente para ti.
El día en que se lanzó la "Revisión del juego AI", los usuarios que habían calificado para la prueba ya habían comenzado a dejar mensajes de "deseos" en el área de comentarios oficial de Kuaishou.
GenAI New World también obtuvo la calificación para pruebas internas por primera vez. Echemos un vistazo a nuestra experiencia de primera mano.
Primero, abra el área de comentarios de cualquier video en la aplicación Kuaishou y busque el botón "AI" en el lado derecho del cuadro de entrada de comentarios. Puede ingresar fácilmente a la interfaz funcional "AI Play Review".
El requisito previo para generar imágenes es que debe ingresar un texto de al menos seis palabras. Después de ingresar, el ícono AI a la derecha se iluminará automáticamente, indicándole que puede comenzar a generar.
Primero pruebe algunas descripciones más convencionales para ver si lo entiende, como "un niño jugando en una playa soleada".
Después de unos segundos, aparecerá debajo un conjunto de imágenes generadas por IA, cada imagen está marcada con un estilo diferente, incluyendo Makoto Shinkai, pixel art, animación realista, estilo chino, cyberpunk, Pixar, etc. más de una docena de tipos. . Si no está satisfecho con los conjuntos de imágenes generados, también puede hacer clic en "Cambiar" en la esquina superior derecha para generar un nuevo conjunto.
A juzgar por las imágenes generadas, la comprensión es bastante buena.
Ingrese algunos poemas chinos antiguos más y realmente los entenderá:
A juzgar por los detalles de la imagen, ya sea la textura sutil de las hojas y los pétalos o los estambres claramente definidos, es raro que se manejen bien (también se reflejan los bordes muertos en la periferia de las hojas).
Se dice que el equipo de investigación de Kuaishou AI cambió la fórmula subyacente y la fórmula de adición de ruido del algoritmo de eliminación de ruido y, al mismo tiempo, seleccionó un lote de datos de alta calidad con altos detalles y alta estética para realizar un aprendizaje enfocado en las etapas posteriores. del aprendizaje modelo. Puede enriquecer los detalles y la textura de las imágenes generadas, lo que debe estar relacionado con esto.
Introduzcamos algunas frases con significados específicos en el contexto chino:
No está mal, al menos la carne de cerdo desmenuzada con sabor a pescado no está representada como un pescado y un trozo de carne, y puedes oler el picante del mapo tofu a través de la pantalla (incluso está adornado con cebolla verde picada).
Incluso puede entender qué es una persona Gan Fan (“Gan Fan” es originalmente un dialecto mandarín del suroeste):
Se puede decir que la comprensión de las expresiones chinas en el modelo grande "Ketu" se tuvo en cuenta desde el principio.
Según el personal de I+D de Kuaishou, Kuaishou AI tiene miles de millones de datos de entrenamiento de imágenes y texto, que se sintetizan a partir de la comunidad de código abierto y tecnología de IA de desarrollo propio, y cubren 30 millones de conceptos de entidades chinas comunes. Modelo CLIP chino.
El LLM chino de desarrollo propio combinado con las características gráficas y de texto de CLIP se utiliza como módulo de comprensión de texto del gráfico vicenciano, lo que permite que el modelo grande "graficable" comprenda mejor los conceptos característicos chinos y reduzca los problemas comunes en el campo de los gráficos vicencianos. como conceptos complejos y confusión de atributos.
Sin embargo, dado que la función "Revisión de juegos de IA" está ubicada en el área de comentarios, también deberíamos echar un vistazo a cómo funciona en el escenario de comentarios.
Aprovechando un tema candente, ingresé la descripción de mi estado de ánimo "Estoy muy frustrado porque no puedo conseguir un boleto de tren". "AI Game Review" aún generó algunas imágenes interesantes que pueden reflejar mejor esta emoción:
Y cuando escribí la expresión clásica "No entiendo, pero me sorprendió", descubrí que el estilo de figura de palo generado y el estilo de Makoto Shinkai eran los más apropiados (¿el estilo generado más popular programado?):
Después de la experiencia general, la "Revisión del juego de IA" sigue siendo notable. Por supuesto, la premisa sigue siendo que se puede indicar a la IA con descripciones apropiadas y relativamente comunes. Y si se tienen en cuenta las características generales de los internautas que expresan libremente sus estados de ánimo y coloquialismos al comentar, esta función aún se puede explorar mucho.
En la función "Revisión del juego AI", podemos ver algunos de los pensamientos de Kuaishou sobre la aplicación de modelos grandes, es decir, hay un fuerte énfasis en el "aterrizaje".
A diferencia de muchas empresas anteriores que se comprometieron a crear productos de modelos grandes de propósito general, las comunidades de contenido de video corto como Kuaishou deberían prestar más atención a la integración con la comunidad en el desarrollo de funciones de productos de modelos grandes y preocuparse por si los usuarios realmente pueden usarlos. .
Al igual que la función "Diálogo AI" lanzada en agosto basada en el modelo grande "Ruyi", parte de ella se basa en escenarios de búsqueda, lo que permite a los usuarios encontrar contenido en la plataforma de manera más conveniente y precisa (las respuestas también estarán acompañadas de información relacionada). videos, enlace de la Enciclopedia), la idea de servir a los usuarios también se extiende a las "reseñas de juegos de IA".
En cuanto a por qué el modelo grande "Ketu" se publicó por primera vez en el área de comentarios del sitio de Kuaishou, la respuesta oficial de Kuaishou es:
"El número acumulado de pares de usuarios mutuamente relacionados de las aplicaciones Kuaishou supera los 31,1 mil millones, un aumento interanual de casi el 50%, y la interacción diaria promedio (incluidos me gusta, comentarios y reenvíos, etc.) asciende a 8 mil millones de veces. Videos cortos con fuerte adherencia al usuario El área de comentarios se ha convertido en uno de los mejores escenarios de aplicación para las capacidades AIGC... (dedicar tiempo y energía a encontrar imágenes coincidentes) ha inhibido en gran medida la disposición de los usuarios a publicar comentarios. La revisión de IA puede aumentar en gran medida los usuarios ' entusiasmo y entusiasmo por participar en los comentarios. Satisfacción.”
Por supuesto, ahora que el modelo grande "imaginable" se ha convertido en un producto, Kuaishou puede tener mayores ambiciones detrás de él.
Durante la conferencia telefónica sobre resultados del primer trimestre en mayo de este año, el director ejecutivo de Kuaishou, Cheng Yixiao, reveló al mundo exterior por primera vez el progreso del gran negocio de modelos de Kuaishou: se ha establecido un gran equipo de investigación y desarrollo de modelos, basándose en tecnologías anteriores de AIGC. algoritmos y modelos de lenguaje a gran escala Acumular y promover el desarrollo y la capacitación de modelos a gran escala según lo planeado.
Dos meses después, Kuaishou anunció el 8 de julio que comenzaría las pruebas internas de su “producto de búsqueda inteligente de preguntas y respuestas”, dando inicio al lanzamiento de aplicaciones modelo a gran escala.
Lo que sigue es un lanzamiento relativamente intensivo de productos y funciones: el 8 de agosto, Kuaishou comenzó las pruebas internas de la función "AI Conversation", el 21 de agosto, el modelo de lenguaje grande "Ruyi" comenzó las pruebas internas y el 15 de septiembre, el principal El sitio web lanzó pruebas internas de la función "AI Game Review", hasta hoy apareció el modelo grande de "Ketu" Wenshengtu...
Vale la pena señalar que Kuaishou presentó oficialmente y en detalle el progreso de su negocio de modelos grandes por primera vez en la Conferencia de Creadores Fotosintéticos celebrada para creadores de plataformas el 10 de agosto de este año.
Kuaishou anunció en esta conferencia una serie de novedades para su negocio de modelos grandes, que hasta ahora rara vez se había revelado al mundo exterior. Esto incluye varias capacidades para la generación de texto, imágenes, videos e incluso material 3D y audio musical, cubriendo todos los aspectos de la estimulación creativa, extracción de materiales y edición y producción de creación de videos. También se enfoca en la escena de transmisión en vivo para crear rápidamente la propia escena del usuario. La solución humana digital gemela "Kuaishou Zhibo".
Incluso la propia conferencia anual, incluidos los carteles y las apariciones de invitados, rara vez está llena de elementos del AIGC.
Kuaishou, que optó por desarrollar su propio modelo grande desde cero, ha acumulado mucho sin saberlo y lentamente construyó lo que llama una "solución AIGC de modelo grande de modo completo".
Por tanto, se puede decir que Kuaishou está bien preparado a la hora de lanzar esta vez un modelo grande "tutuable".
Aunque las principales empresas nacionales han comenzado a lanzar sus propios productos de modelos grandes este año, en lo que respecta a las empresas de contenidos, no hemos visto un producto realmente impresionante. ¿Cómo podemos entrenar un modelo confiable? Sobre la base de modelos grandes, más nuevos Se explorarán formas de jugar para las empresas de contenidos, lo cual es muy emocionante de pensar.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
De primera mano | El modelo grande Wenshengtu “Ketu” desarrollado por Kuaishou ya está aquí y ha comenzado las pruebas internas en un futuro próximo.
Fuente original: GenAI Nuevo Mundo
Autor|Li Hezi
Desde la segunda mitad de este año, Kuaishou ha estado desarrollando con frecuencia grandes negocios de modelos.
GenAI New World conoció de primera mano que el último progreso de Kuaishou en el campo de AIGC: el modelo de gráfico Vincent "Kolors" de desarrollo propio se ha lanzado completamente dentro de la empresa para pruebas internas.
Tras el lanzamiento del modelo de lenguaje grande "KwaiYii" el mes pasado, Kuaishou lanzó el modelo de gráfico Wensheng grande "Kolors" en menos de un mes. Posteriormente, se agregó el territorio de "Vincent Pictures".
GenAI New World aprendió de los miembros de investigación y desarrollo del equipo del proyecto Ketu que el modelo grande "Ketu" Wenshengtu tiene tres características sobresalientes, a saber, una poderosa comprensión del texto, una caracterización rica en detalles y una transformación de estilos diversos.
Desde el diseño de la página de inicio de la versión de prueba de la plataforma interna del modelo grande "Ketu", podemos ver que ya tiene un prototipo de producto maduro.
Aunque el modelo grande "Ketu" aún no ha comenzado las pruebas externas, todavía podemos vislumbrar su rendimiento específico gracias a la función "AI Game Review" lanzada por la aplicación Kuaishou hace dos días.
"AI Game Review" se lanzó para pruebas internas en el sitio principal de Kuaishou el 15 de septiembre, con soporte técnico proporcionado por el modelo grande "Ketu" Wenshengtu.
Justo cuando pensábamos que esta era otra herramienta Wenshengtu puramente para creadores de videos cortos y que aparecería en el backend de edición de video, Kuaishou sorprendentemente puso la función "Revisión de reproducción AI" en el área de comentarios.
En otras palabras, cuando comentes un determinado vídeo corto en el futuro, es posible que ya no necesites buscar minuciosamente un paquete de imagen/emoticón adecuado: Kuaishou puede generar uno directamente para ti.
El día en que se lanzó la "Revisión del juego AI", los usuarios que habían calificado para la prueba ya habían comenzado a dejar mensajes de "deseos" en el área de comentarios oficial de Kuaishou.
Primero, abra el área de comentarios de cualquier video en la aplicación Kuaishou y busque el botón "AI" en el lado derecho del cuadro de entrada de comentarios. Puede ingresar fácilmente a la interfaz funcional "AI Play Review".
Primero pruebe algunas descripciones más convencionales para ver si lo entiende, como "un niño jugando en una playa soleada".
Después de unos segundos, aparecerá debajo un conjunto de imágenes generadas por IA, cada imagen está marcada con un estilo diferente, incluyendo Makoto Shinkai, pixel art, animación realista, estilo chino, cyberpunk, Pixar, etc. más de una docena de tipos. . Si no está satisfecho con los conjuntos de imágenes generados, también puede hacer clic en "Cambiar" en la esquina superior derecha para generar un nuevo conjunto.
A juzgar por las imágenes generadas, la comprensión es bastante buena.
Introduzcamos algunas frases con significados específicos en el contexto chino:
Incluso puede entender qué es una persona Gan Fan (“Gan Fan” es originalmente un dialecto mandarín del suroeste):
Según el personal de I+D de Kuaishou, Kuaishou AI tiene miles de millones de datos de entrenamiento de imágenes y texto, que se sintetizan a partir de la comunidad de código abierto y tecnología de IA de desarrollo propio, y cubren 30 millones de conceptos de entidades chinas comunes. Modelo CLIP chino.
El LLM chino de desarrollo propio combinado con las características gráficas y de texto de CLIP se utiliza como módulo de comprensión de texto del gráfico vicenciano, lo que permite que el modelo grande "graficable" comprenda mejor los conceptos característicos chinos y reduzca los problemas comunes en el campo de los gráficos vicencianos. como conceptos complejos y confusión de atributos.
Sin embargo, dado que la función "Revisión de juegos de IA" está ubicada en el área de comentarios, también deberíamos echar un vistazo a cómo funciona en el escenario de comentarios.
Aprovechando un tema candente, ingresé la descripción de mi estado de ánimo "Estoy muy frustrado porque no puedo conseguir un boleto de tren". "AI Game Review" aún generó algunas imágenes interesantes que pueden reflejar mejor esta emoción:
En la función "Revisión del juego AI", podemos ver algunos de los pensamientos de Kuaishou sobre la aplicación de modelos grandes, es decir, hay un fuerte énfasis en el "aterrizaje".
A diferencia de muchas empresas anteriores que se comprometieron a crear productos de modelos grandes de propósito general, las comunidades de contenido de video corto como Kuaishou deberían prestar más atención a la integración con la comunidad en el desarrollo de funciones de productos de modelos grandes y preocuparse por si los usuarios realmente pueden usarlos. .
Al igual que la función "Diálogo AI" lanzada en agosto basada en el modelo grande "Ruyi", parte de ella se basa en escenarios de búsqueda, lo que permite a los usuarios encontrar contenido en la plataforma de manera más conveniente y precisa (las respuestas también estarán acompañadas de información relacionada). videos, enlace de la Enciclopedia), la idea de servir a los usuarios también se extiende a las "reseñas de juegos de IA".
En cuanto a por qué el modelo grande "Ketu" se publicó por primera vez en el área de comentarios del sitio de Kuaishou, la respuesta oficial de Kuaishou es:
Por supuesto, ahora que el modelo grande "imaginable" se ha convertido en un producto, Kuaishou puede tener mayores ambiciones detrás de él.
Durante la conferencia telefónica sobre resultados del primer trimestre en mayo de este año, el director ejecutivo de Kuaishou, Cheng Yixiao, reveló al mundo exterior por primera vez el progreso del gran negocio de modelos de Kuaishou: se ha establecido un gran equipo de investigación y desarrollo de modelos, basándose en tecnologías anteriores de AIGC. algoritmos y modelos de lenguaje a gran escala Acumular y promover el desarrollo y la capacitación de modelos a gran escala según lo planeado.
Dos meses después, Kuaishou anunció el 8 de julio que comenzaría las pruebas internas de su “producto de búsqueda inteligente de preguntas y respuestas”, dando inicio al lanzamiento de aplicaciones modelo a gran escala.
Lo que sigue es un lanzamiento relativamente intensivo de productos y funciones: el 8 de agosto, Kuaishou comenzó las pruebas internas de la función "AI Conversation", el 21 de agosto, el modelo de lenguaje grande "Ruyi" comenzó las pruebas internas y el 15 de septiembre, el principal El sitio web lanzó pruebas internas de la función "AI Game Review", hasta hoy apareció el modelo grande de "Ketu" Wenshengtu...
Vale la pena señalar que Kuaishou presentó oficialmente y en detalle el progreso de su negocio de modelos grandes por primera vez en la Conferencia de Creadores Fotosintéticos celebrada para creadores de plataformas el 10 de agosto de este año.
Kuaishou anunció en esta conferencia una serie de novedades para su negocio de modelos grandes, que hasta ahora rara vez se había revelado al mundo exterior. Esto incluye varias capacidades para la generación de texto, imágenes, videos e incluso material 3D y audio musical, cubriendo todos los aspectos de la estimulación creativa, extracción de materiales y edición y producción de creación de videos. También se enfoca en la escena de transmisión en vivo para crear rápidamente la propia escena del usuario. La solución humana digital gemela "Kuaishou Zhibo".
Incluso la propia conferencia anual, incluidos los carteles y las apariciones de invitados, rara vez está llena de elementos del AIGC.
Kuaishou, que optó por desarrollar su propio modelo grande desde cero, ha acumulado mucho sin saberlo y lentamente construyó lo que llama una "solución AIGC de modelo grande de modo completo".
Por tanto, se puede decir que Kuaishou está bien preparado a la hora de lanzar esta vez un modelo grande "tutuable".
Aunque las principales empresas nacionales han comenzado a lanzar sus propios productos de modelos grandes este año, en lo que respecta a las empresas de contenidos, no hemos visto un producto realmente impresionante. ¿Cómo podemos entrenar un modelo confiable? Sobre la base de modelos grandes, más nuevos Se explorarán formas de jugar para las empresas de contenidos, lo cual es muy emocionante de pensar.