¡Hoy, el "intérprete de código" de ChatGPT se levanta oficialmente! Convierte imágenes en videos en 30 segundos y haz relojes con tu boca | Las obras completas de diez magia asombrosa

Fuente: Xinzhiyuan

En espera de más de 3 meses, el "intérprete de código" de ChatGPT finalmente está completamente abierto y se avecina una ola de magia.

¡Familias, por fin está aquí!

Justo ahora, la versión beta del "intérprete de código" de ChatGPT está oficialmente abierta a todos los usuarios de Plus.

Karpathy, un científico de OpenAI, también hizo público esto, y la versión beta del intérprete de código es bastante poderosa.

Es su analista de datos personales: puede leer archivos cargados, ejecutar código, generar gráficos, análisis estadísticos y más. Espero que la comunidad tarde un tiempo en revelar todo su potencial.

Hace algún tiempo, la disminución de la capacidad de GPT4 causó un gran revuelo en Internet, y algunas personas incluso pensaron que era un poco más fuerte que GPT3.5.

Y ahora, el intérprete de código hace que la gente sienta de nuevo que el familiar y potente GPT-4 ha vuelto.

Tan pronto como se lanzó el complemento, muchos internautas comenzaron a probarlo.

Función de desbloqueo

Entonces, ¿qué puede hacer exactamente un "intérprete de código"?

30 segundos, la imagen se convierte en video

No, algunos internautas en realidad usaron ChatGPT para convertir fotos en videos. Este efecto es aún más explosivo que Midjourney y Runway.

¿Cómo se hace esto? Los internautas dieron un conjunto completo de tutoriales.

Paso 1: Abra el "Modelo de intérprete de código". Para habilitarlo, vaya a Configuración -> Funciones beta -> Intérprete de código.

Segundo paso:

Seleccione la opción Intérprete de código en el menú desplegable. Luego, cargue la imagen que desea animar.

Paso tres:

Quiero mostrar algo de comida de un restaurante elegante. Entonces, le pedí a ChatGPT que animara esta imagen de comida de izquierda a derecha. Al modificar mis sugerencias de GPT (ver más abajo), puede crear sus propias animaciones.

detalles de la siguiente manera:

Paso cuatro:

Presiona enter. Después de 30 segundos, ChatGPT le dará un enlace de descarga del video.

El cofundador Greg Brockman retuitea el intérprete de código para la conversión de imágenes cuando es imposible recordar las llamadas ffmpeg.

Los hechos han demostrado que el "intérprete de código" es realmente bueno. Ahora, si corta un video, solo necesita una oración para hacerlo.

"Hay un cierto límite de capacidad de memoria, pero no hay problema para procesar archivos pequeños. Acabo de enviar un video gen-2 de 4 segundos a TA, intercepté los primeros dos segundos, no hay problema, y se hizo rápidamente.

Probará automáticamente el código apropiado. Si desea programar, puede enviar un archivo a ta y solicitarlo, y luego mirar el código proporcionado por ta ".

### PDF a imagen

"Bao Yu", un conocido blogger de tecnología de Internet en China, usó un "intérprete de código" para convertir archivos PDF en imágenes.

En el pasado, era necesario combinar el contenido de cada página en una sola imagen, pero ahora uno puede hacerlo.

### GIF a vídeo

Además de convertir imágenes en videos, también puede convertir GIF en videos.

Los internautas le dieron una pista a ChatGPT: subo un GIF, me das un MP4 de 5s y uso una lente de historia para acercar lentamente.

Subir GIF

Finalmente ChatGPT generó el video inmediatamente

, duración 00:05

Además, ChatGPT también puede crear un GIF de "matriz".

### Generar código QR

Hace dos días, OpenAI anunció que el "intérprete de código" ChatGPT estará completamente abierto.

Muestra un ejemplo que puede generar un código QR, en una sola frase puedes completar la tarea con solo mover la boca.

### Analista de datos de "bolsillo"

El mayor caso de uso para los intérpretes de código es el análisis de datos.

Por ejemplo, permita que analice los datos de esperanza de vida de varios países, las ciudades más grandes del mundo (puede cargar archivos CSV, Word, PDF o video)

Luego, hable con los datos y haga cualquier pregunta que desee hacer.

O solicite extraer tendencias aleatorias únicas de sus datos para una sorpresa.

Por ejemplo, encuentre tendencias únicas en dos conjuntos de datos y muéstrelos en forma tabular.

El paso final, la visualización.

Convierta los datos en cualquier tabla o gráfico que desee. Lo mejor de todo es que está a solo un clic de distancia.

Por ejemplo, genere un diagrama de dispersión que ilustre la relación entre el PIB per cápita de un país y su expectativa de vida promedio.

Al ver a un "analista de datos" tan poderoso, los internautas comenzaron a RIP nuevamente.

guía del usuario

¿Cómo usar el "intérprete de código"? Un profesor de Wharton, Ethan Mollick, escribió una guía precisamente para esto.

En primer lugar, Mollick señaló que el nombre Code Interpreter continúa con la larga tradición de OpenAI de dar malos nombres a sus propios productos.

Porque, aunque se le llama "intérprete de código", de hecho es más útil para aquellos que no entienden nada de programación.

Esencialmente, el "intérprete de código" permite que GPT-4 cargue y descargue información, y escriba y ejecute programas para el usuario, lo que permite que AI haga todo tipo de cosas que antes no podía hacer.

Específicamente, proporciona a AI una caja de herramientas general para resolver problemas (escribiendo código en Python), gran memoria (hasta 100 MB, puede estar en forma comprimida) y los usuarios pueden integrar esta caja de herramientas en AI para jugar LLM Las ventajas.

Esto ayuda a solucionar muchos problemas con versiones anteriores de ChatGPT. Por ejemplo,

Permite que la IA maneje matemáticas (incluso si es compleja), pero también que maneje palabras con mayor precisión (como contar palabras en un párrafo), y la razón subyacente es que puede escribir código Python para abordar las debilidades naturales de LLM en matemáticas y idioma.

Por ejemplo, como la imagen de abajo.

Como puede ver, el "intérprete de código" puede contar con precisión el número de palabras en el párrafo.

Además, el "código intérprete" reduce las posibilidades de alucinaciones y tonterías.

Cuando una IA usa Python directamente, el código ayuda a mantenerlo "honesto". La razón también es muy simple, si el código es incorrecto, Python informará un error. Dado que el código opera con datos, AI no puede insertar errores en los datos.

Por supuesto, no es perfecto. Todavía existe la posibilidad de que la IA alucine, pero esto no es común y es poco probable que afecte el código o los datos en sí.

De esta manera, la IA está más cerca de la inteligencia artificial general: una gran cantidad de problemas se pueden resolver mediante código.

Además, GPT-4 es muy bueno para decidir cuándo usar un "intérprete de código" en formas nuevas e interesantes.

Mollick dio un ejemplo, si GPT-4 le demostrara al usuario que la Tierra es redonda, entonces se usaría un "intérprete de código", proporcionando múltiples argumentos, combinando texto con código e imágenes.

Anteriormente, las personas que necesitaban programar en varias especializaciones tenían que saber cómo escribir código, pero tenían que depurarlo por sí mismos después de escribirlo. Incluso si la IA anterior puede proporcionar alguna ayuda, todavía es bastante difícil para las personas que no tienen un conocimiento básico de Python, y tienen que usar el poder de la IA para modificar el código repetidamente.

¡Y ahora, con el "intérprete de código", la IA puede corregir errores y depurar por sí misma!

Luego, Mollick habló sobre cómo usar el "intérprete de código" para procesar datos, lo que puede considerarse un verdadero problema para una gran cantidad de usuarios.

Mollick dijo que el "intérprete de código" opera a un nivel muy avanzado, puede manejar automáticamente muchos análisis cuantitativos complejos y puede adoptar métodos de datos muy complejos.

Los usuarios pueden cargar datos fácilmente, incluso datos comprimidos como archivos ZIP, simplemente haciendo clic en el signo más.

Al mismo tiempo, al proporcionar datos, es mejor si el usuario puede dar uno. ¡La IA puede descifrar el significado y la estructura de los datos a partir del contexto!

Además, Mollick señaló que al usar el "intérprete de código", el usuario está más en un "diálogo" con la IA, y no necesita devanarse los sesos para escribir uno riguroso y conciso.

Al igual que conversar con un analista de datos, la forma en que habla con las personas es la forma en que se comunica con el "intérprete de código".

Pero hay dos casos especiales aquí, y aún necesita escribir algo similar.

Una es que la IA a veces no recuerda lo que puede hacer, y en este momento necesita uno para despertar la IA.

Por ejemplo: "Puedes crear GIF, inténtalo".

Otra situación es que cuando el usuario no está satisfecho con el resultado, se puede utilizar el "intérprete de código" para optimizar el resultado.

Por ejemplo: "Ejecute más pruebas con este resultado" o "¿Se puede mejorar este gráfico?".

Después de cargar los datos, GPT puede realizar operaciones de fusión y limpieza de datos. El método de procesamiento específico es bastante complicado, pero como se mencionó anteriormente, solo piense en el "intérprete de código" como un analista de datos cara a cara.

Al mismo tiempo, Mollick recuerda a los usuarios que es mejor verificar los resultados después de que la IA se corrija y se corrija a sí misma, en caso de que algo salga mal.

Inmediatamente después de que Mollick lo practicara, le pidió al "intérprete de código" que hiciera un modelo predictivo para predecir qué superpoderes podría tener un superhéroe.

Como puede ver, el "intérprete de código" crea un Random Forest Distributor.

Por supuesto, en el proceso de operación real, los usuarios todavía tienen que "comunicarse más" con GPT. Mollick no quiere que la IA utilice datos numéricos para estimar los datos que faltan, sino que quiere descartar la parte que falta directamente.

Pero señaló que también es posible hablar con GPT y dejar que cambie a un método de procesamiento diferente.

Posteriormente, Mollick envió a GPT una pregunta "¿Puede hacer otro análisis complejo e interesante?". Dijo que estaba impresionado por algunos de los métodos de análisis elegidos por Code Interpreter.

Al igual que la imagen de abajo.

"Code Interpreter" analiza hábilmente la situación de la red de las superpotencias. Como puedes ver, los métodos son diversos y muy interesantes.

Lo más impresionante del "intérprete de código" debería ser su capacidad de razonamiento. Mollick lo resumió como muy "humano".

Además, el nivel de interactividad en las visualizaciones sigue en línea y mejorando. Los usuarios pueden dejar que AI mejore o cambie continuamente el contenido de salida.

Mollick hizo que la IA creara una tabla interactiva, que incluía seis gráficos, uno de ellos en 3D.

Para hacer el gráfico más hermoso, Mollick continuó ingresando y ajustando los resultados.

El resultado final se parece al de la derecha en la imagen de abajo.

Las 10 magias más asombrosas

El internauta @GPTDAOCN resumió recientemente los diez casos de uso más impactantes de ChatGPT:

Visualización del intérprete de código

  1. Convertir GIF a MP4: puede convertir imágenes dinámicas (GIF) en archivos de video (MP4), lo que facilita compartir y usar.

  2. Cree varios gráficos: puede usar esta función para generar varios gráficos, como histogramas, gráficos de líneas, gráficos circulares, etc., para presentar y analizar visualmente sus datos.

  3. Extraer colores de la imagen para crear una paleta PNG: esta función puede extraer los colores principales de cualquier imagen y luego generar una paleta en formato PNG.

  4. Limpie los datos para generar una visualización detallada: si tiene algunos datos desordenados, esta función puede ayudarlo a limpiarlos y organizarlos, y luego convertirlos en una visualización clara.

  5. Convertir archivo CSV a GIF: esta función puede mostrar los datos en el archivo CSV (valores separados por comas) de forma dinámica y generar una imagen GIF.

  6. Analice listas de reproducción para resumir su gusto musical: puede usar esta función para analizar sus listas de reproducción de música para resumir su gusto musical.

  7. Convierta su conjunto de datos en un sitio web HTML completamente funcional: esta función puede convertir rápidamente sus datos en un sitio web completamente funcional para que lo muestre y comparta.

  8. Cree un conjunto de datos de acciones descargable: esta función puede ayudarlo a crear un conjunto de datos de acciones, y este conjunto de datos se puede descargar, lo cual es conveniente para realizar análisis e investigaciones en profundidad.

  9. Convierta imágenes en archivos de texto: si necesita extraer texto de las imágenes, esta función puede ayudarlo a convertir el texto de las imágenes en archivos de texto.

  10. Análisis detallado de datos sin formato: para aquellos datos sin formato sin un formato específico, esta función puede ayudarlo a realizar un análisis en profundidad para obtener información valiosa.

De hecho, los casos de uso de los intérpretes de código son mucho más que estos.

Comentarios de los internautas

Estoy probando el intérprete de código ChatGPT. Hasta ahora, todo lo que puedo sugerir es que "todos los desarrolladores comiencen a trabajar en él ahora".

¿Cuántas vidas de personas han sido cortadas por Code Interpreter? Demasiados administradores procesan datos de manera ineficiente todos los días y ahora solo necesitan lenguaje natural para automatizar la oficina.

Referencias:

Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)