_ ¿El ingeniero está obsoleto? Nace una nueva carrera impulsada por los peces gordos de la IA

Fuente: SenseAI

Cuando la mayoría de la gente lamenta las enormes olas, los navegantes entusiastas ya se han puesto en marcha para encontrar el nuevo continente. Recientemente, Karpathy, el director de IA de Tesla y principal transmisor de IA que regresó a OpenAI no hace mucho, retuiteó el último episodio del podcast Latent Space, pensando que mantenerse al día con el desarrollo de la IA se ha convertido en un trabajo de tiempo completo. necesario, y la demanda superará con creces a los ingenieros de algoritmos de aprendizaje automático de hoy. En este número, continuaremos analizando más a fondo el retrato de capacidad de los talentos de IA que se necesitarán en el futuro.

Pensamiento sensorial

Tratamos de presentar una deducción más divergente y un pensamiento profundo basado en el contenido del artículo, bienvenido a intercambiar.

**Tecnología de modelos frente a aterrizaje de productos: **Mientras que la mayoría de la gente se lamenta de las enormes olas, los navegantes entusiastas se han puesto en marcha para encontrar nuevos continentes. Los artesanos que inventaron la brújula y construyeron barcos jugaron un papel en la época, y luego, marineros y trabajadores ampliaron el territorio.

**Era del software 3.0:**SenseAI una vez más enfatiza la red de agentes. Esta vez, la máquina viene a nosotros, y el lenguaje natural se convertirá en el paquete de lenguaje que completará la mayoría de las necesidades de desarrollo, liberando aún más la imaginación humana. Los agentes usan la densidad de interacción y la colaboración en red para resolver la ejecución, y lo que los humanos tienen que hacer es proponer imaginación de nivel inferior, destruir y reconstruir.

Este artículo tiene un total de 3255 palabras, y se tarda unos 9 minutos en leerlo detenidamente.

01. Nuevo trabajo: ingeniero de IA

Estamos observando un "cambio hacia la derecha" generacional de IA aplicada impulsado por las capacidades emergentes y la disponibilidad de código abierto/API de los modelos subyacentes. Una serie de tareas de inteligencia artificial que tomó 5 años y un equipo de investigación para completar en 2013 ahora se puede completar con solo documentación API y una tarde libre.

La API es universal: los ingenieros de IA pueden ir a la izquierda para optimizar/alojar modelos, y los ingenieros de investigación pueden ir a la derecha para crear aplicaciones sobre la API, pero sus fortalezas relativas y bases técnicas son claras.

Sin embargo, el trabajo más difícil está en los detalles específicos de implementación.En la actualidad, LLM todavía tiene los siguientes desafíos en términos de evaluación, aplicación y producción exitosas:

**1. Modelo:**Desde la evaluación de los modelos más grandes de GPT-4 y Claude, hasta los modelos más pequeños de código abierto Huggingface, LLaMA y otros.

2. Herramientas: desde las herramientas más populares de vinculación, recuperación y búsqueda de vectores, como LangChain, LlamaIndex y Pinecone, hasta el campo emergente de las herramientas de proxy, como Auto-GPT y BabyAGT.

3. Noticias: La cantidad de artículos, modelos y técnicas que se publican todos los días está creciendo exponencialmente con atención y capital, hasta el punto en que estar al tanto de todos estos desarrollos de vanguardia se ha convertido casi en un trabajo de tiempo completo. .

El LLM crea un trabajo de tiempo completo. La ingeniería de software incubará una nueva subdisciplina, se centrará en la aplicación de IA y utilizará de manera efectiva la pila de tecnología emergente, al igual que "ingeniero de confiabilidad del sitio", "ingeniero de operaciones y mantenimiento de desarrollo", "ingeniero de datos" y "Ingeniero analítico" como prometedor.

**Los ingenieros de IA ascenderán para representar este tipo de función. **

Casi todas las startups tienen algún tipo de grupo de discusión de IA. Estos grupos pasarán de grupos informales a equipos formales, como ya lo han hecho Amplitude, Replit y Notion. Esos miles de ingenieros de software que trabajan en la producción de modelos de OSS y API de IA, ya sea en el horario de la empresa o en las noches y los fines de semana, en Slack corporativo o Discord independiente, se especializarán y reunirán bajo un solo título: ingeniero de IA. Es probable que este sea el trabajo de ingeniería con mayor demanda en la próxima década.

Desde las empresas más grandes como Microsoft y Google, hasta startups de vanguardia como Figma (adquirida por Diagram), Vercel (RoomGPT de Hassan El Mghari) y Notion (Notion AI de Ivan Zhao y Simon Last), hasta hackers independientes como Simon Willison, Pieter Levels (Photo/InteriorAI) y Riley Goodside (ahora en Scale AI). Ganan $300,000 al año haciendo ingeniería de pistas en Anthropic y $900,000 construyendo software en OpenAI. Pasan los fines de semana libres trabajando en ideas en AGI House y compartiendo consejos en /r/LocalLLaMA2. Lo que todos tienen en común es que están convirtiendo los avances en inteligencia artificial en productos reales que son utilizados por millones casi de la noche a la mañana.

**Ninguno tiene un doctorado. Cuando se trata de lanzar productos de IA, se necesitan ingenieros, no investigadores. **

02, los ingenieros de IA reemplazarán a los ingenieros de ML

La demanda de ingenieros de IA crecerá rápidamente en el futuro. Actualmente en Indeed, los ingenieros de ML tienen 10 veces más oportunidades laborales que los ingenieros de IA, pero la tasa de crecimiento más alta de la IA lleva a creer que esta proporción se revertirá dentro de 5 años.

Gráfico de tendencia de empleo mensual para HN Quién está contratando

Todos los títulos de trabajo son unilaterales, pero algunos son útiles. Somos cautelosos y estamos cansados del interminable debate semántico entre IA y ML, pero somos muy conscientes de que el rol convencional de "ingeniero de software" es perfectamente capaz de crear software de IA. Sin embargo, una pregunta reciente en Ask HN sobre cómo entrar en la ingeniería de IA revela una percepción fundamental que aún existe en el mercado:

Captura de pantalla de junio de 2023: las respuestas más votadas a "Cómo introducirse en la ingeniería de IA"

La mayoría de las personas todavía ven la ingeniería de IA como una forma de aprendizaje automático o ingeniería de datos, por lo que recomiendan la misma pila tecnológica. Pero puede estar seguro de que ninguno de los ingenieros de inteligencia artificial altamente efectivos mencionados anteriormente ha realizado un trabajo equivalente al curso de Andrew Ng Coursera, no conocen PyTorch y no conocen la diferencia entre un lago de datos y un almacén de datos.

**Pronto, nadie sugerirá comenzar la ingeniería de IA leyendo Attention is All You Need, como tampoco aprenderá a conducir leyendo dibujos de un Ford Modelo T. Por supuesto, comprender los fundamentos y la historia siempre es útil, y realmente puede ayudarlo a encontrar innovaciones y ganancias de eficiencia/capacidad que aún no han entrado en la conciencia general. Pero a veces, puedes usar los productos directamente y conocer sus cualidades a través de la experiencia.

Es cierto que la reversión de los ingenieros de IA y los ingenieros de ML no sucederá de la noche a la mañana. La gente, naturalmente, quiere desarrollar sus currículums, completar mapas de mercado y destacar citando temas más profundos y autorizados. Dicho esto, la ingeniería rápida y la ingeniería de inteligencia artificial se sentirán en desventaja sobre aquellos con una sólida formación en ciencia de datos/aprendizaje automático durante mucho tiempo. Sin embargo, la economía de la oferta y la demanda finalmente ganará, y la demanda de ingenieros de IA superará con creces la de los ingenieros de ML.

**03 ¿Por qué ahora? **

  1. El modelo base es un "aprendiz de pocos intentos", que exhibe la capacidad de aprender incluso la transferencia de cero intentos en contexto, lo que va más allá de la intención original del entrenador del modelo. En otras palabras, las personas que crearon estos modelos no sabían completamente de lo que eran capaces. Aquellos que no son investigadores de LLM pueden descubrir y aprovechar estas capacidades simplemente pasando más tiempo interactuando con los modelos y aplicándolos a áreas de investigación subestimadas (por ejemplo, la aplicación de Jasper a la redacción publicitaria).

  2. Microsoft, Google, Meta y grandes laboratorios de modelos fundamentales han monopolizado el escaso talento de investigación, proporcionando esencialmente API de "investigación de IA como servicio". No puede contratarlos, pero puede alquilarlos, si tiene ingenieros de software en su equipo que sepan cómo trabajar con ellos. **Hay alrededor de 5000 investigadores LLM en todo el mundo, pero hay alrededor de 50 millones de ingenieros de software. Las limitaciones de suministro determinan que surgirá un ingeniero de IA "central" para satisfacer la demanda del mercado. **

** 3. Reserva de GPU. **Por supuesto, OpenAI/Microsoft fueron los primeros en hacer este trabajo, pero Stability AI provocó una carrera armamentista de GPU entre las nuevas empresas al enfatizar su clúster de 4000 GPU.

**4 Acción ágil directamente desde el producto. **En lugar de requerir que los científicos de datos/ingenieros de ML realicen un trabajo pesado de recopilación de datos antes de entrenar un modelo específico de dominio y luego ponerlo en producción, los gerentes de producto/ingenieros de software pueden solicitar LLM primero y construir/validar una idea de producto, luego Luego obtenga datos específicos para el ajuste fino.

Digamos que el último es 100x a 1000x más que el primero, y al seguir el flujo de trabajo "disparar, preparar, apuntar" de LLM, lo hace 10x a 100x más rápido que el aprendizaje automático tradicional. Como resultado, los ingenieros de IA podrán validar productos de IA a un costo entre 1000 y 10 000 veces menor. Este es otro desarrollo de Waterfall versus Agile, y AI es Agile.

** 5. Pitón → Java. **Data/AI ha dependido tradicionalmente en gran medida de Python, y las primeras herramientas de ingeniería de IA como LangChain, LlamaIndex y Guardrails también se originaron en la misma comunidad. Sin embargo, ahora hay tantos desarrolladores de Java como desarrolladores de Python, por lo que las herramientas ahora se adaptan cada vez más a esta base de usuarios ampliada, desde LangChain.js y Transformers.js hasta el nuevo AI SDK de Vercel. La oportunidad de expansión del mercado es enorme.

**6. IA generativa frente a Classifier ML. ** "IA generativa" como término ha pasado de moda, dando paso a otras categorías como "Motores de inferencia", pero establece de manera sucinta la diferencia entre las herramientas MLOps existentes y los profesionales de aprendizaje automático y lo que es más adecuado para usar LLM y Sigue siendo muy útil al observar el nuevo y distinto rol del generador de texto a imagen. Si bien la investigación de aprendizaje automático existente podría centrarse en cosas como el riesgo de fraude, los sistemas de recomendación, la detección de anomalías y el almacenamiento de características, los ingenieros de IA están creando aplicaciones de escritura, herramientas de aprendizaje personalizadas, hojas de cálculo de lenguaje natural y aplicaciones similares a Factorio.Lenguaje de programación visual.

Cada vez que hay un subgrupo con antecedentes completamente diferentes, hablando un idioma diferente, produciendo un producto completamente diferente y utilizando una herramienta completamente diferente, eventualmente se dividen en grupos separados.

04, 1+2=3: Programación en la era del software 3.0

Hace 6 años, Andrej Karpathy escribió un artículo muy influyente que describía el Software 2.0, contrastando la "pila clásica" de los lenguajes de programación escritos a mano tradicionales que modelan la lógica con precisión, y las nuevas redes neuronales de "aprendizaje automático" que aproximan la lógica. permitir que el software resuelva más problemas de los que los humanos pueden modelar. Este año, señaló en un artículo de seguimiento que el nuevo lenguaje de programación más popular es el inglés, y finalmente llenó el área gris que no marcó en su artículo original.

La ingeniería se convirtió en un meme el año pasado, describiendo cómo cambiará el trabajo cuando las personas comiencen a aprovechar GPT-3 y Stable Diffusion. Las personas se burlan de las nuevas empresas de IA por llamarlas "envolturas de OpenAI" y expresan su preocupación de que las aplicaciones LLM son vulnerables a la ingeniería de sugerencias y la ingeniería de sugerencias inversas. ¿Existen realmente las barreras? (Sense Says: consulte nuestro primer artículo "Sistemas inteligentes: el foso de las futuras empresas de IA")

Pero uno de los temas más importantes en 2023 será restablecer el papel del código escrito por humanos en la coordinación y el desplazamiento de las capacidades de LLM, desde Langchain de más de $ 200 millones hasta Voyager respaldado por Nvidia, lo que demuestra la clara importancia de la generación y reutilización de código. . La ingeniería está sobrevalorada y llegó para quedarse, pero el resurgimiento del paradigma del Software 1.0 en las aplicaciones del Software 3.0 es tanto una gran oportunidad como un área de confusión, que crea un espacio en blanco para numerosas empresas emergentes.

Un inversor que no sabe hacer estudios de mercado no es un buen inversor

Por supuesto, esto no es solo código escrito por humanos. Las historias de numerosos proyectos (smol-developer, más ampliamente gpt-engineer y las aventuras de otros agentes generadores de código como Codium AI, Codegen.ai y Morph/Rift) sugieren que serán cada vez más parte de la IA caja de herramientas del ingeniero. A medida que los ingenieros humanos aprendan a aprovechar la IA, la IA se involucrará cada vez más en la ingeniería.

Hasta que algún día en el futuro lejano miremos hacia arriba y ya no podamos distinguir la diferencia entre los dos.

Referencias

Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)