Muchos de los 14 autores que participaron en el estudio Llama se han ido.
En febrero de este año, Meta "abrió el código" de una nueva serie de modelos grandes: Llama (Large Language Model Meta AI), con cantidades de parámetros que oscilan entre 7 mil millones y 65 mil millones. Unos meses más tarde, el lanzamiento de Llama 2 marcó el comienzo de la comercialización de modelos grandes. Mucha gente describió el código abierto de Llama 2 como el "momento Android" de los modelos grandes.
Debido al excelente rendimiento de los modelos de las series Llama y Llama 2, muchas personas los consideran alternativas gratuitas y de código abierto a modelos más grandes como ChatGPT. Todo el mundo elogia a Meta por sus contribuciones a la comunidad de código abierto, pero para algunos de los científicos e ingenieros involucrados en el proyecto Llama, esos elogios fueron demasiado pocos y demasiado tarde.
Según The Information, personas familiarizadas con la situación interna dijeron que muchas personas involucradas en el proyecto Llama renunciaron debido a una lucha interna entre otro equipo de investigación en Meta y el equipo de Llama por los recursos informáticos. El equipo estaba trabajando en un modelo competitivo, pero finalmente lo abandonó por razones desconocidas.
Si bien estas fueron revelaciones internas, sus salidas son un recordatorio de que las empresas de tecnología, grandes y pequeñas, están lidiando con tensiones por la escasez de recursos informáticos mientras desarrollan modelos de IA generativa que requieren chips dedicados, y esos chips no son gratuitos. Las grandes empresas de tecnología tienen más recursos informáticos que la mayoría, un hecho que algunas empresas, como Meta, están enfatizando al contratar investigadores de IA.
Vemos que incluso las grandes empresas tienen recursos limitados que pueden ofrecer. A medida que aumenta la demanda de talento en IA, el éxodo también pone de relieve los desafíos que enfrentan las grandes empresas de tecnología para retener el talento en IA.
Llama Este artículo "LLaMA: Modelos lingüísticos básicos abiertos y eficientes" se publicó en febrero de este año. Hay 14 autores. Ahora varios de ellos han dimitido, algunos se han ido a nuevas empresas de nueva creación y otros han iniciado actividades empresariales.
Dirección del papel:
Echemos un vistazo a los que han dimitido.
Gautier Izacard
Gautier Izacard comenzó a trabajar en Meta en 2020 y dejará Meta en abril de 2023 para unirse a la startup Inflection AI en 2022.
Inflection AI tiene muchos antecedentes: sus tres cofundadores son el cofundador original de DeepMind, Mustafa Suleyman, el cofundador de Linkedln, Reid Hoffman, y la ex científica jefe de DeepMind, Karen Simonyan. En junio de este año, Inflection AI también anunció que la compañía había recaudado 1.300 millones de dólares en una nueva ronda de financiación, liderada por Microsoft, Nvidia y Reid Hoffman, Bill Gates y el ex director ejecutivo de Google, Eric Schmidt.
*Tres cofundadores de Inflection AI. *
Timothée Lacroix
Timothee Lacroix se unió al Facebook AI Research Lab en 2015 como ingeniero de investigación. En junio de 2023, dejó Meta (Facebook) y se unió a la startup francesa Mistral AI como director de tecnología (CTO).
Armand Joulin
Armand Joulin se doctoró en 2012 en el INRIA y en la Ecole Normale Supérieure (ENS). Armand Joulin se unió a Meta en 2014 como investigador científico, gerente senior de investigación y director de investigación. Antes de unirse a Meta, Armand fue investigador postdoctoral en la Universidad de Stanford, trabajando con Daphne Koller y Feifei Li. En mayo de 2023, Armand Joulin dimitió del Meta.
Guillaume Lampe
Guillaume Lample es ahora cofundador y científico jefe de Mistral AI. Dejó Meta en marzo de este año, después de haber trabajado aquí durante más de seis años. Su puesto anterior en Meta era como científico investigador.
Guillaume Lample tiene una maestría de la Universidad Carnegie Mellon y un doctorado de la Universidad de París VI.
Por último, nos gustaría presentarles la nueva empresa Mistral AI, fundada en mayo de este año. La agencia se centra principalmente en la investigación y el desarrollo de modelos de IA generativa, compitiendo con OpenAI. Los cofundadores incluyen a Arthur MENSCH (y director ejecutivo), Guillaume Lample (y director científico) y Timothee Lacroix como director de tecnología.
Según Techcrunch, planean lanzar el primer modelo de inteligencia artificial generativa basado en texto en 2024. En junio de este año, Mistral AI, que se estableció hace solo 4 semanas, recibió 113 millones de dólares en financiación de ronda inicial.
Ya hemos presentado anteriormente a Guillaume Lample y Timothee Lacroix. Como director ejecutivo, Arthur MENSCH trabajó anteriormente en DeepMind (ahora fusionada con Google DeepMind) durante más de 2 años y participó en la investigación del modelo de lenguaje visual Flamingo.
referencias:
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Meta estuvo expuesta a feroces luchas internas por los recursos informáticos y muchos autores de Llama dimitieron.
Editores: Xiaozhou, Chen Ping
En febrero de este año, Meta "abrió el código" de una nueva serie de modelos grandes: Llama (Large Language Model Meta AI), con cantidades de parámetros que oscilan entre 7 mil millones y 65 mil millones. Unos meses más tarde, el lanzamiento de Llama 2 marcó el comienzo de la comercialización de modelos grandes. Mucha gente describió el código abierto de Llama 2 como el "momento Android" de los modelos grandes.
Debido al excelente rendimiento de los modelos de las series Llama y Llama 2, muchas personas los consideran alternativas gratuitas y de código abierto a modelos más grandes como ChatGPT. Todo el mundo elogia a Meta por sus contribuciones a la comunidad de código abierto, pero para algunos de los científicos e ingenieros involucrados en el proyecto Llama, esos elogios fueron demasiado pocos y demasiado tarde.
Según The Information, personas familiarizadas con la situación interna dijeron que muchas personas involucradas en el proyecto Llama renunciaron debido a una lucha interna entre otro equipo de investigación en Meta y el equipo de Llama por los recursos informáticos. El equipo estaba trabajando en un modelo competitivo, pero finalmente lo abandonó por razones desconocidas.
Si bien estas fueron revelaciones internas, sus salidas son un recordatorio de que las empresas de tecnología, grandes y pequeñas, están lidiando con tensiones por la escasez de recursos informáticos mientras desarrollan modelos de IA generativa que requieren chips dedicados, y esos chips no son gratuitos. Las grandes empresas de tecnología tienen más recursos informáticos que la mayoría, un hecho que algunas empresas, como Meta, están enfatizando al contratar investigadores de IA.
Vemos que incluso las grandes empresas tienen recursos limitados que pueden ofrecer. A medida que aumenta la demanda de talento en IA, el éxodo también pone de relieve los desafíos que enfrentan las grandes empresas de tecnología para retener el talento en IA.
Llama Este artículo "LLaMA: Modelos lingüísticos básicos abiertos y eficientes" se publicó en febrero de este año. Hay 14 autores. Ahora varios de ellos han dimitido, algunos se han ido a nuevas empresas de nueva creación y otros han iniciado actividades empresariales.
Echemos un vistazo a los que han dimitido.
Gautier Izacard
Inflection AI tiene muchos antecedentes: sus tres cofundadores son el cofundador original de DeepMind, Mustafa Suleyman, el cofundador de Linkedln, Reid Hoffman, y la ex científica jefe de DeepMind, Karen Simonyan. En junio de este año, Inflection AI también anunció que la compañía había recaudado 1.300 millones de dólares en una nueva ronda de financiación, liderada por Microsoft, Nvidia y Reid Hoffman, Bill Gates y el ex director ejecutivo de Google, Eric Schmidt.
Timothée Lacroix
Armand Joulin
Guillaume Lampe
Guillaume Lample tiene una maestría de la Universidad Carnegie Mellon y un doctorado de la Universidad de París VI.
Por último, nos gustaría presentarles la nueva empresa Mistral AI, fundada en mayo de este año. La agencia se centra principalmente en la investigación y el desarrollo de modelos de IA generativa, compitiendo con OpenAI. Los cofundadores incluyen a Arthur MENSCH (y director ejecutivo), Guillaume Lample (y director científico) y Timothee Lacroix como director de tecnología.
Ya hemos presentado anteriormente a Guillaume Lample y Timothee Lacroix. Como director ejecutivo, Arthur MENSCH trabajó anteriormente en DeepMind (ahora fusionada con Google DeepMind) durante más de 2 años y participó en la investigación del modelo de lenguaje visual Flamingo.