Bu yılın şubat ayında Meta, parametre miktarları 7 milyar ile 65 milyar arasında değişen yeni bir büyük model serisi olan Llama'yı (Büyük Dil Modeli Meta AI) "açık kaynaklı" hale getirdi. Birkaç ay sonra Llama 2'nin piyasaya sürülmesi, büyük modellerin ticarileşmesine öncülük etti. Birçok kişi, Llama 2'nin açık kaynağını büyük modellerin "Android anı" olarak tanımladı.
Llama ve Llama 2 serisi modellerin mükemmel performansı nedeniyle birçok kişi bunları ChatGPT gibi daha büyük modellere göre ücretsiz ve açık kaynaklı alternatifler olarak görüyor. Herkes Meta'yı açık kaynak topluluğuna yaptığı katkılardan dolayı övüyor, ancak Llama projesinde yer alan bazı bilim insanları ve mühendisler için bu övgü çok az ve çok geç oldu.
TheInformation'a göre, iç duruma aşina olan kişiler, Lama projesinde yer alan birçok kişinin, Meta'daki başka bir araştırma ekibinin, Lama ekibiyle bilgi işlem kaynakları konusunda iç bir çekişme yaşaması nedeniyle istifa ettiğini ve açıklamalarda adı geçen başka bir kaynağın, ekip üzerinde çalıştığını söyledi. rakip bir model üzerinde çalıştı, ancak bilinmeyen bir nedenden dolayı onu terk etti.
Bu sadece içeriden birinin ifşası olsa da, onların ayrılışı, büyük ve küçük teknoloji şirketlerinin, özel çipler gerektiren üretken yapay zeka için modeller geliştirirken, bilgi işlem kaynaklarının yetersizliğinden kaynaklanan gerilimlerle boğuştuğunu ve bu çiplerin bunu yapmadığını hatırlatıyor. bedavaya gelme. Büyük teknoloji şirketlerinin çoğundan daha fazla bilgi işlem kaynağı var; bu, Meta gibi bazı şirketlerin yapay zeka araştırmacılarını işe alırken vurguladığı bir gerçek.
Büyük şirketlerin bile sağlayabileceği kaynakların sınırlı olduğunu görüyoruz. Yapay zeka yeteneklerine olan talep arttıkça bu göç, büyük teknoloji şirketlerinin yapay zeka yeteneklerini elde tutma konusunda karşılaştığı zorlukları da vurguluyor.
Llama Bu makale "LLaMA: Açık ve Verimli Temel Dil Modelleri" bu yıl Şubat ayında yayınlandı. 14 yazar var. Şimdi birçoğu istifa etti. Bazıları yeni start-up şirketlere gitti, bazıları da girişimciliğe başladı.
Kağıt adresi:
Şimdi istifa edenlere bir göz atalım.
Gautier Izacard
Gautier Izacard, 2020'de Meta'da çalışmaya başladı ve 2022'de kurulan bir girişim olan Inflection AI'ye katılmak için Nisan 2023'te Meta'dan ayrıldı.
Inflection AI'nın uzun bir geçmişi var. Üç kurucu ortağı, eski DeepMind kurucu ortağı Mustafa Süleyman, Linkedln kurucu ortağı Reid Hoffman ve eski DeepMind baş bilim adamı Karen Simonyan'dır. Bu yılın haziran ayında Inflection AI ayrıca şirketin Microsoft, Nvidia, Reid Hoffman, Bill Gates ve eski Google CEO'su Eric Schmidt liderliğindeki yeni bir finansman turuyla 1,3 milyar ABD doları topladığını duyurdu.
*Inflection AI'nin üç kurucu ortağı. *
Timothee Lacroix
Timothee Lacroix, 2015 yılında Facebook Yapay Zeka Araştırma Laboratuvarı'na araştırma mühendisi olarak katıldı. Haziran 2023'te Meta'dan (Facebook) ayrıldı ve Fransız startup Mistral AI'ye baş teknoloji sorumlusu (CTO) olarak katıldı.
Armand Joulin
Armand Joulin doktora derecesini 2012 yılında INRIA ve Ecole Normale Supérieure'den (ENS) aldı. Armand Joulin, Meta'ya 2014 yılında Araştırma Bilimcisi, Kıdemli Araştırma Müdürü, Araştırma Direktörü olarak katıldı. Armand, Meta'ya katılmadan önce Stanford Üniversitesi'nde Daphne Koller ve Feifei Li ile birlikte çalışan doktora sonrası araştırmacıydı. Armand Joulin, Mayıs 2023'te Meta'dan ayrılacak.
Guillaume Lample
Guillaume Lample şu anda Mistral AI'nın kurucu ortağı ve baş bilim insanıdır. Altı yıldan fazla bir süredir burada çalıştığı için bu yıl Mart ayında Meta'dan ayrıldı.Meta'daki önceki görevi araştırma bilimciydi.
Guillaume Lample, Carnegie Mellon Üniversitesi'nden yüksek lisans ve Paris VI Üniversitesi'nden doktora dereceleriyle mezun oldu.
Son olarak bu yılın mayıs ayında kurulan Mistral AI girişimini tanıtıyoruz. Kuruluş esas olarak üretken yapay zeka modellerinin araştırılması ve geliştirilmesine odaklanıyor ve OpenAI ile rekabet ediyor. Kurucu ortaklar arasında Arthur MENSCH (ve CEO), Guillaume Lample (ve baş bilim insanı) ve Timothee Lacroix baş teknoloji sorumlusu yer alıyor.
Techcrunch'a göre ilk metin tabanlı üretken yapay zeka modelini 2024 yılında piyasaya sürmeyi planlıyorlar. Sadece 4 hafta önce kurulan Mistral AI, bu yılın haziran ayında tohum turu finansmanından 113 milyon ABD doları aldı.
Guillaume Lample ve Timothee Lacroix daha önce tanıtılmıştı. Arthur MENSCH, CEO olarak DeepMind'da (şu anda Google DeepMind ile birleştirilmiştir) 2 yıldan fazla çalıştı ve görsel bir dil modeli olan Flamingo araştırmasına katıldı.
Referanslar:
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Meta, bilgi işlem kaynaklarının soyulması nedeniyle şiddetli iç çatışmalara maruz kaldı ve birçok Llama yazarı ayrıldı.
Editörler: Xiaozhou, Chen Ping
Bu yılın şubat ayında Meta, parametre miktarları 7 milyar ile 65 milyar arasında değişen yeni bir büyük model serisi olan Llama'yı (Büyük Dil Modeli Meta AI) "açık kaynaklı" hale getirdi. Birkaç ay sonra Llama 2'nin piyasaya sürülmesi, büyük modellerin ticarileşmesine öncülük etti. Birçok kişi, Llama 2'nin açık kaynağını büyük modellerin "Android anı" olarak tanımladı.
Llama ve Llama 2 serisi modellerin mükemmel performansı nedeniyle birçok kişi bunları ChatGPT gibi daha büyük modellere göre ücretsiz ve açık kaynaklı alternatifler olarak görüyor. Herkes Meta'yı açık kaynak topluluğuna yaptığı katkılardan dolayı övüyor, ancak Llama projesinde yer alan bazı bilim insanları ve mühendisler için bu övgü çok az ve çok geç oldu.
TheInformation'a göre, iç duruma aşina olan kişiler, Lama projesinde yer alan birçok kişinin, Meta'daki başka bir araştırma ekibinin, Lama ekibiyle bilgi işlem kaynakları konusunda iç bir çekişme yaşaması nedeniyle istifa ettiğini ve açıklamalarda adı geçen başka bir kaynağın, ekip üzerinde çalıştığını söyledi. rakip bir model üzerinde çalıştı, ancak bilinmeyen bir nedenden dolayı onu terk etti.
Bu sadece içeriden birinin ifşası olsa da, onların ayrılışı, büyük ve küçük teknoloji şirketlerinin, özel çipler gerektiren üretken yapay zeka için modeller geliştirirken, bilgi işlem kaynaklarının yetersizliğinden kaynaklanan gerilimlerle boğuştuğunu ve bu çiplerin bunu yapmadığını hatırlatıyor. bedavaya gelme. Büyük teknoloji şirketlerinin çoğundan daha fazla bilgi işlem kaynağı var; bu, Meta gibi bazı şirketlerin yapay zeka araştırmacılarını işe alırken vurguladığı bir gerçek.
Büyük şirketlerin bile sağlayabileceği kaynakların sınırlı olduğunu görüyoruz. Yapay zeka yeteneklerine olan talep arttıkça bu göç, büyük teknoloji şirketlerinin yapay zeka yeteneklerini elde tutma konusunda karşılaştığı zorlukları da vurguluyor.
Llama Bu makale "LLaMA: Açık ve Verimli Temel Dil Modelleri" bu yıl Şubat ayında yayınlandı. 14 yazar var. Şimdi birçoğu istifa etti. Bazıları yeni start-up şirketlere gitti, bazıları da girişimciliğe başladı.
Şimdi istifa edenlere bir göz atalım.
Gautier Izacard
Inflection AI'nın uzun bir geçmişi var. Üç kurucu ortağı, eski DeepMind kurucu ortağı Mustafa Süleyman, Linkedln kurucu ortağı Reid Hoffman ve eski DeepMind baş bilim adamı Karen Simonyan'dır. Bu yılın haziran ayında Inflection AI ayrıca şirketin Microsoft, Nvidia, Reid Hoffman, Bill Gates ve eski Google CEO'su Eric Schmidt liderliğindeki yeni bir finansman turuyla 1,3 milyar ABD doları topladığını duyurdu.
Timothee Lacroix
Armand Joulin
Guillaume Lample
Guillaume Lample, Carnegie Mellon Üniversitesi'nden yüksek lisans ve Paris VI Üniversitesi'nden doktora dereceleriyle mezun oldu.
Son olarak bu yılın mayıs ayında kurulan Mistral AI girişimini tanıtıyoruz. Kuruluş esas olarak üretken yapay zeka modellerinin araştırılması ve geliştirilmesine odaklanıyor ve OpenAI ile rekabet ediyor. Kurucu ortaklar arasında Arthur MENSCH (ve CEO), Guillaume Lample (ve baş bilim insanı) ve Timothee Lacroix baş teknoloji sorumlusu yer alıyor.
Guillaume Lample ve Timothee Lacroix daha önce tanıtılmıştı. Arthur MENSCH, CEO olarak DeepMind'da (şu anda Google DeepMind ile birleştirilmiştir) 2 yıldan fazla çalıştı ve görsel bir dil modeli olan Flamingo araştırmasına katıldı.