بعد أربعة أسابيع من إنشائها ، جمعت 105 مليون يورو ، والنص الكامل لمذكرة تمويل نموذج اللغة الأوروبية mistral.ai

2023-06-25 03:30:09

المصدر: Empower Labs

* مصدر الصورة: تم إنشاؤه بواسطة أداة Unbounded AI *

الفريق الذي تم إنشاؤه لبضعة أسابيع فقط أكمل تمويلًا بقيمة 105 مليون يورو بدون منتجات أو مستخدمين أو خبرة تشغيلية. ساعدت هذه المذكرة (المذكرة) في إقناع Light Speed والرئيس التنفيذي السابق لشركة Google إريك شميدت وآخرين. تؤكد المذكرة على السوق الأوروبية ، وأمن الذكاء الاصطناعي ، والامتثال ، والجوانب الأخرى. ويعتقد ميسترال أن استخدامهم لطريق مفتوح المصدر يختلف تمامًا عن OpenAI سيسمح له في النهاية بتحديد المزايا وتحقيق التفوق. مما قرأته ، من الواضح أن هذه المذكرة مكتوبة بمهارة شديدة ، وتحتوي أيضًا على بعض العناصر الخادعة. لقد استفادت بشكل جيد من عقلية FOMO الحالية للمجتمع الأوروبي على نموذج اللغة الكبيرة لإكمال التمويل.

ميسترال مستعدة للإشارة إلى الرياح الباردة الشمالية الغربية الجافة والقوية في جنوب فرنسا ، وهي أيضًا اسم سفينة هجومية برمائية فرنسية الصنع. هذه هي السفينة الهجومية البرمائية الرائدة في العالم. الاسم يجسد الفخر الفرنسي. الأعضاء الستة في الفريق المؤسس جميعهم من فرنسا ، وبدلاً من فهمه كنموذج لغة أوروبية كبير ، أعتقد أنه يشبه إلى حد كبير شركة نموذج لغة فرنسية كبيرة. يروي قصة أوروبية جيدة ، لكنها لن تكون الوحيدة في أوروبا.

رأيت Memo في مجموعة مناقشة. بعد التأكد من أن محتوى Memo لم يعد بحاجة إلى السرية ، استخدمت ChatGPT لترجمة النص الكامل لها ، ثم قمت بمراجعة وإعادة ترجمة بعض المحتوى.

مذكرة استراتيجية mistral.ai

المؤلف: mistral.ai

ترجمة: ChatGPT ، وانغ تشاو

الذكاء الاصطناعي التوليدي هو تقنية تحويلية

في العام الماضي ، شهدنا تسارعًا هائلاً في الذكاء الاصطناعي التوليدي (أنظمة قادرة على إنشاء نص / صور من النص والصور). يمكن أن تساعد هذه الأنظمة البشر:

● إنتاج محتوى ممتاز ومبتكر (نص ، رمز ، رسومات)

● قراءة ومعالجة وتلخيص التدفقات غير المنظمة للمحتوى أسرع بآلاف المرات من البشر

● التفاعل مع العالم من خلال اللغة الطبيعية أو واجهات برمجة التطبيقات لتنفيذ مهام سير العمل بشكل أسرع من أي وقت مضى.

تم الكشف عن القدرات القوية للذكاء الاصطناعي التوليدي فجأة للجمهور بعد إصدار ChatGPT. يتم إنتاج مثل هذه المنتجات من قبل عدد قليل من الفرق الصغيرة حول العالم ، وأصبح العدد المحدود من الباحثين في هذه الفرق بمثابة عنق زجاجة يمنع إنشاء اقتصاد جديد في هذا المجال.

يوشك الذكاء الاصطناعي التوليدي على زيادة الإنتاجية في جميع الصناعات وإنشاء صناعة جديدة من خلال زيادة قدرات الآلة للعقل البشري بسلاسة (سوق بقيمة 10 مليارات دولار في عام 2022 ، ومن المتوقع أن يصل إلى 110 مليار دولار بحلول عام 2030 ، بمعدل نمو سنوي متوقع بنسبة 35٪). إنها تقنية تحويلية للاقتصاد العالمي من شأنها تغيير طبيعة العمل وإحداث تغيير اجتماعي إيجابي.

احتكار القلة في طور التكوين

تعتمد تقنيات الذكاء الاصطناعي التوليدية على سنوات من البحث في الصناعة والأوساط الأكاديمية. من خلال توسيع نطاق التدريب إلى البيانات على نطاق الإنترنت وتصحيح النموذج مع ردود الفعل البشرية ، تم تحقيق الاختراقات التي جعلت التكنولوجيا في متناول الجماهير من قبل حفنة من اللاعبين في الصناعة ، ويبدو أن أكبرهم (OpenAI) لديه نية مهيمنة على السوق.

يقوم هؤلاء اللاعبون القلائل بتدريب النماذج التوليدية واستخدامها كأصول ؛ فهم يخدمون الآلاف من الأطراف الثالثة الذين ينشئون منتجات لتحسين الإنتاجية ، بالإضافة إلى عامة الناس من خلال منتجاتهم الخاصة مثل روبوتات المحادثة. لا يزال يتم تشكيل عدد كبير من الشركات الناشئة التابعة لجهات خارجية لبناء خدمات متنوعة بناءً على هذه النماذج التوليدية.

** نعتقد أن معظم القيمة في سوق الذكاء الاصطناعي التوليدي الناشئ تأتي من التكنولوجيا التي يصعب صنعها ، والنماذج التوليدية نفسها. ** تحتاج هذه النماذج إلى التدرب على آلاف الآلات القوية ، ومعالجة تريليونات البيانات من مصادر عالية الجودة ، وهو ما يشكل أول شريط مرتفع. العائق الثاني المهم هو صعوبة بناء فريق متمرس ، و mistral.ai في وضع جيد للقيام بذلك.

** حاليًا (GLM) جميع اللاعبين الرئيسيين موجودون في الولايات المتحدة ** ، لا يوجد منافس جاد في أوروبا حتى الآن. بالنظر إلى مدى قوة (وخطورة) هذه التكنولوجيا الجديدة ، فهذا سؤال جيوسياسي رئيسي. سيكون mistral.ai الرائد الأوروبي في مجال الذكاء الاصطناعي الذي يزيد الإنتاجية والإبداع ويوجه الثورة الصناعية الجديدة القادمة.

** الذكاء الاصطناعي التوليدي الحالي لا يلبي احتياجات السوق **

اختارت شركة OpenAI ومنافسيها الحاليين مسارًا تكنولوجيًا مغلقًا ، مما سيحد بشكل كبير من تغطية السوق. في هذا النهج ، يتم الاحتفاظ بالنموذج بشكل خاص ويتم تقديمه فقط من خلال واجهة برمجة تطبيقات نص إلى نص. يثير هذا الأسئلة المهمة التالية للأعمال:

● تضطر المؤسسات التي ترغب في استخدام تقنيات الذكاء الاصطناعي التوليدية إلى ** تقديم بيانات الأعمال القيمة وبيانات المستخدم الحساسة إلى نموذج الصندوق الأسود ** ، والذي يتم نشره غالبًا في السحابة العامة. يطرح هذا مشكلة أمنية: لا يمكن التحقق من النموذج الذي يتم الاحتفاظ به سريًا للتأكد من أن مخرجاته آمنة ، ولا يمكن نشر مثل هذا النموذج في تطبيق مهم للأمان. يثير هذا الموقف أيضًا مشكلات قانونية ، خاصةً عندما تقوم الشركة بنقل البيانات الشخصية خارج حدودها القانونية وقد تخضع لقوانين خارج الحدود الإقليمية.

● يؤدي عرض إخراج النموذج فقط ، بدلاً من النموذج الكامل ، إلى صعوبة التفاعل مع المكونات الأخرى (قاعدة بيانات الاسترجاع ، والمدخلات المنظمة ، والصور والأصوات). يوجد حاليًا المئات من المنتجات التي تنشئ قدرات مركبة (على سبيل المثال ، الذاكرة ، والرؤية ، وما إلى ذلك) من خلال ربط مخرجات ومدخلات النماذج. ** ستعمل هذه المنتجات بشكل أفضل وأسرع إذا كان من الممكن توفير النموذج كمربع أبيض (نموذج شفاف) ** (مثل The Flamingo يدمج النماذج المرئية والنصية للمربع الأبيض في نص + نموذج مرئي).

● ** البيانات المستخدمة لتدريب النموذج سرية ** ، مما يعني أننا نعتمد على أنظمة ذات أصل غير مؤكد والتي قد تنتج مخرجات لا يمكن السيطرة عليها. جهود التصفية لمعالجة هذه المشكلة توفر فقط ضمانات ضعيفة وهشة بأن النموذج لن ينتج محتوى حساسًا ربما يكون قد تم تدريبه على القيام به. أدت هذه المشكلة إلى حظر ChatGPT في إيطاليا في أبريل 2023.

كسر نمط السوق من أوروبا

من خلال تأسيس mistral.ai ، نخطط لاتخاذ موقف معاكس تمامًا للنماذج المغلقة الحالية لتدريب النماذج المتقدمة. ** تتمثل رؤيتنا في أن نصبح لاعبًا رائدًا في هذا المجال مع دمج هذه النماذج في أوروبا والصناعة الأوسع لتطوير أعمال ذات قيمة عالية. **

** سوف تكون mistral.ai رائدة في مجال الأبحاث في مجال الذكاء الاصطناعي التوليدي وفي غضون أربع سنوات ستكون المزود الرائد لتقنية الذكاء الاصطناعي في السوق. ** لتحقيق هذا الهدف ، سنركز أولاً على بعض الخصائص المميزة الرئيسية ، ثم نجري جهدًا شاملاً في البحث والتطوير لتحديد أكثر الاستراتيجيات فعالية للتحرك نحو الذكاء الاصطناعي ذي القيمة العملية للبشر.

التركيز على السوق الأوروبية أولاً سيمنحنا ميزة دفاعية ، وموقفنا المنفتح على طريق التكنولوجيا سيعزز جاذبيتنا بشكل أكبر. العديد من ألمع العقول في مجال نمذجة اللغة الكبيرة (LLM) هم أوروبيون ؛ تجربتنا الواسعة تظهر أن العديد منهم يرغبون في الانضمام إلى مشروعنا.

مقابل تحديد المواقع الفنية

كانت المفاضلات المبكرة لدينا ، وهي النقاط العمياء في استراتيجيات منافسينا ، كما يلي:

● ** اتبع نهجًا أكثر انفتاحًا لتطوير النموذج. ** سنصدر النموذج بموجب ترخيص برنامج مفتوح المصدر مسموح به ، والذي ** سيتفوق بشكل كبير على المنافسة **. سنصدر أدوات لتسخير قوة نماذج الصندوق الأبيض هذه وإنشاء مجتمع مطورين حول علامتنا التجارية. هذا النهج مختلف تمامًا من الناحية الأيديولوجية عن OpenAI ، ** سيجذب هذا أفضل الباحثين ، وسيكون تسريعًا قويًا لتطوير المشروع ** ، لأنه سيوفر الكثير من مطوري المصب المتحمسين يفتحون الباب. سيؤدي هذا إلى زيادة نطاق تطوير أعمالنا. سنوازن بين إستراتيجيتنا مفتوحة المصدر والمصالح المالية ، ** نحتفظ بأقوى النماذج وأكثرها احترافًا للمستخدمين الذين يدفعون رسومًا **.

○ سنخصص 1٪ من الأموال للمؤسسات غير الربحية المسؤولة عن تنمية مجتمع المصادر المفتوحة.

● سواء كانت مفتوحة المصدر أو مرخصة ، فإن العناصر الداخلية (الهندسة المعمارية والأوزان المدربة) لنماذجنا مفتوحة دائمًا لعملائنا. ** سيتيح هذا تكاملًا أكثر إحكامًا مع تدفقات عمل العملاء ، ويمكن إدخال محتواهم في أجزاء مختلفة من النموذج العميق ، بدلاً من الحصول على تسلسل لكل شيء كنص إدخال ، ويتم تغذيته في واجهة برمجة تطبيقات الصندوق الأسود. **

● ** زيادة التركيز على مصدر البيانات والتحكم فيها. ** سيتم تدريب نماذجنا على محتوى بيانات عالي الجودة (بخلاف المحتوى المسروق) الذي سنتفاوض بشأنه بشأن اتفاقية ترخيص. سيسمح لنا ذلك بتدريب نماذج أفضل من النماذج المتوفرة حاليًا مثل Llama. باستخدام تقنيات المشاركة العميقة (الخبراء المختلطون ونماذج الاسترداد المعززة) ، سنوفر نماذج مع وصول اختياري لمصدر البيانات: بالنسبة للمستخدمين المتميزين المدفوعين ، يمكن تخصيص نماذج محددة للتمويل / القانوني / إلخ (وهذا يوفر زيادة كبيرة في الأداء). باستخدام تقنيات مماثلة ، سيكون نموذجنا قادرًا على توفير وصول فوري متمايز إلى البيانات للموظفين الذين يتمتعون بحقوق ملكية فكرية مختلفة للشركة.

● ** يوفر ضمانًا لا مثيل له للأمان والخصوصية. ** سيكون نموذجنا قابلاً للنشر في سحابة خاصة وبشكل اختياري على الجهاز ، مما يقلل بشكل فعال مخاوف الخصوصية من خلال التخلص من العمليات التي قد تكون إشكالية. تحقيقا لهذه الغاية ، سنوجه جهودنا في البحث والتطوير نحو تدريب نماذج صغيرة لكنها فائقة الكفاءة ، ونقترح بفعالية نماذج ذات أعلى نسبة جودة / تكلفة في السوق. ستضمن إستراتيجيتنا مفتوحة المصدر أيضًا إمكانية تدقيق نماذجنا عند نشرها في الصناعات الرئيسية (خاصة الصناعات المزدوجة والصحية).

تطوير الاعمال

فيما يتعلق بالأعمال ، سنقدم الوحدات الفنية الأكثر قيمة لصناعة الذكاء الاصطناعي كخدمة الناشئة ، وسنستخدم الذكاء الاصطناعي التوليدي لتغيير سير عمل الأعمال تمامًا. سنشارك في بناء حلول متكاملة مع شركات التكامل الأوروبية والعملاء الصناعيين ونحصل على تعليقات قيّمة للغاية منهم لنصبح الأداة الرئيسية لجميع الشركات التي تتطلع إلى الاستفادة من الذكاء الاصطناعي في أوروبا.

يمكن أن يتخذ التكامل مع القطاعات أشكالًا مختلفة من السوق ، بما في ذلك تراخيص الوصول الكامل إلى النماذج (بما في ذلك الأوزان المدربة) ، وتخصص النماذج بناءً على الطلب ، والعقود التجارية مع شركات التكامل / الشركات الاستشارية لبناء حلول متكاملة تمامًا. كما هو مفصل في خارطة الطريق الخاصة بنا ، سوف نستكشف ونحدد أفضل الأساليب مع تطور التكنولوجيا.

كيف تصبح رائدًا في مجال الذكاء الاصطناعي

** الفريق الأعلى **

يتكون الفريق المؤسس من كبار الباحثين في هذا المجال الذين عملوا في DeepMind و Meta ، بالإضافة إلى رواد الأعمال الفرنسيين ذوي الخبرة والقادة العامين المؤثرين.

● آرثر مينش - الرئيس التنفيذي - كبير علماء الأبحاث السابق في DeepMind ، المؤلف الرئيسي للعديد من المساهمات الرئيسية في LLM: Chinchilla و Retro و Flamingo

● Guillaume Lample - كبير العلماء - كبير علماء أبحاث Meta سابقين. قاد مشروع Llama ، مساهمة Meta الرئيسية في مجال نماذج اللغات الكبيرة

● Timothée Lacroix - CTO - مهندس برمجيات سابق في Meta ، قائد تقني في Llama

● جان تشارلز صموليان آلان الرئيس التنفيذي

● Charles Gorintin ， Alan CTO

● سيدريك أو ، وزير الدولة الفرنسي السابق للشؤون الرقمية

سيكون أول خمسة موظفين تم تحديدهم بالفعل باحثين ذوي خبرة من شركات التكنولوجيا الكبيرة. إن حماسهم لأوروبا ومفهوم المصدر المفتوح ، وإعادة الهيكلة التنظيمية المستمرة لبعض الشركات بسبب التطور السريع للذكاء الاصطناعي التوليدي ، يشكل أيضًا وقتًا مناسبًا لهم لمغادرة هذه الشركات.

** البنية التحتية ومصادر البيانات **

لتدريب نموذج تنافسي ، يجب استخدام مجموعة على نطاق خارجي لعدة أشهر على الأقل. نعتزم استئجار موارد الحوسبة هذه لمدة عام كامل ، وبالتالي تطوير نماذج مفتوحة المصدر ونماذج تجارية ذات قدرات مختلفة.

نجري بالفعل مفاوضات تنافسية مع كبار مزودي الخدمات السحابية بشأن استئجار موارد الحوسبة (نخطط للبدء في الصيف وتشكيل احتياطي حوسبة يبلغ 1536 H100 بحلول سبتمبر). نظرًا لأن موقع mistral.ai يتمتع بقاعدة أوروبية قوية ، فسوف نتعاون أيضًا مع مزودي الخدمات السحابية الأوروبيين الناشئين الذين يوسعون بنشاط خدمات حوسبة التعلم العميق.

لقد قمنا بتدريب نماذج واسعة النطاق من قبل ، مما زودنا بالخبرة اللازمة لتدريب 10-100 مرة أسرع من الأساليب المتاحة للجمهور - كان مؤسسونا وموظفونا الأوائل يعرفون بوضوح كيفية تدريب أقوى نموذج بميزانية حسابية معينة.

مستثمرينا الأوائل هم أيضًا مزودو محتوى في أوروبا ، وسيفتحون لنا جميع الأبواب اللازمة للحصول على مجموعات بيانات عالية الجودة يمكننا تدريب نماذجنا عليها وصقلها.

** استكشف السيناريوهات مع العملاء الرئيسيين **

ينظم الفريق المؤسس بالفعل استكشافات تجارية مع كبرى المؤسسات التجارية الفرنسية والأوروبية. سيبدأ فريق صغير موجه نحو المنتج (6 أشخاص بحلول نهاية العام) في تنمية الأعمال بينما يقوم الفريق الفني بتدريب وحدات تقنية قيمة.

سيظل فريق النمذجة يركز بنسبة 100 ٪ على تطوير التكنولوجيا لتجنب الانحرافات.

سيبدأ تطوير الأعمال بالتزامن مع تطوير عائلة نماذج الجيل الأول ، باستخدام الاستراتيجيات التالية:

● الاستكشاف المركّز لاحتياجات الشركات الصناعية الكبيرة ، بتيسير من جهات تكامل خارجية سيتم منحها وصولاً كاملاً إلى أفضل نماذجنا (غير مفتوحة المصدر)

● التصميم المشترك للمنتجات مع بعض الشركاء الناشئين الصغار الذين يركزون على منتجات الذكاء الاصطناعي التوليدية.

سيتم استخدام الاستكشاف القائم على الأعمال لدفع تصميم طراز الجيل الثاني.

خريطة الطريق

السنة الاولى

سنقوم بتدريب جيلين من النماذج ، وسيتقدم تطوير النموذج والتكامل التجاري في وقت واحد. سيكون الجيل الأول مفتوح المصدر جزئيًا ، معتمداً على التكنولوجيا التي أتقنها الفريق. ستثبت قدرتنا على تلبية احتياجات عملائنا ومستثمرينا ومؤسساتنا. سيعالج نموذج الجيل الثاني أوجه القصور الكبيرة في النموذج الحالي ، مما يسمح باستخدامه بشكل آمن واقتصادي من قبل الشركات.

** تدريب أفضل نموذج قياسي مفتوح المصدر **

بحلول نهاية عام 2023 ، سنقوم بتدريب سلسلة من نماذج إنشاء النصوص التي يمكن أن تتفوق بشكل كبير على ChatGPT 3.5 وإصدار مارس 2023 من Bard ، بالإضافة إلى جميع الحلول مفتوحة المصدر.

ستكون هذه السلسلة مفتوحة المصدر ، وسنشارك في المجتمع للبناء عليها ، مما يجعلها معيارًا مفتوحًا.

سنقدم نفس واجهة الخدمة مثل منافسينا ونفرض رسومًا لجمع بيانات استخدام الطرف الثالث ، وسننشئ بعض التطبيقات المجانية للمستهلكين لتوسيع تأثير العلامة التجارية والتقاط بيانات مستخدم الطرف الأول.

** مخصصة ومميزة لاحتياجات العمل **

خلال الأشهر الستة المقبلة ، سيتم تجهيز هذه النماذج بنماذج تضمين دلالية للبحث في المحتوى ، ومكونات إضافية متعددة الوسائط للتعامل مع المدخلات المرئية. كما سيتم إعداد نماذج مخصصة أعيد تدريبها باستخدام مصادر بيانات عالية الجودة ومتاحة تجارياً.

سيبدأ التطوير التجاري بالتزامن مع تطوير سلسلة طرازات الجيل الأول: نعتزم أن يكون لدينا تكامل لإثبات صحة المفهوم بحلول نهاية الربع الأول من عام 2024.

فيما يتعلق بالتكنولوجيا ، في الربعين الأول والثاني من عام 2024 ، سنركز على مجالين رئيسيين لا تقدرهما الشركات القائمة بأقل من قيمتها الحقيقية:

● ** تدريب نموذج صغير بما يكفي ** ليعمل على كمبيوتر محمول بسعة 16 جيجابايت أثناء العمل كمساعد مفيد للذكاء الاصطناعي

● ** نماذج التدريب ** مع سياقات إضافية قابلة للتبديل السريع ** ، مما يسمح ** بما يصل إلى ملايين ** من السياقات الإضافية ، والدمج الفعال لنماذج اللغة وأنظمة الاسترجاع.

في الوقت نفسه ، سيستمر إثراء مجموعات البيانات التدريبية والضبط الدقيق من خلال الشراكات والحصول على البيانات.

** بحلول نهاية الربع الثاني من عام 2024 ، نعتزم: **

● توزيع أفضل نموذج نصي مفتوح المصدر مع إخراج نصي ومرئي

● لديه نموذج عام وخبير مع أحد أعلى نسب القيمة / التكلفة

● توفير إمكانات نموذجية للمتكاملين الخارجيين من خلال واجهات برمجة التطبيقات المتاحة والقابلة للتطوير والمتنوعة

● إنشاء علاقة تجارية مرخصة مع واحد أو اثنين من كبار الفاعلين في الصناعة الذين التزموا باستخدام تقنيتنا

المرحلة القادمة

سيتطلب التنافس مع لاعبين متفوقين مثل OpenAI استثمارات كبيرة في مراحل لاحقة (تكلف GPT-4 عدة مئات من الملايين من الدولارات). هدفنا للسنة الأولى هو إثبات أننا أحد أقوى الفرق في مسابقة الذكاء الاصطناعي العالمية ، وقادرون على تطوير وإطلاق نماذج يمكنها التنافس مع أكبر اللاعبين. ستسمح لنا تجربتنا كباحثين في نموذج اللغة على نطاق واسع (LLM) بأن نكون أكثر كفاءة في رأس المال في مرحلة مبكرة من الشركات التي تكتشف هذا المجال أو تنتقل إليه.

سيكون الأمان أحد نجوم شمال mistral.ai: سنصدر نماذج بطريقة جيدة التنظيم ، مع التأكد من استخدام نماذجنا فقط للأغراض المتوافقة مع قيمنا ، ولهذا سنوفر وصول "الفريق الأحمر" إلى الإصدار التجريبي من تحديد السلوك غير اللائق وتصحيحه.

من خلال القيام بذلك ، سنقنع المؤسسات العامة والخاصة الرئيسية بأنه يمكننا بناء تقنيات آمنة ويمكن التحكم فيها وفعالة تسمح للبشرية بالاستفادة من هذا الاختراق العلمي. وسيؤدي ذلك إلى جذب المؤسسات والدول للمشاركة في تمويلنا من الفئة أ. في السلسلة أ (الربع الثالث 2024) ، نتوقع أن نحتاج إلى جمع 200 مليون دولار لتدريب النماذج التي تتجاوز قدرات GPT-4.

سيسمح لنا الدعم المالي القوي بتدريب النماذج على بنية تحتية أكبر بكثير ، مما يعزز مكانتنا كشركة رائدة في أبحاث الذكاء الاصطناعي والمورد المفضل في قطاع الصناعة الأوروبي.

(نص كامل)

شاهد النسخة الأصلية

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.