الرهان على الطاقة النووية! مايكروسوفت عازمة على تغذية النماذج الكبيرة بـ "ذخيرة" جديدة!

** المصدر 丨 ** مكدس تكنولوجيا 51CTO

** بقلم يون تشاو **

إن شركة Microsoft طموحة، وفي نفس اليوم الذي تم فيه تمكين نظام التشغيل Windows 11 بالكامل من خلال الذكاء الاصطناعي، تم الكشف عن أنها اتخذت خطوات جديدة.

في 25 سبتمبر بالتوقيت المحلي، نشرت مايكروسوفت فجأة رسالة توظيف لـ "مدير مشروع التكنولوجيا النووية" على موقعها الرسمي على الإنترنت. ليس من الصعب أن نرى أنه بعد Microsoft Cloud، أصبح Nadella مليئًا بالقوة النارية عند التعامل مع النماذج الكبيرة.

ولكن ما يثير الدهشة هو أنه بدءًا من الوصول إلى "Office Family Bucket" إلى GPT4، وتوفير Azure للموارد السحابية، إلى Windows 11 الشامل القائم على الذكاء الاصطناعي، فقط عندما تكون Microsoft الجديدة على وشك الظهور، لماذا قررت Microsoft التركيز أيضًا على قطاع الطاقة؟من أين نبدأ؟

الذكاء الاصطناعي والطاقة النووية، مايكروسوفت لن تتخلى عن أي منهما!

تم تكليف منصب "مدير البرنامج الرئيسي للتكنولوجيا النووية" الذي تقوم Microsoft بتعيينه بقيادة التقييم التكنولوجي للمفاعل المعياري الصغير العالمي (SMR) وتكامل المفاعلات الدقيقة لتوفير الطاقة لمراكز البيانات حيث توجد سحابة Microsoft والذكاء الاصطناعي. ينص إعلان الوظيفة على أن "هذا المنصب سيحافظ على خريطة طريق واضحة وقابلة للتكيف لتكامل التكنولوجيا، واختيار وإدارة شركاء التكنولوجيا والحلول بعناية، وتقييم التقدم المستمر وتأثير أعمال التنفيذ".

المصدر: مايكروسوفت

بالإضافة إلى ذلك، لدى Microsoft أيضًا متطلبات للمرشحين المثاليين لهذا المنصب: يجب أن يكون لديهم خبرة في صناعة الطاقة ولديهم فهم متعمق للتكنولوجيا النووية والشؤون التنظيمية. سيكون هذا المنصب أيضًا مسؤولاً عن البحث والتطوير لتقنيات الطاقة الأخرى قبل الاستخدام التجاري.

النموذج الكبير "ينفد" من تيسلا!

قدم وو جون، خبير الصناعة المعروف، استعارة لتدريب ChatGPT: كل تدريب على ChatGPT يعادل السماح لـ 3000 سيارة كهربائية من طراز Tesla بإكمال رحلة مدتها 21 عامًا في شهر واحد، وجميعها عديمة الفائدة بشكل أساسي. وهذا الوصف ليس مبالغة.

وفقًا لـ "تقرير مؤشر الذكاء الاصطناعي لعام 2023" الصادر عن معهد ستانفورد للذكاء الاصطناعي (HAI)، فإن الطاقة المطلوبة لتدريب GPT3 كافية لاستمرار عائلة أمريكية متوسطة لمئات السنين. وفقا لتقديرات شركة جوشنج للأوراق المالية، فإن تكلفة التدريب الفردي على GPT-3 تصل إلى 1.4 مليون دولار أمريكي. وبالنسبة لبعض حاملي شهادات الماجستير (نماذج اللغات الكبيرة) الأكبر حجما، تتراوح تكلفة التدريب بين 2 مليون دولار أمريكي و12 مليون دولار أمريكي.

مصدر البيانات: لوتشيوني وآخرون.

"60٪ من تكلفة تدريب النماذج الكبيرة هي الكهرباء." كما أعرب تيان تشي، كبير العلماء في شركة Huawei AI، عن قلقه بشأن مشكلة الطاقة، معتقدًا أن خفض التكلفة وتحسين كفاءة الطاقة أمران ملحان. إذا انتشرت النماذج الكبيرة وأصبحت الخوادم تعمل بسرعة حول العالم، فأنا أخشى أن ذلك لن يحرق الأرض.

فلا عجب أن مؤسس OpenAI قال في حدث يوم الاثنين أنه بالنسبة لـ GPT، ينصب التركيز الآن على "تقليل التكاليف وتحسين الموثوقية" بدلاً من التسرع في إطلاق GPT-5.

من أجل توفير الطاقة، يفكر رؤساء وادي السيليكون بشكل كبير

دعونا ننظر إلى مايكروسوفت أولا. وفي الوقت الحاضر، وضعت مايكروسوفت أنظارها على الطاقة النووية. ربما لا تعلم أن بيل جيتس لديه أيضًا هوية أخرى، وهي رئيس شركة الابتكار النووي TerraPower، التي تعمل على تطوير وترويج تصميمات المفاعلات المعيارية الصغيرة. ومع ذلك، قال متحدث باسم TerraPower: "لا يوجد حاليًا أي اتفاق لبيع مفاعلات لشركة Microsoft".

وفقًا لإدارة معلومات الطاقة الأمريكية، تولد المفاعلات النووية الموجودة في الولايات المتحدة حاليًا حوالي 18% من إجمالي الكهرباء المولدة في الولايات المتحدة. إن الآمال بالنسبة للجيل القادم من تكنولوجيا المفاعلات النووية تعتمد إلى حد كبير على المفاعلات النووية الصغيرة.

كما يوحي الاسم، فإن المفاعلات النووية الصغيرة أصغر من المفاعلات التقليدية وأرخص وأسرع في البناء لأنها مصممة بهيكل معياري ولا يحتاج كل جزء من المفاعل إلى أن يكون مصنوعًا حسب الطلب.

بالإضافة إلى ذلك، التزمت مايكروسوفت علنًا بمتابعة الحصول على الطاقة النووية من المبدعين في مجال الاندماج النووي. في شهر مايو من هذا العام، أعلنت شركة مايكروسوفت أنها وقعت اتفاقية شراء الطاقة مع شركة هيليون الناشئة في مجال الاندماج النووي لشراء الطاقة من شركة هيليون في عام 2028. كما تصادف، كان الرئيس التنفيذي لشركة OpenAI، سام ألتمان، أيضًا من أوائل المستثمرين المهمين في شركة Helion.

كما أن ماسك "الرجل الحديدي في وادي السيليكون" الشهير قد أخذ بعين الاعتبار الطاقة أيضًا. كانت هناك شائعات في أبريل بأن ماسك وبيزوس كانا يستعدان لتوحيد جهودهما لتدريب نموذج كبير جدًا. ومن أجل توفير التبريد واستهلاك الطاقة، اقترح الاثنان بالفعل خطة "مركز بيانات فضائي"، وإرسال 50 ألف بطاقة H100 NVIDIA إلى الفضاء بواسطة SpaceX، وحمل كمية هائلة من الألواح الشمسية، على أمل استخدام قوة الفضاء لحل المشكلة. مشكلة الكهرباء المشكلة. ومع ذلك، فقد رأى بعض الخبراء أن هذا الحل غير موثوق به، ففي الوقت الحاضر، يتمتع نظام إمداد الطاقة للألواح الشمسية الفضائية عمومًا بقدرة 1200 واط فقط، وكل من مصدر الطاقة والتكلفة ليسا بجودة الحلول الأرضية.

بالطبع، هناك حل آخر أكثر موثوقية، وهو تحسين استهلاك الطاقة للرقاقة نفسها. منطق هذا النوع من إدارة استهلاك الطاقة هو أن هناك شرائح متعددة في مركز البيانات، وكل شريحة تحتوي على مليارات أو حتى عشرات المليارات من الترانزستورات، والترانزستور الواحد يعادل وحدة واحدة من استهلاك الكهرباء، ومن هذا يمكن أن يكون واستنتج أن حجم ظفر الإصبع هو أن الشريحة عبارة عن شبكة طاقة واسعة النطاق. إذا كان من الممكن تحسين استهلاك الطاقة لكل ترانزستور، فيمكن أن ينتشر توفير الطاقة النهائي إلى مركز البيانات بأكمله.

لقد قامت شركة Synopsys، الشركة الرائدة عالميًا في مجال EDA، باستكشاف هذا المجال بشكل أكبر، فمنذ 7 سنوات مضت، أطلقت مشروعًا يسمى "تصميم كفاءة الطاقة" لزيادة كفاءة استخدام الطاقة للرقاقة إلى الحد الأقصى.

مايكروسوفت، هل تريد فقط حل مشكلة استهلاك الطاقة؟

ولا ترجع خطوة مايكروسوفت إلى رهانها على الذكاء الاصطناعي ومصدر قوة مركز البيانات فحسب، بل لأسباب أخرى أيضًا.

ووفقا لوسائل الإعلام الأجنبية theVerge، كان بيل جيتس دائما من أشد المعجبين بالطاقة النووية لأن الطاقة النووية لا تنتج انبعاثات غازات الدفيئة وقد تلعب دورا معينا في مكافحة تغير المناخ.

وبالإضافة إلى ذلك، فإن مشكلة استهلاك الطاقة في النماذج الكبيرة ليست بالخطورة التي نتصورها. قال أحد كبار المحللين بصراحة إن السوق لا داعي للقلق كثيرًا بشأن استهلاك الطاقة في النماذج الكبيرة. "يتجاهل الكثير من الناس حقيقة أن الطلب على الطاقة الحاسوبية للنماذج الكبيرة سينخفض حتماً تدريجياً في المستقبل، مما يعني أن استهلاك الطاقة سينخفض أيضاً تبعاً لذلك."

على سبيل المثال، توضح خدمة DeepSpeed-Chat مفتوحة المصدر من Microsoft في 12 أبريل هذه النقطة بشكل كامل، حيث يمكنها زيادة سرعة التدريب بأكثر من 15 مرة وتقليل تكلفة قوة الحوسبة بشكل كبير. يمكن لوحدة معالجة رسومات واحدة وحدها أن تدعم نموذجًا يشبه ChatGPT مع 13 مليار معلمة، ويستغرق وقت التدريب 1.25 ساعة فقط.

وأخيرا، لا يسعنا إلا أن نقول إنه بمجرد بدء عجلة التغيير، يصبح من الصعب التراجع عنها. إن استثمار مايكروسوفت في الذكاء الاصطناعي هذه المرة يتجاوز خيال الصناعة.

الروابط المرجعية:

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت