تعني سلسلة الأسئلة أعلاه أن دمج التخزين والحساب لم يعد "يبقى" في الأوساط الأكاديمية والصناعية ، ويبدو أنه شائع في السوق الثانوية: يعمل المساهمون ومؤسسات الوساطة لوقت إضافي لتعويض تكامل التخزين والحساب ، لذا فإن مصنعي الرقائق التقليديين منذ بداية عام 2023 ، تعرض تخطيط تكامل التخزين والحوسبة "للضرر".
أعطت Huawei ، التي أصدرت منتج التخزين الجديد OceanStor A310 في 7.14 ، إجابتها الخاصة. قال Zhou Yuefeng ، رئيس خط إنتاج تخزين البيانات في Huawei ، إن هناك العديد من مشاكل البيانات في التدريب والتفكير في النماذج الكبيرة للأغراض العامة والنماذج الصناعية الكبيرة: الجمع البطيء عبر المجالات للبيانات الضخمة ، وانخفاض كفاءة تفاعل البيانات في المعالجة المسبقة و التدريب ، وصعوبة أمن تدفق البيانات.
يجلب نموذج الذكاء الاصطناعي الكبير تحديات جديدة للتخزين. على سبيل المثال ، الاستقرار أسوأ من استقرار الذكاء الاصطناعي التقليدي. وفي الوقت نفسه ، هناك قدر كبير من المعالجة المسبقة للبيانات وأعمال التحضير.من الضروري استخدام الحوسبة القريبة من الذاكرة ( نوع من التخزين وتكامل الحوسبة) لحل المشكلة. قم بمعالجة هذه المشكلة بشكل منهجي. **
إذن ، ما مقدار "كمية البيانات الكبيرة" هنا؟ وفقًا لحساب CIRUI Insight ، يضم ChatGPT حاليًا 100 مليون مستخدم يوميًا.إذا طرح 5٪ من الأشخاص أسئلة كل ثانية في نفس الوقت كل يوم ، فسوف يبتلع توليد الطاقة لسد الخوانق الثلاثة لمدة عام تقريبًا. **
بعبارة أخرى ، تتطلب النماذج الكبيرة بشكل محموم قوة الحوسبة ، ويمكن للحلول الناشئة المتمثلة في تكامل التخزين والحوسبة أن تحل العديد من التحديات التي تسببها النماذج الكبيرة. في الواقع ، بالإضافة إلى فرض متطلبات صارمة على قوة الحوسبة ، يمنح النموذج الكبير أيضًا مصنعي شرائح الذكاء الاصطناعي "الكثير من السكر لتناوله".
تحاول هذه المقالة استكشاف ، في ظل خلفية النموذج الكبير ، ما هي الفوائد التي تُعطى لمصنعي شرائح الذكاء الاصطناعي؟ ما هو النمط المستقبلي للمصنعين المتكاملين للتخزين والحوسبة التي تم "إطلاقها" بواسطة ChatGPT؟
** "الحظ وسوء الحظ يعتمدان على بعضهما البعض" الشركات المصنعة لشرائح الذكاء الاصطناعي **
** رياح نماذج بالحجم الطبيعي لا تزال تهب ، والمناقشات حول نماذج بالحجم الطبيعي لا تزال على قدم وساق. **
في بداية شهر أغسطس ، في المنتدى الفرعي لمؤتمر الذكاء الاصطناعي لاتحاد الكمبيوتر الصيني (CCF) - "رؤية كونلون في حدود الذكاء الاصطناعي على نطاق واسع لنموذج الحوسبة الحدودية" ، اتفق الخبراء والعلماء على أنه في عصر النماذج واسعة النطاق ، أصبحت قوة الحوسبة الذكية الحديثة "نادرة". أصبحت الأصول ، وكيفية الاستفادة الجيدة من موارد الطاقة الحاسوبية وتعظيم فوائدها تحديًا يجب على كل مشارك مواجهته.
بالنسبة لمقدار قوة الحوسبة التي تتطلبها GPT-3 وحدها ، في ظل الظروف المحافظة ، يحتاج سد الخوانق الثلاثة إلى "العمل" طوال الليل للوفاء بما يلي:
بافتراض وجود 100 مليون شخص عبر الإنترنت في نفس الوقت ، يطرح 5٪ منهم أسئلة كل ثانية في نفس الوقت كل يوم ، كل منها يشغل 30 رمزًا ، و 15.3 مليون شريحة H100 مطلوبة لتوفير قوة الحوسبة الاستدلالية ؛ والقوة استهلاك كل H100 هو 750 واط ، إذا تم تشغيله لمدة 10 ساعات في اليوم ، فإن استهلاك الطاقة السنوي لمركز البيانات حيث توجد شرائح H100 هذه سيصل إلى 84 مليار كيلو واط * ساعة ، في حين أن توليد الطاقة السنوي لسد الخوانق الثلاثة هو 88.2 مليار كيلوواط * ساعة.
ما يجعل مصنعي شرائح الذكاء الاصطناعي أكثر قلقًا هو أن هذا ليس سوى استهلاك الطاقة لنموذج ChatGPT كبير في مرحلة الاستدلال.
** نتيجة لذلك ، تم التنقيب عن سلسلة من الحلول الناشئة من قبل الشركات المصنعة: ** التخزين والحساب المتكامل ، chiplet ، HBM ، إلخ. من بينها ، نظرًا لأن دمج التخزين والحوسبة قد أطاح بجدار التخزين في ظل بنية von Neumann التقليدية ، فقد حقق بالفعل خفض التكلفة وتحسين الكفاءة ، ليصبح Ziweixing هذا العام.
(مصدر الصورة: "تقرير صناعة رقائق طاقة الحوسبة الكبرى لمنظمة العفو الدولية - مئات البوارج ، المبتكرون أولاً" بقلم Cirui Insights)
** بالإضافة إلى ظهور الحلول الناشئة التي منحت مصنعي شرائح الذكاء الاصطناعي أنفاسًا ، فإن النموذج الكبير يجلب أيضًا أخبارًا جيدة لمصنعي الرقائق ، وخاصة الشركات المصنعة للرقائق المبتدئة: تتراجع أهمية بيئة البرمجيات. **
عندما لم تكن التكنولوجيا ناضجة بما يكفي في الأيام الأولى ، كان بإمكان الباحثين البدء فقط من خلال حل مشكلة معينة ، وولدت نماذج صغيرة بأقل من مليون متغير. على سبيل المثال ، DeepMind ، وهي شركة ذكاء اصطناعي مملوكة لشركة Google ، تسمح لـ AlphaGO بإجراء "تعليم" خاص على خطوات لعب الشطرنج لملايين اللاعبين المحترفين من البشر.
بعد وجود المزيد من الطرز الصغيرة ، تصبح مشكلة الأجهزة مثل تكيف الرقاقة وشيكة. لذلك ، عندما أطلقت Nvidia نظام CUDA البيئي الموحد ، فازت GPU + CUDA بسرعة باعتراف مجتمع علوم الكمبيوتر وأصبحت التكوين القياسي لتطوير الذكاء الاصطناعي.
تتمتع النماذج الكبيرة التي تظهر واحدة تلو الأخرى اليوم بقدرات متعددة الوسائط ، ويمكنها التعامل مع النصوص والصور والبرمجة وغيرها من المشكلات ، ويمكنها أيضًا تغطية مجالات رأسية متعددة مثل المكتب والتعليم والرعاية الطبية. هذا يعني أيضًا أن التكيف مع البيئة السائدة ليس هو الخيار الوحيد: عندما يرتفع الطلب على الرقائق للنماذج الكبيرة ، قد يكون مصنعو الرقائق قادرين فقط على التكيف مع نموذج واحد أو نموذجين كبيرين ، ويمكنهم إكمال تطوير نماذج صغيرة متعددة في الماضي. **
بمعنى آخر ، يوفر ظهور ChatGPT للشركات المصنعة للرقائق المبتدئة فرصة للتغلب على الزوايا. هذا يعني أن هيكل سوق شرائح الذكاء الاصطناعي سيخضع لتغييرات هائلة: لم تعد رقائق الذكاء الاصطناعي عرضًا فرديًا للمصنعين الفرديين ، ولكنها لعبة جماعية للعديد من المبتكرين. **
** عندما تصبح قوة الحوسبة سلعة نادرة ، ولم يعد التكيف مع البيئة السائدة أمرًا ضروريًا ، فإن تكامل التخزين والحوسبة بالكاد يمكن أن يخفي ضوءها. ** في هذا الوقت ، أصبحت مسألة الاستثمار من عدمه ومقدار الاستثمار هي المشكلة الثانية التي تواجه مصنعي شرائح الذكاء الاصطناعي. **
في هذا الصدد ** الجواب الذي قدمته شركة الرقائق العملاقة NVIDIA لسنوات عديدة هو التحلي بالشجاعة في الابتكار واستثمار الكثير من المال: **
لا شك أن كل شركة مصنعة للبحث والتطوير لتقنية ناشئة ستواجه مشكلات على مستويات مختلفة مثل عقبات الاستكشاف التقني وخلاف الشركات المصنعة للمصب. في المرحلة المبكرة ، أياً كان من يتوقع اتجاه التنمية المستقبلي أولاً ، يأخذ الشجاعة لاتخاذ خطوات الاستكشاف ، ويضع موارد معقولة للمحاولة ، فإنه يغتنم الفرصة.
عندما لم تصل موجة مراكز البيانات بشكل كبير بعد ، ولا يزال تدريب الذكاء الاصطناعي مجالًا متخصصًا ، استثمرت Nvidia بكثافة في تطوير وحدات معالجة الرسومات (GPU) للحوسبة العامة للأغراض العامة وبرامج البرمجة الموحدة CUDA ، وهي وظيفة جيدة لشركة Nvidia- منصات الحوسبة.
في ذلك الوقت ، كان جعل وحدة معالجة الرسومات قابلة للبرمجة خيارًا "عديم الفائدة وخاسرًا": لا أعرف ما إذا كان يمكن مضاعفة أدائها ، ولكن تطوير المنتج سيتضاعف. لهذا السبب ، لا يوجد عميل على استعداد لدفع ثمنها. ومع ذلك ، قررت Nvidia ، التي توقعت أن معالج الرسومات أحادي الوظيفة ليس حلاً طويل الأمد ، تطبيق CUDA على جميع خطوط الإنتاج.
في مقابلة بين Xindongxi والدكتور Lai Junjie ، المدير الأول للهندسة والحلول في Nvidia China ، قال Lai Junjie: "من أجل رؤية منصة الحوسبة ، حشد Huang Renxun بسرعة الكثير من الموارد من Nvidia صعودًا وهبوطًا في وقت مبكر أيام."
Foresight + استثمار ضخم ، في عام 2012 ، فازت Nvidia بجائزة المبتكر: في عام 2012 ، تسبب أداء الحوسبة لخوارزمية التعلم العميق في إحداث ضجة كبيرة في الدائرة الأكاديمية. كأداة إنتاجية عالية الحوسبة وأكثر تنوعًا وسهولة في الاستخدام ، أصبحت GPU + CUDA شائعة بسرعة أصبح مجتمع علوم الكمبيوتر "التكوين القياسي" لتطوير الذكاء الاصطناعي.
في رحلة رقائق الذكاء الاصطناعي ذات قوة الحوسبة الكبيرة ، أدخلت شريحة الكل في واحد للتخزين والحوسبة "حقبة ذهبية" خاصة بها. **
** غير تقني ، غني مالياً ، لا تدخل **
بالنظر إلى الفوائد المختلفة لدمج التخزين والحوسبة ، في هذه المرحلة ، ينمو معسكر اللاعبين الذين يدمجون رقائق الحوسبة والتخزين.
(مصدر الصورة: "تقرير صناعة رقائق طاقة الحوسبة الكبرى للذكاء الاصطناعي - مئات البوارج ، المبتكرون أولاً" بقلم Cirui Insights)
وفقًا للإحصاءات غير المكتملة لـ CIRUI Insight ، منذ عام 2019 ، قامت معظم الشركات المصنعة لرقائق الذكاء الاصطناعي الجديدة بدمج التخزين والحوسبة: هناك 20 مصنعًا جديدًا لرقائق الذكاء الاصطناعي في 2019-2021 ، و 10 منهم اختاروا مسار تكامل الإيداع والحساب.
كل هذا يوضح أن تكامل التخزين والحوسبة سيصبح نجمًا صاعدًا بعد GPGPU و ASIC والبنى الأخرى. ** وهذا النجم الجديد لا يستطيع الجميع اختياره. **
في ظل الظروف التي تكون فيها الدوائر الأكاديمية ودوائر الصناعة ورأس المال متفائلة بالإجماع بشأن تكامل التخزين والحوسبة ، فإن القوة التقنية القوية للبلاد ، ومجموعة المواهب القوية ، والتحكم الدقيق في قبول تكاليف الهجرة هي المفتاح للشركات الناشئة للحفاظ على تنافسيتهم في الصناعة ثلاث حواجز تقف أمام لاعبين جدد. **
** القوة التقنية القوية هي دائمًا أعلى جبل في مجال الرقائق. **
الأول هو تكامل التخزين والحوسبة ، والذي يتضمن العملية الكاملة لتصنيع الرقائق: من الجهاز الأدنى ، إلى تصميم الدوائر ، والتصميم المعماري ، وسلسلة الأدوات ، ثم إلى البحث والتطوير لطبقة البرنامج ؛ الجسم بالكامل ": أثناء إجراء التغييرات المقابلة في كل طبقة ، يجب أيضًا مراعاة درجة التكيف بين كل طبقة.
** دعونا نلقي نظرة عليها طبقة تلو الأخرى ، ما نوع المشكلات التقنية التي تحدث عند تصنيع شريحة متكاملة تعمل بحوسبة الذاكرة. **
بادئ ذي بدء ، فيما يتعلق باختيار الجهاز ، فإن المصنِّعين "يسيرون على الجليد الرقيق": يحدد تصميم الذاكرة معدل إنتاج الرقاقة ، وبمجرد أن يكون الاتجاه خاطئًا ، قد لا يتم إنتاج الرقاقة بكميات كبيرة.
والثاني هو مستوى تصميم الدائرة. بعد أن يكون الجهاز متاحًا على مستوى الدائرة ، يجب استخدامه لتصميم دائرة صفيف التخزين. في الوقت الحالي ، في تصميم الدوائر ، لا توجد إرشادات أداة EDA للحساب في الذاكرة ، ويجب أن يتم ذلك يدويًا ، مما يزيد بلا شك من صعوبة التشغيل بشكل كبير.
بعد ذلك مباشرة ، بعد وجود دوائر على المستوى المعماري ، من الضروري تصميم الطبقة المعمارية. كل دائرة هي وحدة حوسبة أساسية ، وتتكون البنية بأكملها من وحدات مختلفة ، ويحدد تصميم الوحدة المتكاملة لحوسبة الذاكرة نسبة كفاءة الطاقة للرقاقة. سوف تتأثر الدوائر التناظرية بالضوضاء ، وستواجه الرقائق العديد من المشكلات عندما تتأثر بالضوضاء.
في هذه الحالة ، يُطلب من المهندسين المعماريين للرقائق الفهم الكامل لخصائص عملية الحوسبة التناظرية في الذاكرة ، وفي نفس الوقت تصميم البنية وفقًا لهذه الخصائص. وعلى هذا الأساس ، يجب أيضًا مراعاة القدرة على التكيف بين الهندسة المعمارية وتطوير البرامج . بعد اكتمال التصميم المعماري على مستوى البرنامج ، يجب تطوير سلسلة الأدوات المقابلة.
(مصدر الصورة: "تقرير صناعة رقائق طاقة الحوسبة الكبرى لمنظمة العفو الدولية - مئات البوارج ، المبتكرون أولاً" بقلم Cirui Insights)
نظرًا لأن النموذج الأصلي لتكامل حوسبة التخزين يختلف عن النموذج الموجود في البنية التقليدية ، يحتاج المحول البرمجي إلى التكيف مع بنية تكامل حوسبة تخزين مختلفة تمامًا لضمان إمكانية ربط جميع وحدات الحوسبة بالأجهزة وتشغيلها بسلاسة.
** ستختبر سلسلة تقنية كاملة قدرة كل رابط من الأجهزة ، وتصميم الدائرة ، والتصميم المعماري ، وسلسلة الأدوات ، وتطوير طبقة البرامج ، وتنسيق قدرة التكيف لكل رابط ، وهي معركة طويلة الأمد تستغرق وقتًا وجهدًا و مال. **
** في الوقت نفسه ، وفقًا لعملية تشغيل الروابط أعلاه ، يمكن ملاحظة أن الشريحة المدمجة بحوسبة الذاكرة بحاجة ماسة إلى مصممي الدوائر ومهندسي الشرائح ذوي الخبرة. **
في ضوء خصوصية تكامل التخزين والحساب ، يجب أن تتمتع الشركات التي يمكنها دمج التخزين والحساب بالخاصيتين التاليتين من حيث احتياطي الموظفين:
القائد يحتاج إلى ما يكفي من الشجاعة. يجب أن تكون هناك فكرة واضحة في اختيار اختيار الجهاز (RRAM ، SRAM ، إلخ) ووضع الحوسبة (تقليدي von Neumann ، التخزين المتكامل والحساب ، إلخ). هذا لأنه ، كتقنية تخريبية ومبتكرة ، لا يوجد أحد يقود تكامل التخزين والحساب ، كما أن تكلفة التجربة والخطأ مرتفعة للغاية. غالبًا ما يتمتع مؤسسو الشركات التي يمكنها تحقيق التسويق بخبرة غنية في الصناعة وكبار المصنعين والخلفيات الأكاديمية ، ويمكنهم قيادة الفريق لإكمال عمليات تكرار المنتجات بسرعة.
في الفريق الأساسي ، من الضروري تجهيز المواهب ذات الخبرة في جميع مستويات التكنولوجيا. على سبيل المثال ، المهندس المعماري الذي هو جوهر الفريق. يحتاج المهندسون المعماريون إلى فهم عميق وإدراك لأدوات الأجهزة والبرامج الأساسية ، وأن يكونوا قادرين على إدراك بنية التخزين والحوسبة في المفهوم من خلال التكنولوجيا ، وأخيراً تحقيق هبوط المنتج ؛
بالإضافة إلى ذلك ، وفقًا لتقرير qubit ، هناك نقص في المواهب المتطورة في تصميم الدوائر في الصين ، خاصة في مجال الدوائر الهجينة. تتضمن الحوسبة في الذاكرة عددًا كبيرًا من تصميمات الدوائر التناظرية. وبالمقارنة مع تصميم الدوائر الرقمية الذي يركز على العمل الجماعي ، فإن تصميم الدوائر التناظرية يتطلب مصممين فرديين على دراية كبيرة بالعملية والتصميم والتخطيط ونموذج PDK والتعبئة والتغليف.
وهذه السلسلة من المواهب والتقنيات يجب أن تأخذ تأثير الهبوط كهدف نهائي - إنتاج الدرجة الأولى هو القوة الإنتاجية الأساسية. ** أثناء التسليم ، ما يعتبره العميل ليس فقط التكنولوجيا المتكاملة لحوسبة التخزين ، ولكن ما إذا كانت مؤشرات أداء SoC المتكاملة لحوسبة التخزين ، مثل نسبة كفاءة الطاقة ونسبة كفاءة المنطقة وسهولة الاستخدام ، كافية مقارنةً بـ المنتجات السابقة التحسين ، والأهم من ذلك ، ما إذا كانت تكلفة الترحيل ضمن النطاق المقبول.
إذا كان اختيار شريحة جديدة لتحسين أداء الخوارزمية يتطلب إعادة تعلم نظام البرمجة ، وكانت تكلفة العمالة لترحيل النموذج أعلى من تكلفة شراء وحدة معالجة الرسومات الجديدة ، فمن المرجح ألا يختار العملاء استخدام شريحة جديدة.
** لذلك ، ما إذا كان دمج الإيداع والحساب يمكن أن يقلل تكلفة الترحيل أثناء عملية الهبوط هو عامل رئيسي للعملاء عند اختيار المنتجات. **
في سياق النماذج واسعة النطاق ، أصبحت الرقاقة المتكاملة لحوسبة الذاكرة نجمة صاعدة في مسار الرقائق بفضل استهلاكها المنخفض للطاقة ولكن نسبة كفاءة الطاقة العالية. في الوقت الحاضر ، لا يزال سوق الإيداع والحساب المتكامل في مرحلة "Xiaohe آخذ في الظهور للتو".
** ومع ذلك ، لا يمكننا إنكار أن مشغلي التخزين والحساب المدمجين قد قاموا بالفعل ببناء ثلاثة جدران عالية ، ولا ينبغي لمن يتمتعون بقوة فنية قوية واحتياطيات قوية من المواهب الدخول. **
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
في عام 2023 ، طُلب من شركات شرائح الذكاء الاصطناعي ثلاث مرات متتالية
المصدر: Insights by Si Rui، author | Renee، editor | Sun Yue
في عام 2023 ، تطرح المؤسسات الاستثمارية والمساهمون على الشركات المدرجة في مجال رقائق الذكاء الاصطناعي ثلاثة أسئلة قاتلة:
هل صنعت شريحة متكاملة للتخزين والحساب حتى الآن؟
كيف يتم التقدم في الشريحة المتكاملة لحوسبة الذاكرة؟
ما هو احتمال التخزين المتكامل ورقائق الحوسبة؟
تعني سلسلة الأسئلة أعلاه أن دمج التخزين والحساب لم يعد "يبقى" في الأوساط الأكاديمية والصناعية ، ويبدو أنه شائع في السوق الثانوية: يعمل المساهمون ومؤسسات الوساطة لوقت إضافي لتعويض تكامل التخزين والحساب ، لذا فإن مصنعي الرقائق التقليديين منذ بداية عام 2023 ، تعرض تخطيط تكامل التخزين والحوسبة "للضرر".
** سؤال طبيعي لماذا أصبح تكامل الإيداع والحساب فجأة ذائع الصيت؟ **
أعطت Huawei ، التي أصدرت منتج التخزين الجديد OceanStor A310 في 7.14 ، إجابتها الخاصة. قال Zhou Yuefeng ، رئيس خط إنتاج تخزين البيانات في Huawei ، إن هناك العديد من مشاكل البيانات في التدريب والتفكير في النماذج الكبيرة للأغراض العامة والنماذج الصناعية الكبيرة: الجمع البطيء عبر المجالات للبيانات الضخمة ، وانخفاض كفاءة تفاعل البيانات في المعالجة المسبقة و التدريب ، وصعوبة أمن تدفق البيانات.
يجلب نموذج الذكاء الاصطناعي الكبير تحديات جديدة للتخزين. على سبيل المثال ، الاستقرار أسوأ من استقرار الذكاء الاصطناعي التقليدي. وفي الوقت نفسه ، هناك قدر كبير من المعالجة المسبقة للبيانات وأعمال التحضير.من الضروري استخدام الحوسبة القريبة من الذاكرة ( نوع من التخزين وتكامل الحوسبة) لحل المشكلة. قم بمعالجة هذه المشكلة بشكل منهجي. **
إذن ، ما مقدار "كمية البيانات الكبيرة" هنا؟ وفقًا لحساب CIRUI Insight ، يضم ChatGPT حاليًا 100 مليون مستخدم يوميًا.إذا طرح 5٪ من الأشخاص أسئلة كل ثانية في نفس الوقت كل يوم ، فسوف يبتلع توليد الطاقة لسد الخوانق الثلاثة لمدة عام تقريبًا. **
بعبارة أخرى ، تتطلب النماذج الكبيرة بشكل محموم قوة الحوسبة ، ويمكن للحلول الناشئة المتمثلة في تكامل التخزين والحوسبة أن تحل العديد من التحديات التي تسببها النماذج الكبيرة. في الواقع ، بالإضافة إلى فرض متطلبات صارمة على قوة الحوسبة ، يمنح النموذج الكبير أيضًا مصنعي شرائح الذكاء الاصطناعي "الكثير من السكر لتناوله".
تحاول هذه المقالة استكشاف ، في ظل خلفية النموذج الكبير ، ما هي الفوائد التي تُعطى لمصنعي شرائح الذكاء الاصطناعي؟ ما هو النمط المستقبلي للمصنعين المتكاملين للتخزين والحوسبة التي تم "إطلاقها" بواسطة ChatGPT؟
** "الحظ وسوء الحظ يعتمدان على بعضهما البعض" الشركات المصنعة لشرائح الذكاء الاصطناعي **
** رياح نماذج بالحجم الطبيعي لا تزال تهب ، والمناقشات حول نماذج بالحجم الطبيعي لا تزال على قدم وساق. **
في بداية شهر أغسطس ، في المنتدى الفرعي لمؤتمر الذكاء الاصطناعي لاتحاد الكمبيوتر الصيني (CCF) - "رؤية كونلون في حدود الذكاء الاصطناعي على نطاق واسع لنموذج الحوسبة الحدودية" ، اتفق الخبراء والعلماء على أنه في عصر النماذج واسعة النطاق ، أصبحت قوة الحوسبة الذكية الحديثة "نادرة". أصبحت الأصول ، وكيفية الاستفادة الجيدة من موارد الطاقة الحاسوبية وتعظيم فوائدها تحديًا يجب على كل مشارك مواجهته.
بالنسبة لمقدار قوة الحوسبة التي تتطلبها GPT-3 وحدها ، في ظل الظروف المحافظة ، يحتاج سد الخوانق الثلاثة إلى "العمل" طوال الليل للوفاء بما يلي:
ما يجعل مصنعي شرائح الذكاء الاصطناعي أكثر قلقًا هو أن هذا ليس سوى استهلاك الطاقة لنموذج ChatGPT كبير في مرحلة الاستدلال.
** نتيجة لذلك ، تم التنقيب عن سلسلة من الحلول الناشئة من قبل الشركات المصنعة: ** التخزين والحساب المتكامل ، chiplet ، HBM ، إلخ. من بينها ، نظرًا لأن دمج التخزين والحوسبة قد أطاح بجدار التخزين في ظل بنية von Neumann التقليدية ، فقد حقق بالفعل خفض التكلفة وتحسين الكفاءة ، ليصبح Ziweixing هذا العام.
** بالإضافة إلى ظهور الحلول الناشئة التي منحت مصنعي شرائح الذكاء الاصطناعي أنفاسًا ، فإن النموذج الكبير يجلب أيضًا أخبارًا جيدة لمصنعي الرقائق ، وخاصة الشركات المصنعة للرقائق المبتدئة: تتراجع أهمية بيئة البرمجيات. **
عندما لم تكن التكنولوجيا ناضجة بما يكفي في الأيام الأولى ، كان بإمكان الباحثين البدء فقط من خلال حل مشكلة معينة ، وولدت نماذج صغيرة بأقل من مليون متغير. على سبيل المثال ، DeepMind ، وهي شركة ذكاء اصطناعي مملوكة لشركة Google ، تسمح لـ AlphaGO بإجراء "تعليم" خاص على خطوات لعب الشطرنج لملايين اللاعبين المحترفين من البشر.
بعد وجود المزيد من الطرز الصغيرة ، تصبح مشكلة الأجهزة مثل تكيف الرقاقة وشيكة. لذلك ، عندما أطلقت Nvidia نظام CUDA البيئي الموحد ، فازت GPU + CUDA بسرعة باعتراف مجتمع علوم الكمبيوتر وأصبحت التكوين القياسي لتطوير الذكاء الاصطناعي.
تتمتع النماذج الكبيرة التي تظهر واحدة تلو الأخرى اليوم بقدرات متعددة الوسائط ، ويمكنها التعامل مع النصوص والصور والبرمجة وغيرها من المشكلات ، ويمكنها أيضًا تغطية مجالات رأسية متعددة مثل المكتب والتعليم والرعاية الطبية. هذا يعني أيضًا أن التكيف مع البيئة السائدة ليس هو الخيار الوحيد: عندما يرتفع الطلب على الرقائق للنماذج الكبيرة ، قد يكون مصنعو الرقائق قادرين فقط على التكيف مع نموذج واحد أو نموذجين كبيرين ، ويمكنهم إكمال تطوير نماذج صغيرة متعددة في الماضي. **
بمعنى آخر ، يوفر ظهور ChatGPT للشركات المصنعة للرقائق المبتدئة فرصة للتغلب على الزوايا. هذا يعني أن هيكل سوق شرائح الذكاء الاصطناعي سيخضع لتغييرات هائلة: لم تعد رقائق الذكاء الاصطناعي عرضًا فرديًا للمصنعين الفرديين ، ولكنها لعبة جماعية للعديد من المبتكرين. **
** عندما تصبح قوة الحوسبة سلعة نادرة ، ولم يعد التكيف مع البيئة السائدة أمرًا ضروريًا ، فإن تكامل التخزين والحوسبة بالكاد يمكن أن يخفي ضوءها. ** في هذا الوقت ، أصبحت مسألة الاستثمار من عدمه ومقدار الاستثمار هي المشكلة الثانية التي تواجه مصنعي شرائح الذكاء الاصطناعي. **
في هذا الصدد ** الجواب الذي قدمته شركة الرقائق العملاقة NVIDIA لسنوات عديدة هو التحلي بالشجاعة في الابتكار واستثمار الكثير من المال: **
لا شك أن كل شركة مصنعة للبحث والتطوير لتقنية ناشئة ستواجه مشكلات على مستويات مختلفة مثل عقبات الاستكشاف التقني وخلاف الشركات المصنعة للمصب. في المرحلة المبكرة ، أياً كان من يتوقع اتجاه التنمية المستقبلي أولاً ، يأخذ الشجاعة لاتخاذ خطوات الاستكشاف ، ويضع موارد معقولة للمحاولة ، فإنه يغتنم الفرصة.
عندما لم تصل موجة مراكز البيانات بشكل كبير بعد ، ولا يزال تدريب الذكاء الاصطناعي مجالًا متخصصًا ، استثمرت Nvidia بكثافة في تطوير وحدات معالجة الرسومات (GPU) للحوسبة العامة للأغراض العامة وبرامج البرمجة الموحدة CUDA ، وهي وظيفة جيدة لشركة Nvidia- منصات الحوسبة.
في ذلك الوقت ، كان جعل وحدة معالجة الرسومات قابلة للبرمجة خيارًا "عديم الفائدة وخاسرًا": لا أعرف ما إذا كان يمكن مضاعفة أدائها ، ولكن تطوير المنتج سيتضاعف. لهذا السبب ، لا يوجد عميل على استعداد لدفع ثمنها. ومع ذلك ، قررت Nvidia ، التي توقعت أن معالج الرسومات أحادي الوظيفة ليس حلاً طويل الأمد ، تطبيق CUDA على جميع خطوط الإنتاج.
في مقابلة بين Xindongxi والدكتور Lai Junjie ، المدير الأول للهندسة والحلول في Nvidia China ، قال Lai Junjie: "من أجل رؤية منصة الحوسبة ، حشد Huang Renxun بسرعة الكثير من الموارد من Nvidia صعودًا وهبوطًا في وقت مبكر أيام."
Foresight + استثمار ضخم ، في عام 2012 ، فازت Nvidia بجائزة المبتكر: في عام 2012 ، تسبب أداء الحوسبة لخوارزمية التعلم العميق في إحداث ضجة كبيرة في الدائرة الأكاديمية. كأداة إنتاجية عالية الحوسبة وأكثر تنوعًا وسهولة في الاستخدام ، أصبحت GPU + CUDA شائعة بسرعة أصبح مجتمع علوم الكمبيوتر "التكوين القياسي" لتطوير الذكاء الاصطناعي.
في رحلة رقائق الذكاء الاصطناعي ذات قوة الحوسبة الكبيرة ، أدخلت شريحة الكل في واحد للتخزين والحوسبة "حقبة ذهبية" خاصة بها. **
** غير تقني ، غني مالياً ، لا تدخل **
بالنظر إلى الفوائد المختلفة لدمج التخزين والحوسبة ، في هذه المرحلة ، ينمو معسكر اللاعبين الذين يدمجون رقائق الحوسبة والتخزين.
وفقًا للإحصاءات غير المكتملة لـ CIRUI Insight ، منذ عام 2019 ، قامت معظم الشركات المصنعة لرقائق الذكاء الاصطناعي الجديدة بدمج التخزين والحوسبة: هناك 20 مصنعًا جديدًا لرقائق الذكاء الاصطناعي في 2019-2021 ، و 10 منهم اختاروا مسار تكامل الإيداع والحساب.
كل هذا يوضح أن تكامل التخزين والحوسبة سيصبح نجمًا صاعدًا بعد GPGPU و ASIC والبنى الأخرى. ** وهذا النجم الجديد لا يستطيع الجميع اختياره. **
في ظل الظروف التي تكون فيها الدوائر الأكاديمية ودوائر الصناعة ورأس المال متفائلة بالإجماع بشأن تكامل التخزين والحوسبة ، فإن القوة التقنية القوية للبلاد ، ومجموعة المواهب القوية ، والتحكم الدقيق في قبول تكاليف الهجرة هي المفتاح للشركات الناشئة للحفاظ على تنافسيتهم في الصناعة ثلاث حواجز تقف أمام لاعبين جدد. **
** القوة التقنية القوية هي دائمًا أعلى جبل في مجال الرقائق. **
الأول هو تكامل التخزين والحوسبة ، والذي يتضمن العملية الكاملة لتصنيع الرقائق: من الجهاز الأدنى ، إلى تصميم الدوائر ، والتصميم المعماري ، وسلسلة الأدوات ، ثم إلى البحث والتطوير لطبقة البرنامج ؛ الجسم بالكامل ": أثناء إجراء التغييرات المقابلة في كل طبقة ، يجب أيضًا مراعاة درجة التكيف بين كل طبقة.
** دعونا نلقي نظرة عليها طبقة تلو الأخرى ، ما نوع المشكلات التقنية التي تحدث عند تصنيع شريحة متكاملة تعمل بحوسبة الذاكرة. **
بادئ ذي بدء ، فيما يتعلق باختيار الجهاز ، فإن المصنِّعين "يسيرون على الجليد الرقيق": يحدد تصميم الذاكرة معدل إنتاج الرقاقة ، وبمجرد أن يكون الاتجاه خاطئًا ، قد لا يتم إنتاج الرقاقة بكميات كبيرة.
والثاني هو مستوى تصميم الدائرة. بعد أن يكون الجهاز متاحًا على مستوى الدائرة ، يجب استخدامه لتصميم دائرة صفيف التخزين. في الوقت الحالي ، في تصميم الدوائر ، لا توجد إرشادات أداة EDA للحساب في الذاكرة ، ويجب أن يتم ذلك يدويًا ، مما يزيد بلا شك من صعوبة التشغيل بشكل كبير.
بعد ذلك مباشرة ، بعد وجود دوائر على المستوى المعماري ، من الضروري تصميم الطبقة المعمارية. كل دائرة هي وحدة حوسبة أساسية ، وتتكون البنية بأكملها من وحدات مختلفة ، ويحدد تصميم الوحدة المتكاملة لحوسبة الذاكرة نسبة كفاءة الطاقة للرقاقة. سوف تتأثر الدوائر التناظرية بالضوضاء ، وستواجه الرقائق العديد من المشكلات عندما تتأثر بالضوضاء.
في هذه الحالة ، يُطلب من المهندسين المعماريين للرقائق الفهم الكامل لخصائص عملية الحوسبة التناظرية في الذاكرة ، وفي نفس الوقت تصميم البنية وفقًا لهذه الخصائص. وعلى هذا الأساس ، يجب أيضًا مراعاة القدرة على التكيف بين الهندسة المعمارية وتطوير البرامج . بعد اكتمال التصميم المعماري على مستوى البرنامج ، يجب تطوير سلسلة الأدوات المقابلة.
نظرًا لأن النموذج الأصلي لتكامل حوسبة التخزين يختلف عن النموذج الموجود في البنية التقليدية ، يحتاج المحول البرمجي إلى التكيف مع بنية تكامل حوسبة تخزين مختلفة تمامًا لضمان إمكانية ربط جميع وحدات الحوسبة بالأجهزة وتشغيلها بسلاسة.
** ستختبر سلسلة تقنية كاملة قدرة كل رابط من الأجهزة ، وتصميم الدائرة ، والتصميم المعماري ، وسلسلة الأدوات ، وتطوير طبقة البرامج ، وتنسيق قدرة التكيف لكل رابط ، وهي معركة طويلة الأمد تستغرق وقتًا وجهدًا و مال. **
** في الوقت نفسه ، وفقًا لعملية تشغيل الروابط أعلاه ، يمكن ملاحظة أن الشريحة المدمجة بحوسبة الذاكرة بحاجة ماسة إلى مصممي الدوائر ومهندسي الشرائح ذوي الخبرة. **
في ضوء خصوصية تكامل التخزين والحساب ، يجب أن تتمتع الشركات التي يمكنها دمج التخزين والحساب بالخاصيتين التاليتين من حيث احتياطي الموظفين:
القائد يحتاج إلى ما يكفي من الشجاعة. يجب أن تكون هناك فكرة واضحة في اختيار اختيار الجهاز (RRAM ، SRAM ، إلخ) ووضع الحوسبة (تقليدي von Neumann ، التخزين المتكامل والحساب ، إلخ). هذا لأنه ، كتقنية تخريبية ومبتكرة ، لا يوجد أحد يقود تكامل التخزين والحساب ، كما أن تكلفة التجربة والخطأ مرتفعة للغاية. غالبًا ما يتمتع مؤسسو الشركات التي يمكنها تحقيق التسويق بخبرة غنية في الصناعة وكبار المصنعين والخلفيات الأكاديمية ، ويمكنهم قيادة الفريق لإكمال عمليات تكرار المنتجات بسرعة.
في الفريق الأساسي ، من الضروري تجهيز المواهب ذات الخبرة في جميع مستويات التكنولوجيا. على سبيل المثال ، المهندس المعماري الذي هو جوهر الفريق. يحتاج المهندسون المعماريون إلى فهم عميق وإدراك لأدوات الأجهزة والبرامج الأساسية ، وأن يكونوا قادرين على إدراك بنية التخزين والحوسبة في المفهوم من خلال التكنولوجيا ، وأخيراً تحقيق هبوط المنتج ؛
بالإضافة إلى ذلك ، وفقًا لتقرير qubit ، هناك نقص في المواهب المتطورة في تصميم الدوائر في الصين ، خاصة في مجال الدوائر الهجينة. تتضمن الحوسبة في الذاكرة عددًا كبيرًا من تصميمات الدوائر التناظرية. وبالمقارنة مع تصميم الدوائر الرقمية الذي يركز على العمل الجماعي ، فإن تصميم الدوائر التناظرية يتطلب مصممين فرديين على دراية كبيرة بالعملية والتصميم والتخطيط ونموذج PDK والتعبئة والتغليف.
وهذه السلسلة من المواهب والتقنيات يجب أن تأخذ تأثير الهبوط كهدف نهائي - إنتاج الدرجة الأولى هو القوة الإنتاجية الأساسية. ** أثناء التسليم ، ما يعتبره العميل ليس فقط التكنولوجيا المتكاملة لحوسبة التخزين ، ولكن ما إذا كانت مؤشرات أداء SoC المتكاملة لحوسبة التخزين ، مثل نسبة كفاءة الطاقة ونسبة كفاءة المنطقة وسهولة الاستخدام ، كافية مقارنةً بـ المنتجات السابقة التحسين ، والأهم من ذلك ، ما إذا كانت تكلفة الترحيل ضمن النطاق المقبول.
إذا كان اختيار شريحة جديدة لتحسين أداء الخوارزمية يتطلب إعادة تعلم نظام البرمجة ، وكانت تكلفة العمالة لترحيل النموذج أعلى من تكلفة شراء وحدة معالجة الرسومات الجديدة ، فمن المرجح ألا يختار العملاء استخدام شريحة جديدة.
** لذلك ، ما إذا كان دمج الإيداع والحساب يمكن أن يقلل تكلفة الترحيل أثناء عملية الهبوط هو عامل رئيسي للعملاء عند اختيار المنتجات. **
في سياق النماذج واسعة النطاق ، أصبحت الرقاقة المتكاملة لحوسبة الذاكرة نجمة صاعدة في مسار الرقائق بفضل استهلاكها المنخفض للطاقة ولكن نسبة كفاءة الطاقة العالية. في الوقت الحاضر ، لا يزال سوق الإيداع والحساب المتكامل في مرحلة "Xiaohe آخذ في الظهور للتو".
** ومع ذلك ، لا يمكننا إنكار أن مشغلي التخزين والحساب المدمجين قد قاموا بالفعل ببناء ثلاثة جدران عالية ، ولا ينبغي لمن يتمتعون بقوة فنية قوية واحتياطيات قوية من المواهب الدخول. **