**كم مضى منذ أن سمعت شركة ناشئة تقول إنها ستنقذ الإنترنت؟ **
يبدو أن رواد الأعمال اليوم إما يكسبون المال بصمت، أو يناقشون استخدام الذكاء الاصطناعي لإنقاذ (أو تدمير) البشرية جمعاء. في عالم الإنترنت الذي نعيشه كل يوم، يبدو أن لا أحد يهتم بحياته وموته.
وبالنسبة لكري، بدا الأمر وكأنه سيموت.
عندما سمعته يقول هذا لي تحت أشعة الشمس الساطعة في سان خوسيه، بدا الأمر مثيرًا بعض الشيء. ولكن عندما تبقى مع هذا الألماني ذو الشعر الشبيه بالأسد لفترة طويلة، فإن لغته الإنجليزية المنطقية ذات النمط الألماني ستجعلك تعتقد بسهولة أن هذه مشكلة كبيرة بالفعل.
Chri Besenbruch هو المؤسس المشارك والرئيس التنفيذي لشركة Deep Render، ببساطة، ما تفعله شركته هو "استخدام الذكاء الاصطناعي لضغط حجم ملفات الفيديو إلى أحجام صغيرة جدًا".
ويدعي أن الخوارزمية "أفضل" بما يصل إلى خمس مرات من برنامج الترميز القياسي في الصناعة HVEC، على الرغم من أنه لم يحدد المقياس، ويمكن تشغيلها في الوقت الفعلي على شرائح حديثة من Qualcomm وApple وNvidia. يشير "برنامج الترميز" إلى البرامج وأحيانًا الأجهزة التي يمكنها تشفير البيانات وفك تشفيرها، عادةً لبيانات الصوت أو الفيديو.
قد يرتبك بعض الأشخاص الذين هم على دراية بوادي السيليكون عندما يسمعون ذلك، معتقدين أنني أعيد سرد سيناريو "وادي السيليكون". في هذه الدراما الأمريكية، التي توصف بأنها عرض مثالي للنظام البيئي لريادة الأعمال في وادي السيليكون، كل شيء المهزلة هي أن بطل الرواية قد طور خوارزمية ضغط مذهلة.
"نعم، لقد أخبرني الكثير من الناس بذلك. نحن نشبه إلى حد كبير مزمار البييد." هذا الشخص ذو الخلفية المعقدة الذي نشأ في ألمانيا، ودرس الرياضيات كطالب جامعي، وذهب إلى سويسرا لدراسة مدرسة الفنون، ثم ذهب إلى المملكة المتحدة لدراسة علوم الكمبيوتر، ويتمتع بطل الرواية ريتشارد في "وادي السيليكون" أيضًا بجو قوي من الطالب الذي يذاكر كثيرا، ولكن على عكس عملية اختراق خوارزمية الضغط السخيفة في المسلسل التلفزيوني، والافتقار إلى الحس السليم التجاري في المسلسل التلفزيوني، ريتشارد غالبًا ما يكون مترددًا، كما أن ريادة أعماله صارمة مثل حل المشكلات الرياضية، كما أنه جاد جدًا فيما يتعلق بالشركة، كما أن نموذج العمل مدروس بوضوح.
وبرأيه فإن الإنترنت يتجه نحو التدمير، وهذه هي المشكلة الأكبر. أراد أن يحل هذه المشكلة الكبرى، وبعد التحليل، اعتقدوا أن السبب الجذري هو أن التكنولوجيا القديمة لم تتكيف مع العالم الجديد:
*بعد أن أصبح الفيديو شائعاً وأصبح وسيلة التواصل الرئيسية على الإنترنت، دخلنا فعلياً إلى عالم جديد. عالم يزداد فيه حجم البيانات رعبًا، ولا مجال للعودة إلى الوراء. *
*التقنيات القديمة لم تعد مناسبة لهذا العالم الجديد. إن الاستمرار في تقديم ابتكارات وتحسينات طفيفة على نفس المسار القديم لن يؤدي إلا إلى طريق مسدود، وفي نهاية المطاف انهيار الإنترنت. *
"سوف ننقذ الإنترنت من خلال اختراع خوارزميات ضغط جديدة. وما يجعل هذا ممكنًا هو الذكاء الاصطناعي."
وعلى هذا المنوال، أسس كريس شركة Deep Render في عام 2018 مع زملائه في الدراسات العليا في المملكة المتحدة، ولم يكن واحدًا من تلك الشركات الناشئة التي تطارد موجة ChatGPT.
قال لي: "في الأساس، ليس لدينا الكثير لنفعله مع LLM. قد يكون الأمر مرتبطًا بنموذج الانتشار، لكنه يتعلق أكثر بالإمكانيات المحتملة في المستقبل". "لقد بدأنا من المبادئ الأولى وأردنا أن نفهم ما هو مناسب للذكاء الاصطناعي وجوهر الضغط. وفي النهاية، اعتقدنا أن الطريقة التي تعتمد بالكامل على الذكاء الاصطناعي يجب أن تكون طريقًا تقنيًا جديدًا."
ومع ذلك، فإن "القلق" الذي تعاني منه شركة LLM ساعد في الواقع شركتها. "كنا في الواقع نقامر في ذلك الوقت، لأنه لتحقيق أهدافنا، بالإضافة إلى الخوارزميات الخاصة بي، كنا نحتاج أيضًا إلى تقدم كبير في البرامج والأجهزة. لقد قمنا بالتنبؤ في ذلك الوقت، على افتراض أن هذه التقنيات الأساسية يمكن أن تحقق قفزات كبيرة الحدود. واليوم حدث كل هذا الآن." قال لي، لهجته مليئة بالإثارة.
"ربما نحن محظوظون فقط."
**يبدو متواضعا للغاية، ولكن ما لم يقله هو أنه إذا تحققت توقعاته، فقد تصبح شركته واحدة من أهم شركات تكنولوجيا الإنترنت في البشرية في العقود القليلة المقبلة. **سيتم توفير التكنولوجيا الخاصة بهم للشركات الكبرى في شكل مرخص، وفي الوقت الذي يقومون فيه بحل مشكلة النطاق الترددي للإنترنت، سيصبحون أيضًا نوع الشركة التي تجمع فواتير الخدمات والضرائب.
في الواقع، كل شيء بدأ يتغير.
منذ هذا العام دخلت هذه الشركة التي تم تجاهلها في رؤية وادي السيليكون والمؤسسات الاستثمارية المعروفة حول العالم، وبعد الانتهاء من التمويل في شهر مارس، بدأ كريس بتحويل تركيزه إلى وادي السيليكون، حيث يوجد المال والأشخاص المهتمين بهم العملاء الكبار.
ووفقا لبيانه، فإن فريقهم الصغير الحالي مرهق بالفعل عندما يواجه الاهتمام والطلب من "الشركات الكبرى التي لا يمكن ذكر اسمها ولكنها مهمة للغاية".
وكشف لي أنه إذا سارت الأمور على ما يرام الآن، فسيتم استخدام تقنيتها في خدمة تطبيقات معروفة جدًا في الربع الثاني من عام 2024.
"سيتمكن عشرات الملايين من المستخدمين من الوصول إليها."
كما بدأ السوق الصيني، الذي يشهد طلبًا كبيرًا على ضغط الفيديو والبيانات، في الظهور بأشكال مختلفة أمام هذا الرئيس التنفيذي الذي لم يقم بزيارة الصين.
وقال "لدينا العديد من الأصدقاء المستثمرين الذين لديهم علاقات قوية مع الصين ويساعدون بعض الشركات الصينية على الاتصال بنا. ونحن على اتصال بالفعل مع العديد من أكبر شركات الإنترنت في الصين". جاءت هذه المطالب فجأة وعنيفة لدرجة أنه أمضى نصف يوم يسألني أسئلة أساسية حول "كيف يبدو العمل مع شركات الإنترنت الصينية؟"
"يبدو أنك إذا كنت تريد إنقاذ الإنترنت، فلن تتمكن من القيام بذلك بدون السوق الصينية." أخبرته بشيء من المزاح بعد أن أخبرت رائد الأعمال التكنولوجي الذي قضى معظم حياته في أوروبا قصصًا عن الشرق بقدر ما ممكن.
"أنت على حق." أجاب بابتسامة. ولكن قبل أن يفكر في السوق الصينية، كان عليه أولاً أن يغزو وادي السيليكون.
في نهاية الدراما الأمريكية "وادي السيليكون"، بلغت قيمة شركة ريتشارد 8 مليارات دولار بعد ست سنوات من الصعود والهبوط، ولكن قبل أيام قليلة فقط من طرح المنتج رسميًا، اكتشفوا أن خوارزمية الضغط كانت مختلفة "من تلك التي طوروها. الذكاء الاصطناعي الذي حسن الشبكة قام بتحسين بعضها البعض وتحول إلى "وحش" لم يتمكنوا من فهمه ولكن يمكنه اختراق جميع الأنظمة. بعد وزنه، قرروا أخيرًا "إنقاذ العالم" - باستخدام أحمق رائع لجعل الجميع يتوقفون. لدي أفكار حول هذا المسار الفني.
هذه ليست نهاية جيدة لبدء التشغيل. عندما طرحت هذا الموضوع على كريس، الذي سيكون في عامه السادس من بدء مشروع تجاري في العام المقبل، فكر لفترة من الوقت، ثم ابتسم وقال:
"آمل أن تكون نهايتنا أفضل."
** وفيما يلي نص الحوار **
س: قدم نفسك وشركتك بشكل مختصر.
ج: بالطبع. أنا كريس بيسنبروش، الرئيس التنفيذي والمؤسس المشارك لشركة Deep Render. ما يفعله Deep Render هو في الأساس ضغط حجم ملفات الفيديو وما إلى ذلك إلى حجم صغير جدًا. السبب وراء حاجتنا للقيام بذلك هو أن البيانات الموجودة على الإنترنت تنمو بشكل كبير، وقد تم إنشاء 90٪ من البيانات في العامين الماضيين. إنهم بحاجة إلى السفر عبر شبكات الألياف الضوئية حول العالم، وهي بنية تحتية مكلفة للغاية على هذا النطاق. تبلغ تكلفة البنية التحتية للألياف الضوئية في العالم بأكملها 5 تريليون دولار. وهذا ليس مريحًا لأنه إذا تضاعفت البيانات كل عامين، فماذا يعني ذلك بالنسبة للبنية التحتية، فإنها تحتاج إلى المضاعفة أيضًا. لكن هذا يمثل مضاعفة على مستوى التريليون. هذا مستحيل. هذا هو السبب وراء قيامي بذلك.
**الفكرة هي أنه إذا لم نتمكن من جعل المسار أكبر وأسرع، فسنجعل البيانات الموجودة في المسار أصغر. لذلك أشار إلى الضغط **. هذا هو أساسنا ورؤيتنا.
س: لقد استنتجت أولاً إحدى المشكلات الأساسية التي تواجه الإنترنت اليوم، واكتشفت حلها، ثم استخدمتها لتحديد اتجاهك في مجال تنظيم المشاريع.
أ: نعم، هذا كل شيء. لأنه بدون طريقة ضغط أفضل بكثير، ستنهار شبكة الإنترنت بأكملها قريبًا. وأنا أحب الإنترنت وأريد أن أستمر فيه.
س: إذن ما هو الفرق بين التكنولوجيا الخاصة بك، لأن الضغط ليس شيئًا جديدًا، فهو موجود منذ فترة طويلة، حتى أن الناس اعتادوا عليه ونسوا وجوده. ربما يمكنك وصف التكنولوجيا الخاصة بك بمصطلحات يمكن أن يفهمها الأحمق.
أ: هاهاها، سأبذل قصارى جهدي. "نحن بحاجة إلى إلقاء نظرة على الصناعة بأكملها من الستين عامًا الماضية. عندما ظهرت تقنية الضغط التقليدية، كان ذلك إنجازًا هائلاً. كان كل شيء يعتمد على DCT* (يرمز DCT إلى تحويل جيب التمام المنفصل، والذي يقسم الصورة إلى مكونات مكونة من عناصر مختلفة ترددات. كتل صغيرة. أثناء عملية التكميم، يتم التخلص من المكونات عالية التردد، ويتم حفظ المكونات منخفضة التردد المتبقية واستخدامها لإعادة بناء الصورة لاحقًا. ملاحظة المحرر)*، تم اختراع هذه الطريقة التي تجعل تقنية ضغط الفيديو الحالية ممكنة في السبعينيات والثمانينيات أو نحو ذلك، وهيمنت على الصناعة بعد ذلك. **ولكن منذ ذلك الحين، لم تتحسن هذه التكنولوجيا إلا قليلاً كل 10 سنوات، وكانت دائمًا نفس الفكرة التقنية. لا يمكننا أن نتوقع من التكنولوجيا أن تحقق قفزة نوعية بمجرد تكرار نفس الفكرة مئات المرات. **إنها تكنولوجيا عظيمة، لكن دورة ابتكارها انتهت أو في طريقها إلى الانتهاء.
لذلك نحن بحاجة إلى شيء جديد. وهذا "الجديد" هو الذكاء الاصطناعي. ونظرًا لأن الذكاء الاصطناعي يمكنه التعامل مع الصور ومقاطع الفيديو بشكل جيد للغاية، فإن هذا ليس طريقًا لا يمكن تصوره. لذلك بدأ الجمع بين تقنية الذكاء الاصطناعي وتكنولوجيا الضغط. كانت هناك موجتان بعد ذلك، الأولى حدثت في عام 2017، عندما ظهرت الدقة الفائقة واخترعها Magic Pony، وكانت فكرتهم هي الإبقاء على طريقة الضغط التقليدية في منتصف الخط وإضافة الذكاء الاصطناعي في الأمام والخلف.
** لا يعتقد Deep Render أن هذا هو النهج الصحيح. لأن ما بقي فيها هي تقنية الضغط التقليدية التي نعتقد أنها انهارت تماما. إنه لا يتغير كثيرًا عما كان عليه من قبل، ولا يزال غير مفيد. **
"نحن الموجة الثانية، نتخلى تمامًا عن تكنولوجيا الضغط التقليدية ونستخدم الشبكات العصبية فقط. وهذا يعني أيضًا إعادة اختراع الضغط. إعادة اختراع الضغط حول تكنولوجيا التعلم الآلي له أكبر تأثير. تحصل الشبكة العصبية على البيانات وتضغط الملف. أرسل إلى الإنترنت، وتستقبل الشبكة الملف المضغوط وتعيد الفيديو إليك. هذا حل للذكاء الاصطناعي فقط. نحن نقود هذه المهمة، ونحن في الواقع الشركة الوحيدة التي تقوم بذلك.
س: إذن أنت تستخدم الذكاء الاصطناعي بشكل أساسي لاستبدال الجزء الذي تكون التكنولوجيا التقليدية مسؤولة عنه، فلماذا يستطيع الذكاء الاصطناعي القيام بذلك بشكل أفضل؟
أ: سببين. يعد ضغط الفيديو أو الفيديو في الأساس بمثابة مقايضة بين حجم الملف وجودة الصورة. إما أن يكون لديك ملفات كبيرة جدًا وفيديو رائع المظهر، أو ملفات صغيرة جدًا ذات تعريف سيئ. لذا فإن الضغط الجيد يتعلق بالمقايضات الجيدة. من حيث حجم الملف، المفتاح هو التكرار. إذا كان بإمكانك التنبؤ بما سيكون عليه البكسل التالي، فلن تحتاج إلى إرسال بيانات زائدة عن الحاجة، مما يوفر حجم الملف. هذا هو المكان الذي يستطيع فيه الذكاء الاصطناعي إجراء تنبؤات أفضل. فإذا كان التنبؤ جيدًا، فيمكن إزالة التكرار واستقبال بيانات أقل. والذكاء الاصطناعي أقوى بشكل أساسي لأنه يتفاعل مع البيانات.
والثاني يتعلق بجودة الفيديو. ستؤدي أي خوارزمية ضغط إلى حدوث أخطاء في إخراج الفيديو، وهذا هو تعريف الضغط مع فقدان البيانات، وقبول بعض الأخطاء من أجل أحجام ملفات أصغر. ولكن ما يهم الإنسان حقاً هو توزيع هذه الأخطاء، فنحن أكثر حساسية تجاه البعض وقد نتصالح مع البعض الآخر. ** لذا فإن الذكاء الاصطناعي لدينا يقلد النظام البصري البشري بحيث يتم إخفاء هذه الأخطاء عن البشر. **
من الأمثلة الرائعة على ذلك أن الناس يكرهون عندما تصبح الخطوط غير واضحة، ويشعر الناس بالتعاسة إذا أصبحت الخطوط الحادة غير واضحة لأن هذا أمر محدد بيولوجيا. على سبيل المثال، عندما يبدأ النمر بالتحرك من خلف صخرة، نحتاج أن نكون قادرين على رؤيته، وسوف نحدق فيه. دقة اللون ليست مضمونة، ولا أحد يلاحظ حقًا إذا كان هناك فقدان. لذا يمكنك التخلي عن بعض دقة الألوان دون طمس الحواف. يفضل الناس جودة الفيديو هذه.
فكرتنا هي دائمًا أن نبدأ من المبادئ الأولى، ما هو المعقول، وما هي المبادئ الرياضية التي تكمن وراءه، وما هي الأدوات التي يمكن استخدامها لحل المشكلات الحقيقية. ويصادف أن الذكاء الاصطناعي هو الأداة الأنسب لهذا الغرض.
س: إنها مثيرة للاهتمام للغاية، وهذه هي الفكرة الأساسية، والخطوة التالية هي التنفيذ. باعتبارك شركة عمرها خمس سنوات، هل تؤثر تغييرات الذكاء الاصطناعي اليوم عليك؟
ج: على مستوى البرمجيات، نحن في الواقع متجذرون دائمًا في دائرة البحث، وتأتي منتجاتنا البرمجية من دائرة البحث. إن التغيرات التي نشهدها اليوم في مجال الذكاء الاصطناعي ليس لها تأثير يذكر علينا، ولقد شاركت في هذه الدوائر البحثية منذ عام 2015، عندما بدأت ثورة الذكاء الاصطناعي.
على العكس من ذلك، مستوى الأجهزة هو في الواقع أحدث. لدينا تقنية ضغط رائعة على مستوى البرامج، لكنها كانت تعمل في الماضي فقط في السحابة، لذلك كان موضوعًا بحثيًا جيدًا، وليس منتجًا. **فقط عندما يدخل إلى كل محطة حتى يتمكن الملايين من الأشخاص من استخدامه على أجهزتهم الخاصة، فإنه يصبح منتجًا. **
ولذلك، فقد راهنا بالفعل على التغيرات التكنولوجية المستقبلية، فبالإضافة إلى الرهان على أن الذكاء الاصطناعي سيكون فعالا، فإننا نراهن أيضا على ظهور الأجهزة التي نحتاجها، وأجهزة محددة لتسريع الذكاء الاصطناعي، مثل NPU، وشرائح الأجهزة المختلفة من أبل وكوالكوم. و Google. **لقد قمنا بالرهان في عام 2018، واليوم لدينا في عام 2023. **
**إما أننا حظينا بإطلالة جيدة أو كنا محظوظين. **
س: وهذه الشركات المصنعة للأجهزة الكبرى مهتمة بك أيضًا.
أ: **نعم، نظرًا لامتلاكهم هذه الأجهزة، بدأوا في البحث عن التطبيقات القاتلة. ذهبنا إليهم وقلنا، مرحبًا، الجميع يشاهدون الفيديو، هذا هو التطبيق القاتل الذي تريده. هذه المرة مناسبة جدًا أيضًا. **
س: بالإضافة إلى الخوارزميات، عندما تحدثنا من قبل، ذكرت أن البيانات هي أيضًا عتبة، ولكن من الواضح أن الشركات الكبيرة لديها المزيد من البيانات، فهل ستكون هذه مشكلة؟
أ: سؤال مثير للاهتمام للغاية. (تأمل) أعتقد أنه مع ضغط الذكاء الاصطناعي، سيتبين في النهاية أن الخوارزمية أكثر أهمية. لأنني لا أعتقد أن المجال ككل ناضج بما يكفي ليتطلب قرارات تتعلق بجودة البيانات.
س: هذا هو سؤال المرحلة الثانية.
ج: نعم، لا يزال الأمر في المرحلة الأولى. لا يمكننا القول إن لدينا خوارزمية مثالية. تحرز الخوارزمية لدينا تقدمًا كبيرًا كل شهر وتتغير بسرعة كبيرة جدًا. عندما تكون الخوارزمية قوية، فهي البيانات. لكننا نتراكم أيضًا، لأن عوائد البيانات متناقصة. الآن لدينا ما بين مليون إلى مليوني بيانات تسلسل فيديو، والتي نحصل عليها من المصادر المفتوحة والقنوات الموثوقة أو نشتريها من مواقع الفيديو. في هذه المرحلة، فهي مفتوحة تمامًا، لكن الجميع يرونها نظرًا لأن ChatGPT يغير درجة الانفتاح، فنحن محظوظون لأننا اشترينا هذه البيانات في وقت سابق، وهذه أيضًا ميزة، ولكنها ليست ميزة حاسمة حقًا في هذه المرحلة.
س: هل تضيف نماذج LLM والانتشار أي شيء جديد إلى الخوارزمية الخاصة بك؟
ج: هناك عدد قليل نسبيًا. هناك بعض الأفكار التي يمكن استخدامها كمرجع. المشكلة هي أن هذه النماذج تبدو قادرة على دخول عمليتنا وإدخال تحسينات علينا. على سبيل المثال، قد يساعدني الانتشار المستقر على التحسين قدرات الضغط، ولكن لا تزال هناك مقايضات - على سبيل المثال تتم معالجة SD مرة واحدة كل 10 ثوانٍ، لكننا نحتاج إلى معالجتها 300 مرة في 10 ثوانٍ. مشكلة كيفية الاختيار بين الوقت الفعلي والتأثيرات. لديهم القدرة على إحداث تأثير في المستقبل.
س: إذا نظرنا إلى الأمر من منظور تنافسي، فمن أين تأتي التحديات الحالية التي تواجهك؟
أ: الخوارزمية، ومن ثم الأشخاص الذين يقفون خلفها. نحن ندرس العديد من الخوارزميات الأساسية بأنفسنا لأنه لا يوجد الكثير من الأبحاث لقراءتها. التحدي الأكثر أهمية هو تشكيل فريق جيد، ** لأن هناك الكثير من الأشخاص في السوق يدرسون الذكاء الاصطناعي، وليس هناك الكثير من الأشخاص الذين يدرسون نظرية المعلومات، ولا يوجد تقريبًا أي شخص يدرس كلا الأمرين في نفس الوقت. لذلك نحن بحاجة إلى تشكيل فريق وتدريبهم، الأمر الذي يستغرق وقتًا طويلاً ** لأنه ليس لديهم الكثير ليفعلوه مع بعضهم البعض. لذلك تحتاج إلى تدريب مجموعة من الأشخاص أولاً، ثم السماح لهم بقيادة الأشخاص الموجودين بالأسفل، هذا هيكل هرمي.
س: هل قمت بالفعل ببناء هذا الهرم؟
أ: لدينا أكثر من 30 نجمًا بارزًا في أبحاث الذكاء الاصطناعي. لكننا أمضينا وقتًا طويلاً جدًا في هذا الأمر.
س: إذًا فإن 30 شخصًا فقط في العالم موجودون معك هنا.
أ: أود أن أقول ذلك. هناك أيضًا بعض المختبرات التي تبحث في هذه المواضيع، ولديها أشخاص جيدون، ولكن Deep Render هي أكبر منظمة في هذا المجال من حيث الحجم.
س: رأيت أنك ذكرت استخدام التمويل الجديد الأخير لتوسيع أعمالك وتواجدك في وادي السيليكون.
ج: هذا غريب بعض الشيء، نحن شركة بريطانية، ولكن الشركات التي تستخدم معظم موارد الإنترنت موجودة في الصين والولايات المتحدة. فضلاً عن ذلك فإن أوروبا ليست في واقع الأمر مكاناً صديقاً للتنمية التكنولوجية. لدينا الكثير من الطلب من الولايات المتحدة، لذلك من الطبيعي أن ندخل الولايات المتحدة، وينطبق الشيء نفسه على الصين.
س: هل اتصل بك أي من العملاء الصينيين؟
أ: لا أستطيع أن أقول الاسم، لقد وقعت اتفاقية طويلة جدًا لذا يجب أن أكون حذرًا هاها. ولكن عندما اتصلت بهذه الشركات، وجدت أن الصين لديها بالفعل متطلبات عرض النطاق الترددي أعلى من الولايات المتحدة.
س: أنت بالفعل على اتصال مع العملاء، إذا حكمنا من خلال الحشد الشعبي أن الناس يحبون مناقشتها، في أي مرحلة أنت الآن؟
أ: من الصعب دائمًا تحديد ذلك. أعتقد أننا وصلنا إلى الحشد الشعبي لأن لدينا طلبًا أكبر مما يمكننا التعامل معه. نحن حقًا نرفض العديد من الشركات الكبيرة لأن موارد النطاق الترددي الخاصة بنا ليست كافية، لقد حجزتنا العديد من الشركات، ولا يمكننا سوى تلبية احتياجات 4 إلى 5 شركات كبيرة في نفس الوقت. وبمجرد أن تصبح التكنولوجيا أكثر نضجا، يصبح التسويق التجاري أسهل. لقد تجاوزنا مرحلة إثبات المفهوم. إذا سارت الأمور على ما يرام، يمكنك رؤية تطبيق تقنيتنا على خدمة إنترنت معروفة جدًا في الربع الثاني من عام 2024، وسيستخدمها عشرات الملايين من المستخدمين بحلول ذلك الوقت.
س: في مواجهة الطلب الهائل، والقوى العاملة المحدودة، والوضع الفني الخاص بك، تقع على عاتقك كرئيس تنفيذي مسؤولية اتخاذ خيارات متوازنة.
س: هاها، هذا هو التحدي الذي يواجهني في وظيفتي. سأحاول اتخاذ قرار. إن التحرك بسرعة كبيرة يستهلك دائمًا الموارد، وسيجلب التوظيف تحديات، ويحتاج موظفونا بشكل عام إلى 4 أشهر من التدريب قبل أن يتمكنوا من تحقيق الإنتاجية. إذن أنت على حق، فهذه مشكلة تتعلق بالتحسين، وبالطبع قد أكون على استعداد للدفع مقابل شخص يستخدم الذكاء الاصطناعي لتطوير أداة ما.
س: هاها، ربما تستطيع LLM المشاركة هنا.
ج: نعم هههههههه.
س: يبدو أن كل شيء يسير على ما يرام، ما هو نموذج العمل الذي صممته لهذا العمل؟
أ: نحن حاليًا في شكل B2B، نحن نقدم ترخيص المنتج للعملاء، ويمكن للعملاء توفير الكثير من المال، ويمكن منحنا جزءًا منه. هذا نموذج عمل يعتمد على الترخيص. إذا نظرت إلى البيانات هنا، فهي في الواقع جنونية، فبحلول عام 2030، ستصل تكلفة نقل المحتوى في جميع أنحاء العالم إلى 125 مليار دولار. **إذا كنت تريد تدمير Netflix، استخدم 4K وشاهد Netflix 24 ساعة يوميًا لمدة شهر. **
س: من الأفضل عدم القيام بذلك.
ج: هاهاها، ولكن إذا تمكنت من تقليل حجم الملف بنسبة 90% على سبيل المثال، فيمكن للشركات توفير الكثير من المال على أساس 125 مليار دولار.
س: هذه هي فرصتك لكسب المال.
أ: هذا عمل يستفيد منه الجميع. لقد فزت، وفازت الشركة، وفاز المستخدمون، وفازت شركات الإنترنت الكبرى. لا أحد يخسر شيئا.
س: ماذا عن إنقاذ الإنترنت؟ هل سبق لك أن تخيلت الشكل الذي ستبدو عليه شبكة الإنترنت المستقبلية التي ستساعد شركتك في بنائها؟
س: طبعا أحلم به كل يوم هههههههه. **تتمثل رؤيتنا في تحويل عرض النطاق الترددي إلى سلعة غير محدودة، بحيث لا يضطر الجميع إلى القلق بشأن سرعة الشبكة. بالنسبة للجميع، يمكنهم الاستمتاع بمقاطع فيديو عالية الجودة للغاية في المنزل، وبالنسبة للشركات، يمكنهم الحصول عليها بسعر رخيص جدًا أو حتى موارد الإنترنت المجانية: يمكن للمعلومات أن تتدفق، وحتى البيانات التي تعتبر ثقيلة اليوم يمكن أن تتدفق بحرية. هذا هو المستقبل الذي كان من المفترض أن يحظى به الإنترنت. **
س: أنا متأكد من أن العديد من الأشخاص قد طرحوا عليك هذا السؤال الأخير، والحديث عنه جعلني أشعر أكثر أن قصة المسلسل التلفزيوني الأمريكي "وادي السيليكون" تبدو مماثلة لقصتك.
أ: صحيح، صحيح. هذا هو برنامجي المفضل إلى حد كبير. لكن الأمر المثير للاهتمام حقًا هو أنني وشركائي المؤسسين لم نكن نعرف شيئًا عن Deep Render إلا بعد مرور عام ونصف على تأسيسها، لأن HBO لم تكن تحظى بشعبية كبيرة في المملكة المتحدة. لكن المثير للاهتمام هو أن نموذج عملنا والمراحل التي مررنا بها هي تقريبًا نفس القصة في هذه المسرحية. خاصة وأننا رأيناه لاحقًا، قلنا كلانا، انتظر لحظة، هذا مثلنا تمامًا.
س: أنت تعرف أيضًا نهاية هذه الدراما.
أ:... هاهاها، أتمنى أن تكون نهايتنا أفضل.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
"الإنترنت سوف يموت، ونحن فقط من يستطيع إنقاذه"
المصدر الأصلي: Silicon Star People
**كم مضى منذ أن سمعت شركة ناشئة تقول إنها ستنقذ الإنترنت؟ **
يبدو أن رواد الأعمال اليوم إما يكسبون المال بصمت، أو يناقشون استخدام الذكاء الاصطناعي لإنقاذ (أو تدمير) البشرية جمعاء. في عالم الإنترنت الذي نعيشه كل يوم، يبدو أن لا أحد يهتم بحياته وموته.
وبالنسبة لكري، بدا الأمر وكأنه سيموت.
عندما سمعته يقول هذا لي تحت أشعة الشمس الساطعة في سان خوسيه، بدا الأمر مثيرًا بعض الشيء. ولكن عندما تبقى مع هذا الألماني ذو الشعر الشبيه بالأسد لفترة طويلة، فإن لغته الإنجليزية المنطقية ذات النمط الألماني ستجعلك تعتقد بسهولة أن هذه مشكلة كبيرة بالفعل.
Chri Besenbruch هو المؤسس المشارك والرئيس التنفيذي لشركة Deep Render، ببساطة، ما تفعله شركته هو "استخدام الذكاء الاصطناعي لضغط حجم ملفات الفيديو إلى أحجام صغيرة جدًا".
ويدعي أن الخوارزمية "أفضل" بما يصل إلى خمس مرات من برنامج الترميز القياسي في الصناعة HVEC، على الرغم من أنه لم يحدد المقياس، ويمكن تشغيلها في الوقت الفعلي على شرائح حديثة من Qualcomm وApple وNvidia. يشير "برنامج الترميز" إلى البرامج وأحيانًا الأجهزة التي يمكنها تشفير البيانات وفك تشفيرها، عادةً لبيانات الصوت أو الفيديو.
قد يرتبك بعض الأشخاص الذين هم على دراية بوادي السيليكون عندما يسمعون ذلك، معتقدين أنني أعيد سرد سيناريو "وادي السيليكون". في هذه الدراما الأمريكية، التي توصف بأنها عرض مثالي للنظام البيئي لريادة الأعمال في وادي السيليكون، كل شيء المهزلة هي أن بطل الرواية قد طور خوارزمية ضغط مذهلة.
"نعم، لقد أخبرني الكثير من الناس بذلك. نحن نشبه إلى حد كبير مزمار البييد." هذا الشخص ذو الخلفية المعقدة الذي نشأ في ألمانيا، ودرس الرياضيات كطالب جامعي، وذهب إلى سويسرا لدراسة مدرسة الفنون، ثم ذهب إلى المملكة المتحدة لدراسة علوم الكمبيوتر، ويتمتع بطل الرواية ريتشارد في "وادي السيليكون" أيضًا بجو قوي من الطالب الذي يذاكر كثيرا، ولكن على عكس عملية اختراق خوارزمية الضغط السخيفة في المسلسل التلفزيوني، والافتقار إلى الحس السليم التجاري في المسلسل التلفزيوني، ريتشارد غالبًا ما يكون مترددًا، كما أن ريادة أعماله صارمة مثل حل المشكلات الرياضية، كما أنه جاد جدًا فيما يتعلق بالشركة، كما أن نموذج العمل مدروس بوضوح.
وبرأيه فإن الإنترنت يتجه نحو التدمير، وهذه هي المشكلة الأكبر. أراد أن يحل هذه المشكلة الكبرى، وبعد التحليل، اعتقدوا أن السبب الجذري هو أن التكنولوجيا القديمة لم تتكيف مع العالم الجديد:
*بعد أن أصبح الفيديو شائعاً وأصبح وسيلة التواصل الرئيسية على الإنترنت، دخلنا فعلياً إلى عالم جديد. عالم يزداد فيه حجم البيانات رعبًا، ولا مجال للعودة إلى الوراء. *
*التقنيات القديمة لم تعد مناسبة لهذا العالم الجديد. إن الاستمرار في تقديم ابتكارات وتحسينات طفيفة على نفس المسار القديم لن يؤدي إلا إلى طريق مسدود، وفي نهاية المطاف انهيار الإنترنت. *
"سوف ننقذ الإنترنت من خلال اختراع خوارزميات ضغط جديدة. وما يجعل هذا ممكنًا هو الذكاء الاصطناعي."
وعلى هذا المنوال، أسس كريس شركة Deep Render في عام 2018 مع زملائه في الدراسات العليا في المملكة المتحدة، ولم يكن واحدًا من تلك الشركات الناشئة التي تطارد موجة ChatGPT.
قال لي: "في الأساس، ليس لدينا الكثير لنفعله مع LLM. قد يكون الأمر مرتبطًا بنموذج الانتشار، لكنه يتعلق أكثر بالإمكانيات المحتملة في المستقبل". "لقد بدأنا من المبادئ الأولى وأردنا أن نفهم ما هو مناسب للذكاء الاصطناعي وجوهر الضغط. وفي النهاية، اعتقدنا أن الطريقة التي تعتمد بالكامل على الذكاء الاصطناعي يجب أن تكون طريقًا تقنيًا جديدًا."
ومع ذلك، فإن "القلق" الذي تعاني منه شركة LLM ساعد في الواقع شركتها. "كنا في الواقع نقامر في ذلك الوقت، لأنه لتحقيق أهدافنا، بالإضافة إلى الخوارزميات الخاصة بي، كنا نحتاج أيضًا إلى تقدم كبير في البرامج والأجهزة. لقد قمنا بالتنبؤ في ذلك الوقت، على افتراض أن هذه التقنيات الأساسية يمكن أن تحقق قفزات كبيرة الحدود. واليوم حدث كل هذا الآن." قال لي، لهجته مليئة بالإثارة.
"ربما نحن محظوظون فقط."
**يبدو متواضعا للغاية، ولكن ما لم يقله هو أنه إذا تحققت توقعاته، فقد تصبح شركته واحدة من أهم شركات تكنولوجيا الإنترنت في البشرية في العقود القليلة المقبلة. **سيتم توفير التكنولوجيا الخاصة بهم للشركات الكبرى في شكل مرخص، وفي الوقت الذي يقومون فيه بحل مشكلة النطاق الترددي للإنترنت، سيصبحون أيضًا نوع الشركة التي تجمع فواتير الخدمات والضرائب.
في الواقع، كل شيء بدأ يتغير.
منذ هذا العام دخلت هذه الشركة التي تم تجاهلها في رؤية وادي السيليكون والمؤسسات الاستثمارية المعروفة حول العالم، وبعد الانتهاء من التمويل في شهر مارس، بدأ كريس بتحويل تركيزه إلى وادي السيليكون، حيث يوجد المال والأشخاص المهتمين بهم العملاء الكبار.
ووفقا لبيانه، فإن فريقهم الصغير الحالي مرهق بالفعل عندما يواجه الاهتمام والطلب من "الشركات الكبرى التي لا يمكن ذكر اسمها ولكنها مهمة للغاية".
وكشف لي أنه إذا سارت الأمور على ما يرام الآن، فسيتم استخدام تقنيتها في خدمة تطبيقات معروفة جدًا في الربع الثاني من عام 2024.
"سيتمكن عشرات الملايين من المستخدمين من الوصول إليها."
كما بدأ السوق الصيني، الذي يشهد طلبًا كبيرًا على ضغط الفيديو والبيانات، في الظهور بأشكال مختلفة أمام هذا الرئيس التنفيذي الذي لم يقم بزيارة الصين.
وقال "لدينا العديد من الأصدقاء المستثمرين الذين لديهم علاقات قوية مع الصين ويساعدون بعض الشركات الصينية على الاتصال بنا. ونحن على اتصال بالفعل مع العديد من أكبر شركات الإنترنت في الصين". جاءت هذه المطالب فجأة وعنيفة لدرجة أنه أمضى نصف يوم يسألني أسئلة أساسية حول "كيف يبدو العمل مع شركات الإنترنت الصينية؟"
"يبدو أنك إذا كنت تريد إنقاذ الإنترنت، فلن تتمكن من القيام بذلك بدون السوق الصينية." أخبرته بشيء من المزاح بعد أن أخبرت رائد الأعمال التكنولوجي الذي قضى معظم حياته في أوروبا قصصًا عن الشرق بقدر ما ممكن.
"أنت على حق." أجاب بابتسامة. ولكن قبل أن يفكر في السوق الصينية، كان عليه أولاً أن يغزو وادي السيليكون.
في نهاية الدراما الأمريكية "وادي السيليكون"، بلغت قيمة شركة ريتشارد 8 مليارات دولار بعد ست سنوات من الصعود والهبوط، ولكن قبل أيام قليلة فقط من طرح المنتج رسميًا، اكتشفوا أن خوارزمية الضغط كانت مختلفة "من تلك التي طوروها. الذكاء الاصطناعي الذي حسن الشبكة قام بتحسين بعضها البعض وتحول إلى "وحش" لم يتمكنوا من فهمه ولكن يمكنه اختراق جميع الأنظمة. بعد وزنه، قرروا أخيرًا "إنقاذ العالم" - باستخدام أحمق رائع لجعل الجميع يتوقفون. لدي أفكار حول هذا المسار الفني.
هذه ليست نهاية جيدة لبدء التشغيل. عندما طرحت هذا الموضوع على كريس، الذي سيكون في عامه السادس من بدء مشروع تجاري في العام المقبل، فكر لفترة من الوقت، ثم ابتسم وقال:
"آمل أن تكون نهايتنا أفضل."
** وفيما يلي نص الحوار **
س: قدم نفسك وشركتك بشكل مختصر.
ج: بالطبع. أنا كريس بيسنبروش، الرئيس التنفيذي والمؤسس المشارك لشركة Deep Render. ما يفعله Deep Render هو في الأساس ضغط حجم ملفات الفيديو وما إلى ذلك إلى حجم صغير جدًا. السبب وراء حاجتنا للقيام بذلك هو أن البيانات الموجودة على الإنترنت تنمو بشكل كبير، وقد تم إنشاء 90٪ من البيانات في العامين الماضيين. إنهم بحاجة إلى السفر عبر شبكات الألياف الضوئية حول العالم، وهي بنية تحتية مكلفة للغاية على هذا النطاق. تبلغ تكلفة البنية التحتية للألياف الضوئية في العالم بأكملها 5 تريليون دولار. وهذا ليس مريحًا لأنه إذا تضاعفت البيانات كل عامين، فماذا يعني ذلك بالنسبة للبنية التحتية، فإنها تحتاج إلى المضاعفة أيضًا. لكن هذا يمثل مضاعفة على مستوى التريليون. هذا مستحيل. هذا هو السبب وراء قيامي بذلك.
س: لقد استنتجت أولاً إحدى المشكلات الأساسية التي تواجه الإنترنت اليوم، واكتشفت حلها، ثم استخدمتها لتحديد اتجاهك في مجال تنظيم المشاريع.
أ: نعم، هذا كل شيء. لأنه بدون طريقة ضغط أفضل بكثير، ستنهار شبكة الإنترنت بأكملها قريبًا. وأنا أحب الإنترنت وأريد أن أستمر فيه.
س: إذن ما هو الفرق بين التكنولوجيا الخاصة بك، لأن الضغط ليس شيئًا جديدًا، فهو موجود منذ فترة طويلة، حتى أن الناس اعتادوا عليه ونسوا وجوده. ربما يمكنك وصف التكنولوجيا الخاصة بك بمصطلحات يمكن أن يفهمها الأحمق.
أ: هاهاها، سأبذل قصارى جهدي. "نحن بحاجة إلى إلقاء نظرة على الصناعة بأكملها من الستين عامًا الماضية. عندما ظهرت تقنية الضغط التقليدية، كان ذلك إنجازًا هائلاً. كان كل شيء يعتمد على DCT* (يرمز DCT إلى تحويل جيب التمام المنفصل، والذي يقسم الصورة إلى مكونات مكونة من عناصر مختلفة ترددات. كتل صغيرة. أثناء عملية التكميم، يتم التخلص من المكونات عالية التردد، ويتم حفظ المكونات منخفضة التردد المتبقية واستخدامها لإعادة بناء الصورة لاحقًا. ملاحظة المحرر)*، تم اختراع هذه الطريقة التي تجعل تقنية ضغط الفيديو الحالية ممكنة في السبعينيات والثمانينيات أو نحو ذلك، وهيمنت على الصناعة بعد ذلك. **ولكن منذ ذلك الحين، لم تتحسن هذه التكنولوجيا إلا قليلاً كل 10 سنوات، وكانت دائمًا نفس الفكرة التقنية. لا يمكننا أن نتوقع من التكنولوجيا أن تحقق قفزة نوعية بمجرد تكرار نفس الفكرة مئات المرات. **إنها تكنولوجيا عظيمة، لكن دورة ابتكارها انتهت أو في طريقها إلى الانتهاء.
لذلك نحن بحاجة إلى شيء جديد. وهذا "الجديد" هو الذكاء الاصطناعي. ونظرًا لأن الذكاء الاصطناعي يمكنه التعامل مع الصور ومقاطع الفيديو بشكل جيد للغاية، فإن هذا ليس طريقًا لا يمكن تصوره. لذلك بدأ الجمع بين تقنية الذكاء الاصطناعي وتكنولوجيا الضغط. كانت هناك موجتان بعد ذلك، الأولى حدثت في عام 2017، عندما ظهرت الدقة الفائقة واخترعها Magic Pony، وكانت فكرتهم هي الإبقاء على طريقة الضغط التقليدية في منتصف الخط وإضافة الذكاء الاصطناعي في الأمام والخلف.
** لا يعتقد Deep Render أن هذا هو النهج الصحيح. لأن ما بقي فيها هي تقنية الضغط التقليدية التي نعتقد أنها انهارت تماما. إنه لا يتغير كثيرًا عما كان عليه من قبل، ولا يزال غير مفيد. **
"نحن الموجة الثانية، نتخلى تمامًا عن تكنولوجيا الضغط التقليدية ونستخدم الشبكات العصبية فقط. وهذا يعني أيضًا إعادة اختراع الضغط. إعادة اختراع الضغط حول تكنولوجيا التعلم الآلي له أكبر تأثير. تحصل الشبكة العصبية على البيانات وتضغط الملف. أرسل إلى الإنترنت، وتستقبل الشبكة الملف المضغوط وتعيد الفيديو إليك. هذا حل للذكاء الاصطناعي فقط. نحن نقود هذه المهمة، ونحن في الواقع الشركة الوحيدة التي تقوم بذلك.
س: إذن أنت تستخدم الذكاء الاصطناعي بشكل أساسي لاستبدال الجزء الذي تكون التكنولوجيا التقليدية مسؤولة عنه، فلماذا يستطيع الذكاء الاصطناعي القيام بذلك بشكل أفضل؟
أ: سببين. يعد ضغط الفيديو أو الفيديو في الأساس بمثابة مقايضة بين حجم الملف وجودة الصورة. إما أن يكون لديك ملفات كبيرة جدًا وفيديو رائع المظهر، أو ملفات صغيرة جدًا ذات تعريف سيئ. لذا فإن الضغط الجيد يتعلق بالمقايضات الجيدة. من حيث حجم الملف، المفتاح هو التكرار. إذا كان بإمكانك التنبؤ بما سيكون عليه البكسل التالي، فلن تحتاج إلى إرسال بيانات زائدة عن الحاجة، مما يوفر حجم الملف. هذا هو المكان الذي يستطيع فيه الذكاء الاصطناعي إجراء تنبؤات أفضل. فإذا كان التنبؤ جيدًا، فيمكن إزالة التكرار واستقبال بيانات أقل. والذكاء الاصطناعي أقوى بشكل أساسي لأنه يتفاعل مع البيانات.
والثاني يتعلق بجودة الفيديو. ستؤدي أي خوارزمية ضغط إلى حدوث أخطاء في إخراج الفيديو، وهذا هو تعريف الضغط مع فقدان البيانات، وقبول بعض الأخطاء من أجل أحجام ملفات أصغر. ولكن ما يهم الإنسان حقاً هو توزيع هذه الأخطاء، فنحن أكثر حساسية تجاه البعض وقد نتصالح مع البعض الآخر. ** لذا فإن الذكاء الاصطناعي لدينا يقلد النظام البصري البشري بحيث يتم إخفاء هذه الأخطاء عن البشر. **
من الأمثلة الرائعة على ذلك أن الناس يكرهون عندما تصبح الخطوط غير واضحة، ويشعر الناس بالتعاسة إذا أصبحت الخطوط الحادة غير واضحة لأن هذا أمر محدد بيولوجيا. على سبيل المثال، عندما يبدأ النمر بالتحرك من خلف صخرة، نحتاج أن نكون قادرين على رؤيته، وسوف نحدق فيه. دقة اللون ليست مضمونة، ولا أحد يلاحظ حقًا إذا كان هناك فقدان. لذا يمكنك التخلي عن بعض دقة الألوان دون طمس الحواف. يفضل الناس جودة الفيديو هذه.
فكرتنا هي دائمًا أن نبدأ من المبادئ الأولى، ما هو المعقول، وما هي المبادئ الرياضية التي تكمن وراءه، وما هي الأدوات التي يمكن استخدامها لحل المشكلات الحقيقية. ويصادف أن الذكاء الاصطناعي هو الأداة الأنسب لهذا الغرض.
س: إنها مثيرة للاهتمام للغاية، وهذه هي الفكرة الأساسية، والخطوة التالية هي التنفيذ. باعتبارك شركة عمرها خمس سنوات، هل تؤثر تغييرات الذكاء الاصطناعي اليوم عليك؟
ج: على مستوى البرمجيات، نحن في الواقع متجذرون دائمًا في دائرة البحث، وتأتي منتجاتنا البرمجية من دائرة البحث. إن التغيرات التي نشهدها اليوم في مجال الذكاء الاصطناعي ليس لها تأثير يذكر علينا، ولقد شاركت في هذه الدوائر البحثية منذ عام 2015، عندما بدأت ثورة الذكاء الاصطناعي.
على العكس من ذلك، مستوى الأجهزة هو في الواقع أحدث. لدينا تقنية ضغط رائعة على مستوى البرامج، لكنها كانت تعمل في الماضي فقط في السحابة، لذلك كان موضوعًا بحثيًا جيدًا، وليس منتجًا. **فقط عندما يدخل إلى كل محطة حتى يتمكن الملايين من الأشخاص من استخدامه على أجهزتهم الخاصة، فإنه يصبح منتجًا. **
ولذلك، فقد راهنا بالفعل على التغيرات التكنولوجية المستقبلية، فبالإضافة إلى الرهان على أن الذكاء الاصطناعي سيكون فعالا، فإننا نراهن أيضا على ظهور الأجهزة التي نحتاجها، وأجهزة محددة لتسريع الذكاء الاصطناعي، مثل NPU، وشرائح الأجهزة المختلفة من أبل وكوالكوم. و Google. **لقد قمنا بالرهان في عام 2018، واليوم لدينا في عام 2023. **
**إما أننا حظينا بإطلالة جيدة أو كنا محظوظين. **
س: وهذه الشركات المصنعة للأجهزة الكبرى مهتمة بك أيضًا.
أ: **نعم، نظرًا لامتلاكهم هذه الأجهزة، بدأوا في البحث عن التطبيقات القاتلة. ذهبنا إليهم وقلنا، مرحبًا، الجميع يشاهدون الفيديو، هذا هو التطبيق القاتل الذي تريده. هذه المرة مناسبة جدًا أيضًا. **
س: بالإضافة إلى الخوارزميات، عندما تحدثنا من قبل، ذكرت أن البيانات هي أيضًا عتبة، ولكن من الواضح أن الشركات الكبيرة لديها المزيد من البيانات، فهل ستكون هذه مشكلة؟
أ: سؤال مثير للاهتمام للغاية. (تأمل) أعتقد أنه مع ضغط الذكاء الاصطناعي، سيتبين في النهاية أن الخوارزمية أكثر أهمية. لأنني لا أعتقد أن المجال ككل ناضج بما يكفي ليتطلب قرارات تتعلق بجودة البيانات.
س: هذا هو سؤال المرحلة الثانية.
ج: نعم، لا يزال الأمر في المرحلة الأولى. لا يمكننا القول إن لدينا خوارزمية مثالية. تحرز الخوارزمية لدينا تقدمًا كبيرًا كل شهر وتتغير بسرعة كبيرة جدًا. عندما تكون الخوارزمية قوية، فهي البيانات. لكننا نتراكم أيضًا، لأن عوائد البيانات متناقصة. الآن لدينا ما بين مليون إلى مليوني بيانات تسلسل فيديو، والتي نحصل عليها من المصادر المفتوحة والقنوات الموثوقة أو نشتريها من مواقع الفيديو. في هذه المرحلة، فهي مفتوحة تمامًا، لكن الجميع يرونها نظرًا لأن ChatGPT يغير درجة الانفتاح، فنحن محظوظون لأننا اشترينا هذه البيانات في وقت سابق، وهذه أيضًا ميزة، ولكنها ليست ميزة حاسمة حقًا في هذه المرحلة.
س: هل تضيف نماذج LLM والانتشار أي شيء جديد إلى الخوارزمية الخاصة بك؟
ج: هناك عدد قليل نسبيًا. هناك بعض الأفكار التي يمكن استخدامها كمرجع. المشكلة هي أن هذه النماذج تبدو قادرة على دخول عمليتنا وإدخال تحسينات علينا. على سبيل المثال، قد يساعدني الانتشار المستقر على التحسين قدرات الضغط، ولكن لا تزال هناك مقايضات - على سبيل المثال تتم معالجة SD مرة واحدة كل 10 ثوانٍ، لكننا نحتاج إلى معالجتها 300 مرة في 10 ثوانٍ. مشكلة كيفية الاختيار بين الوقت الفعلي والتأثيرات. لديهم القدرة على إحداث تأثير في المستقبل.
س: إذا نظرنا إلى الأمر من منظور تنافسي، فمن أين تأتي التحديات الحالية التي تواجهك؟
أ: الخوارزمية، ومن ثم الأشخاص الذين يقفون خلفها. نحن ندرس العديد من الخوارزميات الأساسية بأنفسنا لأنه لا يوجد الكثير من الأبحاث لقراءتها. التحدي الأكثر أهمية هو تشكيل فريق جيد، ** لأن هناك الكثير من الأشخاص في السوق يدرسون الذكاء الاصطناعي، وليس هناك الكثير من الأشخاص الذين يدرسون نظرية المعلومات، ولا يوجد تقريبًا أي شخص يدرس كلا الأمرين في نفس الوقت. لذلك نحن بحاجة إلى تشكيل فريق وتدريبهم، الأمر الذي يستغرق وقتًا طويلاً ** لأنه ليس لديهم الكثير ليفعلوه مع بعضهم البعض. لذلك تحتاج إلى تدريب مجموعة من الأشخاص أولاً، ثم السماح لهم بقيادة الأشخاص الموجودين بالأسفل، هذا هيكل هرمي.
س: هل قمت بالفعل ببناء هذا الهرم؟
أ: لدينا أكثر من 30 نجمًا بارزًا في أبحاث الذكاء الاصطناعي. لكننا أمضينا وقتًا طويلاً جدًا في هذا الأمر.
س: إذًا فإن 30 شخصًا فقط في العالم موجودون معك هنا.
أ: أود أن أقول ذلك. هناك أيضًا بعض المختبرات التي تبحث في هذه المواضيع، ولديها أشخاص جيدون، ولكن Deep Render هي أكبر منظمة في هذا المجال من حيث الحجم.
س: رأيت أنك ذكرت استخدام التمويل الجديد الأخير لتوسيع أعمالك وتواجدك في وادي السيليكون.
ج: هذا غريب بعض الشيء، نحن شركة بريطانية، ولكن الشركات التي تستخدم معظم موارد الإنترنت موجودة في الصين والولايات المتحدة. فضلاً عن ذلك فإن أوروبا ليست في واقع الأمر مكاناً صديقاً للتنمية التكنولوجية. لدينا الكثير من الطلب من الولايات المتحدة، لذلك من الطبيعي أن ندخل الولايات المتحدة، وينطبق الشيء نفسه على الصين.
س: هل اتصل بك أي من العملاء الصينيين؟
أ: لا أستطيع أن أقول الاسم، لقد وقعت اتفاقية طويلة جدًا لذا يجب أن أكون حذرًا هاها. ولكن عندما اتصلت بهذه الشركات، وجدت أن الصين لديها بالفعل متطلبات عرض النطاق الترددي أعلى من الولايات المتحدة.
س: أنت بالفعل على اتصال مع العملاء، إذا حكمنا من خلال الحشد الشعبي أن الناس يحبون مناقشتها، في أي مرحلة أنت الآن؟
أ: من الصعب دائمًا تحديد ذلك. أعتقد أننا وصلنا إلى الحشد الشعبي لأن لدينا طلبًا أكبر مما يمكننا التعامل معه. نحن حقًا نرفض العديد من الشركات الكبيرة لأن موارد النطاق الترددي الخاصة بنا ليست كافية، لقد حجزتنا العديد من الشركات، ولا يمكننا سوى تلبية احتياجات 4 إلى 5 شركات كبيرة في نفس الوقت. وبمجرد أن تصبح التكنولوجيا أكثر نضجا، يصبح التسويق التجاري أسهل. لقد تجاوزنا مرحلة إثبات المفهوم. إذا سارت الأمور على ما يرام، يمكنك رؤية تطبيق تقنيتنا على خدمة إنترنت معروفة جدًا في الربع الثاني من عام 2024، وسيستخدمها عشرات الملايين من المستخدمين بحلول ذلك الوقت.
س: في مواجهة الطلب الهائل، والقوى العاملة المحدودة، والوضع الفني الخاص بك، تقع على عاتقك كرئيس تنفيذي مسؤولية اتخاذ خيارات متوازنة.
س: هاها، هذا هو التحدي الذي يواجهني في وظيفتي. سأحاول اتخاذ قرار. إن التحرك بسرعة كبيرة يستهلك دائمًا الموارد، وسيجلب التوظيف تحديات، ويحتاج موظفونا بشكل عام إلى 4 أشهر من التدريب قبل أن يتمكنوا من تحقيق الإنتاجية. إذن أنت على حق، فهذه مشكلة تتعلق بالتحسين، وبالطبع قد أكون على استعداد للدفع مقابل شخص يستخدم الذكاء الاصطناعي لتطوير أداة ما.
س: هاها، ربما تستطيع LLM المشاركة هنا.
ج: نعم هههههههه.
س: يبدو أن كل شيء يسير على ما يرام، ما هو نموذج العمل الذي صممته لهذا العمل؟
أ: نحن حاليًا في شكل B2B، نحن نقدم ترخيص المنتج للعملاء، ويمكن للعملاء توفير الكثير من المال، ويمكن منحنا جزءًا منه. هذا نموذج عمل يعتمد على الترخيص. إذا نظرت إلى البيانات هنا، فهي في الواقع جنونية، فبحلول عام 2030، ستصل تكلفة نقل المحتوى في جميع أنحاء العالم إلى 125 مليار دولار. **إذا كنت تريد تدمير Netflix، استخدم 4K وشاهد Netflix 24 ساعة يوميًا لمدة شهر. **
س: من الأفضل عدم القيام بذلك.
ج: هاهاها، ولكن إذا تمكنت من تقليل حجم الملف بنسبة 90% على سبيل المثال، فيمكن للشركات توفير الكثير من المال على أساس 125 مليار دولار.
س: هذه هي فرصتك لكسب المال.
أ: هذا عمل يستفيد منه الجميع. لقد فزت، وفازت الشركة، وفاز المستخدمون، وفازت شركات الإنترنت الكبرى. لا أحد يخسر شيئا.
س: ماذا عن إنقاذ الإنترنت؟ هل سبق لك أن تخيلت الشكل الذي ستبدو عليه شبكة الإنترنت المستقبلية التي ستساعد شركتك في بنائها؟
س: طبعا أحلم به كل يوم هههههههه. **تتمثل رؤيتنا في تحويل عرض النطاق الترددي إلى سلعة غير محدودة، بحيث لا يضطر الجميع إلى القلق بشأن سرعة الشبكة. بالنسبة للجميع، يمكنهم الاستمتاع بمقاطع فيديو عالية الجودة للغاية في المنزل، وبالنسبة للشركات، يمكنهم الحصول عليها بسعر رخيص جدًا أو حتى موارد الإنترنت المجانية: يمكن للمعلومات أن تتدفق، وحتى البيانات التي تعتبر ثقيلة اليوم يمكن أن تتدفق بحرية. هذا هو المستقبل الذي كان من المفترض أن يحظى به الإنترنت. **
أ: صحيح، صحيح. هذا هو برنامجي المفضل إلى حد كبير. لكن الأمر المثير للاهتمام حقًا هو أنني وشركائي المؤسسين لم نكن نعرف شيئًا عن Deep Render إلا بعد مرور عام ونصف على تأسيسها، لأن HBO لم تكن تحظى بشعبية كبيرة في المملكة المتحدة. لكن المثير للاهتمام هو أن نموذج عملنا والمراحل التي مررنا بها هي تقريبًا نفس القصة في هذه المسرحية. خاصة وأننا رأيناه لاحقًا، قلنا كلانا، انتظر لحظة، هذا مثلنا تمامًا.
س: أنت تعرف أيضًا نهاية هذه الدراما.
أ:... هاهاها، أتمنى أن تكون نهايتنا أفضل.