الإضافات: الذكاء الاصطناعي تطبيقات أصلية بديلة بأقل عائق أمام الدخول

المصدر: الذكاء الاصطناعي الاستخبارات الجديدة

* مصدر الصورة: تم إنشاؤه بواسطة الذكاء الاصطناعي غير محدود *

نموذج كبير + نموذج مكون إضافي هو على الأرجح أحد الإجابات على تسويق الذكاء الاصطناعي النماذج الكبيرة.

في 17 أكتوبر ، في "مؤتمر بايدو العالمي 2023" ، أصدر روبن لي رسميا أحدث إصدار من طراز Wenxin 4.0.

لبعض الوقت ، تدفقت تقييمات مختلفة ، وأجرت وسائل الإعلام العلمية والتكنولوجية الرئيسية تقييمات شاملة للنموذج من جوانب الفهم والتوليد والمنطق والقدرة على الذاكرة.

ومع ذلك ، بالإضافة إلى الحديث المتكرر عن Wenxin 4.0 ، أظهرت وظيفة أخرى منخفضة المستوى قليلا في المؤتمر الصحفي أيضا ببرود اتجاه تطوير النماذج الكبيرة المستقبلية.

** هذه هي وظيفة المكونات الإضافية ل Baidu Wenxin 4.0. **

في الوقت الحاضر ، يحتوي Wenxin 4.0 على 8 مكونات إضافية بمفردها ، بما في ذلك ظل تدفق المرآة (النص إلى الفيديو) ، على سبيل المثال لوحة الصور (انظر إلى الصور والتحدث) ، E Yan Yi Tu (تحليل البيانات المرئية) وما إلى ذلك.

يمكن أيضا دمج هذه المكونات الإضافية بحرية لإنجاز مهام أكثر تعقيدا.

ليس ذلك فحسب ، فقد تم تطبيق منصة تطوير المكونات الإضافية الكبيرة Baidu Wenxin ، Lingjing Matrix Platform ، من قبل 27000 مطور لمدة شهر واحد بعد إطلاقها ، ويمثل المطورون الفرديون أكثر من 30٪.

إذن ، لماذا تعلق بايدو أهمية كبيرة على المكونات الإضافية؟ وماذا يعني ازدهار النظام البيئي الإضافي بالنسبة للنموذج الكبير؟

** البرنامج المساعد ، دع النموذج الكبير مثل جناح النمر **

إلى حد ما ، تعادل المكونات الإضافية "تطبيقا قاتلا" مخفيا آخر للطرز الكبيرة. "

بدون تحسين خوارزمية النموذج والمعلمات ، من الممكن توسيع قدرات النموذج وتحسينها بشكل كبير باستخدام وظيفة إضافية بسيطة فقط.

في السابق ، حقق GPT-4 تأثير تقوية النمر من خلال وظيفة المكونات الإضافية. حتى أن العالم الخارجي دعا هذه الزيادة ** وصول GPT-4.5 **.

في 9 يوليو من هذا العام ، أعلن OpenAI أن المكون الإضافي الرسمي Code Interpreter (Code Interpreter) سيكون متاحا لجميع مستخدمي ChatGPT Plus من خلال لوحة Beta في الإعدادات.

إذن ما الذي يمكن أن يفعله مترجم الكود بالضبط؟

ببساطة ، إنه يعادل توسعا كبيرا في حدود قدرة GPT-4 ، مما يسمح ل GPT-4 بالقيام بالعديد من الأشياء التي لم تكن ممكنة من قبل.

على سبيل المثال ، بعد إطلاق المكون الإضافي ، أظهر مستخدم Twitter @歸藏 عملية تحليل بيانات المشتركين في الرسائل الإخبارية باستخدام محلل التعليمات البرمجية.

لا يحتاج محلل الكود إلى استخدام أي برنامج معقد من تحليل البيانات إلى رسم الخرائط ، فقط قل شيئا صريحا: "أريد تحليل اتجاه نمو المشتركين في الشهر الماضي".

بالإضافة إلى ذلك ، يمكن للأشخاص أيضا استخدام "الكلام البشري" مباشرة للسماح ل GPT بعمل بعض صور GIF المرئية من البيانات.

على سبيل المثال ، إذا أراد الأشخاص إنشاء رمز جغرافي لمنارة أمريكية ، فإنهم يحتاجون فقط إلى تحميل بيانات الموقع الجغرافي ، ويمكن ل GPT إنشاء صورة GIF التالية تلقائيا من خلال وظيفة المكون الإضافي.

وحتى إذا كنت ترغب في إنشاء فيديو من الصور ، يمكن ل CodeInterpreter القيام بذلك في متناول يدك. بعد تمكين المكون الإضافي ، ما عليك سوى إخبار GPT: "أريد استخدام هذه الصورة لإنشاء فيديو متحرك من اليمين إلى اليسار." "

ستقوم GPT تلقائيا بعمل مقطع فيديو للصور التي تم إنشاؤها بواسطة Midjourney وفقا لمتطلباتك.

يستخدم Netizen ChaseLean ChatGPT لإنشاء فيديو برجر

حتى الأشخاص الذين لديهم خبرة قليلة في البرمجة والبرمجة يمكنهم استخدام المكون الإضافي CodeInterpreter لإنشاء لعبة بسيطة في 5 دقائق.

مع عدد قليل من المطالبات ، تكتمل لعبة مصغرة بسيطة

بشكل عام ، يتضمن CodeInterpreter وظائف تغطي العديد من المهام المختلفة مثل كسر الحواجز المشروطة وتحويل أشكال المواد وإجراء تحليل البيانات.

السبب في أن المكون الإضافي يحتوي على وظيفة "تتحدى السماء" هو أنه يكسر الحاجز بين اللغة الطبيعية ولغة الكود. **

باستخدامه ، يمكن للمستخدمين قطع عمليات التعليمات البرمجية المعقدة وإكمال العديد من المهام عبر المجالات وعبر الوسائط مباشرة من خلال تفاعل اللغة الطبيعية (ما يسمى "الكلام البشري").

لهذا السبب ، صرخ بعض الناس أن هذا المكون الإضافي الذي يضاعف قدرات النموذج هو وصول GPT-4.5.

لذلك ، ليس من الصعب فهم سبب إيلاء بايدو أهمية كبيرة لتطوير المكونات الإضافية.

بالنسبة لفرق تطوير النماذج الكبيرة ، من المستحيل وغير الواقعي إنشاء نموذج يشمل جميع احتياجات المستخدمين. لأنه في عملية التطور الذكاء الاصطناعي ، سيولد المستخدمون حتما المزيد من الأفكار والاحتياجات الجديدة وغير المتوقعة.

في هذا الوقت ، أصبحت مجموعة متنوعة من المكونات الإضافية المرنة "طرفا اصطناعيا" يوسع قدرة الطرز الكبيرة.

**الإضافات تتفتح **

بالإضافة إلى المكونات الإضافية الأصلية التي تأتي مع OpenAI ، ظهرت مكونات إضافية أخرى على المسار الذكاء الاصطناعي الحالي.

هنا ، سنقوم ببعض التعداد البسيط لمعرفة المكونات الإضافية المتنوعة للملحقات ذات الوظائف المختلفة التي ستجلبها إلى الطرز الأكبر.

دردشة PDF

ChatPDF هي أداة PDF قوية عبر الإنترنت ، يحتاج المستخدمون فقط إلى تحميل ملفات PDF إلى ChatPDF ، ويمكن ل ChatPDF استخدام الذكاء الاصطناعي بسرعة لتحليل محتوى ملف PDF ، وإنشاء إجابات دقيقة للإجابة على أسئلة المستخدمين.

بالإضافة إلى ميزة الأسئلة والأجوبة الذكية ، يوفر ChatPDF أيضا التحرير والتحويل وضغط الملفات عبر الإنترنت. إذا أراد المستخدمون إضافة أو إزالة عناصر من ملف PDF ، أو تغيير بعض النصوص أو الصور ، فستكون ميزة التحرير عبر الإنترنت في ChatPDF مفيدة للغاية.

### مونيكا

مكون إضافي للشريط الجانبي لصفحة الويب يتصل بواجهة برمجة تطبيقات ChatGPT ، وعند إطلاقه ، يمكن لمونيكا استخدام قدرة ChatGPT على تفسير أي معلومات أو نص ، أو مناقشة محتوى الصفحة ، وتقديم ترجمات عند تصفح أي موقع ويب.

تجدر الإشارة إلى أنه بالإضافة إلى ChatGPT ، تقوم Monica أيضا بدمج واجهات الذكاء الاصطناعي الأخرى مثل Claued و Bard ، وإذا لم يكن ذلك كافيا ، فيمكن للمستخدمين أيضا البحث وإضافة أدوات الذكاء الاصطناعي أخرى بأنفسهم في المكتبة الذكاء الاصطناعي التي يصلون إليها ، حتى يتمكنوا من تلبية احتياجاتهم المتنوعة من خلال أنظمة الذكاء الاصطناعي المختلفة.

### شات هب

إنه مكون إضافي يسمح لك باستخدام روبوتات محادثة مختلفة في تطبيق واحد ، ويدعم حاليا ChatGPT و BingChat الجديد ، وسيدمج المزيد من روبوتات المحادثة مثل Google Bard في المستقبل. يمكن للمستخدمين التواصل مع روبوتات محادثة متعددة في نفس الوقت ومقارنة إجاباتهم بسهولة.

### NoteGPT

هذا مكون إضافي يستخدم ChatGPT لتلخيص مقاطع الفيديو. دعم التقاط لقطات الشاشة وتدوين الملاحظات على مواقع الفيديو بنقرة واحدة.

بعد تشغيل المكون الإضافي ، يمكن للمستخدمين استخدام ChatGPT بسرعة للحصول على معلومات أساسية حول محتوى الفيديو وإنشاء ملخصات وملخصات عند مواجهة مقاطع فيديو طويلة معينة ، مع التقاط لقطات شاشة أو تسجيل ملاحظات مختومة زمنيا أثناء مشاهدة مقاطع الفيديو بنقرة واحدة.

### مساعد سمارت ستار الذكاء الاصطناعي

هذا هو أول منتج نموذج معرفي الذكاء الاصطناعي في الصين يدعم المكونات الإضافية ، ولدى Zhixing الذكاء الاصطناعي حاليا إمكانية الوصول إلى 7 مكونات إضافية ، بما في ذلك استعلام الطقس ، وبحث Bing ، و Wolfram ، وما إلى ذلك ، والتي يمكنها توفير معلومات الطقس في الوقت الفعلي بسرعة ، والإجابة على المشكلات الرياضية المتقدمة ، وإجراء تحليل مالي متعمق.

بالمقارنة ، يمكن ل ChatGPT استخدام 3 مكونات إضافية فقط في المرة الواحدة ، بينما لا يوجد حد لعدد المكونات الإضافية في Smartstar الذكاء الاصطناعي

### WPSAI

وهو يعادل الإصدار المحلي من Microsoft365 Copilot ، مع الاختصار والتوسيع والاستمرار وتغيير أسلوب الكتابة وتلخيص وتلخيص النقاط الرئيسية للمقالة ، وإنشاء مخططات PPT بسرعة ، وإنتاج قوالب PPT بنقرة واحدة ، والمعالجة الذكية لجداول Excel والوظائف الأخرى ، ولديه ميزات جديدة للتفاعل الصوتي ، والتي يمكن استخدامها للمكتب المتنقل على محطات الشاشة الصغيرة مثل الهواتف المحمولة.

**الطموح في البرنامج المساعد **

بالإضافة إلى الأنواع المختلفة المذكورة أعلاه من وظائف المكونات الإضافية التابعة لجهات خارجية ، أظهر عمالقة التكنولوجيا الرئيسيون أيضا زخما في اتجاه المكونات الإضافية.

على سبيل المثال ، يوفر النظام الأساسي المكون الإضافي ل Microsoft الذكاء الاصطناعي سلسلة من الأدوات والخدمات التي تسمح للمطورين باستخدام ChatGPT من Microsoft و Bing الجديد لإنشاء ونشر العديد من المكونات الإضافية الذكاء الاصطناعي ، بما في ذلك فئات نموذج القدرة وفئات البيانات وفئات التطبيقات وما إلى ذلك. تمتد المكونات الإضافية الخاصة به إلى سيناريوهات ومنتجات متعددة ، مثل Dynamics 365 و Microsoft 365 والمزيد. **

في الصين ، أطلقت بايدو أيضا منصة "** Spirit Matrix **" ، والتي تعرف بأنها تسمح للجميع بتطوير المكونات الإضافية الذكاء الاصطناعي ، في محاولة لبناء نظام بيئي ضخم للمكونات الإضافية بناء على كلمات Wen Xin.

وراء هذا التصميم الكبير ، يتم الكشف عن نوايا العمالقة على الأقل في جانبين:

**1. اتخاذ المكونات الإضافية كنقطة اختراق لفتح طريق التسويق على نطاق واسع. **

**2. باستخدام نظام بيئي ضخم للمكونات الإضافية ، قم ببناء حواجز برمجية مثل CUDA من NVIDIA. **

فيما يتعلق بالنقطة الأولى ، لماذا من المرجح أن يكون نموذج النموذج الكبير + نموذج المكونات الإضافية هو الحل لتسويق الذكاء الاصطناعي على نطاق واسع؟

السبب في الواقع بسيط للغاية ، النموذج الكبير السابق ، سواء كان نصا الذكاء الاصطناعي أو رسما أو مجالا تمكينيا لا يمكن أن يقتصر إلا على نطاق واحد ضيق.

قد يكون للنموذج الكبير مستوى كتابة جيد ، ولكن في الواقع ، كيف يمكن حل المهام متعددة الفئات والمحددة لمقارنة السلع والتحليل المالي؟

احتياجات الناس في الحياة متنوعة ومتعددة المستويات ، من وجهة النظر هذه ، عندما يكسر النموذج الكبير قيود وضع واحد ويلبي هذا الطلب المتنوع ، فهو بداية تسويقه الحقيقي على نطاق واسع. **

ووظائف المكونات الإضافية لكل خارجي تعادل الطرز الكبيرة؟ "العين" و "اليد" تجعلها لا تقتصر على مجال واحد ونطاق الطريقة.

في المستقبل ، قد يحتاج المستخدمون فقط إلى مدخل نموذجي كبير لإكمال المهام مثل حجز التذاكر وطلب الطعام وطلب الطعام وطلب الوجبات الجاهزة.

يؤدي هذا أيضا إلى النقطة الثانية ، أي الحاجز البيئي الذي تهيمن عليه ** المكونات الإضافية. **

في المسار الحالي للنموذج الكبير ، على الرغم من وجود عدد لا يحصى من التطبيقات الذكاء الاصطناعي المشتقة في الداخل والخارج ، عندما لا يزال جزء كبير منها عبارة عن منتجات "shell" قائمة على ChatGPT.

ينعكس هذا الواقع أيضا من جانب واحد: في اختيار الطرز الكبيرة ، لا يزال معظم المطورين والمستخدمين يتعرفون فقط على أقوى منتجات الرأس.

أعلنت A16Z ، وهي مؤسسة استثمارية معروفة ، الشهر الماضي أن جزءا كبيرا من أفضل 50 موقعا الذكاء الاصطناعي من حيث حركة المرور هي تطبيقات "shell"

بمعنى آخر ، بالنسبة للطرز الكبيرة ، طالما أن المستخدم يواجه واحدة هي الأفضل للاستخدام ، فمن غير المرجح أن يستخدم الآخر.

في ظل هذا المنطق ، إذا كانت العديد من الشركات لا تريد الوقوع في حالة تكرار العجلة ، فيجب أن يكون الخيار الأفضل هو تحويل تركيزها إلى جانب التطبيق.

تظهر التجربة التاريخية أنه في منافسة البرامج والتطبيقات ، الذين يمكنهم تزويد المطورين ببيئة تطوير منخفضة العتبة وودية ، والذين يمكنهم أخذ زمام المبادرة في إنشاء حواجز بيئية خاصة بهم.

في هذا الصدد ، يمكن القول أن CUDA من NVIDIA قد قدم مثالا ممتازا.

بعد التطور المستمر ، شكلت CUDA نظاما بيئيا غنيا وناضجا. حققت NVIDIA أيضا ربطا عميقا للبرامج والأجهزة: مع برنامجه ، يجب عليك شراء أجهزته ، ويمكن أن يكون شراء أجهزته باستخدام CUDA أكثر فعالية مرتين.

في الوقت الحالي ، يشبه تخطيط العمالقة الرئيسيين في المكونات الإضافية أيضا CUDA من NVIDIA: إذا أراد المطورون أو المستخدمون تحقيق تطوير تطبيقات الذكاء الاصطناعي منخفض العتبة وسريع ، فيجب أن يعتمدوا على قدرات نماذجهم الكبيرة.

في المقابل ، فإن ازدهار بيئة التطبيق سيعزز اعتماد الناس على نموذجها الكبير.

كل من يأخذ زمام المبادرة في تحقيق مثل هذا النظام البيئي الذي يعزز ويكمل بعضه البعض بالتطبيقات سيكون أول من يقيم حواجزه البيئية الخاصة في عصر الذكاء الاصطناعي.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت