** المؤلف: ** لي زي ، دكتوراه في علم اجتماع التكنولوجيا ، زميل ما بعد الدكتوراه ، قسم العلوم الإنسانية والأخلاق الطبية ، جامعة كولومبيا
مصدر الصورة: تم إنشاؤه بواسطة Unbounded AI
في النصف الأول من العام ، ولدت ChatGPT ، وتم الكشف عن إمكانات الذكاء الاصطناعي ، مما أدى إلى مناقشة أزمة البقاء على قيد الحياة في العديد من الصناعات. يمكن لـ GPT اجتياز امتحانات تأهيل المهندسة ، وكتابة مقالات جامعية دون الرسوب في الدرجات ، وحتى "فهم" النكات. يمكنه الإجابة على أسئلة الأشخاص وتنظيم الهياكل اللغوية الحية وتقليد مجموعة متنوعة من أنماط اللغة ؛ ويمكن أن يتيح الجمع بين نماذج اللغة الكبيرة وتقنيات الذكاء الاصطناعي لتوليد الصور ، مثل Midjourney ، للأشخاص الذين لم يتلقوا أي تدريب فني استخدام القليل كلمات "إنشاء" صور فنية مذهلة.
جوهر ChatGPT هو في الواقع نموذج لغة كبير (نموذج لغة كبير ، LLM) متراكب على الذكاء الاصطناعي التوليدي. نموذج اللغة الكبير ، كما يوحي الاسم ، كبير ، يستخدم عددًا كبيرًا من الأشكال لتدريب نموذج كمبيوتر باستخدام أساليب التعلم الآلي. تستخدم الصيغة التوليدية طريقة تنبؤية لعرض اتصالات المورفيم الأكثر احتمالاً أثناء الحوار.
بالنسبة إلى "معالجات" المعرفة و "المستهلكين" ، فإن قدرات نماذج اللغات الكبيرة بالإضافة إلى الذكاء الاصطناعي التوليدي هائلة. إن بيانات التشكل الضخمة والشبكة العصبية العميقة وقوة الحوسبة الضخمة تعادل "تسطيح" المعرفة الكاملة من الإنترنت ، ثم "تجميعها" من خلال التفاعل بين الإنسان والحاسوب.
** فيما يتعلق بالمنطق الحسابي ، فإن ChatGPT يعادل محرك بحث أكثر قوة. ** تقوم محركات البحث العادية مثل Google و Baidu "بتجميع" معلومات الإنترنت بالكامل من خلال وضع الزاحف والفرز من خلال الخوارزميات المعقدة. تعادل طريقة الذكاء الاصطناعي باستخدام التعلم الآلي فرز المعلومات بطريقة تنبؤية بما يتماشى مع منطق اللغة. أصبحت معالجة المعرفة أكثر ملاءمة وأسرع ، وأصبح الاستهلاك أكثر إيجازًا ووضوحًا - وأحيانًا يكون بسيطًا للغاية ، مما يتيح فرصًا للغش في أوراق الامتحان.
في ضوء ذلك ، يعتقد المتفائلون التكنولوجيون أنه نظرًا لأن المحتوى الذي يمكن أن تنشئه الآلات من الآن فصاعدًا ، فقد لا يتطلب الأمر من معظم البشر استخدام أدمغتهم لتحقيق ذلك ، تمامًا مثل محركات البحث التي تحل محل بطاقات المكتبة والآلات الحاسبة التي تحل محل العداد. في الواقع ، حتى لو لم يتدخل الذكاء الاصطناعي في اتخاذ القرار النهائي ، فإن تلك المهام التي تتطلب الكثير من الكتابة المتكررة ، أو العد والفرز الميكانيكي ، يمكن أن توفر بالفعل درجة كبيرة من الإنتاجية وتساعد البشر في معالجة واستهلاك المعرفة.
إذن ، هل القراءة مفيدة؟ هل يمكن لموظفي الجامعات والمؤسسات البحثية الكبرى ترك العمل أيضًا؟
** ما الذي يمكن أن "تتعلمه" الآلة **
جلبت النماذج اللغوية الكبيرة والذكاء الاصطناعي التوليفي موضوعًا لا مفر منه "لمنتجي" المعرفة المستقبلية: ما هي المعرفة؟ كيف ننتج معرفة متنوعة وغير متحيزة وأصيلة؟
إن قدرة الذكاء الاصطناعي على "التعلم" مذهلة. لا يمكن فصل نموذج اللغة الكبير الحالي وتطبيق الذكاء الاصطناعي عن التعلم الآلي كخلفية له. كلمة "التعلم" هي أساسًا لاستخدام كمية كبيرة من البيانات لتدريب نموذج التنبؤ ، ولإيجاد توازن بين دقة وعالمية التنبؤ. يعتمد هذا النوع من التنبؤ في الواقع على المعرفة الموجودة ، ويستند التنبؤ بنموذج اللغة أيضًا على الارتباط بين اللغات الموجودة. على سبيل المثال ، إدخال "مطهو ببطء في صلصة الصويا" ، وتتنبأ الآلة "باللحوم" ؛ ثم بناءً على المزيد من المدخلات ، مثل الموقع والأشخاص والعادات وما إلى ذلك ، ستقدم تنبؤات أكثر دقة ، مثل "لحم بقري الجدة المطهو ببطء في الصلصة البنية "وما إلى ذلك.
كيف تحقق هذا التوقع؟ نظام الإحداثيات المألوف لدينا ثنائي الأبعاد. على سبيل المثال ، في جميع السكان ، هناك تطابق تقريبي بين الطول والوزن ، وبالنظر إلى الارتفاع ، تتنبأ الآلة بمتوسط الوزن ، وهو تنبؤ يعتمد على البيانات الموجودة. أضف بعدًا آخر ، مثل الجنس ، ثم يصبح تنسيقًا ثلاثي الأبعاد ، وستكون تنبؤات الرجال والنساء مختلفة. إذا استمر هذا الأمر ، يمكن أن تكون أبعاد البيانات غير محدودة ، ونموذج التعلم الآلي هو العثور على مثل هذه الروابط في فضاء متعدد الأبعاد لا يستطيع العقل البشري تخيله ، وضبط الأوزان باستمرار بين الأبعاد المختلفة. على سبيل المثال ، "مدى أهمية" هو توقع الطول بالنسبة للوزن ، والذي يمكن تعديله بعد إدخال عدد كبير من البيانات.
** لذلك ، فإن الذكاء الاصطناعي القائم على التعلم الآلي سوف يربط البيانات ذات الأبعاد المختلفة في مساحة ذات أبعاد أعلى ، ولديه القدرة على اكتشاف الروابط المحتملة بين البيانات ، كما أنه سوف "يتعلم" بعض الأشياء غير الموجودة في الواقع ، ولكن بشكل كبير. الروابط المحتملة. ** يمكن للذكاء الاصطناعي ، المستخدم في نموذج اللغة ، تعلم أنماط لغة مختلفة واستكشاف "الجوهر" و "المشاكل" في النص الحالي.
** كلما زادت البيانات ، زاد نضج النموذج ، وزادت قدراته في الحوسبة والتعدين. ** على غرار الذكاء الاصطناعي مثل BERT و GPT ، اللذان وُلدا في مؤسسات كبيرة ، يعتقد الكثير من الناس أنهم وصلوا إلى "نقطة انعطاف" التكنولوجيا ، وليس من غير المعقول أن تنتج التغييرات الكمية تغييرات نوعية - وهذا أمر جيد الشيء لمنتجي المعرفة. ومع ذلك ، فإن النماذج الكبيرة أيضًا لها مشكلات متأصلة ، وكلما كان النموذج أكبر ، زادت حدة المشكلات ، خاصة فيما يتعلق بالجوانب المتنوعة والعادلة والصادقة للمعرفة.
** كيف تنتج الحقيقي **
** والمعرفة الحيادية؟ **
يمكن إنشاء معرفة جديدة من الاتصالات والنماذج الجديدة للمعرفة الحالية ، وهذا صحيح سواء كان ذلك على مستوى الإنسان أو الجهاز. ومع ذلك ، هل المعرفة الموجودة كافية؟ هل يكفي؟ هل هذا عادل؟ إذا كان أساس المعرفة الحالية غير كافٍ أو حتى متحيز ، فإن المعرفة الجديدة المبنية عليه ستكون متحيزة أيضًا.
منذ أن تم تطبيق الذكاء الاصطناعي للتعلم الآلي على نطاق واسع ، كشف العلماء باستمرار عن التحيزات الكامنة في هذه النماذج: التمييز على أساس الجنس ، والعنصرية ، والمخرجات غير الأخلاقية ، وما إلى ذلك. يستخدم المطورون العديد من التصحيحات وطرق التصحيح للتعويض عن ذلك ، ولكن معظم المشاكل مخفية في عملية إنتاج البيانات والتدريب ، كما أن انحياز الذكاء الاصطناعي هو انعكاس وتضخيم للتحيز الاجتماعي.
قضية أخرى هي جودة البيانات. لا يقتصر التعلم الآلي على القدرة على تدريب النماذج فحسب ، بل يشمل أيضًا كمية البيانات وجودتها. تضع عملية التطوير الحالية مزيدًا من التركيز على أداء النموذج وحتى الخرافات ، ولكنها تتجاهل المشكلة الأساسية لمصادر البيانات. تعتمد معظم البيانات اليوم على التنظيف اليدوي والتنسيق ، والتصنيف ، ووضع العلامات وما إلى ذلك. في كثير من الأحيان ، تكون عملية إنتاج البيانات هذه مبهمة ، بل ومخربشة. على سبيل المثال ، وراء تطوير الذكاء الاصطناعي للشركات الكبيرة ، تم الاستعانة بمصادر خارجية لعدد كبير من العمالة "القذرة والفوضوية" إلى "مصانع الذكاء الاصطناعي" في المناطق المتخلفة. من ناحية ، هذه العملية لها قضايا أخلاقيات العمل ، ومن ناحية أخرى ، فإنها تطرح أيضًا تحديات على جودة البيانات.
في عصر النماذج الكبيرة ، قد تكون هذه المشكلة مخفية بشكل أعمق: ليس كل باحث أو فريق لديه القدرة على تطوير نماذج الذكاء الاصطناعي من الصفر ، وخاصة نماذج اللغة الكبيرة والصورة الكبيرة ، والتي يعتمد معظمها على النماذج الحالية التي تم ضبطها بدقة. سيتم ترحيل مشاكل وانحرافات النموذج الكبير نفسه إلى المزيد من نماذج التطبيقات. وكلما انخفض الانحراف ، زادت صعوبة التعامل معه من خلال الضبط الدقيق وتصحيح الانحراف.
سيؤدي وضع توليد التنبؤ لنموذج اللغة الحالي إلى تضخيم الانحراف الحالي للبيانات ، مما يؤدي إلى تأثير "فرط التخصيص": على سبيل المثال ، يحتوي مرض معين على نسبة عالية من البيانات الإحصائية في مجموعة عرقية معينة ، حوالي 60٪ ؛ ولكن إذا تم استخدام نموذج اللغة لإنشاء صورة شخصية للمريض ، فهناك أكثر من 90٪ احتمال أن ينتمي وصف المريض الذي تم إنشاؤه إلى هذه المجموعة.
الآن يتبنى بعض تدريب نموذج الذكاء الاصطناعي وضع "القتال المتبادل" - ما يسمى بـ "شبكة الخصومة التوليدية" (شبكة الخصومة التوليدية) ، مما يسمح لنموذجين بتوليد وتصحيح بعضهما البعض بشكل مستمر. تعمل هذه الطريقة على تحسين كفاءة تدريب النموذج ، ولكن سيتم تضخيم أي انحراف صغير في هذا "التفاعل". وفقًا للمبدأ نفسه ، إذا اعتمد منتج المعرفة الذي يعمل بشكل وثيق مع آلة على هذا النوع من "التوليد" ، فسيتم تضمين بعض التحيزات من النموذج في المزيد من المعرفة الجديدة ، وسيتم استيعاب المعرفة الجديدة كبيانات ، يقوي تحيز النموذج. ** يجب على منتجي المعرفة أن يظلوا يقظين في هذه العملية.
** ما هي المعرفة الجديدة؟ هل يمكن أن يمثل "جيل" الذكاء الاصطناعي معرفة جديدة؟ **
ما هو ما يسمى بالمعرفة الجديدة؟ إذا كان للذكاء الاصطناعي أن يستخدم بشكل كامل لإنتاج المعرفة ، فيجب على منتجي المعرفة التفكير في هذه المسألة من وجهة نظر الجمع بين الإنسان والآلة. أي معلومات ، بالإضافة إلى المعرفة المكتسبة من قبل البشر من العالم الحقيقي ، تحتاج إلى "تنظيفها" و "تنسيقها" في بيانات. بالإضافة إلى جودة البيانات المذكورة أعلاه ، فإن عملية توليد البيانات مهمة أيضًا. باختصار ، ما هي المشكلة التي يرغب المرء في دراستها؟ ما نوع البيانات التي يتم ترجمة هذا السؤال إليها؟ كيف يتم إنتاج هذه البيانات ، وهل تمثل بشكل كامل وعادل القضايا التي يريد منتجو المعرفة دراستها؟
وتنطبق هذه المشكلة أيضًا على منتجي المعارف "التقليدية". خذ التاريخ كمثال: على الرغم من أن التاريخ يدرس الأحداث الماضية ، فلا توجد أحداث سابقة يمكن أن تكون نهائية بنسبة 100٪. عادة ما يبحث العلماء باستمرار عن مواد تاريخية جديدة لتكملة فهمهم للقضايا التاريخية ، وكشف وجهات النظر والأصوات المهملة في الماضي. ومن المثير للاهتمام ، أن التأريخ الحالي غالبًا ما يلجأ إلى كمية كبيرة من البيانات ، لا سيما البيانات الاقتصادية والسكان والمناخية السابقة ، بل ويعتمد أيضًا على التعلم الآلي لجلب مفاهيم ووجهات نظر جديدة إلى التاريخ.
وبالمثل ، قد يؤدي الاعتماد على الرؤى والآراء الناتجة عن الآلة إلى تضخيم أهمية بعض مصادر البيانات. يعتمد منتجو المعرفة اليوم كثيرًا على المعلومات السائدة والإنترنت والمعلومات الإلكترونية لإنشاء أشياء تمت "ترجمتها" إلى بيانات بواسطة الآخرين. ** في عصر الذكاء الاصطناعي ، من المحتمل أن تجعل الراحة والقابلية التوسعية التي يوفرها الذكاء الاصطناعي من السهل على الأشخاص تجاهل المعرفة التجريبية وغير السائدة التي لم يتم تحويلها إلى رقمية أو إلكترونية ، وبالتالي تفويت إمكانية تكوين وجهات نظر ووجهات نظر جديدة . **
على مستوى أعمق ، غالبًا ما تنشأ المعرفة الجديدة من التنقيب عن مواد جديدة ، وتصادم وجهات النظر ووجهات النظر المختلفة ، وإعادة تفكيك المعرفة الموجودة. يوفر نموذج اللغة الكبير العديد من الاحتمالات لعرض المعرفة ، ولكن منطقها الداخلي وهيكلها قد يتعارضان مع طريقة الإنتاج هذه.
** استنادًا إلى طريقة التدريب الخاصة بنموذج اللغة الكبير وخصائص المخرجات الناتجة عن النموذج ، سيصبح وزن محتوى المخرجات الأعلى تصنيفًا والاحتمالية الأعلى أكبر وستصبح الميزات أكثر تفردًا **. أصبحت عبارة "يولد الذكاء الاصطناعي" صفة تقريبًا لوصف الكلمات غير المنطقية والمتكررة والهراء التي تُقال كما لو لم تكن كذلك. صحيح أنه بالنسبة لمستهلكي المعرفة ، فإن الإجابات "الأكثر ترجيحًا" تقلل كثيرًا من عتبة الفهم ؛ ولكن بالنسبة لمنتجي المعرفة ، قد تصبح هذه الأشياء عائقًا بدلاً من ذلك.
** إلى أين يتجه منتجو المعرفة في العصر الجديد؟ **
ربما واجه العديد من الباحثين في العلوم الاجتماعية مثلي هذه المشكلة عند استخدام ChatGPT: اطلب منه شرح مفهوم ، وهذا منطقي ؛ لم يكتب المؤلف أبدًا كتابًا ، ولم ينشر بحثًا مطلقًا. كلما كان المجال أضيق وأكثر تخصصًا ، زادت إمكانية "الهراء".
بالعودة إلى مبدأ الذكاء الاصطناعي ، فإن هذا النوع من "الخلق" يقوم في الواقع بالتنقيب عن الروابط "الممكنة" للكلمات والجمل في بيانات ضخمة ، لكن هذه الروابط غير موجودة في الواقع. وبصراحة ، فإنها "تبدو متشابهة" . هذه الظاهرة الجديدة تسمى الآن "الهلوسة". بالنسبة لمنتجي المعرفة ، فإن كيفية استخدام الذكاء الاصطناعي لاستخراج الأنماط والصلات الموجودة في قاعدة المعرفة الحالية ، مع البقاء متيقظين ضد "رؤية" الآلة ، ما هو موجود وما هو مشكوك فيه ، هو مهارة مهمة للغاية.
سيصبح "الحوار" مع الذكاء الاصطناعي أيضًا مهارة جديدة. لا يزال الذكاء الاصطناعي الحالي "صندوقًا أسود" غامضًا لمعظم الأشخاص غير التقنيين (حتى الأشخاص التقنيين). ** كيفية البدء من المستوى الأدنى أو المتوسط للتكنولوجيا للتحدث إلى الآلات بشكل أكثر فعالية ، يتطلب فهم "الرؤية" ومكافحتها تعاون منتجي المعرفة والممارسين التقنيين **.
للبحث عن المعرفة الجديدة ، ووجهات النظر الجديدة ، والمواد الجديدة ، لا يزال الهيكل والتفسير الفريد لكل مجال مهمين للغاية في الوقت الحاضر. لا تزال النماذج التنبؤية للنماذج اللغوية الكبيرة والذكاء الاصطناعي التوليفي تميل إلى أن تكون مفردة ومتكررة ، وكلما كانت مواد التدريب محدودة ، كلما كانت القدرات محدودة. إذا كنت ترغب في الجمع بين القدرات الآلية والبشرية ، فيجب أن تبدأ من مصدر إنتاج البيانات ، واستخدام بيانات دقيقة ومتنوعة وعادلة وجديدة لتدريب نماذج الذكاء الاصطناعي ، وإنشاء نموذج تفاعل بين الإنسان والحاسوب حميد.
إن ظهور النماذج اللغوية الكبيرة والذكاء الاصطناعي التوليفي هو مجرد بداية للتحديات التي يواجهها الباحثون. بدلاً من مناقشة "الاستبدال" ، من الأفضل البحث عن إمكانية المشاركة والتنمية تحت نظرة أكثر حكمة.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
مع ChatGPT ، هل القراءة مفيدة؟
** المؤلف: ** لي زي ، دكتوراه في علم اجتماع التكنولوجيا ، زميل ما بعد الدكتوراه ، قسم العلوم الإنسانية والأخلاق الطبية ، جامعة كولومبيا
في النصف الأول من العام ، ولدت ChatGPT ، وتم الكشف عن إمكانات الذكاء الاصطناعي ، مما أدى إلى مناقشة أزمة البقاء على قيد الحياة في العديد من الصناعات. يمكن لـ GPT اجتياز امتحانات تأهيل المهندسة ، وكتابة مقالات جامعية دون الرسوب في الدرجات ، وحتى "فهم" النكات. يمكنه الإجابة على أسئلة الأشخاص وتنظيم الهياكل اللغوية الحية وتقليد مجموعة متنوعة من أنماط اللغة ؛ ويمكن أن يتيح الجمع بين نماذج اللغة الكبيرة وتقنيات الذكاء الاصطناعي لتوليد الصور ، مثل Midjourney ، للأشخاص الذين لم يتلقوا أي تدريب فني استخدام القليل كلمات "إنشاء" صور فنية مذهلة.
جوهر ChatGPT هو في الواقع نموذج لغة كبير (نموذج لغة كبير ، LLM) متراكب على الذكاء الاصطناعي التوليدي. نموذج اللغة الكبير ، كما يوحي الاسم ، كبير ، يستخدم عددًا كبيرًا من الأشكال لتدريب نموذج كمبيوتر باستخدام أساليب التعلم الآلي. تستخدم الصيغة التوليدية طريقة تنبؤية لعرض اتصالات المورفيم الأكثر احتمالاً أثناء الحوار.
بالنسبة إلى "معالجات" المعرفة و "المستهلكين" ، فإن قدرات نماذج اللغات الكبيرة بالإضافة إلى الذكاء الاصطناعي التوليدي هائلة. إن بيانات التشكل الضخمة والشبكة العصبية العميقة وقوة الحوسبة الضخمة تعادل "تسطيح" المعرفة الكاملة من الإنترنت ، ثم "تجميعها" من خلال التفاعل بين الإنسان والحاسوب.
** فيما يتعلق بالمنطق الحسابي ، فإن ChatGPT يعادل محرك بحث أكثر قوة. ** تقوم محركات البحث العادية مثل Google و Baidu "بتجميع" معلومات الإنترنت بالكامل من خلال وضع الزاحف والفرز من خلال الخوارزميات المعقدة. تعادل طريقة الذكاء الاصطناعي باستخدام التعلم الآلي فرز المعلومات بطريقة تنبؤية بما يتماشى مع منطق اللغة. أصبحت معالجة المعرفة أكثر ملاءمة وأسرع ، وأصبح الاستهلاك أكثر إيجازًا ووضوحًا - وأحيانًا يكون بسيطًا للغاية ، مما يتيح فرصًا للغش في أوراق الامتحان.
في ضوء ذلك ، يعتقد المتفائلون التكنولوجيون أنه نظرًا لأن المحتوى الذي يمكن أن تنشئه الآلات من الآن فصاعدًا ، فقد لا يتطلب الأمر من معظم البشر استخدام أدمغتهم لتحقيق ذلك ، تمامًا مثل محركات البحث التي تحل محل بطاقات المكتبة والآلات الحاسبة التي تحل محل العداد. في الواقع ، حتى لو لم يتدخل الذكاء الاصطناعي في اتخاذ القرار النهائي ، فإن تلك المهام التي تتطلب الكثير من الكتابة المتكررة ، أو العد والفرز الميكانيكي ، يمكن أن توفر بالفعل درجة كبيرة من الإنتاجية وتساعد البشر في معالجة واستهلاك المعرفة.
إذن ، هل القراءة مفيدة؟ هل يمكن لموظفي الجامعات والمؤسسات البحثية الكبرى ترك العمل أيضًا؟
** ما الذي يمكن أن "تتعلمه" الآلة **
جلبت النماذج اللغوية الكبيرة والذكاء الاصطناعي التوليفي موضوعًا لا مفر منه "لمنتجي" المعرفة المستقبلية: ما هي المعرفة؟ كيف ننتج معرفة متنوعة وغير متحيزة وأصيلة؟
إن قدرة الذكاء الاصطناعي على "التعلم" مذهلة. لا يمكن فصل نموذج اللغة الكبير الحالي وتطبيق الذكاء الاصطناعي عن التعلم الآلي كخلفية له. كلمة "التعلم" هي أساسًا لاستخدام كمية كبيرة من البيانات لتدريب نموذج التنبؤ ، ولإيجاد توازن بين دقة وعالمية التنبؤ. يعتمد هذا النوع من التنبؤ في الواقع على المعرفة الموجودة ، ويستند التنبؤ بنموذج اللغة أيضًا على الارتباط بين اللغات الموجودة. على سبيل المثال ، إدخال "مطهو ببطء في صلصة الصويا" ، وتتنبأ الآلة "باللحوم" ؛ ثم بناءً على المزيد من المدخلات ، مثل الموقع والأشخاص والعادات وما إلى ذلك ، ستقدم تنبؤات أكثر دقة ، مثل "لحم بقري الجدة المطهو ببطء في الصلصة البنية "وما إلى ذلك.
كيف تحقق هذا التوقع؟ نظام الإحداثيات المألوف لدينا ثنائي الأبعاد. على سبيل المثال ، في جميع السكان ، هناك تطابق تقريبي بين الطول والوزن ، وبالنظر إلى الارتفاع ، تتنبأ الآلة بمتوسط الوزن ، وهو تنبؤ يعتمد على البيانات الموجودة. أضف بعدًا آخر ، مثل الجنس ، ثم يصبح تنسيقًا ثلاثي الأبعاد ، وستكون تنبؤات الرجال والنساء مختلفة. إذا استمر هذا الأمر ، يمكن أن تكون أبعاد البيانات غير محدودة ، ونموذج التعلم الآلي هو العثور على مثل هذه الروابط في فضاء متعدد الأبعاد لا يستطيع العقل البشري تخيله ، وضبط الأوزان باستمرار بين الأبعاد المختلفة. على سبيل المثال ، "مدى أهمية" هو توقع الطول بالنسبة للوزن ، والذي يمكن تعديله بعد إدخال عدد كبير من البيانات.
** لذلك ، فإن الذكاء الاصطناعي القائم على التعلم الآلي سوف يربط البيانات ذات الأبعاد المختلفة في مساحة ذات أبعاد أعلى ، ولديه القدرة على اكتشاف الروابط المحتملة بين البيانات ، كما أنه سوف "يتعلم" بعض الأشياء غير الموجودة في الواقع ، ولكن بشكل كبير. الروابط المحتملة. ** يمكن للذكاء الاصطناعي ، المستخدم في نموذج اللغة ، تعلم أنماط لغة مختلفة واستكشاف "الجوهر" و "المشاكل" في النص الحالي.
** كلما زادت البيانات ، زاد نضج النموذج ، وزادت قدراته في الحوسبة والتعدين. ** على غرار الذكاء الاصطناعي مثل BERT و GPT ، اللذان وُلدا في مؤسسات كبيرة ، يعتقد الكثير من الناس أنهم وصلوا إلى "نقطة انعطاف" التكنولوجيا ، وليس من غير المعقول أن تنتج التغييرات الكمية تغييرات نوعية - وهذا أمر جيد الشيء لمنتجي المعرفة. ومع ذلك ، فإن النماذج الكبيرة أيضًا لها مشكلات متأصلة ، وكلما كان النموذج أكبر ، زادت حدة المشكلات ، خاصة فيما يتعلق بالجوانب المتنوعة والعادلة والصادقة للمعرفة.
** كيف تنتج الحقيقي **
** والمعرفة الحيادية؟ **
يمكن إنشاء معرفة جديدة من الاتصالات والنماذج الجديدة للمعرفة الحالية ، وهذا صحيح سواء كان ذلك على مستوى الإنسان أو الجهاز. ومع ذلك ، هل المعرفة الموجودة كافية؟ هل يكفي؟ هل هذا عادل؟ إذا كان أساس المعرفة الحالية غير كافٍ أو حتى متحيز ، فإن المعرفة الجديدة المبنية عليه ستكون متحيزة أيضًا.
منذ أن تم تطبيق الذكاء الاصطناعي للتعلم الآلي على نطاق واسع ، كشف العلماء باستمرار عن التحيزات الكامنة في هذه النماذج: التمييز على أساس الجنس ، والعنصرية ، والمخرجات غير الأخلاقية ، وما إلى ذلك. يستخدم المطورون العديد من التصحيحات وطرق التصحيح للتعويض عن ذلك ، ولكن معظم المشاكل مخفية في عملية إنتاج البيانات والتدريب ، كما أن انحياز الذكاء الاصطناعي هو انعكاس وتضخيم للتحيز الاجتماعي.
في عصر النماذج الكبيرة ، قد تكون هذه المشكلة مخفية بشكل أعمق: ليس كل باحث أو فريق لديه القدرة على تطوير نماذج الذكاء الاصطناعي من الصفر ، وخاصة نماذج اللغة الكبيرة والصورة الكبيرة ، والتي يعتمد معظمها على النماذج الحالية التي تم ضبطها بدقة. سيتم ترحيل مشاكل وانحرافات النموذج الكبير نفسه إلى المزيد من نماذج التطبيقات. وكلما انخفض الانحراف ، زادت صعوبة التعامل معه من خلال الضبط الدقيق وتصحيح الانحراف.
سيؤدي وضع توليد التنبؤ لنموذج اللغة الحالي إلى تضخيم الانحراف الحالي للبيانات ، مما يؤدي إلى تأثير "فرط التخصيص": على سبيل المثال ، يحتوي مرض معين على نسبة عالية من البيانات الإحصائية في مجموعة عرقية معينة ، حوالي 60٪ ؛ ولكن إذا تم استخدام نموذج اللغة لإنشاء صورة شخصية للمريض ، فهناك أكثر من 90٪ احتمال أن ينتمي وصف المريض الذي تم إنشاؤه إلى هذه المجموعة.
الآن يتبنى بعض تدريب نموذج الذكاء الاصطناعي وضع "القتال المتبادل" - ما يسمى بـ "شبكة الخصومة التوليدية" (شبكة الخصومة التوليدية) ، مما يسمح لنموذجين بتوليد وتصحيح بعضهما البعض بشكل مستمر. تعمل هذه الطريقة على تحسين كفاءة تدريب النموذج ، ولكن سيتم تضخيم أي انحراف صغير في هذا "التفاعل". وفقًا للمبدأ نفسه ، إذا اعتمد منتج المعرفة الذي يعمل بشكل وثيق مع آلة على هذا النوع من "التوليد" ، فسيتم تضمين بعض التحيزات من النموذج في المزيد من المعرفة الجديدة ، وسيتم استيعاب المعرفة الجديدة كبيانات ، يقوي تحيز النموذج. ** يجب على منتجي المعرفة أن يظلوا يقظين في هذه العملية.
** ما هي المعرفة الجديدة؟ هل يمكن أن يمثل "جيل" الذكاء الاصطناعي معرفة جديدة؟ **
ما هو ما يسمى بالمعرفة الجديدة؟ إذا كان للذكاء الاصطناعي أن يستخدم بشكل كامل لإنتاج المعرفة ، فيجب على منتجي المعرفة التفكير في هذه المسألة من وجهة نظر الجمع بين الإنسان والآلة. أي معلومات ، بالإضافة إلى المعرفة المكتسبة من قبل البشر من العالم الحقيقي ، تحتاج إلى "تنظيفها" و "تنسيقها" في بيانات. بالإضافة إلى جودة البيانات المذكورة أعلاه ، فإن عملية توليد البيانات مهمة أيضًا. باختصار ، ما هي المشكلة التي يرغب المرء في دراستها؟ ما نوع البيانات التي يتم ترجمة هذا السؤال إليها؟ كيف يتم إنتاج هذه البيانات ، وهل تمثل بشكل كامل وعادل القضايا التي يريد منتجو المعرفة دراستها؟
وتنطبق هذه المشكلة أيضًا على منتجي المعارف "التقليدية". خذ التاريخ كمثال: على الرغم من أن التاريخ يدرس الأحداث الماضية ، فلا توجد أحداث سابقة يمكن أن تكون نهائية بنسبة 100٪. عادة ما يبحث العلماء باستمرار عن مواد تاريخية جديدة لتكملة فهمهم للقضايا التاريخية ، وكشف وجهات النظر والأصوات المهملة في الماضي. ومن المثير للاهتمام ، أن التأريخ الحالي غالبًا ما يلجأ إلى كمية كبيرة من البيانات ، لا سيما البيانات الاقتصادية والسكان والمناخية السابقة ، بل ويعتمد أيضًا على التعلم الآلي لجلب مفاهيم ووجهات نظر جديدة إلى التاريخ.
وبالمثل ، قد يؤدي الاعتماد على الرؤى والآراء الناتجة عن الآلة إلى تضخيم أهمية بعض مصادر البيانات. يعتمد منتجو المعرفة اليوم كثيرًا على المعلومات السائدة والإنترنت والمعلومات الإلكترونية لإنشاء أشياء تمت "ترجمتها" إلى بيانات بواسطة الآخرين. ** في عصر الذكاء الاصطناعي ، من المحتمل أن تجعل الراحة والقابلية التوسعية التي يوفرها الذكاء الاصطناعي من السهل على الأشخاص تجاهل المعرفة التجريبية وغير السائدة التي لم يتم تحويلها إلى رقمية أو إلكترونية ، وبالتالي تفويت إمكانية تكوين وجهات نظر ووجهات نظر جديدة . **
على مستوى أعمق ، غالبًا ما تنشأ المعرفة الجديدة من التنقيب عن مواد جديدة ، وتصادم وجهات النظر ووجهات النظر المختلفة ، وإعادة تفكيك المعرفة الموجودة. يوفر نموذج اللغة الكبير العديد من الاحتمالات لعرض المعرفة ، ولكن منطقها الداخلي وهيكلها قد يتعارضان مع طريقة الإنتاج هذه.
** استنادًا إلى طريقة التدريب الخاصة بنموذج اللغة الكبير وخصائص المخرجات الناتجة عن النموذج ، سيصبح وزن محتوى المخرجات الأعلى تصنيفًا والاحتمالية الأعلى أكبر وستصبح الميزات أكثر تفردًا **. أصبحت عبارة "يولد الذكاء الاصطناعي" صفة تقريبًا لوصف الكلمات غير المنطقية والمتكررة والهراء التي تُقال كما لو لم تكن كذلك. صحيح أنه بالنسبة لمستهلكي المعرفة ، فإن الإجابات "الأكثر ترجيحًا" تقلل كثيرًا من عتبة الفهم ؛ ولكن بالنسبة لمنتجي المعرفة ، قد تصبح هذه الأشياء عائقًا بدلاً من ذلك.
** إلى أين يتجه منتجو المعرفة في العصر الجديد؟ **
ربما واجه العديد من الباحثين في العلوم الاجتماعية مثلي هذه المشكلة عند استخدام ChatGPT: اطلب منه شرح مفهوم ، وهذا منطقي ؛ لم يكتب المؤلف أبدًا كتابًا ، ولم ينشر بحثًا مطلقًا. كلما كان المجال أضيق وأكثر تخصصًا ، زادت إمكانية "الهراء".
بالعودة إلى مبدأ الذكاء الاصطناعي ، فإن هذا النوع من "الخلق" يقوم في الواقع بالتنقيب عن الروابط "الممكنة" للكلمات والجمل في بيانات ضخمة ، لكن هذه الروابط غير موجودة في الواقع. وبصراحة ، فإنها "تبدو متشابهة" . هذه الظاهرة الجديدة تسمى الآن "الهلوسة". بالنسبة لمنتجي المعرفة ، فإن كيفية استخدام الذكاء الاصطناعي لاستخراج الأنماط والصلات الموجودة في قاعدة المعرفة الحالية ، مع البقاء متيقظين ضد "رؤية" الآلة ، ما هو موجود وما هو مشكوك فيه ، هو مهارة مهمة للغاية.
سيصبح "الحوار" مع الذكاء الاصطناعي أيضًا مهارة جديدة. لا يزال الذكاء الاصطناعي الحالي "صندوقًا أسود" غامضًا لمعظم الأشخاص غير التقنيين (حتى الأشخاص التقنيين). ** كيفية البدء من المستوى الأدنى أو المتوسط للتكنولوجيا للتحدث إلى الآلات بشكل أكثر فعالية ، يتطلب فهم "الرؤية" ومكافحتها تعاون منتجي المعرفة والممارسين التقنيين **.
للبحث عن المعرفة الجديدة ، ووجهات النظر الجديدة ، والمواد الجديدة ، لا يزال الهيكل والتفسير الفريد لكل مجال مهمين للغاية في الوقت الحاضر. لا تزال النماذج التنبؤية للنماذج اللغوية الكبيرة والذكاء الاصطناعي التوليفي تميل إلى أن تكون مفردة ومتكررة ، وكلما كانت مواد التدريب محدودة ، كلما كانت القدرات محدودة. إذا كنت ترغب في الجمع بين القدرات الآلية والبشرية ، فيجب أن تبدأ من مصدر إنتاج البيانات ، واستخدام بيانات دقيقة ومتنوعة وعادلة وجديدة لتدريب نماذج الذكاء الاصطناعي ، وإنشاء نموذج تفاعل بين الإنسان والحاسوب حميد.
إن ظهور النماذج اللغوية الكبيرة والذكاء الاصطناعي التوليفي هو مجرد بداية للتحديات التي يواجهها الباحثون. بدلاً من مناقشة "الاستبدال" ، من الأفضل البحث عن إمكانية المشاركة والتنمية تحت نظرة أكثر حكمة.