في العقد الأخير، تم تحقيق تقدم كبير في مجال الذكاء الاصطناعي وأصبح الذكاء الاصطناعي أكثر انتشارًا في حياتنا اليومية.
في العقد الأخير، تم تحقيق تقدم كبير في مجال الذكاء الاصطناعي (AI) وأصبح الذكاء الاصطناعي أكثر انتشارًا في حياتنا اليومية. يمكن أن تُعزى الاستخدام الواسع والتبني للذكاء الاصطناعي إلى عوامل متعددة، بما في ذلك Deep Learning (DL) ، المعروف أيضًا بالشبكات العصبية الاصطناعية الحديثة ، وتوافر كميات كبيرة من البيانات ، والقدرة على التدريب باستخدام القوة الحسابية للنماذج DL. في الآونة الأخيرة ، لفت الذكاء الاصطناعي التوليدي انتباه الجمهور العام ، وذلك بفضل OpenAI وبناء نماذج لغة كبيرة قابلة للتطوير وفعالة (LLMs). تم استخدام الذكاء الاصطناعي التوليدي أيضًا لإنتاج النصوص والصور ومقاطع الفيديو وشفرة البرمجة والموسيقى. هناك نماذج متعددة الوسائط تقوم بتوليد الصور استنادًا إلى الوصف النصي (على سبيل المثال ، DALL·E) والعكس بالعكس ، وسوف تستمر مثل هذه الابتكارات في النمو بسرعة كبيرة.
تم تحقيق اختراق هام في تطبيق نموذج DL خلال العام 2012 [1] لتصنيف الصور إلى عدة مجموعات مختلفة (تحدي التعرف على الصور البصرية على نطاق كبير في ImageNet 2010). وقد تبع ذلك استخدام DL لمهام تصنيف مماثلة في النصوص والكلام حيث قدمت النماذج DL تحسينات كبيرة على المقاييس المعتمدة سابقًا. تم تدريب هذه النماذج للمهام المتخصصة وقدمت أداءً على أحدث مستوى. لقد أثار استخدام DL لتوليد مجموعة واسعة من النواتج اهتمام الباحثين في مجال الذكاء الاصطناعي. تم إجراء أعمال بحثية إضافية لتطوير تقنيات الذكاء الاصطناعي التوليدي في مجالات أخرى.
كان نمذجة اللغة مهمة صعبة للذكاء الاصطناعي. هدف النماذج اللغوية هو التنبؤ بالكلمة التالية بناءً على سلسلة من الكلمات. تم توضيح استخدام DL للتدريب المسبق لنماذج LLM في عام 2019 [3]. تعد النماذج المراقبة التوليدية (GPT) التكنولوجيا المستخدمة في ChatGPT. تم تدريب هذه النماذج على حجم ضخم من البيانات النصية بواسطة استخدام قدرة حوسبة هائلة على وحدات معالجة الرسومات (GPU). كانت نتائج GPT-3/GPT-4 لمهام مثل تلخيص النصوص والإجابة على الأسئلة وإنشاء الشفرة مثيرة للإعجاب.
تواجه النماذج الذكاء الاصطناعي التوليدي تحديات. تتعلم نماذج DL من البيانات التدريبية وتحدد معلمات الشبكات العصبية الاصطناعية لتمثيل الرؤية العالمية كما هو موجود في البيانات. عادةً ما تكون هذه النماذج أكبر بكثير من نماذج التعلم الآلي التقليدية. قد يكون حجم هذه الشبكات والنماذج تحدٍ عندما يكون كمية البيانات المتاحة للتدريب صغيرة. معظم مجموعات البيانات الحقيقية لديها توازن في الفئات وقد تحتوي على تحيز متأصل (غير ظاهر). يتم تطوير تقنيات لتدريب نماذج DL للتغلب على هذه التحديات بانتظام. وإلا ، فإنها عرضة لحفظ البيانات التدريبية في الذاكرة ، المعروف أيضًا باسم التطابق المفرط ، وقد لا تتمكن النماذج من التعميم للبيانات غير المتوقعة أو تقديم نتائج متحيزة.
وتتعرض النماذج الذكاء الاصطناعي التوليدي أيضًا للتحديات المتعلقة بتقنيات DL الأصلية. بالإضافة إلى ذلك ، يمكن أن يؤدي الطابع التوليدي للنماذج إلى إدخال مشاكل في البيانات المولدة. على سبيل المثال ، يواجه مُولدو الصور الذكاء الاصطناعي صعوبة في توليد الأيدي. يمكن أن ينتجوا صورًا غريبة الشكل يصعب تفسيرها. تم اقتراح العديد من النهج للتغلب على هذه التحديات [4]. هذا صحيح أيضًا بالنسبة لنماذج LLM التي تعمل على توقع الكلمة التالية. يمكن أن تنتج تكملات خاطئة أو تقدم إجابات خاطئة ، بناءً على البيانات التي تم تدريبها عليها.