AutoML يأتي كحل لتحديات بناء وتدريب النماذج الذكية. سنناقش هنا حالة دراسية حول توقع أمراض القلب باستخدام بايثون.
في عالمنا الحالي، تريد جميع المؤسسات استخدام تعلم الآلة لتحليل البيانات التي يتم توليدها يوميًا من المستخدمين. ومع مساعدة الآلات أو خوارزميات التعلم العميق، يمكنهم تحليل البيانات ومن ثم التنبؤ بالبيانات الاختبارية في بيئة الإنتاج. ولكن إذا بدأنا باتباع العملية المذكورة، فقد نواجه مشاكل مثل بناء وتدريب نماذج التعلم الآلي، حيث يستغرق ذلك وقتًا طويلاً ويتطلب الخبرة في مجالات مثل البرمجة والإحصاءات وعلوم البيانات، وما إلى ذلك.
لذلك، للتغلب على مثل هذه التحديات، يأتي AutoML كحل واحد من أشهر الحلول التي يمكن أن توفر العديد من جوانب خط أنابيب التعلم الآلي. ومن هنا، سنناقش حالة دراسية حول AutoML باستخدام بايثون لتوقع أمراض القلب.
يمكننا بسهولة ملاحظة أن المشاكل المتعلقة بالقلب هي السبب الرئيسي للوفاة في جميع أنحاء العالم. والطريقة الوحيدة للحد من هذا النوع من التأثير هي الكشف عن المرض في وقت مبكر باستخدام بعض الطرق التلقائية بحيث يتم استهلاك وقت أقل هناك، وبعد ذلك اتخاذ بعض التدابير الوقائية لتقليل تأثيره. وبالتالي، عن طريق الحفاظ على هذه المشكلة في الاعتبار، سنستكشف أحد مجموعات البيانات المتعلقة بسجلات المرضى الطبية لبناء نموذج لتعلم الآلة حيث يمكننا التنبؤ بالاحتمال الأعلى أو الاحتمالية للمريض المصاب بأمراض القلب. يمكن تطبيق هذا النوع من الحلول بسهولة في المستشفيات للتحقق من ذلك حتى يتمكن الأطباء من تقديم بعض العلاجات في أقرب وقت ممكن.
الخط الأساسي الكامل للنموذج الذي اتبعناه في هذه الحالة الدراسية موضح في الشكل أدناه.
تُظهر الرقم 1 خط الأنابيب لنموذج AutoML. وبعد إعداد البيانات لنموذج التعلم الآلي، سنستخدم واحدة من المكتبات الشهيرة للتعلم الآلي التلقائي وهي مكتبة H2O.ai ، التي تساعدنا على إنشاء وتدريب النموذج.
الفائدة الرئيسية لهذه المنصة هي أنها توفر واجهة برمجة تطبيقات عالية المستوى من خلالها يمكننا بسهولة أتمتة العديد من جوانب خط الأنابيب، بما في ذلك هندسة الميزات واختيار النموذج وتنظيف البيانات وضبط العوامل الفرعية، وما إلى ذلك، والتي تقلل بشكل كبير من الوقت المطلوب لتدريب نموذج التعلم الآلي لأي من مشاريع علوم البيانات.
الآن، لبناء النموذج، سنستخدم واجهة برمجة التطبيقات لمكتبة H2O.ai، ولاستخدام هذا، يجب علينا تحديد نوع المشكلة، سواء كانت مشكلة تحويل أو مشكلة تصنيف أو نوع آخر مع استخدام t.