كيفاش نطلع بروجي من زيرو تال ارتيكل | فيرمة د البنان كمثال

ML Engineering المختصر المفيد في هندسة التعلم الآلي

·

6 min read

كيفاش نطلع بروجي  من زيرو تال ارتيكل | فيرمة  د البنان كمثال
💡
MLNomads Mentorship Program | Session 1

ML Descent 1: Engineering in Machine Learning Engineering


يات س يات

يقال أن فهم السؤال هو نصف الجواب, وباش تطلع بروجي ناضي هو تكون عندك وضعية مشكلة واضحة و مفهومة, و تكون مبلاني لكاع الخطوات و التفاصيل باش اصدق ليك البروجي.

فهاد البوسط غادي نحاولو نبسطو الخطوات اللي الواحد اتبعهوم باش اخدم بروجي د تعلم الالة اللي من خلالو غادي القى حل ل شي مشكل اعتمادا على البيانات
Research paper انطلاقا من مرحلة تحديد المشكل و التعريف ديالو تال المرحلة د كتابة ورقة بحثية

تحديد او تعريف المشكل

شنو بغينا؟

اول خطوة من البروجي ديالنا هي نحددو المشكل او الوضعية المشكلة لي عندنا, و اللي على أساسها غادي نعرفو الخطوات اللي نتبعوها باش نقدو نلقاو حلول ليها.
كلما عرفنا المشكل و حددنا التفاصيل ديالو كلما غادي يكون ف الاستطاعة ديالنا نخططو بشكل استباقي لاي اضافة او تغيير حسب المتطلبات ديالنا, كمثال توظيف اوادخال الذكاء الاصطناعي أو التعلم الآلي

فالحالة ديالنا, الجني د البنان كيتطلب يد عاملة مهمة اللي كاتقوم ب مهمة مراقبة اﻷشجار د البنان باش تعرف اللي طايبة و تجمعها. و لكن هاد المهمة كاتكون مكلفة من الناحية المادية خصوصا لا كانت عندنا شي فيرمة لي كبيييرة و حتى من ناحية الوقت و العدد د العمال لي غا تحتاج. بلى مانساو الجودة د الثمار د البنان: كلما تعطلنا باش نعرفو واش طابت كلما كايبداو افقدو الجودة ديالهوم اكيبداو اخسرو.

كحل لهاد المعضلة بغينا نصاوبو واحد الموديل ديال الإي آي لي غادي اسهل علينا هاد المهمة او انقص لينا من التكلفة ديالها
ولكن كيفاش؟
الحل بسيط: فبلاصة المعاينة اليدوية من طرف اليد العاملة غادي نبقاو ناخدو تصاور ديال البنان و نبقاو نصنفوهوم بشكل آلي (سيستيم), وبمجرد القى اللي طايبة غادي اعلمنا او نمشيو نجمعوها.

شنو دار من قبل ؟

كي غاندير ليها؟

كي غاندير ليييهااا؟؟

باش نعرفو كيفاش نحلو المشكلة ديالنا, و لابد خاصنا نشوفو شنو دار من قبل ف الأوراق البحثية اللي تنشرات سواءا في نفس .الموضوع اولا ف مواضيع لي قريبة ليه
.هاكا غادي اكون عندنا اطلاع على شنو توصل ليه البحث العلمي, اللي نقدو نبنيو عليه او نستوحيو منو الحلول ديالنا
و افضل طريقة لمقارنة هاد الحلول الي ديجا كاينا هو عن طريق جدول تتكون فيه هاد المعلومات على كل ورقة بحثية:

  • العنوان

  • السنة د النشر

  • جورنال أو كونفيرونص فاش تنشرات

  • الكلمات المفتاحية

  • الملخص Abstract

  • واش صالحة ليا او لا لا

  • ...

تأطير المشكل

ها المعقول بدا

فهاد المرحلة غادي نحاولو نأطرو المشكلة ديالنا, من خلال نتطرقو للجوانب اللي كاتعلق خاصة بالبيانات الي غانحتاجو و الاستراتيجية باش غاخدمو عليهوم او إلى اي حد صالحة

Input المدخلات

كاتشكل البيانات لي غادي نعطيوها للموديل ديالنا باش اتعلم منها, ولكن كيفاش نقدو نجمعوهم و شنو الطبيعة ديالهوم
واش صور , واش معطيات رقمية و لا نصية

كيفاش نجمعو الداتا؟

من الطرق اللي نقدو نحصلو بيها على الداتا اللي محتاجينها ف البروجي ديالنا

  • البحث عن البيانات اللي ديجا واجدين او خدمو عليهوم الناس
    نقدو نلقاوهوم ف

  • نجمعوالداتا انطلاقا من الويب

    • YouTube, Social Media, ... ناخدو دي سكرينشوت من لي فيديو

    • Data scrapping*نسكرابيو البيانات من مواقع الويب أو من منصات نشر الصور*

  • الجمع اليدوي
    كنلتاجؤو ليها في آخر المطاف لا ماقديناش نلقاوالداتا بالطرق اللي سبقو
    و لكن غادي تحتاج منا الوقت و الماتريال باش نجمعوها
    و نكونو عارفي بالظبط شنو بغينا أو شنو نجمعو عن طريق

    • Sensors مستشعرات

    • RGB صور

    • Satellite Imagery صور جوية

    • ...

فالحالة ديالنا غادي نجمعو تصاور د البنان بكاميرات اللي فيكس ف بلاصتهوم: أقل تكلفة مقارنة بالمستشعرات و أكثر جودة و دقة من الصور الجوية
و لكن غادي تطلب منا بزافالوقت باش نجمعوها ف الفيرمة

كبديل غا نحاولو نجمعو الصور د البنان من الويب

Output المخرجات

هي الحوايج اللي بغينا اتعلمهوم الموديل ديالنا من الداتا الي عطيناه, و كيفاش ايكونو (قيم مستمرة, قيم ثابتة, ...)

  • واش البنان طايب اولا لا

  • جودة البنان واش مزيان اولا خضر اولا خامج

  • شناهي الدرجة د الطيوبية ديال البنان

  • ...

ف هاد الحالة الداتا الي غانجمعو غادي تكون على شكل 3 أصناف كاتبين الجودة د ثمار البنان

  • بنان طايب (أصفر)

  • بنان خضر

  • بنان خامج

الاستراتيجية او مقاربة العمل

هي الطريقة او الوسيلة اللي غادي نعتامدو عليها باش نصاوبو الموديل ديالنا او نعلموه القى لينا الحل

ولكل طريقة غادي اخصنا نشوفو إلى اي حد صالحة, شنو ناخدو بعين الاعتبار أو الحدود ديالها

من بين هاد الطرق

🚨
(غادي نذكرو خفاً زرباً بعض الطرق و ما غاندخلوش ف التفاصيل (خاصنا بوصط على كل وحدة ههههه
  • Deep learning / CNN - التعلم العميق

    • ماشي ديما كاين عندنا GPU

    • شحال د الوقت ايبقا ياخد لينا الموديل باش اعطينا النتيجة

    • كلما كانت الداتا قليلة و ماشي جينيراليزي ايولي غي كايحفظ

  • Classic ML: SVM, ... - التعلم الآلي التقليدي

    • محدود من حيث القدرة ديالو على التعلم و القدرة على التعميم على الداتا لي ماشافهاش
  • Transfer learning - نقل التعلم

    • اقد ازيد لينا البروي ف الموديل الشيء لي غايأثر على النتيجة اللي بغينا و الأداء د الموديل ديالنا
  • Self-supervised learning - التعلم الذاتي

    • هنا بقينا لابغينا نعلمو الموديل ب شي داتا كبيييييرة

    • غايخصنا الوقت و الموارد التقنية

  • Handmade methods - (البريكولاج) طرق خاصة

    • تقد تصدق لينا فالمشاكل البساط

    • و لكن كلما تعقد البروبليم اوكبرات الداتا راه ماتبقاش خدامة

و باش ناخدو فكرة اللي تقد تسهل علينا الاستراتيجية باش نخدمو , نقدو نجربو بشكل مبسط و مصغر بعض الطرق و نقارنو النتائج الأولية ديالها

تجربة:موديل كايصنف البنان

النتائج

النتائج هي اللي كاتبين الخدمة اللي دارت
الى ماعرفناش انقدموها كما ينبغي فغنضيعو علينا كولشي

عليها خاص اتعطاها حقها او نبينوها كما ينبغي و نتأكدو من الصحة ديالها

كيفاش؟

  • (accuracy, loss, ...) نستعملو المقاييس المناسبة
    باش نبينو اﻷداء و الفعالية ديال الموديل

  • (non technical) نقادو دي بريزونطاسيون موجهة للزبائن
    نشرحو من خلالها و نبينو القيمة المضافة ديال الخدمة والحلول اللي تلقاو

  • (deployment) نوجدو لي دوكيمونطاسيون د الكود اوالتقارير التقنية

  • (research paper) تقرير البحث

    ... أو الورقة البحثية اللي كانقدمو فيها العمل ديالنا بطابع أكاديمي أو ننشروها للعموم ف جورنال أو كونفيرونس

التقرير

وصلنا لآخر مرحلة اللي هي التقرير, اللي من خلالو كانقدمو الخدمة اللي درنا و النتائج اللي توصلنا ليها او كي درنا ليها
نقدو نلخصو المحتوى د التقرير ف النقط التالية بعجالة

  • المقدمة

    • تمهيد للوضعية المشكلة

    • ملخص مقتضب على استراتيجية العمل, النتائج و القيمة المضافة للعمل

  • ٍState of art شنو اللي دار من قبل

    • شنو دارو الناس قبل باش احلو نفس المشكل أو المشاكل اللي مشابهة
  • Methods الطريقة

    • Data البيانات المستعملة

    • الموديل اللي استعملنا: كيفاش علمناه و التفاصيل ديالو

    • التفاصيل التجريبية: الماتريال و تفاصيل التعلم

  • Results & discussion النتائج و المناقشة

    • نعرضو النتائج اللي تحصلنا عليها: جداول, مبيانات, مقاييس

    • نناقشو من خلال مقارنة النتائج و التفسير د الصعوبات اللي واجهات الموديل

  • الخاتمة

    • شنو درنا و لاش وصلنا

    • الطموحات ديالنا: شنو بغينا نديرو مستقبلا

نختمو: افلا واوال

"يات س يات اورد يات ف يات"

كلما حددنا المشكل اللي عندنا و عرفنا كاع التفاصيل ديالو كلما سهالت علينا القضية باش نعرفو الخطوات اللي نتبعو باش نحلوه

نتلاقاو ف بوست جديد على موضوع جديد


مصادر الصور