Author: Barakat, Mohamed Sayed Ramadan./ Title: Machine Learning Approach for <br>Confirmation of In Vitro Anticancer Drug Discovery and Predictive Analytics in Drug Discovery for Cancer Cells \

Search In this Thesis

العنوان

Machine Learning Approach for
Confirmation of In Vitro Anticancer Drug Discovery and Predictive Analytics in Drug Discovery for Cancer Cells \

المؤلف

Barakat, Mohamed Sayed Ramadan.

هيئة الاعداد

باحث / محمد سيد رمضان بركات

مشرف / نجوى بدر

مشرف / شيرين موسى

مناقش / نجوى بدر

تاريخ النشر

2022.

عدد الصفحات

111 p. :

اللغة

الإنجليزية

الدرجة

ماجستير

التخصص

Information Systems

تاريخ الإجازة

1/1/2022

مكان الإجازة

جامعة عين شمس - كلية الحاسبات والمعلومات - نظم المعلومات

الفهرس

Only 14 pages are availabe for public view

from

111

from

111

Abstract

في الآونة الأخيرة ، حققت تقنيات المعلوماتية الحيوية تطوراً ملحوظاً في فهم ودراسة أنظمة اكتشاف وتصميم الأدوية. تم استخدام خوارزميات مختلفة للذكاء الاصطناعي والتعلم الآلي في اكتشاف الأدوية وتصميمها ، مما أدى إلى حدوث تطورات في جميع مجالات اكتشاف الأدوية ، بما في ذلك التمييز بين الأدوية والمركب ، والتنبؤ بالتفاعل بين الأدوية المستهدفة والتفاعل بين الأدوية والعقاقير ، والتي تستغرق وقتًا طويلاً. يخشى المرضى من تناول أكثر من دواء في نفس الوقت، حيث قد يؤدي ذلك إلى تفاعلات بين الأدوية ، مما قد يؤدي الي آثار جانبية أو تسمم ومضاعفات خطيرة أخرى.
خاصة مرضى السرطان ، فهم يخشون من أن الأدوية المضادة للسرطان قد تتفاعل مع أدوية أخرى ، وهذا له عواقب سلبية. يستخدم باحثو تنبؤات الادوية عادةً التفاعلات الدوائية وتفاعلات غير الدوائية ، والتي يتم اختيارها عادةً بشكل عشوائي. هذا يمكن أن يقلل دقة التنبؤ بتفاعلات الادوية.
أيضًا، تعد تفاعلات البروتين أحد الركائز الأساسية التي تساعد في تطوير اكتشاف الأدوية. على الرغم من أن توقع تفاعلات البروتينات هو مهمة حاسمة ومدروسة جيدًا في المعلوماتية الحيوية ، إلا أنها لا تزال تفتقر إلى التحقيقات الشاملة للعديد من البروتينات. إن تكلفة فهم تفاعلات البروتينات وتحديد تفاعلات البروتين والبروتين غير القائمة باستخدام محاذاة التسلسل تجعل الطرق الحسابية الحالية غير فعالة. يحث هذا على إنشاء قاعدة بيانات لتفاعلات البروتين والبروتين غير القائمة استنادًا إلى تشابه التسلسل دون تطبيق محاذاة التسلسل لجدوى حسابية ميسورة التكلفة. يمكن اعتماد تقنيات التعلم الآلي للتعلم من تسلسل الأزواج المتفاعلة والحصول على ميزات البروتين.
في هذا البحث ، تم اقتراح نهج التعلم الآلي للتنبؤ بتفاعلات البروتين بناءً على نهجنا ”الجيل السلبي القائم على الميزات” لأخذ عينات سالبة (تفاعلات غير قائمة) من بيانات تسلسل البروتين. يقيس تشابه ميزات التسلسل بدون محاذاة. تمت مقارنة طرق الاستخراج (COT) و Epitopes لتحقيق دقة أعلى مع استهلاك وقت أقل. تم استخدام العديد من تقنيات للتعلم الآلي ، حيث حقق نموذج (Tree) أعلى النتائج بدقة 97.8٪. حقق تجريب تنبؤات بتفاعلات البروتين باستخدام مجموعة بيانات سلبية تم إنشاؤها و (COT) باستخدام 343 ميزة دقة 97.8٪ ، مقابل 93٪ باستخدام مجموعة بيانات سلبية عشوائية. حقق تطبيق Epitopes باستخدام مجموعة بيانات سلبية تم إنشاؤها باستخدام 21 ميزة دقة 94.5٪ مقابل 92.5٪ باستخدام مجموعة بيانات سلبية عشوائية. وبالتالي ، فإن التنبؤ بتفاعلات البروتين باستخدام مجموعة البيانات السلبية التي تم إنشاؤها من نهجنا المقترح أكثر دقة. يعتبر استخدام Epitopes لاستخراج الميزات أسرع من COT بمتوسط 83٪.
تم تطبيق نفس تقنيات التعلم الآلي على مجموعات بيانات التفاعلات الإيجابية والسلبية لتفاعلات لادوية و وتفاعلات الادوية مع البروتين و الادوية المضادة للسرطان التي تم إنشاؤها بناءً على التشابه بين الأدوية ، وحل مشكلة البيانات السلبية العشوائية والغير دقيقة في الاعمال السابقة ، وطرق جديدة لتفاعلات لادوية و وتفاعلات الادوية مع البروتين و الادوية المضادة للسرطان تم اقتراح التنبؤ باستخدام أساليب التعلم الالي المحسّنة واستخراج الميزات للحصول على نتائج أسرع وأكثر دقة. تستخدم الطريقة المقترحة للتنبؤ بتفاعلات الادوية مع البروتينات 7 ميزات للأدوية و 21 ميزة للبروتينات ، مما يجعل تنبؤ بتفاعلات الادوية مع البروتينات وتوليد البيانات السلبية أسرع. تُظهر تجربة التنبؤ بتفاعلات الادوية مع البروتينات أن طريقتنا المقترحة تحقق متوسط دقة 95٪ ، وهو ما يتفوق على الدراسات السابقة بمتوسط 3-4٪.
تستخدم الطريقة المقترحة للتنبؤ بتفاعلات الاوية وبعضها أو مضادات السرطان 7 ميزات دوائية لتسريع التنبؤ وتوليد البيانات السلبية وتكشف النتائج أن الطريقة المقترحة تتنبأ بـبمتوسط دقة يبلغ 83.2٪ لتفاعلات مضادات السرطان باستخدام مجموعة بيانات (OncoRx) و 85.4٪ لـتفاعلات الادوية وبعضها باستخدام مجموعة البيانات (TWOSIDES) ، متفوقة في الدقة على الدراسات ذات الصلة بمتوسط دقة يبلغ 1-3 ٪.