13.07.2015 Aufrufe

29 - علوم الحاسوب والرياضيات - جامعة الموصل

29 - علوم الحاسوب والرياضيات - جامعة الموصل

29 - علوم الحاسوب والرياضيات - جامعة الموصل

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

مجلة الرافدين لعلوم الحاسوب والرياضيات لسنة ٢٠١٠وقائع المؤتمر العلمي الثالث في تقانة المعلومات <strong>29</strong>‐30/Nov./2010كلية علوم الحاسوب والرياضيات – جامعة الموصلدراسة تحليلية لمتتابعة الحامض النوويالرايبي منقوص الأوكسجينأ.د.‏باسل يونس ذنون الخياطفاطمة محمود حسنكلية عوم الحاسبات والرياضياتجامعة الموصلAbstractThis paper contains a general introduction to Bioinformatics, theirs goals,objectives and their applied fields. Is then shed light on the real views of DNAof humans, some processors use mathematical and statistical analysis of thetraditional purpose of these observations and to identify some features andcharacteristics. Graphical analysis of DNA is carried out in two and threedimensions. The inter-connectedness among the sites of DNA is also analyzedas well as a spectral analysis. The attempt is also made to identify the order ofsuch observations. Through this analytical study it is shown that DNA has acomplex structure with interdependent with each other for long-term.الملخصتتضمن هذه الورقة البحثية مقدمة عامة عن المعلوماتية الحيوية،‏ وأهدافها ومضامينها ومجالاتهاالتطبيقية.‏ كذلك يتم تسليط الأضواء على مشاهدات حقيقية للحامض النووي الرايبي منقوصالأوكسجين DNA للإنسان،‏ وتستخدم بعض المعالجات الرياضية والإحصائية لغرض تحليل هذهالمشاهدات والتعرف على بعض سماتها وخصائصها.‏ إذ يتم إجراء تحليل بياني و ُترسم القواعدالنيتروجينية للحامض النووي ببعدين وثلاثة أبعاد.‏ كما يدرس الترابط الداخلي بين مواقع الحامضالنووي ويجرى تحليلا طيفيا لمشاهدات الحامض النووي.‏ وت ُجرى أيضا محاولة للتعرف على مرتبةهذه المشاهدات.‏ ومن خلال هذه الدراسة التحليلية يتبين بان مشاهدات الحامض النووي الرايبيمنقوص الأوكسجين DNA للإنسان معقدة البنية التركيبية،‏ ومترابطة مع بعضها البعض وعلىفترات طويلة الأمد.‏٣١١


مجلة الرافدين لعلوم الحاسوب والرياضيات لسنة ٢٠١٠وقائع المؤتمر العلمي الثالث في تقانة المعلومات <strong>29</strong>‐30/Nov./2010كلية علوم الحاسوب والرياضيات – جامعة الموصل‎١‎‏.المعلوماتيةت ُعرف المعلوماتيةالحيويةالأساسية قواعد بيانات المعلومات:Bioinformaticsالحيوية على أنها استخدام الحاسوب لمعالجة المعلوماتالحيوية.‏ وهو علم ركيزتهالحيوية بمكوناتها الرئيسية الجينات،‏ والبروتينات،‏ ويجمع عددا منالعلوم الأخرى بهدف الاستفادة من هذه المعلومات كعلوم الرياضيات،‏ والحاسوب ، والإحصاء،‏ والطب،‏والكيمياء.‏ ويمكن أن نلخص تعريف المعلوماتية الحيوية على أنها تطبيق التقانة الحاسوبية والمعلوماتيةفي إدارة المعلومات الحيوية.‏ ومثال ذلك تحليل المعلومات الحيوية ‏(الجينات والبروتينات)‏ باستخدامالحاسوب والتقنيات الحاسوبية الحديثة2005)] ,( Lin .[Shoemaker and لقد ا ُستخدمت المعلوماتيةالحيوية على نطاق واسع في الأبحاث التي تخص مشروع الجينوم البشري والذي حدد السلسلة الجينيةالكاملة للإنسان،‏لها علاج من قبل.‏و هو الثورة الجديدة التي تعد تغيير وجه الطبكما أن للمعلوماتيةالذي نعرفه اليوم وعلاج أمراض لم يكنالحيوية دورا ً كبيرا ً وفاعلا في اكتشاف عقاقير جديدة وفعالة،‏ حيثساهمت بشكل كبير في إيجاد حلول لتحليل النتائج المختبرية المعقدة وكذلك استخدامالحاسوب لحفظالمعلومات واسترجاعها.‏ كما أن البحث في المادة الوراثية للكائنات الحية يدخل ضمن نطاق المعلوماتيةالحيوية،‏ ويخدم هذا الفرع من العلم جميع العاملين في مجال الأبحاث العلمية الطبية والوراثية على حدسواء.‏ كما يستخدم في عمليات تخزين البياناتالمعلوماتيةوتحليل سلاسلالحامض النووي .(DNA) ومن خلالالحيوية يمكن أن نفهم بشكل أفضل الكيفية التي تنتظم فيها الجينات في سلسلة الحامض النووي.(DNA) ويتوقع العلماء أن المستقبل القريب سيشهد تغيرا ً في الطريقة التي يعالج بها الأطباء مرضاهم،‏فبدلا ً من إعطاء المريض مجموعة من الأدوية من خلال الفحص السريري،‏ يمكن للطبيب معرفة الدواءالأفضل للمريض وتحديد حدة الاستجابة للدواء من خلال فحص المادة الوراثية للشخص ومقارنتهابالموجود في قواعدالبيانات الجينية للأمراض ومن ثم التأكد إلى أي فئة ينتمي هذا المريض.‏ وفي حالةالخطر يمكن تغيير الجرعة بدقة أو توجيه المريض لاستخدام دواء آخر وتغيير خطة العلاج بأكملها ممايجنب المريض مخاطر الأدوية قبل استخدامها ‏(قاسم. ((٢٠٠٩):(Shoemaker and Lin( 2005)وهي )تهدفالمعلوماتيةالحيوية إلىثلاثةأهداف رئيسية‎١‎‏-تطوير تقنيات وبناء خوارزميات تساعد في تحصيل المعلومات من مجموعة ضخمة منالبيانات.‏٣١٢


مجلة الرافدين لعلوم الحاسوب والرياضيات لسنة ٢٠١٠وقائع المؤتمر العلمي الثالث في تقانة المعلومات <strong>29</strong>‐30/Nov./2010كلية علوم الحاسوب والرياضيات – جامعة الموصل‎٢‎‏-تحليل وتفسير الأنماط المختلفة من البياناتوالبنى البروتينيةالتي تتضمن سلاسل الأحماض الأمينيةوالقطع.‎٣‎‏-تطوير وتنفيذ أدوات تساعد على إدارة فعالة للأنماط المختلفة من المعلومات.‏تتضمن المعلوماتية الحيوية المعالجة البارعة ، والتقصي ، والتنقيب عن بياناتData Miningلمتتابعات .DNAإن تطوير التقنياتِ‏ الخ َزن والتقصي عن متتابعات DNA أدى إلى التقدمِ‏الكبير جدا في الجانب التطبيقيِ‏ ً في علوم الحاسوب،‏ خصوصا ً في مجالات خوارزميات تقصيسلسلة حروفونظرية قاعدة البياناتMachine Learning الماكنة وت َعل ّم String Searching Algorithms.Database Theoryإن التقصي عن متتابعات DNA يهتم بدراسةحدوث َ سلسلة حروف داخل سلسلة أكبر مِن الحروف،‏ للتقصي عن متتابعات معينة مِنالنكليوتيدات.Nucleotidesوتستعمل سلاسل ماركوف لتشخيص الأشياء الشاذ ّة،Anomalies وتصليح البيانات ،Repair Data وتقييم سلامة َ البياناتAssess DataIntegrity‏(الخياط.((٢٠١٠):(Shoemaker and Lin ( 2005))من المجالات التطبيقيةللمعلوماتيةما يأتي الحيويةالطب الشخصي،‏ العلاج الجيني،‏ الطب الجزيئي،‏ الطب الوقائي،‏ العلاج باستخدام المورثات،‏تطوير الأدوية،‏ تطبيقات الجينوم المايكروية،‏ دراسات تغير المناخ،‏ مصادر الطاقة البديلة،‏ التقانةالحيوية،‏ الممانعة المضادة الحيوية،‏ تحسين المحاصيل،‏ تحسين الجودة الغذائية،‏ الطب البيطري.‏. ٢ الحامض النووي الرايبي منقوص الأوكسجين:‏.Deoxyribonucleic هو مختصرAcid DNAيتألف جزيء ال DNA من شريطين يلتفانحول بعضهما باتجاه عقارب الساعة،‏ حول محور واحد،‏ أحدهما يتجه إلى أعلى والآخر إلىأسفل،‏ على هيئة سلم حلزوني مزدوج،‏ كل شريط عبارة عن خيط من وحدات كيماوية تسمىالنيوكلتيدات.‏ والنيوكلتيدات تتكون من أربعة أصناف لا تختلف إلا في نوع القاعدة النيتروجينية،‏وهذه القواعد النيتروجينية هي:‏٣١٣


مجلة الرافدين لعلوم الحاسوب والرياضيات لسنة ٢٠١٠وقائع المؤتمر العلمي الثالث في تقانة المعلومات <strong>29</strong>‐30/Nov./2010كلية علوم الحاسوب والرياضيات – جامعة الموصلالأدنين،، والكوانين GuaninAdeninوالثايمين، والسيتوسينThymine.Cytocineترتبط ‏"الكوانين"‏ ب ‏"السيتوسين".‏وتشكل هذه القواعد أزواجا ، فقاعدة ‏"الأدنين"‏ ترتبط دائما ب ‏"الثايمين"،‏ بينماوتتوزع القواعد بالترتيب على اللولب المزدوج،‏القواعد كلمات وجملا وراثية تحفظ المعلومات الوراثية للكائن الحي منوتشكلبداية الحياة إلى الممات،‏على هيئة جينات،‏ وتتطابق كل مجموعة مؤلفة من ثلاثة أحرف مع حامض أميني واحد ،انظر الشكل. (١)الشكل(‏‎١‎‏)‏ . DNA: شريطأللقد كشفت الدراسات الحديثة أن للولب شريط DNA المزدوج،‏ والذي يطلق علية أيضا جديلة،‏له خصائص مذهلة،‏ لا سيما في العلاقة بين التركيب والوظيفة التي تؤكد أن التصميم الدقيق لهذااللولب المزدوج المثير يشير بقوة إلى قدرة إبداع الخالق العظيم جل جلاله.‏ فأنه إذا تم تمديد جديلةDNAالموجودة في أي خلية من خلايا الإنسان فسيبلغ طولها مترين.‏ وإذا وضعت جميعجزيئات الحامض النووي للجسم البشري سوية من نهايات أطرافها فإنها قد تصل إلى الشمسوترتد أكثر من٦٠٠ مرة(‏‎2005‎‏)‏ al. (Lindblad-Toh K, et، انظر الشكل(‏‎٢‎‏)‏..الشكل(‏‎٢‎‏)‏ : تمديد جديلة DNA٣١٤


١مجلة الرافدين لعلوم الحاسوب والرياضيات لسنة ٢٠١٠وقائع المؤتمر العلمي الثالث في تقانة المعلومات <strong>29</strong>‐30/Nov./2010كلية علوم الحاسوب والرياضيات – جامعة الموصلإن الحامض النووي الرايبي منقوص ألأوكسجين يمثل المادة الوراثية في نواة الخلية ،الحاوية لكلالمعلومات الوراثية ، وقد أثبتت الدراسات تميز هذا الحامض ببعض الخصائص،منها ما يلي:‏- إن كمية هذا الحامض ثابتة في جميع خلايا الأفراد،‏ مهماالعضو·‏٢- إن لهذا الحامض قدرة على تكوين صورةالبينية،‏ من خلال تفكك لولبهبينهما،‏كانت نوعية النسيج الذي يتكون منهطبق الأصل لنفسه،‏ في أثناء الانقسام خلال المرحلةالشريطين المكونين له،‏ بعد انفصام الروابطالهيدروجينيةالتي تربطحيث يقوم كل شريط بعد ذلك بتكوين شريط مقابل،‏ طبقا ً للتجاذب النوعي للقواعدالنيتروجينية،‏ وينتج من هذا التكاثر الذاتي جزيئان متماثلان من هذا الحامض،‏الأصلي من حيث المكونات الأساسية.‏-٣مطابقان للجزيءإن هذا الحامض يحتوي على جميع المعلومات الوراثية،‏ توجد في ترتيبات وتعاقب ونوعيةالقواعد النيتروجينية علىطول سلسلة الحامض،‏ بمعنى أنه يمكن اعتبار هذه القواعد بمثابة لغةمكونة من أربعة أحرف،‏ يمكن استعمالها لتكوين كلمات مختلفة،‏ حسب ترتيب القواعد الأربعة.‏إن هذه القواعد الأربعة ت ُرمز بالأحرفالكلمات،‏ ومن مجموعة هذه الجمل{A,G,C,T}تتكون رسالة محددة ((٢٠٠٩ ( Meyer، ويمكن تكوين جمل لها معنى من هذه.(٣. المتتابعة الزمانية للحامض النووي :DNAإن أل DNA هو مادة وراثية موجودة في سائر الكائنات الحية وتحمل الصفات المورثة تواتراجيلا بعد جيل،‏ وهو احد الخصائص الحيوية المهمة للكائنات الحية والتي تميز بعضها عنالبعض الآخر.‏ إن الحامض النووي DNA يتكون من شريطين ملتفين على بعضهما بحيثيشبهان السلم الملتوي،‏ وأنه يتكون من أربعة أنواع من القواعد النيتروجينية هي،‏ الأدنينوالثايمين(A)(T)والسايتوزينوالكوانين (C)في جميع أجزاء الحامض النووي DNA،(G)وتتكرر هذه القواعد ملايين أو مليارات المرات2007)) al.( ،(Calvino, et انظر الشكل(‏‎٣‎‏).‏٣١٥


مجلة الرافدين لعلوم الحاسوب والرياضيات لسنة ٢٠١٠وقائع المؤتمر العلمي الثالث في تقانة المعلومات <strong>29</strong>‐30/Nov./2010كلية علوم الحاسوب والرياضيات – جامعة الموصلالشكل(‏‎٣‎‏):‏ تركيب الحامض النووي .(DNA)أن كل ثلاث قواعد نيتروجينية تعطي حامضا أمينيا واحدا ، كما أن عدد معين من الأحماضالامينية يؤدي إلى تكوين جين معين،‏ وهذا الجين يكون مسئولا عن تكوين بروتين.‏ وهذا البروتينبدوره له وظيفة محددة في معاني الحياة.‏ يوجدأل DNAفي نواة الخلية الحية كما يوجد عددقليل منه في المايتوكوندريا ‏(بيوت الطاقة)‏ ‏(قاري و جبر (٢٠١٠))، انظر الشكل(‏‎٤‎‏)‏.الشكل (٤):يمثل مقطع للمادة الوراثية DNA والتي تتضمنها الأحماض الامينية.‏٣١٦


مجلة الرافدين لعلوم الحاسوب والرياضيات لسنة ٢٠١٠وقائع المؤتمر العلمي الثالث في تقانة المعلومات <strong>29</strong>‐30/Nov./2010كلية علوم الحاسوب والرياضيات – جامعة الموصل٤. تحليل مشاهدات الحامض النووي:‏إن المشاهدات التي تم استخدامها في هذا البحث هي عبارة عن سلسلة من القواعد النيتروجينيةللحامض النووي DNA والموجودة في المايتوكندريا للإنسان الطبيعي.يبلغ حجم هذه المشاهدات١٦٥٧١ قاعدة نيتروجينية بشكل متتابعة من الحروف الأربعة والتي هي G وC وTو ، A وهذهالمعلومات متوفرة ضمن قاعدةالوراثية ودراسة عمل الجيناتبيانات Base) (DataوالتيGen Bank]والتطوير العلمي مثل وNCBI‏]‏ الشكل يوضحتحويل المشاهدات الحيوية لأستخدامها في التطبيقات الحاسوبية.‏في مراكز عالمية مختصة في الهندسةوفرت للباحثين عدد ًا من البيانات المتاحة لأجل الأبحاث(٥)المخطط البيانيلمراحل عمليةالبدايةتهيئة متتابعة الحامض النووي DNAترميز المشاهداتالمعالجة القبلية للمشاهداتالتحليل البياني الارتباط الذاتي التحليل الطيفيالمعالجة التخصصية للمشاهداتايجاد الطفرات الوراثيةالتعرف على مواقع الجيناتتشخيص الامراض واآتشاف العقاقير الطبيةالنهايةالشكلالتطبيقات الحاسوبية.‏المخطط البياني لمراحل عملية تحويل المشاهدات الحيوية لأستخدامها في٣١٧:(٥)


مجلة الرافدين لعلوم الحاسوب والرياضيات لسنة ٢٠١٠وقائع المؤتمر العلمي الثالث في تقانة المعلومات <strong>29</strong>‐30/Nov./2010كلية علوم الحاسوب والرياضيات – جامعة الموصلملاحظة.:وبالنظر الى ان المعالجة التخصصية تحتاج الى تفاصيل آثيرة ، لذا فان هذة الورقة البحثية سوفتخصص فقط على المعالجة القبلية١.٤ التحليل البياني :يمكن الاستعانة بالرسوم البيانية كأدوات مفيدة لأخذ فكرة أولية عن العلاقات الموجودة بينعناصر سلسلة القواعد النيتروجينية للحامض النووي.‏ أن أول خطوة نحتاج إليها هي تحويلالرموز الحرفية الأربعة إلى أرقام.وقد تم إجراء هذا التحويل على النحو الأتيA ≡ 1:T≡2و. G و ≡ 4 C ≡ 3لأخذ فكره أولية عن الرسم الزمني لهذه المشاهدات فأن الشكلمشاهدة من هذه المتتابعة طول كل منها(٦). ٢٠٠ويوضح أربعة متحققاتوكما هو واضح فأن نمط انتشار النقاط في كلمن هذه المتتابعات الأربعة يختلف عن الأخرى مما يشير إلى عدم وجود سلوك حتمي محددلانتشار النقاط،‏ وان هذه المشاهدات غير مراوحةالقواعد النيتروجينيةللحامض النووي.‏ولو فرضنا الآن إن المتغير العشوائيللحامض النووي تعتمد على مواقعها في سلسلة،Non-Stationary بمعنى أن خصائصالقواعد النيتروجينيةيمثل القاعدة النيتروجينية في الموقعn منسلسلة القواعد النيتروجينية للحامض النووي،‏ وبفرض أن القاعدة النيتروجينية في الموقع، هي دالة بدلالة القاعدة النيتروجينية التي تسبقها بنفترض النموذج الرياضي الآتي بينهما:‏k من المواقع،‏،nX ( n − k)X ( n − k)X (n)X (n)، فيمكننا أنX ( n)= g[X ( n − k)];k = 1,2,3,...(1)والشكل (٦a)يوضح شكل الانتشار بينالمتحققة قيد الدراسة.‏ أما الشكل (٦b)(n) X وللقيمفيوضح شكل الانتشار بينk=1,2,3,4X (n)k=250,500,750,1000k) X ( n − ولمشاهداتللقيمللمشاهدات نفسها.‏ وكما هو واضح من الأشكال فهناك انتقالات بين٣١٨


مجلة الرافدين لعلوم الحاسوب والرياضيات لسنة ٢٠١٠وقائع المؤتمر العلمي الثالث في تقانة المعلومات <strong>29</strong>‐30/Nov./2010كلية علوم الحاسوب والرياضيات – جامعة الموصلجميع القواعد النيتروجينية الأربعة ‏.من ناحية أخرى فمن الواضح أن العلاقة بين هذه القواعد تبدوذات تركيب ذو طبيعة معقدة يختلف باختلاف قيمة.k. ٢٠٠الشكل (٦):أربعة متحققات مشاهدة من هذه المتتابعة طول كل منهاX ( n − k) و X (n)الشكل (٦a):شكل الانتشار بينللقيم1,2,3,4=k لمشاهدات سلسلةالقواعد النيتروجينية للحامض النووي.‏٣١٩


مجلة الرافدين لعلوم الحاسوب والرياضيات لسنة ٢٠١٠وقائع المؤتمر العلمي الثالث في تقانة المعلومات <strong>29</strong>‐30/Nov./2010كلية علوم الحاسوب والرياضيات – جامعة الموصلk=250,500,750,1000(٦b): الشكلشكل الانتشار بينX ( n − k) و X (n)لمشاهدات سلسلة القواعد النيتروجينية للحامض النووي.‏للقيمويمكن تطوير الفكرة السابقة لمحاولة دراسة العلاقة بين القاعدة النيتروجينية في الموقع nوقاعدتين نيتروجينيتين في موقعين آخرين وذلك بفرض أن هذه العلاقة على النحو الآتي:‏لقد تم إعداد برنامج خاص فيX ( n)= G[X ( n − kx),X ( n − ky)];kx,ky = 1,2,3,...(2)OneMATLAB(Dimensionalيقوم بتحويل المشاهدات ‏(وهي ذات بعد واحدإلى منظومة ثلاثية البعد Three Dimensional Arrayيبين (٧) والشكل .النتائج التي حصلنا عليها لقيم مختارة من و ، وهذه النتائج تتضمن رسم الشبكةMesh وكذلك السطح Surface الخاص والمقابل للقيم المختارة من والمعقدة بين مواقع القواعد النيتروجينية واضحة من خلال هذه الإشكال..إن العلاقة٣٢٠


مجلة الرافدين لعلوم الحاسوب والرياضيات لسنة ٢٠١٠وقائع المؤتمر العلمي الثالث في تقانة المعلومات <strong>29</strong>‐30/Nov./2010كلية علوم الحاسوب والرياضيات – جامعة الموصل.الشكل (٧):الشبكةوالسطح الخاص والمقابل للقيم المختارة منو:٢.٤ الارتباط الذاتي (ACF) Autocorrelation Function{ x1,x2,....,xT}تستخدم داله الارتباط الذاتي في تحليلمشاهداتالمتسلسلاتالزمنية.‏إذا كانتمشاهدات من متسلسلة زمنية معينة،‏ فأن داله الارتباط الذاتي يمكن تقديرها على النحو الأتي‏(الخياط:((٢٠١٠)٣٢١


مجلة الرافدين لعلوم الحاسوب والرياضيات لسنة ٢٠١٠وقائع المؤتمر العلمي الثالث في تقانة المعلومات <strong>29</strong>‐30/Nov./2010كلية علوم الحاسوب والرياضيات – جامعة الموصل∧ρ ( k)=(3)T −k∑t=1( xTt∑t=1−−− x)(xt−k− x);−2( x − x)tk= 1,2,3,...,( T −1)−إذ إن =معدل المشاهدات. x x TT∑t=1t/إن داله الارتباط الذاتي هي مقياسمنمجرد من الوحدات وتتراوح قيمه بينx ( n ± k)، ± 1x ( n ± k)+١قيمته منفأن ذلك يدل على أن هناك ترابطا طرديا قويا بينوفإذا اقتربت، وإذا-١فأن ذلك يدل على أن هناك ترابطا عكسيا قويا بين. وقيمتهاقتربتأما إذاكانت قيمة داله الارتباط الذاتي قريبة من الصفر،‏ فان هذا دليل على عشوائية المتسلسلة.‏ إن حديالثقة Confidence Limits لدالة الارتباط الذاتي عند مستوى المعنويةعشوائية المتسلسلة الزمنية هي%٥x(n)x(n). ±2Tوتحت فرضأن دراسة الارتباطρˆkCorrelationيعد احد الجوانب المهمة لدراسة العلاقة بين عناصر أيمتتابعة،‏ ويمكن انجاز ذلك من خلال ما يطلق عليه عادة اختبار العشوائيةTest of.Randomnessإن اختبار العشوائية يمكن انجازه بوساطة دالة الارتباط الذاتي المقدرة.‏ وتجدرالإشارة،‏ إلى أن العناصر الأكثر أهمية من دالة الارتباط الذاتي تكون لفترات الإبطاء الأولى،‏خاصة أول٢٠ قيمة.‏إن أهمية دالة الارتباط الذاتيلقيم المشاهدات تتناسب مع اقتراب قيمة k من نقطة الأصلالصفر كلما ازدادت أهميةثممن حيث الدلالة على الترابط الداخلي.k=0ρفكلما اقتربت قيمةk منρˆ.ˆρ kلذا فان أكثر قيمأهمية هي ρˆ kˆ1ρˆ 3على التوالي.‏ وعند إجراء اختبار للعشوائية فيجب أن تكون قيمجميعها داخل الفترةتليها من حيث الأهميةو و2ˆρ 3ˆρ 2ˆρ 12±Tتقعلكي تكون فرضيتنا لعشوائية المشاهدات مقبولة بمستوى معنوية٣٢٢


مجلة الرافدين لعلوم الحاسوب والرياضيات لسنة ٢٠١٠وقائع المؤتمر العلمي الثالث في تقانة المعلومات <strong>29</strong>‐30/Nov./2010كلية علوم الحاسوب والرياضيات – جامعة الموصلˆρ 3ˆρ 2.%٥أما إذا وقعت في الأقل أي منأو أو ρˆ 1عشوائية المشاهدات ت ُرفض حتى وان كانت جميع باقي قيمخارج الفترة± ، فان فرضية. ± 0.12Tρˆتقع داخل فترة الثقة. kلقد تم تقدير و رسم دالة الارتباط الذاتي لمشاهدات القواعد النيتروجينية للحامض النووي وذلكبالاستعانة بمن هذه الدالة.MATLABوالشكل(8) يوضح رسم أول٢٠ وأول ١٠٠وأول٥٠٠٠ قيمة.فكما هو واضح فأن الترابط الداخلي موجود في فترات الإبطاء القريبةوالمتوسطة والبعيدة.‏ من ناحية أخرى فأن هذا الترابط ليس بالمعنوية الكبيرة وفي الوقت نفسهليس بعدم المعنوية،‏ بل هو أشبة ما يكون بترابط على حافات المعنوية،‏ مما يؤكد العلاقة ذاتالخصوصية الخاصة بين مواقع القواعد النيتروجينية في شريط الحامض النووي قيد الدراسة.‏إن الخطيين المتوازيين الذين تنتشر حولهما قيم دالة الارتباط الذاتي يمثلان حدي الثقة بمستوى٥%، معنويةفكما هو واضح فأن بعضا من النقاط تقع داخل حدي الثقة والبعض الأخر يكونخارجها وبالقرب من حافاتها،كذلك لا توجد قيم لدالة الارتباط الذاتي تزيد عنكل هذايشير إلى أن هذه المشاهدات لا يمكن اعتبارها عشوائية وغير مترابطة مع بعضها البعض،‏ منناحية أخرى فلا يوجد ترابط قوي يمكن الاستناد علية لدراسة العلاقة بين مواقع هذه المشاهداتوهذا يؤكد من جديد تعقيد البنية التركيبية لهذه المشاهدات.‏،٢٠الشكل (8a):دالة الارتباط الذاتي لمشاهدات القواعد النيتروجينية للحامض النووي لأولقيمة.‏٣٢٣


مجلة الرافدين لعلوم الحاسوب والرياضيات لسنة ٢٠١٠وقائع المؤتمر العلمي الثالث في تقانة المعلومات <strong>29</strong>‐30/Nov./2010كلية علوم الحاسوب والرياضيات – جامعة الموصل١٠٠الشكل (8b):دالة الارتباط الذاتي لمشاهدات القواعد النيتروجينية للحامض النووي لأولقيمة.‏٥٠٠٠الشكلقيمة.‏:(8c)دالة الارتباط الذاتي لمشاهدات القواعد النيتروجينية للحامض النووي لأول.٣4 التحليل الطيفي :Spectral Analysis(١٠) الشكليوضح مقدر لدالة كثافة الطيف المعياريةNormalized Power SpectralDensity Function لمتتابعة الحامض النووي الرايبي منقوص الأوكسجين.‏ وقد تم استخدامالمقدر الآتي لهذا الغرض:(Chatfield [1980) ]f ( w)=1+2∑ ∧ρ cos( kwkp);2π− 2π≤ w ≤ 2π,wp=2πp;TTp = 1,2,..., .2(4)، M = [ 2 T وانوان M هي نقطة القطع ،Truncation Point وقد اختيرت لكي تكون ]القوسين ‏[]يعنيان إن يؤخذ الجزء الصحيح من المقدار المحصور بينهما.‏٣٢٤


مجلة الرافدين لعلوم الحاسوب والرياضيات لسنة ٢٠١٠وقائع المؤتمر العلمي الثالث في تقانة المعلومات <strong>29</strong>‐30/Nov./2010كلية علوم الحاسوب والرياضيات – جامعة الموصل(٩) الشكلالأوكسجين.‏: مقدر دالة كثافةالطيف المعيارية لمتتابعة الحامض النووي الرايبي منقوصنلاحظ من الرسم بأن الطاقة الموجودة في هذه المتتابعة تتوزع على مدى قصير يتراوح بين0.152 و‎0.166‎ دورة لكل ثانية ‏(هرتز).‏ أن عدم وجود قمة وحيدة منفردة في هذه الدالة الطيفيةيشير إلى عدم دورية هذه المتتابعة،‏ أي أنها متتابعة غير دورية.(Non Periodic)كما أن عدمثبات مستوى الطاقة عند قيمة معينة يؤكد عدم عشوائية هذه المتتابعة.‏ إن الشكل الذي حصلنا عليةللدالة الطيفية لمتتابعة DNA يعد خاصة بهذه المتتابعة ويشير إلى أن هذه المتتابعة تتمتع ببنيةتركيبة بالغة التعقيد خاصة بها.‏٤,٤ تقدير المرتبة :Estimation of Orderيعد تقدير مرتبة سلسلة ماركوف من المسائل بالغة الأهمية في التطبيقات الواقعية،‏ لما لها منعلاقة بذاكرة السلسلة التي تتحكم ببعد النموذج.‏ يقال للعملية التصادفيةt=0,1,2,…} {X t ; بأنهاسلسلة ماركوفية ذات مرتبة محدودة m، أو ذات ذاكرة حجمها ، m حيث أن m عدد صحيحموجب اكبر من الصفر،‏ إذا تحققت العلاقة الاحتمالية الآتية:(Finesso (1991))P = ( Xt+ 1= j | Xt= io, Xt−1 = i1,................................... )= PX ( = j, | X = i, X = i,..., X = i )(5)t+ 1 t o t−1 1 t−mm.{X t }،∀i∈S وان S={0,1,2,…,N} يمثل،حيث أن 0


مجلة الرافدين لعلوم الحاسوب والرياضيات لسنة ٢٠١٠وقائع المؤتمر العلمي الثالث في تقانة المعلومات <strong>29</strong>‐30/Nov./2010كلية علوم الحاسوب والرياضيات – جامعة الموصلويمكن تعريف المرتبة بأنها اقل عدد صحيح موجب ممكن لعدد الحالات السابقة المباشرة التيتعتمد عليها الحالة اللاحقة.‏فإذا ما اعتمد احتمال الحالة القادمة على m من الحالات السابقةمباشرة ً،‏ وكانت m اصغر عد صحيح موجب ممكن،‏ عندئذ فان mستمثلمرتبة سلسلة ماركوف،‏وبحيث تحقق العلاقة (٥).وقد تكون سلسلة ماركوف ذاتمرتبة صفرية‏(لا تمتلك ذاكرة)،‏ أيأنها عبارة عن سلسلة من المتغيرات العشوائية‏(أو الحالات)‏المستقلة عن بعضها البعض.‏لقد ظهرت في أواخر ستينيات وسبعينيات القرن العشرين معاييرللمعلومات تعالج مسالة تقديرShannonمرتبة سلسلة ماركوف.‏ومن هذه المعايير المستخدمة معيار شانون للمعلومات،Information Criterion ومعيار خطأ التنبؤ النهائي Final Prediction Error ويرمز لهAkaike's Information Criterion ويرمز لهاختصار ًا،FPE ومعيار معلومات اكاكياختصار ًا ،AIC ومعيار معلومات ببز Bayesian Information Criterion ويرمز لهAICاختصار ًا .BICوسوف يعتمد في هذا البحث معيارلتقديرمرتبة متتابعة ألحامض النوويمنقوص الأوكسجين .DNAإن هذا المعيار هو مقياس لانحرافات النموذج عن النموذج الحقيقي.‏،Minimum AIC Estimator والذيوان المرتبةالتيتقلل AIC تسمى بمقدر أدنى ،AICTMSEيرمز له اختصار ًا .MAICEفلو كانمعدل يمثلمجموع مربعات البواقي،‏ وكانيمثلحجم العينة المستخدمة،‏وpيمثل عدد معلمات النموذج،‏ فأن قيمةAIC العددية يمكن حسابها من:(Priestley(1981)المعادلة الآتية )AIC(p)=Tln(MSE)+2p.(٦)إن الصيغة المكافئة لمعيار AICفي مجال تقديرمراتب سلاسل ماركوف تكون على النحوالأتي) الكسو :((٢٠٠٥)R( k) =kηL-2(degrees of freedom)(٧): إذ إن٣٢٦


k L k k + 1 L−1Lمجلة الرافدين لعلوم الحاسوب والرياضيات لسنة ٢٠١٠وقائع المؤتمر العلمي الثالث في تقانة المعلومات <strong>29</strong>‐30/Nov./2010كلية علوم الحاسوب والرياضيات – جامعة الموصلη = η + ... + η⎫⎪2 2=∇ kk + 2+ ... +∇mL+1⎪ ⎬=∇ kL+ 1+ ... +∇kk + 1(-1 ≤ k < L) ⎪-2log λk, k+ 12log λk + 1, k + 22... 2log λL−1, L⎪= − − − ⎭(٨)Degrees of.Difference Operatorوأن∇ تمثل عامل الفرقFreedom فيمكن حسابها من الصيغة الآتيةأما عدد درجات الحرية:(Tong ,1975)Degrees of freedom =∇N− ∇NL+1 k +1(9)L+ 1 L k + 1≡ N − N − N + Nk.حيث أن N تمثل عدد الحالات الممكنة للسلسلةفي فضاء العينةمن المعروف جيدا أن معيار AIC يجهز بمقدر غير متسق Not Consistent Estimateللمرتبة الحقيقية للنموذج ، خاصة عندما يكون حجم المشاهدات كبير.‏ وقد اقترح الباحثان(1993) Davis Brockwell and تصحيحا لمعيار AIC وأوصيا باستخدامه عندما يكون حجمالمشاهدات كبير .إن معيار AIC المصحح يرمز له ويحسب من العلاقة الآتية: ( Brockwell and Davis (1991))معياري AIC( 10)لقد تم تطبيقالأوكسجين وللرتبو المعدلة على مشاهدات الحامض النووي الرايبي منقوص0,1,2=k، والنتائج مبينة في الجدول الأتي.‏ ونشير إلى أن تطبيق هذهالطريقة على رتب أعلى يتطلب تكوين مصفوفات كبيرة جدا.‏ فمثلا عندما تكون 3=k فإننا سوفk=4نحتاج إلى تكوين مصفوفة ذات مرتبة ٢٥٦*٢٥٦ .تكوين مصفوفة ذات مرتبةأما عندما تكونفأنة سوف يتطلب.١٠٢٤ *١٠٢٤٣٢٧


مجلة الرافدين لعلوم الحاسوب والرياضيات لسنة ٢٠١٠وقائع المؤتمر العلمي الثالث في تقانة المعلومات <strong>29</strong>‐30/Nov./2010كلية علوم الحاسوب والرياضيات – جامعة الموصلالجدول(‏‎١‎‏):‏ تقديرمرتبة متتابعة ألحامض النووي منقوص الأوكسجين.نلاحظ أن هناك هبوط قوي فيقيمk Degrees of freedom R(k)0 45 351.2360 351.23621 180 147.1142 147.11492 144 53.2684 53.2699و AICمما يؤكد الاعتمادية بين مواقع مرتبةمتتابعة ألحامض النووي منقوص الأوكسجين أل . DNA مع ذلك فنلاحظ بان هذه القيممستمرة بالهبوط مما يشير إلى أن المرتبة الحقيقية لهذه المتتابعة هي أكثر منالصعوبات٢، إلا أنفي تكوين المصفوفات لم تمكننا من الوصول إلى المرتبة الحقيقية.‏ ولعل استخدامالتقنيات الذكائية يكون احد الوسائل التي توصل إلى المرتبة الحقيقية،‏ ولكن هذا خارج مجالبحثنا.‏٥. الاستنتاجات والتوصيات:‏تضمنت هذه الورقة البحثية مقدمة عامة عن المعلوماتيةالتطبيقية.‏ ثم تم تسليط الأضواء على مشاهدات حقيقيةالأوكسجين DNAالحيوية،‏للإنسان،‏ وا ُستخدمت بعض المعالجات الرياضيةهذه المشاهدات والتعرف على بعض سماتها وخصائصها.‏التي أجريت في هذه الورقة البحثيةمتتابعة معقدة البنية التركيبية،‏ ومترابطة مع بعضها البعض وحتىالأهمية الكبيرة للمتتابعات الزمانية لسلاسلعالمنا المعاصر من جهة،‏إلى التوصيةوأهدافها ومضامينها ومجالاتهاللحامض النووي الرايبي منقوصوالإحصائيةلغرض تحليلوالاستنتاج الواضح بعد كل التحليلاتهو أن هذه المتتابعة تتمتع بخصائص خاصة قل نظيرها:‏ فهيوهذا التركيب البنيوي المعقدالفترات علىالبعيدة المدى.‏ إنالحامض النووي الرايبي منقوص الأوكسجين فيلهذه المتتابعات من جهة أخرى،‏ يدعوبتوجه بحثي اكبر،‏ وبالتعاون مع التخصصات ذوات العلاقة،‏ باتجاه لمتتابعاتالزمانية لسلاسل الحامض النووي الرايبي منقوص الأوكسجين،‏ واستخداما التقنيات والأدواتالعلمية الحديثة،‏ بما في ذلكالمتتابعة بموضوعية اكبر وعمق أكثر.‏ كماالتقنيات الذكائية أو التقنيات الحاسوبية الأخرى،‏أن الأهمية البالغة للمعلوماتيةالضوء على بعض جوانبها في هذه الورقة البحثية،‏ تدعونا للتوصيةجامعة الموصل للمعلوماتيةالحيوية يتضمنالحيوية،‏ وكمالدراسة هذهسلطنابإنشاء مركز تخصصي فيمتخصصين بتخصصات علوم الحياة والطب وطبالأسنان والطب البيطري والزراعة،‏ إضافة إلى تخصصات الحاسوب والرياضيات والإحصاء.‏٣٢٨


مجلة الرافدين لعلوم الحاسوب والرياضيات لسنة ٢٠١٠وقائع المؤتمر العلمي الثالث في تقانة المعلومات <strong>29</strong>‐30/Nov./2010كلية علوم الحاسوب والرياضيات – جامعة الموصلالمصادرالخياط ، باسل يونس ذنون (٢٠١٠). ‏"النمذجة الماركوفية مع تطبيقات عملية"،‏ دارالكتب للطباعة والنشر،‏ الموصل.‏الكسو ‏،ابتهاج عبد الحميد ‏(‏‎٢٠٠٥‎‏)."استخدام الشبكات العصبية في تقدير رتب سلاسلماركوف مع التطبيق على سلسلة جبل بطمة في محافظة الموصل ‏"،أطروحة دكتوراهغير منشورة ‏،كلية علوم الحاسبات والرياضيات ، جامعة الموصل.‏قاري،‏ سمير بن حسن محمد و جبر،‏ جميل فوزي جميل (٢٠١٠). " مدخل والى الوراثةالبشرية"‏ دار الفكر للطباعة والنشر مكة المكرمة.،.١.٢.٣تطبيق التقنيات الذكائية في المعلوماتية الحيوية "،قاسم،‏ عمر صابرأطروحة دكتوراه غير منشورة،‏ كلية علوم الحاسبات والرياضيات،‏ جامعة الموصل.‏".(٢٠٠٩)5. Brockwell,R.J. and Davis, R.A. (1991). “Time Series: Theory andMethods”,Springer, New York.6. Calvino, M., Gomez, N. and Mingo, L.F.,(2007), “DNA Simulation ofGenetic Algorithms: Fitness Computation”, International Journal,Information Theories & Applications, Vol.14.7. Chatfield, C (1980):”The Analysis of Time Series: AnIntroduction”, Chapman and Hall Ltd, London.8. Finesso, Lorenzo. ,(1991): “Consistent estimation of the order formarkov and hidden markov chains”, Ph. D. , Dissertation..٤9. http://www.ncbi.nlm.nih.gov/Education/BLASTinfo/information3.html10. Lindblad-Toh K, et al. (2005). "Genome sequence, comparativeanalysis and haplotype structure of the domestic dog .".Nature ٤٣٨. ١٩–٨٠٣ :(٧٠٦٩)11. Meyer ,S. C.(2009).“Signature in the Cell: DNA and the Evidencefor Intelligent Design", HarperColline_ books, ISBN 978-0-06-189421-3, USP12. Priestley, M. B. ,(1981): “Spectral analysis and time series”, AcademicPress, INC. ,(London) LTD.13. Shoemaker, J.S. and Lin, S.M., (2005), “Methods of Microarray DataAnalysis IV”, Springer Science + Business Media, Inc.14. Tong, H. ,(1975): “Determination of the order of a Markov chain byusing Akaike’s information criterion”, J. Appl. Prob. 12, 488-497.٣٢٩

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!