معلومة

8.2: مثال على جينات متعددة تؤثر على شخصية واحدة - علم الأحياء

8.2: مثال على جينات متعددة تؤثر على شخصية واحدة - علم الأحياء


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

علم الوراثة القط الفراء

يمكن تفسير معظم جوانب أنماط الفراء للقطط الشائعة بفعل عدد قليل من الجينات (الجدول 6-2). قد تقوم الجينات الأخرى ، غير الموصوفة هنا ، بتعديل هذه السمات بشكل أكبر وتفسير الأنماط الظاهرية التي تظهر في القطط العتابية وفي السلالات الأكثر غرابة ، مثل السيامي.

على سبيل المثال ، ملف X- مرتبط البرتقالي الجين له شكلين أليليين. ال اا ينتج الأليل فروًا برتقاليًا ، في حين أن اب تنتج الأليلات فروًا غير برتقالي (غالبًا أسود). لاحظ مع ذلك ، أنه بسبب تعطيل كروموسوم X فإن النتيجة هي الفسيفساء في التعبير. في اا / اب تظهر بقع متغايرة الزيجوت الأنثوية باللونين الأسود والبرتقالي ، والتي تنتج نمط قوقعة السلحفاة (الشكل 6-13 أ ، ب). هذا مثال نادر على الهيمنة المشتركة حيث يمكن رؤية النمط الظاهري لكلا الأليلين. لاحظ أن القطة الموجودة في الجزء (أ) لها فرو قصير مقارنةً بالقط في الجزء (ب) ؛ الأليلات المتنحية في موضع مستقل (لتر / لتر) تنتج طويلاً (ليرة لبنانية) وليس قصير (L_) الفراء.

أليلات يميع يخفف يؤثر الجين على شدة التصبغ بغض النظر عما إذا كان هذا التصبغ ناتجًا عن صبغة سوداء أو برتقالية. يُظهر الجزء C قطة سوداء بها أليل مهيمن واحد على الأقل يميع يخفف (د_) ، على عكس القطة في D ، وهي رمادية وليست سوداء ، لأنها تحتوي على ي الطراز العرقى.

يتم توضيح الإبستاس بواسطة أليل واحد فقط من الجينات في Table ( PageIndex {2} ). أليل واحد مهيمن لـ اخفاء بيضاء (دبليو) يمنع التطور الطبيعي للخلايا الصباغية (الخلايا المنتجة للصباغ). لذلك ، القطط ذات التركيب الوراثي (W_) سيكون لها فراء أبيض بالكامل بغض النظر عن التركيب الوراثي في البرتقالي أو يميع يخفف loci (الجزء هـ). على الرغم من أن هذا المكان ينتج اللون الأبيض ، W_ ليس هو نفسه المهق ، وهو نمط ظاهري أكثر ندرة يسببه طفرات في جينات أخرى. يمكن تمييز القطط البيضاء بوجود عيون حمراء W_ القطط لها عيون غير حمراء.

اكتشاف بيبالد هو حدوث بقع من الفراء الأبيض. تختلف هذه البقع في الحجم لأسباب عديدة ، بما في ذلك التركيب الوراثي. القطط متماثلة اللواقح ذات التركيب الوراثي ss لا يوجد أي بقع بيضاء بينما القطط من التركيب الوراثي SS و SS لديها بقع بيضاء ، وتميل متماثلة الزيجوت إلى الحصول على نسبة أكبر من الفراء الأبيض من متغايرة الزيجوت (الجزء و). مزيج من اكتشاف piebald وزخرفة قذيفة السلحفاة ينتج a كاليكو القط، والتي تحتوي على بقع منفصلة من الفراء البرتقالي والأسود والأبيض.

الجدول ( PageIndex {2} ): ملخص للأنماط الظاهرية والأنماط الجينية لفراء القطط.
سمةالنمط الظاهريالطراز العرقىتعليقات
طول الفراءقصيرةLL أو ليرة لبنانيةإل مهيمن تمامًا
طويلليرة لبنانية
كل الفراء الأبيض (غير ألبينو)100٪ فرو أبيضWW أو رإذا كانت القطة ذات عيون حمراء فهي ألبينو ، لا W_. دبليو هو معرفي لجميع جينات لون الفراء الأخرى ؛ إذا كان القط W_، لا يمكن استنتاج الأنماط الجينية لأي جينات أخرى للون الفراء.
رطب
اكتشاف بيبالد> 50٪ بقع بيضاء (لكن ليس 100٪)SSس هو المسيطر بشكل غير كامل ويظهر تعبيرية متغيرة
<50٪ بقع بيضاءSS
لا بقع بيضاءss
الفراء البرتقاليكل الفراء البرتقاليXاXا أو Xاصا مرتبط بـ X.
تلون قوقعة السلحفاةXاXب
لا يوجد فراء برتقالي (غالبًا أسود)XبXب أو Xبص
تصبغ مخففتصبغ شديدد أو يد مهيمن تمامًا
تمييع التصبغ (على سبيل المثال رمادي بدلاً من أسود ، كريم بدلاً من برتقالي ، بني فاتح بدلاً من بني)ي
مبرقعنمط تاببيAA أو أأهذا هو تبسيط النمط الظاهري tabby ، والذي يتضمن جينات متعددة
تلوين صلبأأ
الجنسأنثىXX
الذكرس ص

مراجع

  1. مقتبس fروم كريستنسن (2000) علم الوراثة 155: 999-1004)

كان مندل قادرًا على تنفيذ عمله بطريقة قابلة للتفسير لأنه أخذ ملاحظات دقيقة ، وقام بإحصاءات دقيقة ، واختار السمات التي أظهرت نمط تعبير مهيمن أو متنحي واضح. في الواقع ، الأليلات التي تظهر أنماط تعبير بسيطة سائدة أو متنحية تسمى أحيانًا & quot؛ سمات مندل & quot ؛ ومع ذلك ، فإن القليل من الأليلات تتصرف بهذه الطريقة المندلية البسيطة. سوف يستكشف هذا البرنامج التعليمي أنماط تعبير أكثر تعقيدًا. بنهاية هذا البرنامج التعليمي ، يجب أن يكون لديك فهم أساسي لما يلي:

  • الجينات ذات الأليلات المتعددة
  • التمييز بين أنواع الهيمنة الثلاثة
  • كيف يمكن أن يكون للجينات تأثيرات متعددة
  • كيف يمكن أن تؤثر الجينات على التعبير عن الجينات الأخرى
  • لماذا يتم التحكم في بعض الشخصيات بواسطة أكثر من جين واحد

سيادة غير تامة

في تجارب مندل ، بدا النسل دائمًا كواحد من نمطين ظاهريين بسبب هيمنة كاملة من أليل واحد على الآخر للحروف التي لها سمتان. هذا ليس هو الحال دائمًا لأن بعض الجينات تظهر سيادة غير تامة. في هذا النوع من علاقة الهيمنة بين أليلين ، يظهر الأفراد غير المتجانسين نمطًا ظاهريًا وسيطًا بين الأفراد المتماثلين. . على سبيل المثال ، يصور الشكل 1 نتيجة تهجين بين أنف العجل بزهور حمراء وواحد مع أزهار بيضاء النسل في F1 لها أزهار وردية. في هذه الحالة ، لا يكون أي من أليلات لون الزهرة هو المسيطر تمامًا على الآخر. لذلك ، فإن الأفراد غير المتجانسين لديهم نمط ظاهري على عكس أولئك الذين لديهم مجموعة من الأليلات المتماثلة اللواقح.


الشكل 1. هيمنة غير كاملة في لون أنف العجل. (اضغط على الصورة لتكبيرها).

كما هو موضح في الشكل 1 ، فإن مربع Punnett لهذا الصليب يشبه أي تقاطع أحادي الهجين آخر. ومع ذلك ، فإن نسبة الأنماط الظاهرية في F2 الجيل ليس 3: 1 (سائد: متنحي) ، كما يُرى مع الأليلات السائدة تمامًا ، بل نسبة 1: 2: 1 من الأحمر: الوردي: الزهور البيضاء. في هذا المثال يتم تمثيل الأليلات بشكل مختلف عن الأمثلة السابقة. نظرًا لأن أليلًا من الأليل لا يهيمن على الآخر ، فإن استخدام الأحرف الكبيرة والصغيرة من نفس الحرف ليس مناسبًا. في هذا المثال ، تتم الإشارة إلى الحرف (لون الزهرة) بحرف (ج) ، والأليلات التي تشفر السمة (بيضاء أو حمراء) مدرجة كأحرف منخفضة (كلاهما كبير لأن أيًا منهما لا يهيمن على الآخر). قد ترى تمثيلات رمزية أخرى للهيمنة غير المكتملة ، لكن لا تدع هذا يربكك. الشيء المهم الذي يجب معرفته هو أن بعض الجينات يتم التعبير عنها بطريقة سائدة غير مكتملة.

في موقع الويب التالي ، ابحث عن الإجابة الصحيحة لأسئلة الاختيار من متعدد أحادي الهجين أو ثنائي الهجين. حل كل مشكلة لنفسك. لعرض شرح للمشكلة ، حدد الزر & quotTUTORIAL & quot. بعد عرض الإجابة الصحيحة ، أغلق مجموعة مشاكل أحادية الهجين أو نافذة تقاطع ثنائي الهجين للعودة إلى هذه الصفحة. (ملاحظة: هذه المواقع هي جزء من مجموعات مشاكل الهجين أحادي الهجين ومزدوجة الهجين التي يقدمها مشروع علم الأحياء بجامعة أريزونا.)

المشكلة 9: الهيمنة غير الكاملة - هذه المشكلة جزء من مجموعة مشاكل الهجين الأحادي.

المشكلة 10: اختفاء الأنماط الظاهرية الأبوية في الجيل F1 - هذه المشكلة أيضًا جزء من مجموعة مشاكل التهجين أحادي الهجين.

المشكلة 11: الهيمنة غير الكاملة في تهجين ثنائي الهجين - هذه المشكلة جزء من مجموعة مشاكل التهجين ثنائي الهجين.


الميراث البسيط

يصف الميراث البسيط الخصائص المظهرية التي تظهر كواحد من شكلين. قد يتم تحديدها بواسطة جين واحد فقط أو أكثر من جين واحد ، لكن السمة الموروثة إما موجودة أو لا. من الأمثلة على الوراثة البسيطة للأنماط الظاهرية السائدة متلازمة آشو (بمعنى أن وميض الكاميرا يجعلك تعطس) ، والذقن المشقوق ، وقصر النظر المبكر (قصر النظر في مرحلة الطفولة) ، وإصبع الخنصر المنحني ، ودمامل الوجه ، وإمساك اليد (الإبهام الأيسر في الأعلى) ) ، وشعر المفصل الأوسط من أصابعك ، والقدرة على لف لسانك في شكل "O".


محتويات

تتمثل الطريقة العامة عند حساب محاذاة التسلسل المتعددة في استخدام الرسوم البيانية لتحديد جميع المحاذاة المختلفة. عند العثور على محاذاة عبر الرسم البياني ، أ محاذاة كاملة يتم إنشاؤه في رسم بياني مرجح يحتوي على مجموعة من الرؤوس ومجموعة من الحواف. كل حافة من حواف الرسم البياني لها وزن يعتمد على إرشادية معينة تساعد في تسجيل كل منها انتقام أو مجموعة فرعية من الرسم البياني الأصلي.

تتبع المحاذاة تحرير

عند تحديد أفضل المحاذاة المناسبة لكل MSA ، أ أثر عادة ما يتم إنشاؤه. التتبع هو مجموعة من أدرك، أو الرؤوس المقابلة والمحاذاة التي لها وزن محدد بناءً على الحواف المحددة بين الرؤوس المتناظرة. عند اختيار آثار لمجموعة من المتواليات ، من الضروري اختيار أثر بأقصى وزن للحصول على أفضل محاذاة للتسلسلات.

هناك العديد من طرق المحاذاة المستخدمة في تسلسل متعدد لتعظيم الدرجات وصحة المحاذاة. يعتمد كل منها عادة على إرشادية معينة مع نظرة ثاقبة للعملية التطورية. يحاول معظمهم تكرار التطور للحصول على محاذاة أكثر واقعية ممكنة للتنبؤ بالعلاقات بين التسلسلات بشكل أفضل.

البرمجة الديناميكية تحرير

تستخدم الطريقة المباشرة لإنتاج MSA تقنية البرمجة الديناميكية لتحديد حل المحاذاة الأمثل عالميًا. بالنسبة للبروتينات ، تتضمن هذه الطريقة عادةً مجموعتين من المعلمات: جزاء الفجوة ومصفوفة الاستبدال التي تحدد الدرجات أو الاحتمالات لمحاذاة كل زوج محتمل من الأحماض الأمينية بناءً على تشابه الخصائص الكيميائية للأحماض الأمينية والاحتمال التطوري لـ طفره. بالنسبة لتسلسلات النوكليوتيدات ، يتم استخدام عقوبة فجوة مماثلة ، ولكن تعتبر مصفوفة استبدال أبسط بكثير ، حيث يتم اعتبار التطابقات المتطابقة وعدم التطابق فقط ، نموذجيًا. قد تكون الدرجات في مصفوفة الاستبدال إما إيجابية أو مزيجًا من الإيجابية والسلبية في حالة المحاذاة العالمية ، ولكن يجب أن تكون إيجابية وسلبية في حالة المحاذاة المحلية. [4]

ل ن التسلسلات الفردية ، تتطلب الطريقة الساذجة بناء ن- مكافئ الأبعاد للمصفوفة المتكونة في محاذاة التسلسل الزوجي القياسي. وبالتالي فإن مساحة البحث تزداد أضعافا مضاعفة مع الزيادة ن كما أنه يعتمد بشدة على طول التسلسل. معبراً عنها بترميز O الكبير الذي يشيع استخدامه لقياس التعقيد الحسابي ، يأخذ MSA ساذجًا O (طول Nseqs) وقت الإنتاج. للعثور على أفضل العالمية ل ن لقد ثبت أن التسلسل بهذه الطريقة يمثل مشكلة NP كاملة. [5] [6] [7] في عام 1989 ، استنادًا إلى خوارزمية Carrillo-Lipman ، [8] قدم Altschul طريقة عملية تستخدم المحاذاة الزوجية لتقييد مساحة البحث ذات البعد n. [9] في هذا النهج ، يتم تنفيذ محاذاة البرمجة الديناميكية الزوجية على كل زوج من التسلسلات في مجموعة الاستعلام ، ويتم البحث فقط عن المسافة القريبة من تقاطع الأبعاد n لهذه المحاذاة عن المحاذاة n-way. يعمل برنامج MSA على تحسين مجموع كل أزواج الأحرف في كل موضع في المحاذاة (ما يسمى مجموع الزوج النتيجة) وتم تنفيذها في برنامج برمجي لإنشاء محاذاة تسلسل متعددة. [10] في عام 2019 ، أظهر كل من Hosseininasab و van Hoeve أنه باستخدام مخططات القرار ، يمكن نمذجة MSA في تعقيد الفضاء متعدد الحدود. [3]

تعديل بناء المحاذاة التقدمية

يستخدم النهج الأكثر استخدامًا لمحاذاة التسلسل المتعدد بحثًا إرشاديًا يُعرف باسم التقنية التقدمية (تُعرف أيضًا بالطريقة الهرمية أو طريقة الشجرة) التي طورها Da-Fei Feng و Doolittle في عام 1987. [11] المحاذاة التقدمية تبني MSA نهائي من خلال الجمع تبدأ المحاذاة الزوجية مع الزوج الأكثر تشابهًا وتتقدم إلى الزوج الأكثر ارتباطًا. تتطلب جميع طرق المحاذاة التدريجية مرحلتين: المرحلة الأولى التي يتم فيها تمثيل العلاقات بين التسلسلات كشجرة ، تسمى دليل الشجرة، والخطوة الثانية التي يتم فيها بناء MSA عن طريق إضافة التسلسلات بالتتابع إلى MSA المتزايد وفقًا لشجرة الدليل. الأولي دليل الشجرة يتم تحديده من خلال طريقة تجميع فعالة مثل الانضمام إلى الجوار أو UPGMA ، وقد يستخدم مسافات بناءً على عدد التسلسلات الفرعية المتطابقة المكونة من حرفين (كما هو الحال في FASTA بدلاً من محاذاة البرمجة الديناميكية). [12]

المحاذاة التقدمية ليست مضمونة لتكون مثالية على مستوى العالم. المشكلة الأساسية هي أنه عند حدوث أخطاء في أي مرحلة من مراحل نمو MSA ، يتم نشر هذه الأخطاء حتى النتيجة النهائية. الأداء سيئ أيضًا بشكل خاص عندما تكون جميع التسلسلات في المجموعة مرتبطة بشكل بعيد. تقوم معظم الطرق التقدمية الحديثة بتعديل وظيفة التسجيل الخاصة بها بوظيفة ترجيح ثانوية تعين عوامل القياس لأعضاء فرديين في الاستعلام تم تعيينه بطريقة غير خطية بناءً على مسافة التطور الخاصة بهم من أقرب جيرانهم. هذا يصحح الاختيار غير العشوائي للتسلسلات المعطاة لبرنامج المحاذاة. [12]

تعتبر طرق المحاذاة التدريجية فعالة بدرجة كافية للتنفيذ على نطاق واسع للعديد من التسلسلات (من 100 إلى 1000). تتوفر خدمات المحاذاة التقدمية بشكل شائع على خوادم الويب التي يمكن الوصول إليها بشكل عام ، لذلك لا يحتاج المستخدمون إلى تثبيت التطبيقات محل الاهتمام محليًا. كانت أكثر طرق المحاذاة التقدمية شيوعًا هي عائلة Clustal ، [13] وخاصة المتغير الموزون ClustalW [14] الذي يتم توفير الوصول إليه من خلال عدد كبير من بوابات الويب بما في ذلك GenomeNet و EBI و EMBNet. يمكن أن تختلف البوابات أو التطبيقات المختلفة في واجهة المستخدم وإتاحة الوصول إلى معلمات مختلفة للمستخدم. يستخدم ClustalW على نطاق واسع لبناء شجرة النشوء والتطور ، على الرغم من تحذيرات المؤلف الصريحة بأنه لا ينبغي استخدام المحاذاة غير المحررة في مثل هذه الدراسات وكمدخلات لتنبؤ بنية البروتين عن طريق نمذجة التماثل. الإصدار الحالي من عائلة Clustal هو ClustalW2. أعلن EMBL-EBI أن CLustalW2 ستنتهي صلاحيته في أغسطس 2015. يوصون Clustal Omega الذي يعمل على أساس أشجار التوجيه المصنفة وتقنيات ملف تعريف HMM لمحاذاة البروتين. أنها توفر أدوات MSA مختلفة لمحاذاة الحمض النووي التقدمي. واحد منهم هو MAFFT (المحاذاة المتعددة باستخدام تحويل فورييه السريع). [15]

هناك طريقة أخرى للمحاذاة التقدمية الشائعة تسمى T-Coffee [16] وهي أبطأ من Clustal ومشتقاتها ولكنها عمومًا تنتج محاذاة أكثر دقة لمجموعات التسلسل ذات الصلة البعيدة. يحسب T-Coffee المحاذاة الزوجية من خلال الجمع بين المحاذاة المباشرة للزوج مع المحاذاة غير المباشرة التي تحاذي كل تسلسل للزوج إلى تسلسل ثالث. يستخدم الإخراج من Clustal بالإضافة إلى برنامج محاذاة محلي آخر LALIGN ، والذي يجد مناطق متعددة من المحاذاة المحلية بين تسلسلين. يتم استخدام المحاذاة الناتجة وشجرة النشوء والتطور كدليل لإنتاج عوامل ترجيح جديدة وأكثر دقة.

نظرًا لأن الطرق التقدمية هي أساليب استدلالية غير مضمونة لتتقارب مع المستوى الأمثل العالمي ، فقد يكون من الصعب تقييم جودة المحاذاة وقد تكون أهميتها البيولوجية الحقيقية غامضة. تم تنفيذ طريقة شبه تقدمية تعمل على تحسين جودة المحاذاة ولا تستخدم توجيهات ضياع أثناء التشغيل في وقت متعدد الحدود في برنامج PSAlign. [17]

الطرق التكرارية تحرير

يتم تصنيف مجموعة من الأساليب لإنتاج MSA مع تقليل الأخطاء المتأصلة في الطرق التقدمية على أنها "تكرارية" لأنها تعمل بشكل مشابه للطرق التقدمية ولكنها تعيد تنظيم التسلسلات الأولية بشكل متكرر بالإضافة إلى إضافة تسلسلات جديدة إلى MSA المتزايد. أحد أسباب اعتماد الطرق التقدمية بشدة على محاذاة أولية عالية الجودة هو حقيقة أن هذه المحاذاة يتم دمجها دائمًا في النتيجة النهائية - أي بمجرد محاذاة التسلسل في MSA ، لا يتم النظر في محاذاة أخرى. هذا التقريب يحسن الكفاءة على حساب الدقة. على النقيض من ذلك ، يمكن أن تعود الطرق التكرارية إلى المحاذاة الزوجية المحسوبة مسبقًا أو MSA الفرعية التي تتضمن مجموعات فرعية من تسلسل الاستعلام كوسيلة لتحسين وظيفة الهدف العامة مثل العثور على درجة محاذاة عالية الجودة. [12]

تم تنفيذ مجموعة متنوعة من طرق التكرار المختلفة بمهارة وإتاحتها في مراجعات حزم البرامج والمقارنات كانت مفيدة ولكنها امتنع بشكل عام عن اختيار تقنية "أفضل". [18] حزمة البرامج PRRN / PRRP تستخدم خوارزمية لتسلق التلال لتحسين درجة محاذاة MSA [19] وتصحح بشكل متكرر كلاً من أوزان المحاذاة والمناطق المتباعدة محليًا أو "المنحدرة" في منطقة MSA المتزايدة. [12] أداء PRRP أفضل عند تنقية محاذاة تم إنشاؤها مسبقًا بطريقة أسرع. [12]

برنامج تكراري آخر ، DIALIGN ، يتخذ نهجًا غير معتاد للتركيز بشكل ضيق على المحاذاة المحلية بين المقاطع الفرعية أو الزخارف المتسلسلة دون إدخال عقوبة الفجوة. [20] ثم يتم تحقيق محاذاة الأشكال الفردية بتمثيل مصفوفة مشابه لمخطط مصفوفة نقطية في محاذاة زوجية. يتم تنفيذ طريقة بديلة تستخدم محاذاة محلية سريعة كنقاط ربط أو "بذور" لإجراء محاذاة عالمية أبطأ في مجموعة CHAOS / DIALIGN. [20]

هناك طريقة ثالثة شائعة قائمة على التكرار تسمى MUSCLE (محاذاة تسلسل متعدد حسب توقع السجل) تعمل على تحسين الطرق التقدمية باستخدام قياس مسافة أكثر دقة لتقييم ارتباط تسلسلين. [21] يتم تحديث مقياس المسافة بين مراحل التكرار (على الرغم من أنه في شكله الأصلي ، احتوى MUSCLE على 2-3 تكرارات فقط اعتمادًا على ما إذا كان قد تم تمكين الصقل).

طرق الإجماع تحرير

تحاول طرق الإجماع العثور على المحاذاة المثلى للتسلسل المتعدد بالنظر إلى محاذاة مختلفة متعددة لنفس مجموعة التسلسلات. هناك طريقتان شائعتا الإجماع ، M-COFFEE و MergeAlign. [22] تستخدم M-COFFEE محاذاة تسلسلية متعددة تم إنشاؤها بواسطة سبع طرق مختلفة لتوليد محاذاة إجماع. MergeAlign قادر على إنشاء محاذاة إجماع من أي عدد من محاذاة الإدخال التي تم إنشاؤها باستخدام نماذج مختلفة لتطور التسلسل أو طرق مختلفة لمحاذاة التسلسل المتعدد. الخيار الافتراضي لـ MergeAlign هو استنتاج توافق إجماع باستخدام المحاذاة التي تم إنشاؤها باستخدام 91 نموذجًا مختلفًا لتطور تسلسل البروتين.

نماذج ماركوف المخفية تحرير

نماذج ماركوف المخفية هي نماذج احتمالية يمكنها تعيين الاحتمالات لجميع المجموعات الممكنة من الفجوات والمطابقات وحالات عدم التطابق لتحديد MSA الأكثر احتمالية أو مجموعة MSA الممكنة. يمكن أن تنتج HMMs ناتجًا واحدًا يحرز أعلى الدرجات ، ولكن يمكنها أيضًا إنشاء مجموعة من المحاذاة المحتملة التي يمكن بعد ذلك تقييمها من حيث الأهمية البيولوجية. يمكن لـ HMMs إنتاج محاذاة عالمية ومحلية. على الرغم من أن الأساليب المستندة إلى HMM قد تم تطويرها مؤخرًا نسبيًا ، إلا أنها توفر تحسينات كبيرة في السرعة الحسابية ، خاصة بالنسبة للتسلسلات التي تحتوي على مناطق متداخلة. [12]

تعمل الطرق النموذجية المستندة إلى HMM من خلال تمثيل MSA كشكل من أشكال الرسم البياني غير الدوري الموجه المعروف باسم الرسم البياني ذي الترتيب الجزئي ، والذي يتكون من سلسلة من العقد التي تمثل الإدخالات المحتملة في أعمدة MSA. في هذا التمثيل ، يتم ترميز العمود الذي يتم الاحتفاظ به تمامًا (أي أن جميع التسلسلات في MSA تشترك في حرف معين في موضع معين) كعقدة واحدة مع العديد من الاتصالات الصادرة بقدر ما توجد أحرف محتملة في العمود التالي من المحاذاة. من حيث نموذج ماركوف المخفي النموذجي ، فإن الحالات الملاحظة هي أعمدة المحاذاة الفردية وتمثل الحالات "المخفية" تسلسل الأجداد المفترض الذي من المفترض أن تنحدر منه التسلسلات في مجموعة الاستعلام. يتم استخدام متغير بحث فعال لطريقة البرمجة الديناميكية ، والمعروف باسم خوارزمية Viterbi ، بشكل عام لمحاذاة MSA المتزايد على التوالي مع التسلسل التالي في مجموعة الاستعلام لإنتاج MSA جديد. [23] وهذا يختلف عن طرق المحاذاة التدريجية لأن محاذاة التسلسلات السابقة يتم تحديثها عند كل إضافة تسلسلية جديدة. ومع ذلك ، مثل الطرق التقدمية ، يمكن أن تتأثر هذه التقنية بالترتيب الذي يتم فيه دمج التسلسلات في مجموعة الاستعلام في المحاذاة ، خاصةً عندما تكون التسلسلات مرتبطة بشكل بعيد. [12]

تتوفر العديد من البرامج التي تم فيها تنفيذ متغيرات من الأساليب المستندة إلى HMM والتي تمت ملاحظتها لقابليتها للتوسع وكفاءتها ، على الرغم من أن استخدام طريقة HMM بشكل صحيح أكثر تعقيدًا من استخدام الأساليب التقدمية الأكثر شيوعًا. أبسطها هو POA (محاذاة الترتيب الجزئي) [24] وهي طريقة مشابهة ولكنها أكثر عمومية يتم تنفيذها في الحزم SAM (محاذاة التسلسل ونظام النمذجة). [25] و HMMER. [26] تم استخدام SAM كمصدر للمحاذاة للتنبؤ ببنية البروتين للمشاركة في تجربة التنبؤ بهيكل CASP ولتطوير قاعدة بيانات للبروتينات المتوقعة في أنواع الخميرة S. cerevisiae. HHsearch [27] عبارة عن حزمة برامج للكشف عن تسلسلات البروتين ذات الصلة عن بعد بناءً على المقارنة الزوجية لـ HMMs. كان الخادم الذي يقوم بتشغيل HHsearch (HHpred) هو الأسرع من بين أفضل 10 خوادم للتنبؤ بالهيكل الآلي في مسابقات التنبؤ بهيكل CASP7 و CASP8. [28]

تحرير طرق علم نسالة

تحاول معظم طرق محاذاة التسلسل المتعددة تقليل عدد عمليات الإدراج / الحذف (الفجوات) ، ونتيجة لذلك ، تنتج محاذاة مضغوطة. يتسبب هذا في العديد من المشكلات إذا كانت التسلسلات المراد محاذاتها تحتوي على مناطق غير متجانسة ، إذا كانت الثغرات مفيدة في تحليل نسالة. هذه المشاكل شائعة في المتواليات المنتجة حديثًا والتي يتم شرحها بشكل سيئ وقد تحتوي على تحولات الإطارات أو المجالات الخاطئة أو exons المقسمة غير المتجانسة. تم تطوير أول طريقة من هذا القبيل في عام 2005 من قبل Löytynoja و Goldman. [29] أطلق نفس المؤلفين حزمة برمجيات تسمى مزحة في عام 2008. [30] PRANK يحسن المحاذاة عند وجود عمليات إدخال. ومع ذلك ، فإنه يعمل ببطء مقارنة بالطرق التقدمية و / أو التكرارية التي تم تطويرها لعدة سنوات.

في عام 2012 ، ظهرت أداتان جديدتان لإدراك علم التطور. واحد يسمى باغان تم تطويره بواسطة نفس فريق PRANK. [31] الآخر ProGraphMSA تم تطويره بواسطة Szalkowski. [32] تم تطوير كلتا حزم البرامج بشكل مستقل ولكنهما تشتركان في ميزات مشتركة ، لا سيما استخدام خوارزميات الرسم البياني لتحسين التعرف على المناطق غير المتجانسة ، وتحسين التعليمات البرمجية مما يجعل هذه البرامج أسرع من PRANK.

العثور على عزر تحرير

اكتشاف الحافز ، المعروف أيضًا باسم تحليل الملف الشخصي ، هو طريقة لتحديد موقع الأشكال المتسلسلة في MSA العالمية والتي تعد وسيلة لإنتاج MSA أفضل ووسيلة لإنتاج مصفوفة تسجيل لاستخدامها في البحث عن متواليات أخرى عن الزخارف المماثلة. تم تطوير مجموعة متنوعة من الطرق لعزل الزخارف ، ولكن جميعها تستند إلى تحديد أنماط قصيرة محفوظة للغاية ضمن المحاذاة الأكبر وإنشاء مصفوفة مماثلة لمصفوفة الاستبدال التي تعكس تكوين الأحماض الأمينية أو النيوكليوتيدية لكل موضع في الفكرة الافتراضية . يمكن بعد ذلك تنقيح المحاذاة باستخدام هذه المصفوفات. في تحليل ملف التعريف القياسي ، تتضمن المصفوفة مدخلات لكل حرف محتمل بالإضافة إلى مدخلات للفجوات. [12] بدلاً من ذلك ، يمكن أن تحدد خوارزميات إيجاد الأنماط الإحصائية الزخارف باعتبارها مقدمة لـ MSA بدلاً من اشتقاقها. في كثير من الحالات عندما تحتوي مجموعة الاستعلام على عدد صغير فقط من التسلسلات أو تحتوي فقط على متواليات شديدة الارتباط ، تتم إضافة الأعداد الزائفة لتطبيع التوزيع المنعكس في مصفوفة التسجيل. على وجه الخصوص ، يؤدي هذا إلى تصحيح إدخالات الاحتمال الصفري في المصفوفة إلى قيم صغيرة ولكنها ليست صفرية.

تحليل الكتل هو طريقة لإيجاد الحافز التي تقصر الزخارف على المناطق غير المحددة في المحاذاة. يمكن إنشاء الكتل من MSA أو يمكن استخلاصها من التسلسلات غير المحاذية باستخدام مجموعة محسوبة مسبقًا من الأشكال الشائعة التي تم إنشاؤها مسبقًا من عائلات الجينات المعروفة. [33] يعتمد تحديد النقاط بشكل عام على تباعد الأحرف عالية التردد بدلاً من حساب مصفوفة الاستبدال الصريحة. يوفر خادم BLOCKS طريقة تفاعلية لتحديد موقع مثل هذه الأشكال في تسلسل غير محاذي.

تم تنفيذ مطابقة الأنماط الإحصائية باستخدام كل من خوارزمية تعظيم التوقع وعينة جيبس. واحدة من أكثر أدوات البحث عن الحافز شيوعًا ، والمعروفة باسم MEME ، تستخدم تعظيم التوقعات وأساليب ماركوف المخفية لتوليد الزخارف التي يتم استخدامها بعد ذلك كأدوات بحث بواسطة رفيقها MAST في المجموعة المدمجة MEME / MAST. [34] [35]

تحرير محاذاة التسلسل المتعدد بدون ترميز

مناطق الحمض النووي غير المشفرة ، خاصةً TFBSs ، هي أكثر حفظًا وليست بالضرورة مرتبطة تطوريًا ، وربما تكون قد تقاربت من أسلاف غير مشتركة. وبالتالي ، فإن الافتراضات المستخدمة لمحاذاة تسلسل البروتين ومناطق ترميز الحمض النووي تختلف بطبيعتها عن تلك التي تحمل تسلسل TFBS. على الرغم من أنه من المفيد محاذاة مناطق ترميز الحمض النووي للتسلسلات المتماثلة باستخدام مشغلي الطفرات ، إلا أن محاذاة تسلسلات موقع الربط لنفس عامل النسخ لا يمكن أن تعتمد على عمليات الطفرات التطورية ذات الصلة. وبالمثل ، يمكن استخدام العامل التطوري للطفرات النقطية لتحديد مسافة تحرير لتسلسلات التشفير ، ولكن هذا ليس له معنى يذكر لتسلسلات TFBS لأن أي اختلاف في التسلسل يجب أن يحافظ على مستوى معين من الخصوصية لكي يعمل موقع الربط. يصبح هذا مهمًا بشكل خاص عند محاولة محاذاة تسلسلات TFBS المعروفة لبناء نماذج خاضعة للإشراف للتنبؤ بالمواقع غير المعروفة لنفس TFBS. ومن ثم ، تحتاج طرق محاذاة التسلسل المتعدد إلى تعديل الفرضية التطورية الأساسية والمشغلات المستخدمة كما في العمل المنشور الذي يتضمن المعلومات الديناميكية الحرارية الأساسية المجاورة [36] لمحاذاة مواقع الربط التي تبحث عن أدنى محاذاة ديناميكية حرارية تحفظ خصوصية موقع الربط ، EDNA.

الخوارزميات الجينية والتلدين المحاكى تحرير

تم أيضًا استخدام تقنيات التحسين القياسية في علوم الكمبيوتر - وكلاهما مستوحى من العمليات الفيزيائية ، ولكنهما لا يتكاثران بشكل مباشر - في محاولة لإنتاج MSA عالي الجودة بكفاءة أكبر. تم استخدام إحدى هذه التقنيات ، وهي الخوارزميات الجينية ، لإنتاج MSA في محاولة لمحاكاة العملية التطورية المفترضة التي أدت إلى الاختلاف في مجموعة الاستعلام. تعمل الطريقة عن طريق تقسيم سلسلة من MSA الممكنة إلى أجزاء وإعادة ترتيب تلك الأجزاء بشكل متكرر مع إدخال فجوات في مواضع مختلفة. يتم تحسين وظيفة الهدف العامة أثناء المحاكاة ، وبشكل عام تكون وظيفة التعظيم "مجموع الأزواج" المقدمة في طرق MSA القائمة على البرمجة الديناميكية. تم تنفيذ تقنية لتسلسل البروتين في برنامج SAGA (محاذاة التسلسل بواسطة الخوارزمية الجينية) [37] وما يعادله في RNA يسمى RAGA. [38]

تقنية محاكاة التلدين ، والتي يتم من خلالها تحسين MSA الموجود بواسطة طريقة أخرى من خلال سلسلة من عمليات إعادة الترتيب المصممة للعثور على مناطق أفضل لمساحة المحاذاة من تلك التي تشغلها محاذاة الإدخال بالفعل. مثل طريقة الخوارزمية الجينية ، فإن التلدين المحاكي يعظم وظيفة موضوعية مثل دالة مجموع الأزواج. يستخدم التلدين المحاكي "عامل درجة حرارة" مجازيًا يحدد المعدل الذي تتم عنده إعادة الترتيب واحتمالية كل إعادة ترتيب استخدام نموذجي فترات بديلة لمعدلات إعادة ترتيب عالية واحتمالية منخفضة نسبيًا (لاستكشاف مناطق أبعد لمساحة المحاذاة) بفترات ذات معدلات أقل واحتمالات أعلى لاستكشاف الحدود الدنيا المحلية بشكل أكثر شمولاً بالقرب من المناطق "المستعمرة" حديثًا. تم تنفيذ هذا النهج في برنامج MSASA (المحاذاة المتعددة التسلسل بواسطة التلدين المحاكي). [39]

تحرير البرمجة الرياضية وخوارزميات الحل الدقيق

تعد البرمجة الرياضية وخاصة نماذج برمجة الأعداد الصحيحة المختلطة طريقة أخرى لحل مشكلات MSA. تتمثل ميزة نماذج التحسين هذه في أنه يمكن استخدامها للعثور على حل MSA الأمثل بشكل أكثر كفاءة مقارنة بنهج DP التقليدي. ويرجع ذلك جزئيًا إلى قابلية تطبيق تقنيات التحلل للبرامج الرياضية ، حيث يتحلل نموذج MSA إلى أجزاء أصغر ويتم حله بشكل متكرر حتى يتم العثور على الحل الأمثل. تتضمن أمثلة الخوارزميات المستخدمة في حل نماذج برمجة الأعداد الصحيحة المختلطة لـ MSA الفرع والسعر [40] وتحلل Benders. [3] على الرغم من أن الأساليب الدقيقة بطيئة حسابيًا مقارنة بخوارزميات الكشف عن مجريات الأمور لـ MSA ، إلا أنها مضمونة للوصول إلى الحل الأمثل في النهاية ، حتى بالنسبة للمشكلات كبيرة الحجم.

تحرير الحوسبة الكمومية المحاكاة

في يناير 2017 ، أعلنت D-Wave Systems أن برنامجها للحوسبة الكمومية qbsolv مفتوح المصدر قد تم استخدامه بنجاح لإيجاد حل أسرع لمشكلة MSA. [41]

يعني الاستخدام الضروري للاستدلال من أجل المحاذاة المتعددة أنه بالنسبة لمجموعة عشوائية من البروتينات ، هناك دائمًا فرصة جيدة لاحتواء المحاذاة على أخطاء. على سبيل المثال ، وجد تقييم للعديد من برامج المحاذاة الرائدة باستخدام معيار BAliBase أن ما لا يقل عن 24٪ من جميع أزواج الأحماض الأمينية المتوافقة تمت محاذاة بشكل غير صحيح. [2] يمكن أن تنشأ هذه الأخطاء بسبب عمليات الإدراج الفريدة في منطقة واحدة أو أكثر من التسلسلات ، أو من خلال بعض العمليات التطورية الأكثر تعقيدًا التي تؤدي إلى بروتينات لا تتماشى بسهولة بالتسلسل وحده. نظرًا لأن عدد التسلسل وتباعدها يزيد العديد من الأخطاء ، فسيتم ارتكابها ببساطة بسبب الطبيعة الاستكشافية لخوارزميات MSA. تتيح عارضات محاذاة التسلسل المتعدد إمكانية مراجعة المحاذاة بصريًا ، غالبًا عن طريق فحص جودة المحاذاة للمواقع الوظيفية المشروحة على تسلسلين أو أكثر. يتيح العديد أيضًا تعديل المحاذاة لتصحيح هذه الأخطاء (الثانوية عادةً) ، من أجل الحصول على محاذاة "منسقة" مثالية للاستخدام في تحليل النشوء والتطور أو النمذجة المقارنة. [42]

ومع ذلك ، مع زيادة عدد التسلسلات وخاصة في الدراسات على مستوى الجينوم التي تتضمن العديد من MSAs ، فمن المستحيل تنظيم جميع المحاذاة يدويًا. علاوة على ذلك ، فإن المعالجة اليدوية ذاتية. وأخيرًا ، حتى أفضل الخبراء لا يستطيعون بثقة محاذاة الحالات الأكثر غموضًا للتسلسلات شديدة التباين. في مثل هذه الحالات ، من الشائع استخدام الإجراءات التلقائية لاستبعاد المناطق المتوافقة بشكل غير موثوق من MSA. لغرض إعادة بناء نسالة المنشأ (انظر أدناه) ، يتم استخدام برنامج Gblocks على نطاق واسع لإزالة كتل المحاذاة المشتبه في انخفاضها ، وفقًا لقطاعات مختلفة على عدد التسلسلات ذات الفجوات في أعمدة المحاذاة. [43] ومع ذلك ، فإن هذه المعايير قد ترشح بشكل مفرط المناطق التي تحتوي على أحداث الإدراج / الحذف التي قد لا تزال محاذاة بشكل موثوق ، وقد تكون هذه المناطق مرغوبة لأغراض أخرى مثل اكتشاف الاختيار الإيجابي. ينتج عدد قليل من خوارزميات المحاذاة درجات خاصة بالموقع تسمح باختيار مناطق عالية الثقة. تم تقديم مثل هذه الخدمة لأول مرة بواسطة برنامج SOAP ، [44] الذي يختبر قوة كل عمود للاضطراب في معلمات برنامج المحاذاة الشهير CLUSTALW. يستخدم برنامج T-Coffee [45] مكتبة من المحاذاة في بناء MSA النهائي ، ويتم تلوين ناتج MSA وفقًا لدرجات الثقة التي تعكس الاتفاق بين المحاذاة المختلفة في المكتبة فيما يتعلق بكل بقايا محاذاة. امتداده TCS: (تيفدائي جالثبات سcore) ، يستخدم مكتبات T-Coffee للمحاذاة الزوجية لتقييم أي MSA تابع لجهة خارجية. يمكن إنتاج الإسقاطات المزدوجة باستخدام طرق سريعة أو بطيئة ، مما يسمح بالمفاضلة بين السرعة والدقة. [46] [47] برنامج محاذاة آخر يمكنه إخراج MSA مع درجات الثقة هو FSA ، [48] والذي يستخدم نموذجًا إحصائيًا يسمح بحساب عدم اليقين في المحاذاة. يمكن استخدام درجة HoT (Heads-Or-Tails) كمقياس لعدم اليقين في المحاذاة الخاصة بالموقع نظرًا لوجود العديد من الحلول المثلى. [49] The GUIDANCE program [50] calculates a similar site-specific confidence measure based on the robustness of the alignment to uncertainty in the guide tree that is used in progressive alignment programs. An alternative, more statistically justified approach to assess alignment uncertainty is the use of probabilistic evolutionary models for joint estimation of phylogeny and alignment. A Bayesian approach allows calculation of posterior probabilities of estimated phylogeny and alignment, which is a measure of the confidence in these estimates. In this case, a posterior probability can be calculated for each site in the alignment. Such an approach was implemented in the program BAli-Phy. [51]

There are free programs available for visualization of multiple sequence alignments, for example Jalview and UGENE.

Multiple sequence alignments can be used to create a phylogenetic tree. [52] This is made possible by two reasons. The first is because functional domains that are known in annotated sequences can be used for alignment in non-annotated sequences. The other is that conserved regions known to be functionally important can be found. This makes it possible for multiple sequence alignments to be used to analyze and find evolutionary relationships through homology between sequences. Point mutations and insertion or deletion events (called indels) can be detected.

Multiple sequence alignments can also be used to identify functionally important sites, such as binding sites, active sites, or sites corresponding to other key functions, by locating conserved domains. When looking at multiple sequence alignments, it is useful to consider different aspects of the sequences when comparing sequences. These aspects include identity, similarity, and homology. Identity means that the sequences have identical residues at their respective positions. On the other hand, similarity has to do with the sequences being compared having similar residues quantitatively. For example, in terms of nucleotide sequences, pyrimidines are considered similar to each other, as are purines. Similarity ultimately leads to homology, in that the more similar sequences are, the closer they are to being homologous. This similarity in sequences can then go on to help find common ancestry. [52]


Evolution of complexity: genic, genomic, and developmental

Studies in arthropods have led to major insights into the complexity of developmental mechanisms and evolutionary changes. Experiments on the fruit fly ذبابة الفاكهة سوداء البطن have uncovered the complexity of gene interaction networks during early development 25,26 . For example, the earliest set of genes that are activated in the embryo, termed the ‘maternal’ class of genes, help establish body axes. Subsequent to the formation of body plan, segments and polarities of segments require the function of genes belonging to zygotic, gap, pair-rule, and segment polarity classes 27 . The cooperative and antagonistic actions between these genes ensure a precise and robust sequence of developmental events in the embryo, leading to the formation of tissues and organs at later stages. While the entire developmental process encoded in the DNA sequence is a necessary component of evolution, the individual mutations involved are not uniquely necessary they can be replaced with others. Genomic and proteomic studies are providing insight into the old question of developmental constraints in evolution. Recent studies have shown that developmental constraint and selection work together: development can constrain evolution in the short term, but selection can alter and reshape those constraints in the long term 28,29 . While developmental constraint on genes affecting embryology is not unexpected, as shown by Artieri and Singh 30 using patterns of gene expression during ذبابة الفاكهة ontogeny, it is not development but Darwinian ‘selection opportunity’ that dictates post-embryological diversification 4,30,31 .

Technological advancements over the last decade have made efficient large-scale genome sequencing of organisms easily available. The analysis of sequence data has revealed the structure of genes, gene families, and their chromosomal organizations (e.g., see www.genecards.org, www.informatics.jax.org, www.flybase.org, and www.wormbase.org). Genomic data together with gene expression studies are providing insight not only into the history of evolution but also on the type and extent of standing variation in populations. Some of the highlights reported by these studies are summarized below.

Number of genes do not correlate with complexity

While higher organisms have more protein coding genes, variation in gene number does not strongly correlate with morphological complexity. For example, the nematode C. ايليجانس has more genes than the fruit fly D. melanogaster, but the latter has appendages and is morphologically more complex. Protein-coding genes in humans, excluding splicing variants, are converging toward 20,000, even though the entire genome is predicted to code over 200,000 transcripts 32 . In addition to mRNA and proteins, there are increasing numbers of non-coding RNA transcripts in metazoan genomes such as micro RNA (miRNA) and long non-coding RNA (lncRNA) 33 . In humans, there are more non-coding RNA genes than protein-coding genes 32 .

Evolution occurs by making alternate use of genes

Evolution occurs by making alternate uses of existing genes through structural 34,35,36 and regulatory changes 37,38 . This is reflected in the 99% sequence similarity shared by humans and chimpanzees, with only 6% of the genes in one species lacking a known homolog in the other 39 . Despite such a high level of sequence conservation, about 80% of proteins in humans and chimps differ in at least one amino acid 35 and 10% of genes between humans and chimpanzees differ in their expression in the brains of the two species 40,41 .

Number of genes affecting a trait appears large

The notion of candidate genes/loci persists and guides much of health genomics for practical reasons. Studies involving the mapping of quantitative trait loci (QTL) have shown that, directly and indirectly, traits are affected by a large number of genes 42,43 . As an example, early studies of variation in human height initially implicated half a dozen to a dozen genes. A recent genomic meta-analysis of human height variation involving over 700,000 individuals has detected over 3290 significant SNPs 44 . Yet together, these SNPs may account for only 24% of the variance in height. The same is largely true for all complex diseases. Genomics is driving home the lesson that there are protein-coding and non-coding genes that perform a variety of functions, but there are no genes specific for a trait. Genome-wide association studies (GWAS) have led to the identification of genes linked to specific traits and diseases 45 (https://www.genome.gov/about-genomics/fact-sheets/Genome-Wide-Association-Studies-Fact-Sheet). The data reveal that genes are shared between traits. A recent paper by Boyle et al. presents an ‘omnigenic’ model of complex traits 46 , proposing that all genes expressed in disease-relevant cells are involved in a functional network and hence contribute to the condition.

A significant part of non-coding DNA may be involved in regulation

The ENCODE project (Encyclopedia of DNA Elements the ENCODE Project Consortium 2012) initially reported a large proportion of the genome to be functional, but ultimately scaled it down to approximately10%. This added to the ‘junk DNA’ debate and questions regarding the proper biological function of a gene 47,48 . Although a large proportion of mammalian DNA may have no necessary or essential function, this should not be interpreted as lacking in function or being inert. Such apparently ‘non-functional’ DNA may be part of the unnecessary complexity of the uncommitted ‘gene pool’—part of current phenotypic plasticity devoid of teleological explanation for future use.

Phylogenetic gene complexity shows the same function can be shaped by different genes

Recent genomic studies of protein evolution in anatomical traits of D. melanogaster embryos showed that younger genes, i.e., genes that are comparatively newer based on phylogenetic analysis, had lesser tissue distribution, fewer interactions, high expression levels, and less evolutionary constraint 49,50 . Given that the function of a gene is not fixed and functions evolve between genes as well as within genes over time, we can expect the complexity of interaction networks of newer genes to increase with time. In a study of adaptation in protein-coding gene trees in the primate clade, Daub et al. 51 remarked: ‘several gene sets are found significant at multiple levels in the phylogeny, but different genes are responsible for the selection signal in the different branches. This suggests that the same function has been optimized in different ways at different times in primate evolution.’

Evolution by gene regulation is not ‘break free’

In the post genomic world, the old ‘major vs. minor’ or ‘regulatory vs. structural’ mutation debate has been restructured and refined in terms of the role of رابطة الدول المستقلة-regulation vs. structural mutation in evolution 52,53,54 . Mutations in ‘رابطة الدول المستقلة’ elements generally affect the expression of individual genes, possibly contributing to regulatory evolution 54 . However, there are also examples of stabilizing selection operating on gene expression that tends to compensate for ‘رابطة الدول المستقلة’ changes (e.g., see ref. 55 ), leading to the evolution of biological complexity. While new cases of evolution by رابطة الدول المستقلة-regulatory mutations are being discovered, they are still far fewer than those by coding mutations 52,53 . Although the importance of رابطة الدول المستقلة-regulatory mutations in evolution is well documented, the real question involves neither their crucial role nor their unique contribution to the evolution of morphology. Instead, it is whether رابطة الدول المستقلة-regulatory mutations provide a source of variation that, unlike protein-coding mutations, is potentially large and pleiotropy-free, i.e., have no deleterious side effects and provide possibilities for ‘break-free’ evolutionary change. It is erroneous to argue that, unlike protein-coding variation, رابطة الدول المستقلة-regulation variation is free of pleiotropic effects or free of constraints 56,57 . Molecular population genetic studies inform us that genetic variation is not the limiting factor in evolution the limiting factor is ‘selection opportunity’ 58 . Evolution does not work toward producing perfect proteins. The protein-protein interactions and any negative effects arising therefrom are part of the genetic machinery involved in evolutionary change. Negative pleiotropy in structural mutations may not be any worse than the negative effect of gene expression in an unwanted place and time 53 . Negative pleiotropic effects of structural mutations are factored into the rate of evolution through compensatory mutations and gene-gene interactions. بصورة مماثلة، رابطة الدول المستقلة-acting regulations are obviously important in controlling gene expression and may appear to provide a limitless rate of evolutionary change however, we do not need to argue that evolution in nature is slow and incremental.

Molecular redundancy is a universal feature of organisms

Organisms are both the subject and the object of evolutionary change. Since the organisms’ environment is not constant, we can expect some degree of molecular flexibility in the ability of the organisms to adapt to environmental fluctuations experienced over their lifetime. Such a flexibility could come from at least three distinct but interrelated sources. One of these is what we have termed as unnecessary complexity, i.e., multiple redundant gene interactions and pathways. The second source of flexibility is over-expression of genes or up-regulation of pathways. It is expected that the functional integrity of any pathway/network would be limited by the least-expressed genes and such genes may be under pressure to be upregulated. Any increase in gene expression will contribute to higher probability of random molecular interactions thereby forming the basis of new functions and, therefore, new evolutionary adaptations. The third source is gene-environment interactions, termed ‘norm of reaction’ 17 . The unnecessary complexity together with molecular flexibility is what we have termed as molecular redundancy (Fig. 1).

G and P are the spaces of the genotypic and phenotypic description. جي1, G′1، جي2, and G′2 are genotypic descriptions at various points in time within successive generations. ص1, P′1, P2, and P′2 are phenotypic descriptions. تي1, and T3 are laws of transformation from genotype to phenotype and back, respectively, during development. تي2 are laws of population biology, and T4 are laws of Mendel and Morgan about gamete formation. Necessary and unnecessary complexities and molecular redundancy are defined in the text. (After Lewontin 19 ). The graph lines are not intended to mean monotonic increase.


Pleiotropy Definition

In pleiotropy, one gene controls the expression of several phenotypic traits. Phenotypes are traits that are physically expressed such as color, body shape, and height. It is often difficult to detect which traits may be the result of pleitoropy unless a mutation occurs in a gene. Because pleiotropic genes control multiple traits, a mutation in a pleiotropic gene will impact more than one trait.

Typically, traits are determined by two alleles (variant form of a gene). Specific allele combinations determine the production of proteins which drive the processes for the development of phenotypic traits. A mutation occurring in a gene alters the DNA sequence of the gene. Changing gene segment sequences most often results in non-functioning proteins. In a pleiotropic gene, all of the traits associated with the gene will be altered by the mutation.

Gene pleiotropy, also referred to as molecular-gene pleiotropy, focuses on the number of functions of a particular gene. The functions are determined by the number of traits and biochemical factors impacted by a gene. Biochemical factors include the number of enzyme reactions catalyzed by the protein products of the gene.

Developmental pleiotropy focuses on mutations and their influence on multiple traits. The mutation of a single gene manifests in the alteration of several different traits. Diseases involving mutational pleiotropy are characterized by deficiencies in multiple organs that impact several body systems.

Selectional pleiotropy focuses on the number of separate fitness components affected by a gene mutation. The term fitness relates to how successful a particular organism is at transferring its genes to the next generation through sexual reproduction. This type of pleiotropy is concerned only with the impact of natural selection on traits.


What Behaviors Do We Inherit Via Genes?

A pervasive assumption in evolutionary psychology is that how we act is affected by the genes we carry. Is there good concrete evidence of this? Are our outcomes predetermined by our biology? The most intriguing findings on this issue came from twin studies.

Evidence that Genes Affect Human Behavior

The study of identical twins reared apart is a natural experiment where two individuals with exactly the same genes grow up in different environments. If they turn out to be similar, then the similarity can be attributed to genotype.

Behavior geneticists concluded that genetics plays a big role in personality, accounting for about half of the differences in personality test results and even more of the differences in IQ scores.

Apart from these scientific findings, researchers were impressed by many obvious similarities between twins when they were reunited for the first time after being separated from birth. Many of the pairs dressed similarly or had the same haircut, or glasses. They described remarkable similarities in hobbies and interests. One pair reported that they were the only ones in their neighborhood to construct a circular bench around a tree in their backyard.

Striking as such stories are, they remain mere anecdotes and have no scientific value. The main problem is that there is confirmation bias. If a pair of twins is wearing the same baseball hat, we tend to interpret this as a wonderful example of genetic control over the minutiae of behavior. If a pair shows up wearing different hats, however, we ignore that difference but instead register some similarities such as both twins wearing a black shirt.

Identical twins separated at birth have some striking differences. If one twin is schizophrenic, there is no more than a coin-toss chance that the other is diagnosed with the same mental disorder. This is striking given that schizophrenia is believed to have a basis in brain biology. (The same is true of political affiliation).

We must also recognize that identical twins are a special case whose relevance to the behavior of ordinary people is disputable. The problem is that many characteristics are affected by multiple genes. If there are six genes involved, identical twins will be the same because they have all six genes. Yet, taken separately, each of those genes might not have a detectable effect on the trait of interest if studied in the general population.

This wrinkle (known as epistasis) may help explain why it is so difficult to establish a biochemical chain of causation between specific genes and complex human behaviors, although researchers have made heroic efforts to account for various traits, such as sensation seeking as a function of dopamine receptors, and have investigated various candidate genes to account for criminal violence.

Biochemistry and Behavior

Establishing that some behavioral traits are heritable is not the end of the scientific mission but really just the beginning. We need to know not just that genes affect behavior but also have to establish which genes are involved and how they affect the biochemistry of brain cells in ways that influence behavior.

One of the first of such projects involved work on receptors for dopamine that are implicated in sensation seeking.

This research proved successful. Yet, the success was qualified because variation in the dopamine receptor explained only a tiny fraction of individual differences in the sensation-seeking trait.

Another study looked at the so-called “warrior genes” that were over-represented among violent criminals. Criminal defense attorneys were excited by this finding because it offered a new defense strategy for violent offenders, namely that they were not fully responsible for their actions because their genes made them do it.

That genetic defense has been a flop, however. Warrior genes affect violent behavior only in the small category of individuals who grow up in extremely abusive homes. Children who are raised by loving parents are very unlikely to engage in orgies of uncontrolled aggression.

So there is a striking contradiction between the seeming clarity of the early research via twin and adoption studies, that established clear and substantial effects of genetic inheritance on personality and behavior, and subsequent efforts to work out how these influences play out.

Adaptation Without Genes

Although it is hard to deny genetic influences on human behavior, anyone who tries to explain what a person does in terms of simple biochemical differences is likely to be disappointed. Personality psychologists recognize that gene effects are difficult to separate from environmental influences. Children growing up in the same home experience that environment very differently because they have distinct temperaments, are treated differently by parents and siblings, and pursue different interests with different companions.

For example, a child with a greater sense of curiosity is going to cultivate varied interests and activities that feed the thirst for knowledge, whereas less curious siblings extract far less intellectual stimulation from their home environment. Such differences between siblings in what they get out of the environment are about as important as genes in determining personality and intelligence (1).

So there is little doubt that how we act is affected by genes in fairly generalized ways. Some individuals are born with a propensity to be outgoing, to be happy, emotionally reactive, sociable, creative, or intelligent. Yet, we do not have a good understanding of any of the relevant biochemical mechanisms.

Moreover, there is no satisfactory explanation of the underlying biochemical mechanisms in most cases. There is an important distinction between personality predispositions and actual behavior. Personality may be genetically heritable to some degree but human behavior never is.

Honeybees have a complex sequence of hygienic behavior that consists of digging out infected larvae and chucking them out of the hive — a sequence that is understood in terms of Mendelian genetics with one gene for uncapping and another for removing the dead larvae (2). As far as humans are concerned, we may or may not have strong hygienic tendencies, but there is no gene for cleaning out the refrigerator.

1 Plomin, R. (1990). Nature and nurture. Pacific Grove, CA: Brooks/Cole.

2 Grier, J. W. (1984). Biology of animal behavior. St. Louis, MO: Times Mirror/Mosby.


Recombination of Linked Genes

It is essential to understand homologous recombination to comprehend linked genes. Now that we know that the chromosomes are cut at random places during homologous recombination, we can see how linked genes are inherited together. Let’s take a real example to better understand it: freckles and red hair.

It is very common to find people with freckles and red hair. In fact, this occurs way more often than it would by chance otherwise, many blonde or brunette people would have freckles more often, and fewer red-haired people would have freckles. This happens because the genes that code for freckles and the genes that code for red hair sit close together on the same chromosome. When homologous recombination occurs, it is very unlikely that the DNA will be cut in between the two genes. Although homologous recombination happens numerous times, these two features are inherited together most of the time because the chances that the DNA coding for these two genes is split up are very low, consequently leading to the genes being inherited together most of the time.


دعم المعلومات

Dataset S1.

The sorghum gene list. Sorghum genes from 37 regions were from Sbi1.4 to which we added many genes on the basis of orthology to rice Niponbarre, TIGR 5 the added genes included many with corresponding RNAs since these are absent in Sbi1.4. SI1 uses the format Sbxgxxxxxx for Sbi1.4 genes and sorghum_chrmosomex_startx_stopx for genes we added based on Sb-Os orthology. Genes in local arrays were marked as parent, duplicate (D or DUP), or interrupter (a gene located within a tandem repeat) using published methods [7], and duplicates were marked and ignored subsequently up to three interrupter genes were permitted. If a remaining gene occurred syntenically (blastn bitscore >50) on a maize homeolog, then it was coded “1” or “2” if it occurred on only one of the homeologs or “B” if it occurred on both. A few genes were invalidated for technical reasons (“N”), and some genes were not found in the syntenic position in either maize homeolog (encoded as “0”).

Dataset S2.

The sorghum-maize dot-plot. Sorghum (x-axis) and maize (ذ-axis) with alpha-tetraploidy lines colored purple by lower Ks from SynMap in CoGe. Numerals are chromosome numbers. Lower Ks is more recent. Although hundreds of breakpoints are evident, each segment of maize is orthologous to one sorghum region, and each sorghum segment is orthologous to two maize regions.

Dataset S3.

Fractionation runs used to determine bias for all 37 orthologous sorghum/maize regions. Here, bias is measured in units “genes lost completely.” The code we used, taken from the Dataset S1 datasheet (e.g. 11BBB1121B2121BBBB2222BB…), is given at the top of each diagram. Assuming that genes are lost in units of one gene, the null hypothesis is that the same number of genes are lost on each of the homeologs: using the symbols of the alignment diagrams, 0 = 1. The ص value predicts the chance that this 1∶1 ratio is possible. Many genes coded “B” (retained) were actually a complete gene paired with a gene fragment, as expected if fractionation is not complete. All of our 37 diagrams had runs of over nine genes removed because they are known to be segmental translocations.

Dataset S4.

Maize-maize self-blastn dot-plot. Sequences present 40×X in the genome were masked. Axes are in genes from annotated psudomolecules from 10-09. Tangent angles = bias. Green lines are higher Ks and are from the alpha-tetraploidy.

Dataset S5.

Whole-gene deletion in soybean (جلايسين ماكس). (A) A GEvo output of soybean homeologous regions from the alpha tetraploidy (panels 1 and 2), Medicago trunculata (panel 3), and the soybean homeologous regions from the beta tetraploidy event (panels 4 and 5). Circled is a gene in ميديكاغو that has orthologs in all soybean homeologs except for soybean chromosome 1 (panel 1). (B) Diagram showing the homeologous sequences of soybean chromosome 1 (Glma01) and chromosome 2 (Glma02, panel 2). In chromosome 2 the circled gene from (A) (colored green in this diagram) is present, but absent in chromosome 1. Direct repeats (purple) and inverted repeats (blue) flank the sequence surrounding the gene in chromosome 2. Yellow denotes the syntenous sequence highlighted in pink from (A).

Dataset S6.

Generating the augmented sorghum gene list by comparison of sorghum to rice. We used a pipeline to generate the sorghum gene list of SI1. Given the input of the same genomes and annotation, this pipeline generates this list repeatedly. This sorghum gene list includes the JGI official annotated sorghum genes plus the output of this pipeline: sorghum-rice ortholgous blastn hits that, when further analyzed, turned out to be homologous to RNA or protein-encoding genes or pseudogenes.

Dataset S7.

The script used to run the genetic algorithm for الشكل 5. The fitness of solutions in the evolutionary algorithm were scored using the Monte Carlo method as described in Methods (with the modification that rather than fixing the deletion length at 1 gene, deletion lengths were selected using the weighted averages generated by the evolutionary algorithm) with the most fit solutions being those where the median simulated number of deletion runs was least different from the observed number of runs. The genetic algorithm was allowed to run for 100,000 generations.


شاهد الفيديو: الأحياء متقدم- صف 11 - الإختلالات الوراثية في الإنسان (ديسمبر 2022).