معلومة

التصنيف التصنيفي لمخرجات بلاست

التصنيف التصنيفي لمخرجات بلاست


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أنا أعمل مع تسلسل الجيل التالي. لقد قمت بتجميع contigs البقري de novo إلى قاعدة بيانات NCBI nucleotide. لقد حصلت على مطابقة مع الكثير من الأنواع ، مثل أنواع مختلفة من البكتيريا والفيروسات والثدييات. أريدهم أن يجمعوا بطريقة منطقية ، أي كل البكتيريا في مجموعة واحدة (مجموعة بكتيريا) وبالمثل فيروسات وثدييات. من الصعب ترتيب هذا يدويًا ، هل يمكن لأي شخص أن يساعد في كيفية ترتيب عدد كبير من الأنواع الخاصة بي في بعض المجموعات المنطقية. شكر تحسبا.


هذا هو في الأساس علم الجينوميات. تهانينا ، لقد قمت بالفعل بأكبر خطوة تستغرق وقتًا طويلاً. هناك عدة طرق للذهاب من هناك ، لكنني سأتحدث عن الطريقة التي أعرفها بشكل أفضل. هناك أداة التحليل الميتاجينومي MEGAN. يمكنه قراءة إخراج Blast الخاص بك ، إذا كان بالتنسيق الصحيح (XML عادي أو جدولي) وسيقوم تلقائيًا بما تريد. كبداية ، ما عليك سوى استخدام القيم الافتراضية ، ولمزيد من المساعدة ، ثم انتقل إلى موقع مجتمع MEGAN للحصول على المساعدة.

قد يستغرق تحليل بياناتك قليلاً ، اعتمادًا على عدد contigs لديك. ولكن إذا تمكنت من تفجيرها في وقت معقول ، فلن تكون هناك مشكلة. كما قلت ، أنت تمر بأكثر الخطوات استهلاكا للوقت بالفعل.


قم بإعداد هذا البحث.

لاحظ مارك بوغوسكي من NBCI هذا وقام بتزويد Crichton بتسلسل أفضل ، كما هو موضح أدناه ، للتتمة ، العالم الضائع. تحديد المصدر الأكثر احتمالا لهذا التسلسل باستخدام انفجار النوكليوتيدات النوكليوتيدية. وضع مارك اسمه في التسلسل الذي قدمه. لرؤية اسم مارك ، استخدم صفحة ترجمة بلاست (blastx) بالتسلسل أدناه. (ابحث عن MARK هنا NIH).

الاستخدام الصحيح لخدمات ترجمة بلاست هو البحث عن بروتينات مماثلة (تحديد المتماثلات المحتملة) في الأنواع الأخرى.


التصنيف التصنيفي لمخرجات بلاست - علم الأحياء

هناك العديد من الطرق للانفجار. البرنامج متاح من NCBI ويمكنك تنزيله وتشغيله على جهازك الخاص. يمكنك استخدام واجهة الويب التي تبحث عن البيانات المتاحة على أجهزة NCBI. (إذا لم تكن قد استخدمت واجهة الويب قبل أن يكون هناك برنامج تعليمي مفصل للغاية يخطرك خلال العملية.) يتم تحديث بيانات NCBI بشكل متكرر لذا يفضل الكثير من الأشخاص كتابة البرامج التي تستخدم خادم NCBI بدلاً من صيانة كل شيء محليًا. يدعم NCBI ذلك مع خدمة QBlast.

يتضمن Biopython دعمًا لتشغيل BLAST محليًا (جميع إصدارات BLAST) وعن بُعد (يسمح QBlast فقط بعمليات بحث BLASTP و BLASTN). إلى جانب قراءة هذه المحاضرة ، يجب أن تذهب من خلال برنامج Biopython التعليمي ذي الصلة لـ BLAST. سأقدمها بأسلوب وتركيز مختلفين.

سأبدأ بواجهة ويب Biopython إلى BLAST (من خلال واجهة QBlast الخاصة بـ NCBI). الوظيفة متاحة كـ Bio.Blast.NCBIWWW.qblast مما يعني أنه موجود في NCBIWWW الوحدة النمطية ، وهي وحدة فرعية من انفجار، وهو نموذج فرعي من السيرة الذاتية. من الممارسات الشائعة في Python استيراد أدنى وحدة نمطية من التسلسل الهرمي إلى الملف ، مثل هذا بمجرد استيراد انفجار يمكنني استخدامه للوصول إلى qblast الوظيفة ، كما ترى في النص أعلاه.

تأخذ وظيفة qblast العديد من المعلمات. يمكنك الحصول على قائمة بها مع لغة Python المدمجة يساعد() الوظيفة: يشير هذا إلى أن هناك ثلاثة حقول مطلوبة: البرنامج المراد استخدامه ("blastp" أو "blastn") ، وقاعدة البيانات للبحث عنها (انظر دليل اختيار NCBI للحصول على قائمة بقواعد البيانات المتاحة للبرنامجين) ، وتسلسل الاستعلام . المعلمات الأخرى اختيارية.

من خلال قراءة وثائق qblast (ليس لضعاف القلوب!) وجدت أن تسلسل الاستعلام يجب أن يكون بتنسيق FASTA أو عن طريق انضمام GenBank أو قائمة معرفات الجينات. سأستخدم سجل FASTA ، والذي سأقوم بتعريفه بشكل تفاعلي. (تُستخدم السلاسل الثلاثية المقتبسة للسلاسل التي قد تكون بطول عدة أسطر.) سأقوم بتشغيل هذا التسلسل مقابل قاعدة بيانات البروتين غير الزائدة لـ NCBI ("nr") في NCBI باستخدام blastp. (رسالة التحذير هذه مزعجة. لقد انتهيت للتو من كتابة رسالة بريد إلكتروني إلى قائمة Biopython تسأل عن سبب وجودها.)

تقوم الدالة qblast بإرجاع ملف cStringIO.StringIO جزء. هذه فئة Python تعمل كملف ولكن بدلاً من الحصول على البيانات من نظام الملفات ، فإنها تحصل على البيانات من سلسلة. إذا كنت تريد أن ترى النتيجة يمكنك أن تقرأ من هذا الملف (أو "مثل ملف") مثيل باستخدامه اقرأ() الطريقة ، كما فعلت هناك. هذا هو الشكل الذي تبدو عليه بداية نص إخراج ويب بلاست. كما ترى ، النتيجة ليست تنسيق BLAST الذي اعتدت رؤيته. يحتوي على ترميز HTML لتمييز حقول معينة ، ولعرض أحد أسماء المؤلفين بشكل صحيح (Sch & aumlffer ، بدلاً من Schaffer).

بعد اقرأ() اعتدت الاتصال تسعى (0). كائن الملف له موضع في الملف. تحدث عمليات القراءة والكتابة في هذا الموضع وتتسبب في تقدم معلومات الموقع (باستثناء ما بعد نهاية الملف). ال تسعى (0) تخبر الطريقة أن ينتقل الملف إلى الموضع 0 ، لذلك ستحدث القراءة التالية في البداية. كنت في حاجة إليها لأن اقرأ() ترك موضع الملف في نهاية الملف.

نظرًا لأن إخراج qblast بتنسيق مختلف عن إخراج Blast العادي ، فستحتاج إلى استخدام محلل مختلف له. يوجد المحلل اللغوي أيضًا في الوحدة النمطية NCBIWWW ومثل مثال NCBIStandalone من الأمس ، ستحتاج إلى عمل محلل قبل أن تتمكن من تحليله. استخدام المحلل اللغوي مطابق لما عرضته بالأمس والنتيجة المحللة في نفس بنية البيانات. تقوم واجهات الويب المستقلة وواجهات الويب الخاصة بـ BLAST بإرجاع النتائج بنفس بنية البيانات. وهذا مفيد. هذا يعني أنك لست مضطرًا إلى كتابة التعليمات البرمجية مرة واحدة لكل نمط واجهة. يمكن أن يتوقع الكود بنية بيانات Blast الشائعة ولا يكون على دراية بمصدر البيانات.

باستخدام BLAST المحلي

كنت آمل أن أعطي بعض الأمثلة على استخدام إصدار سطر الأوامر من BLAST. كما اتضح ، ليس لدي BLAST على هذا الكمبيوتر المحمول وليس لدي مجموعة بيانات معقولة لاختباره ، ولا أقوم بتنزيل كل هذه البيانات عبر DSL إلى منزل Dan. الأمر ليس بهذه الصعوبة وقد تعلمت بالفعل كيفية تحليل النتائج ، لذا يجب أن تكون قادرًا على التقاطها من القسم المعنون 3.1.4 تشغيل BLAST محليًا في كتاب الطبخ Biopython.

سنكتشف ذلك خلال المحاضرة.

لتثبيت بلاست وإعداد بعض قواعد البيانات ، قد يكون من المفيد قراءة وثائق بلاست.

صنع مخرجات FASTA

لقد تحدثت كثيرًا عن تحليل سجل FASTA ، لكن ماذا عن الطريقة الأخرى؟ ماذا عن تحويل FastaRecord إلى سلسلة بتنسيق FASTA؟ للبدء ، إليك تعريف فئة FastaRecord منذ بضعة أيام. جعل سطر العنوان أمرًا بسيطًا. إنه "& GT"متبوعًا بالعنوان متبوعًا بسطر جديد ("ن").

الأمر الأكثر تعقيدًا هو خط التسلسل. قد يكون هذا طويلًا جدًا ، مما يعني أنني سأحتاج إلى تقسيم التسلسل إلى أجزاء وكتابة كل جزء على السطر الخاص به. في الوقت الحالي ، سأستخدم 10 أحرف لكل سطر ، لذا فإن سطر التسلسل الأول يحتوي على أول 10 أحرف ، والثاني يحتوي على 10 أحرف الثانية ، وهكذا. (في الواقع ، يبلغ الرقم حوالي 70. أنا أستخدم 10 لذا فإن الأمثلة أسهل في الكتابة وأقصر.)

يمكنني استخدام تدوين السلسلة الفرعية للحصول على الحقول المختلفة. هنا تسلسل اختبار والأربعة أسطر التي أريد الحصول عليها منه. ما أحتاجه هو طريقة ما للبدء من 0 والعد بمقدار 10 ثوانٍ. توجد بالفعل دالة بايثون مضمنة مسماة نطاق() التي تبدأ من 0 وتحسب بمقدار 1 ثانية. كما يحدث ، فإنه يدعم أوضاع البدء الاختيارية وحجم الخطوة. إذا كان حجم الخطوة هو 2 ، فسيتم حسابه بمقدار 2. إذا كان حجم الخطوة 10 ، فسيتم حسابه بمقدار 10. فيما يلي بعض الأمثلة. يمكنني استخدام حجم خطوة النطاق للحصول على قائمة بالمؤشرات لبداية كل قائمة فرعية. لأنني أريد 10 أحرف لكل سطر ، فإن موضع النهاية هو +10 من موضع البداية. هذا ما يبدو عليه ، مع وجود بعض الأجزاء في المقدمة لتظهر لك ما يحدث. انظر كيف أن السطر الأخير يتكون من 7 أحرف فقط وليس 10؟ في شريحة Python الفرعية (الكود الذي يبدو تسلسل [البداية: النهاية]) إذا كان موضع النهاية كبيرًا جدًا ، يتم تقريبه إلى حجم الخيط. هذا هو السبب في أن حجم التتابع التالي المطلوب هو 10 أحرف ولكن التسلسل الفعلي يتكون من 7 أحرف فقط.

لدي ما يكفي في هذه المرحلة لعمل وظيفة قد تكون مفيدة لتصحيح الأخطاء. سأقوم بطباعة سجل FASTA على الشاشة. هذه الأنواع من الوظائف عادة ما تبدأ بأسماء مطبعة_ لذلك سأسمي هذا print_fasta.

فيما يلي مثال على كيفية الاستخدام ، استنادًا إلى fasta_reader.py منذ بضعة أيام. من الغريب جدًا رؤية 10 أحرف فقط في كل سطر من ملف FASTA! سوف أقوم بتغييره إلى 70 حرفًا في كل سطر. في كثير من الأحيان على الرغم من أنني أريد إخراج تنسيق FASTA كسلسلة. هذا ليس بالأمر الصعب. بدلاً من طباعة نص سطر ما ، سألحق كل سطر بقائمة ثم استخدم " n" لضم العناصر في النهاية. ربما كان يجب علي إضافة " n" إلى نهاية السطور المرتبطة ، بحيث يحتوي السطر الأخير على سطر جديد مثل أي سطر آخر. من الصعب الحكم على ذلك ، وتجربتي تقول أنه من الأفضل ألا تكون الشخصية الأخيرة سطرًا جديدًا.

بعض الفئات لها أشكال أوتار طبيعية جدًا. يتم تمثيل الأعداد الصحيحة بسهولة كرقم ، على سبيل المثال. للحصول على شكل سلسلة من كائن ، يمكنك استخدام شارع وظيفة. ولكن كما ترون ، فإن شارع () من FastaRecord ليس مفيدًا.

من السهل تجاوز تمثيل السلسلة الافتراضي باستخدام طريقة خاصة تسمى __str__. إذا كان الفصل يحتوي على ملف __str__ طريقة ثم شارع () سوف تستدعي هذه الطريقة للحصول على تمثيل السلسلة ، وإلا فإنها تستخدم القيمة الافتراضية غير المفيدة للغاية. (لفهم هذا تمامًا ، يستدعي الأمر "طباعة" أولاً str () على كائن للحصول على تمثيل سلسلة.)


مادة الاحياء

المتبرعمة الكيسية هو طفيلي وحيد الخلية متنوع وراثيًا ذو إمكانات ممرضة غير واضحة يستعمر أمعاء البشر ومجموعة واسعة من الحيوانات غير البشرية. على أساس البيانات الجزيئية ، تم تصنيف الكائن الحي على أنه سترامينوبيل. الكائنات الحية مثل الدياتومات ، الكريسوفيت ، قوالب الماء ، وشبكات الوحل هي أمثلة أخرى على سترامينوبلات.

المتبرعمة الكيسية الكائنات الحية المعزولة عن البشر يشار إليها عادة باسم B. hominis. ومع ذلك ، بسبب التنوع الجيني الواسع (حتى بين الكائنات الحية المعزولة عن البشر) وانخفاض خصوصية العائل ، التعيين المتبرعمة الكيسية ص. يعتبر أكثر ملاءمة. إذا تم إجراء التصنيف الجيني ، فيجب أيضًا ملاحظة النوع الفرعي (ST) وفقًا للمصطلحات الإجماع. وقد تكون مرتبطة بانتقال الأمراض الحيوانية المنشأ.

* Stensvold، C.R.، Suresh، G.K.، Tan، K.S.، Thompson، RA، Traub، R.J.، Viscogliosi، E.، Yoshikawa، H. and Clark، C.G.، 2007. Terminology for المتبرعمة الكيسية الأنواع الفرعية وندشا الإجماع. الاتجاهات في علم الطفيليات، 23 (3) ، ص 93-96.

دورة الحياة

دورة حياة المتبرعمة الكيسية ص. لم يتم فهمه بعد ، بما في ذلك المرحلة المعدية وما إذا كانت (وأي من) الأشكال المورفولوجية المختلفة لهذا الكائن الحي متعدد الأشكال التي تم تحديدها في البراز أو المزرعة تشكل مراحل بيولوجية مميزة للطفيلي في القناة المعوية للمضيفين. من المفترض أن يكون شكل الكيس (3 & ndash5 & microm) مرحلة معدية ، ولكن لم يتم تأكيدها. يشار إلى الشكل السائد الموجود في عينات البراز البشري باسم الفراغ (أو الجسم المركزي) وهو ذو حجم متغير (5 & ndash40 & microm ، وأحيانًا أكبر بكثير). يبدو أن النسخ المتماثل يحدث عبر الانشطار الثنائي. الأشكال المورفولوجية الأخرى (على سبيل المثال ، الأشكال الأميبية والحبيبية) قد لوحظت أيضًا في عينات البراز و / أو الثقافة ، فإن دورها البيولوجي ومصيرها النمائي في نهاية المطاف يتطلب مزيدًا من التحقيق.

المضيفون

المتبرعمة الكيسية تم اكتشافه في البراز من البشر ومجموعة كبيرة من الحيوانات غير البشرية (مثل الكلاب ، والخنازير ، والقرود ، والقوارض ، والطيور ، وما إلى ذلك).

التوزيع الجغرافي

المتبرعمة الكيسية ص. تم العثور عليه في جميع أنحاء العالم. جهود لتوصيف التوزيع الجغرافي والمضيف المتبرعمة الكيسية الأنواع الفرعية جارية.

العرض السريري

سواء المتبرعمة الكيسية ص. (أو أنواع فرعية معينة منها أو سلالات معينة من أنواع فرعية معينة) يمكن أن تسبب مرضًا معديًا معويًا (عدوى أعراض) في البشر لا يزال موضع نقاش واستقصاء. المتبرعمة الكيسية ص. تم اكتشافه في كل من الأشخاص الذين يعانون من الأعراض وغير المصحوبين بأعراض.


الشروط والمفاهيم

  • كليد
  • مانيرابتورا
  • تطور
  • ثيرابود
  • افي
  • Dromaeosaur
  • ترودونتيد
  • ثريزينوصور
  • Oviraptors
  • بروتينات الكولاجين
  • انفجار
  • طفره
  • استفسار
  • تنسيق Fasta
  • شجرة النشوء والتطور
  • تطور

أسئلة

  • ماذا يعني الاختصار انفجار الوقوف؟
  • بناءً على بحثك ، ارسم شجرة عائلة تضم الطيور والديناصورات والزواحف والثدييات.
  • ما الديناصورات التي تم العثور على ريش؟

AutoFACT: أداة شرح وتصنيف وظيفية تلقائية

خلفية: يعد تعيين الوظيفة لبيانات التسلسل الجزيئي الجديدة خطوة أساسية في مشاريع علم الجينوم. تتضمن العملية المعتادة عمليات بحث تشابه لتسلسل معين مقابل قاعدة بيانات واحدة أو أكثر ، وهي عملية شاقة لمجموعات البيانات الكبيرة.

نتائج: نقدم AutoFACT ، أداة تعليقات توضيحية مؤتمتة بالكامل وقابلة للتخصيص تقوم بتعيين وظائف إعلامية بيولوجية إلى تسلسل. تتمثل السمات الرئيسية لهذه الأداة في أنها (1) تحلل بيانات تسلسل النوكليوتيدات والبروتينات (2) تحدد الوصف الوظيفي الأكثر إفادة من خلال الجمع بين تقارير بلاست متعددة من عدة قواعد بيانات يختارها المستخدم (3) تعين مسارات التمثيل الغذائي المفترضة والفئات الوظيفية وفئات الإنزيم ، مصطلحات GeneOntology وأسماء المواقع و (4) تولد مخرجات بتنسيقات HTML و text و GFF لراحة المستخدم. لقد قارنا AutoFACT بأربعة خطوط أنابيب للتعليقات التوضيحية الراسخة. يقدر معدل الخطأ في التعليق التوضيحي الوظيفي بما يتراوح بين 1-2٪ فقط. تُظهر مقارنة AutoFACT مع طريقة التعليقات التوضيحية التقليدية الأكثر نجاحًا أن إجراءنا يزيد من عدد التعليقات التوضيحية الوظيفية بنسبة 50٪ تقريبًا.

استنتاج: سيعمل AutoFACT كأداة مفيدة للتعليق التوضيحي لمجموعات التسلسل الأصغر التي تفتقر إلى فريق عمل متخصص في المعلوماتية الحيوية. يتم تنفيذه في PERL ويعمل على منصات LINUX / UNIX. AutoFACT متاح على http://megasun.bch.umontreal.ca/Software/AutoFACT.htm.

الأرقام

منهجية AutoFACT. التسلسلات مصنفة ...

منهجية AutoFACT. يتم تصنيف التسلسلات في واحدة من ست فئات من التعليقات التوضيحية (مربعات أرجوانية) ...

توزيع المعلومات مقابل المعلومات غير المفيدة ...

توزيع التعليقات التوضيحية بالمعلومات مقابل التعليقات غير المفيدة. أ. كاستيلاني تم شرح ESTs (5130 مجموعة) ...

زيادة بنسبة 50٪ في التعليقات التوضيحية التثقيفية مقارنة بأعلى نتائج بلاست مقابل قاعدة بيانات NCBI nr و UniRef90. يظهر مصدر التعليق التوضيحي لـ AutoFACT بين قوسين ().

نموذج لإخراج HTML لـ AutoFACT ...

نموذج لمخرج HTML للتعليق التوضيحي لـ AutoFACT لـ Acanthamoeba castellanii مجموعة EST ACL00000152. تلقائي ...

مقارنة بين تعليقات AutoFACT التوضيحية عبر ...

مقارنة التعليقات التوضيحية لـ AutoFACT عبر أربعة كائنات متنوعة نسبيًا تم شرحها مسبقًا بواسطة راسخ ...


EPlant كاميلينا

يساعد ePlant علماء الأحياء على تصور الروابط الطبيعية بين تسلسل الحمض النووي ، والتنوع الطبيعي (تعدد الأشكال) ، والهياكل الجزيئية ، وتفاعلات البروتين والبروتين ، وأنماط التعبير الجيني من خلال الجمع بين العديد من أدوات تصور البيانات مع واجهة مستخدم قابلة للزووم.

يتصل ePlant بالعديد من خدمات الويب المتاحة للجمهور لتنزيل أحدث بيانات الجينوم والتفاعل والنسخة لأي عدد من الجينات أو منتجات الجينات التي قد تكون مهتمًا بها. يتم عرض البيانات مع مجموعة من أدوات التصور التي يتم تقديمها مع التسلسل الهرمي المفاهيمي من كبير إلى صغير. تساعد الروابط بين طرق العرض المختلفة على إبراز الروابط بين مستويات التحليل المتعددة.


فتح القفل فئة الفوسفاتيس الهدف

لقد استقطبنا الخبرة العلمية الرائدة عالميًا في بيولوجيا الأمراض التي يحركها الفوسفاتيز واكتشاف الأدوية لإطلاق العنان للإمكانات الكاملة للمُعدِّلات الخيفية المستهدفة للفوسفاتيز. في علم الأورام ، تقوم Anavo بتطوير العديد من البرامج العلاجية الأولى في فئتها وستبني على الشراكات حول منصتها لإنشاء خط أنابيب غني عبر العديد من المؤشرات.

يتم دعم Anavo من قبل المستثمرين البارزين M Ventures و INKEF Capital و Taiho Ventures و Bioqube Ventures.

استهداف أحد البوابات المركزية في علم الأحياء البشري

تنظم الفوسفاتيز والكينازات نشاط العديد من المسارات الجزيئية الحاسمة في الخلايا. عن طريق إزالة أو إضافة ، على التوالي ، مجموعة فوسفات من البروتينات أو الجزيئات الحيوية الأخرى ، تؤثر الفوسفاتازات والكينازات على مستويات نشاط هذه الجزيئات أولاً ومن خلال هذا تنظم الناتج الإجمالي لتسلسلات الإشارات بأكملها. يمكن أن تؤدي الاختلالات في هذه العملية إلى العديد من الأمراض.


الناس

تنظيم الجينات عن طريق التضفير البديل واضمحلال الرنا المرسال غير المعقول. اضمحلال الرنا المرسال غير المعقول (NMD) هو نظام مراقبة الحمض النووي الريبي الخلوي الذي يتعرف على النصوص ذات أكواد الإنهاء المبكر ويحللها. اكتشفنا أعدادًا كبيرة من أشكال اللصق الطبيعية البديلة التي يبدو أنها أهداف لـ NMD ، وتكهننا بأن هذا قد يكون نمطًا من التنظيم الجيني الذي أطلقنا عليه اسم الصدأ (تنظيم الربط والترجمة غير المنتجين). جميع أعضاء عائلة SR لمنظمي اللصق لديهم شكل إسوي بديل غير منتج من الرنا المرسال يستهدف NMD 1 . اللافت للنظر ، يتم حفظ نمط لصق كل منها في الماوس ومرتبطًا دائمًا بمنطقة محمية للغاية أو محمية للغاية من الهوية المثالية بين الإنسان والفأر. بشكل ملحوظ ، يبدو أن هذا قد تطور بشكل مستقل في كل جينة ، مما يشير إلى أن هذا هو النمط الطبيعي للتنظيم. نحن نستخدم RNA-Seq لاستكشاف مدى انتشار NMD في العديد من الأنواع 2 وفهم سلوكها. كجزء من تعديلتشفير كونسورتيوم ، اكتشفنا ذخيرة من أهداف التضفير البديل في الذبابة ، وكذلك العلاقات غير المتوقعة بين تطور الذبابة والدودة 3, 4 . نحن الآن بصدد تفصيل المنظمين في عائلة SR واستكشاف تطور آلية تنظيم التعبير الجيني.

التنبؤ بوظيفة البروتين باستخدام علم تطور جذور بايزي. نحن غارقون في البروتينات المكتشفة من خلال مشاريع التسلسل عالية الإنتاجية. نظرًا لأن جزءًا صغيرًا فقط من هذه العناصر تم تمييزه تجريبيًا ، فإن الطرق الحسابية تستخدم على نطاق واسع للتعليق التوضيحي الآلي. لسوء الحظ ، أدت هذه التنبؤات إلى تناثر المعلومات الخاطئة في قواعد البيانات ، وذلك لأسباب متنوعة بما في ذلك انتشار الأخطاء والعيوب المنهجية في انفجار والطرق ذات الصلة. بالتعاون مع مجموعة مايكل جوردان ، طورنا نهجًا إحصائيًا للتنبؤ بوظيفة البروتين التي تستخدم شجرة تطور عائلة البروتين ، باعتبارها الهيكل الطبيعي لتمثيل علاقات البروتين. نحن نتراكب على جميع وظائف البروتين المعروفة في العائلة. نستخدم نموذجًا لتطور الوظيفة لاستنتاج وظائف جميع وظائف البروتين الأخرى. حتى تطبيقاتنا الأولية لهذه الطريقة تسمى أخرج (الاستدلال الإحصائي للوظيفة من خلال العلاقات التطورية) كان أداؤه أفضل من الأساليب الأخرى المستخدمة على نطاق واسع 5 . نحن نقوم حاليًا بإجراء العديد من التحسينات على الأساسي أخرج الخوارزمية وتعزيز قدرتها على العمل على مجموعة واسعة من البيانات ودمج المزيد من بيانات الارتباط التجريبية. تم تكريم SIFTER كأفضل طريقة أداء في التقييم النقدي لتعليق الوظيفة 9 . نحن نتعاون مع مشروع ENIGMA في LBNL لتحسين التعليقات التوضيحية على نطاق واسع. بالتعاون مع Jack Kirsch ، نقوم أيضًا بالتحقق من صحة التنبؤات الوظيفية بشكل تجريبي ، مع التركيز على عائلة Nudix. نحن نشارك أيضًا في الحفاظ على SCOP: التصنيف الهيكلي للبروتينات ، وهو مورد رئيسي لفهم بيانات بنية البروتين. لذلك نقوم بتحليل جهود الجينوميات الهيكلية ونوجه اتجاهاتهم المستقبلية 8 . باستخدام أساليب النواة والميزات المحددة ، نقوم ببناء أنظمة للتعرف على العلاقات التطورية القديمة للبروتين.

الجينوميات الشخصية. لدينا اهتمام طويل الأمد بتفسير الجينوم الشخصي ، بما في ذلك تطوير مشاع الجينوم 6 ، فهم أساس الأمراض المندلية من الجينوم المتسلسل 10 ، وتنظيم مشروع التقييم النقدي لتفسير الجينوم (CAGI).

علم الجينوم الحاسوبي
تنظيم الجينات عن طريق الربط البديل ومراقبة الحمض النووي الريبي.

اضمحلال الرنا المرسال غير المعقول (NMD) هو نظام مراقبة الحمض النووي الريبي الخلوي الذي يتعرف على النصوص التي تحتوي على أكواد إنهاء مبكرة ويحللها. منذ عدة سنوات ، اكتشفنا أعدادًا كبيرة من أشكال الوصلات البديلة الطبيعية التي يبدو أنها أهداف لـ NMD ، وتوقعنا أن هذا قد يكون نمطًا من تنظيم الجينات الذي أطلقنا عليه اسم RUST (التضفير والترجمة غير المنتجين المنظمين). يبدو أن هذا تم تأكيده من خلال اكتشافنا أن جميع أعضاء عائلة SR لمنظمي اللصق لديهم شكل إسوي مرنا بديل غير منتج يستهدف NMD. اللافت للنظر ، يتم حفظ نمط لصق كل منها في الماوس ومرتبطًا دائمًا بمنطقة شديدة الحفظ أو محفوظة بدرجة عالية من

100 نيوكليوتيد أو أكثر لهوية كاملة بين الإنسان والفأر. بشكل ملحوظ ، يبدو أن هذا قد تطور بشكل مستقل في كل جينة ، مما يشير إلى أن هذا هو النمط الطبيعي للتنظيم. نحن نستخدم بيانات ميكروأري لاستكشاف مدى انتشار NMD في البشر وفي ذبابة الفاكهة، بالتعاون مع دون ريو. كجزء من كونسورتيوم modENCODE ، نخطط لاكتشاف ذخيرة رابطة الدول المستقلة- المواقع اللصيقة للتضفير البديل في الحشرات. تتضمن الاتجاهات المستقبلية تفصيل المنظمين في عائلة SR واستكشاف تطور آلية تنظيم التعبير الجيني.

1. Lareau LF، Inada M، Green RE، Wengrod JC، Brenner SE. 2007. التضفير غير المنتج للجينات SR المرتبطة بعناصر DNA المحفوظة للغاية والمحفوظة للغاية. طبيعة 446:926-929. دوى: 10.1038 / nature05676 [PDF 1.3M] [معلومات تكميلية .9M]

2. Hansen KD، Lareau LF، Blanchette M، Green RE، Meng Q، Rehwinkel J، Gallusser FL، Izaurralde E، Rio DC، Dudoit S، Brenner SE. 2009. تحديد الجينوم لأشكال اللصق البديلة التي يتم تنظيمها من خلال اضمحلال الرنا المرسال غير المعقول بوساطة الرنا المرسال في ذبابة الفاكهة. علم الوراثة PLoS 5: e1000525. دوى: 10.1371 / journal.pgen.1000525 [PDF .5M]

3. Celniker SE وآخرون. 2009. مشروع modENCODE (نموذج الكائن الحي ENCyclopedia Of DNA Elements). الطبيعة 459: 927-930. دوى: 10.1038 / 459927a [PDF 1M]

التنبؤ بوظيفة البروتين باستخدام علم تطور جذور بايزي.

نحن غارقون في البروتينات المكتشفة من خلال مشاريع التسلسل عالية الإنتاجية. نظرًا لأنه تم وصف جزء صغير فقط من هذه العناصر تجريبياً ، تُستخدم الطرق الحسابية على نطاق واسع للتعليق التوضيحي الآلي. لسوء الحظ ، غطت هذه التنبؤات قواعد البيانات بمعلومات خاطئة ، لأسباب متنوعة بما في ذلك انتشار الأخطاء والعيوب المنهجية في بلاست والطرق ذات الصلة. بالتعاون مع مجموعة مايكل جوردان ، طورنا نهجًا إحصائيًا للتنبؤ بوظيفة البروتين التي تستخدم شجرة تطور عائلة البروتين ، باعتبارها الهيكل الطبيعي لتمثيل علاقات البروتين. نحن نتراكب على جميع وظائف البروتين المعروفة في العائلة. نستخدم نموذجًا لتطور الوظيفة لاستنتاج وظائف جميع وظائف البروتين الأخرى. حتى تطبيقاتنا الأولية لهذه الطريقة ، المسماة SIFTER (الاستدلال الإحصائي للوظيفة من خلال العلاقات التطورية) كان أداءها أفضل من الطرق الأخرى المستخدمة على نطاق واسع. نقوم حاليًا بإجراء العديد من التحسينات على خوارزمية SIFTER الأساسية وتعزيز قدرتها على العمل على مجموعة واسعة من البيانات. نحن نتعاون مع معهد الجينوم المشترك والعديد من قواعد بيانات البروتين لتحسين الشرح على نطاق واسع. بالتعاون مع Jack Kirsch ، نقوم أيضًا بالتحقق من صحة التنبؤات الوظيفية بشكل تجريبي ، مع التركيز على عائلة Nudix.

Engelhardt BE، Jordan MI، Muratore KE، Brenner SE. 2005. تنبؤ الوظيفة الجزيئية للبروتين من قبل علم التطور العرقي Bayesian. PLoS Comput Biol 1: 432-445. دوى: 10.1371 / journal.pcbi.0010045 [PDF 1.4M]

الجينوميات الشخصية الطبية والبيئية.

كشف مشروع عينات المحيطات العالمي Sorcerer II عن تسلسل الملايين من متواليات البروتين المفترضة الجديدة ، والتي يمكن القول إنها تضاعف مخزون البروتينات المعروف. لقد تعاونا مع معهد فينتر في تحليل هذه البروتينات ، وفهم كيف تختلف عن تلك التي شوهدت سابقًا ، واكتشاف العلاقات القديمة فيما بينها. نحن نعمل على تطوير طريقة binning جديدة من شأنها أن تساعد في تعيين قراءات تسلسلية فردية و contigs إلى clades ، ونحن نتعاون مع Jill Banfield لتطبيق هذا على مجتمع تصريف المناجم الحمضية. يهدف مشروعنا الطبي / الميتاجينومكس الأولي إلى فهم دور ميكروبيوتا الأمعاء في داء كرون. من المعروف منذ فترة طويلة أن داء كرون مرتبط بالمجتمعات الميكروبية في الأمعاء ، لكن المسببات الدقيقة لم تكن واضحة. من خلال أخذ عينات صريحة من هذه المجتمعات ، نهدف إلى فهم أفضل لكيفية تسببها في المرض. بالإضافة إلى ذلك ، من خلال دراسة كيفية تغير النبيت الجرثومي المعوي أثناء سحب المضادات الحيوية على المدى الطويل ، نأمل في الحصول على نظرة ثاقبة لتأثير هذه الأدوية على الجراثيم المعوية. لدينا أيضًا اهتمام طويل الأمد بتفسير الجينوم الشخصي وتطوير مشاع الجينوم.

1. يوسف إس وآخرون. 2007. الرحلة الاستكشافية لعينات المحيطات العالمية الساحر الثاني: توسيع عالم عائلات البروتين. بلوس بيولوجي 5: e16. دوى: 10.1371 / journal.pbio.0050016 [PDF 3M]

2. برينر سراج الدين. 2007. الفطرة السليمة لجينومنا. الطبيعة 449: 783-784. دوى: 10.1038 / 449783a [PDF .2M]

الجينوميات الإنشائية ومجمعات البروتينات.

يهدف علم الجينوم البنيوي في النهاية إلى توفير بنية تجريبية أو نموذج عالي الجودة لكل بروتين. نحن نشارك في الحفاظ على SCOP: التصنيف الهيكلي للبروتينات وقواعد بيانات ASTRAL التي تعد موارد رئيسية للوصول إلى بيانات بنية البروتين وفهمها. لذلك نقوم بتحليل جهود الجينوميات الهيكلية ونوجه اتجاهاتهم المستقبلية. باستخدام أساليب النواة والميزات المحددة ، نقوم ببناء أنظمة للتعرف على العلاقات التطورية القديمة للبروتين. نشارك أيضًا في مشروع تحليل مركب البروتين ، والذي يستخدم مقياس الطيف الكتلي ، والفحص المجهري الإلكتروني ، والتصوير المقطعي الإلكتروني لفهم مجمعات البروتين وتوزيعها الخلوي.

شاندونيا جم ، برينر سراج الدين. 2006. تأثير الجينوميات الهيكلية: التوقعات والنتائج. علم 311: 347-351. دوى: 10.1126 / science.1121018 [PDF .2M] [مادة داعمة 1.2M]


اللاحقة & # 34-blast & # 34

أميلوبلاست (amelo-blast): خلية طليعية تشارك في تكوين مينا الأسنان.

أرومة جنينية (انفجار جنيني): كتلة خلوية داخلية لكيسة أريمية تحتوي على خلايا جذعية جنينية.

الأديم الخارجي (epi-blast): الطبقة الخارجية من الأريمة قبل تكوين الطبقات الجرثومية.

أريثروبلاست (انفجار الكريات الحمر): خلية تحتوي على نواة غير ناضجة توجد في نخاع العظم تشكل كريات الدم الحمراء (خلايا الدم الحمراء).

الخلايا الليفية (انفجار ليفي): خلايا نسيج ضام غير ناضجة تشكل أليافًا بروتينية يتشكل منها الكولاجين ومختلف هياكل الأنسجة الضامة الأخرى.

الأرومة الضخمة (الانفجار الضخم): أرومة حمراء كبيرة بشكل غير طبيعي تنتج عادةً عن فقر الدم أو نقص الفيتامينات.

Myeloblast (myelo-blast): خلايا الدم البيضاء غير الناضجة التي تتمايز إلى خلايا مناعية تسمى الخلايا الحبيبية (العدلات ، الحمضات ، والخلايا القاعدية).

الأرومة العصبية (neuro-blast): خلية غير ناضجة تُشتق منها الخلايا العصبية والأنسجة العصبية.

أوستيوبلاست (osteo-blast): خلية غير ناضجة اشتق منها العظم.

الأرومة الغاذية (tropho-blast): طبقة الخلايا الخارجية من الكيسة الأريمية التي تربط البويضة المخصبة بالرحم وتتطور لاحقًا إلى المشيمة. توفر الأرومة الغاذية العناصر الغذائية للجنين النامي.