معلومة

قاعدة بيانات لدرجة الربط / الالتحام المتوقعة للبروتين-يجند

قاعدة بيانات لدرجة الربط / الالتحام المتوقعة للبروتين-يجند


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

هل توجد قاعدة بيانات لـ "درجات الربط" المحددة حسابيًا عبر أزواج بروتين - يجند في PDB؟

إن عبارة "الدرجة الملزمة" الخاصة بي عامة عمداً ، لأن أي درجة من هذا القبيل ستكون جيدة. على وجه الخصوص ، ستكون بعض طاقة الالتحام ، أي وظيفة التسجيل ، رائعة. (لا تقلق ، فأنا أدرك أن طاقات الإرساء هذه ليست مثالية :)).

أنا أبحث عن تغطية شاملة و نفس يسجل عبر أزواج منضمة ، مما يعني أنه من الواضح أن القياسات التجريبية مستحيلة ؛ ومع ذلك ، آمل أن يكون هناك أشخاص قاموا بتشغيل بعض وظائف تسجيل الالتحام عبر جميع أزواج البروتين - الترابط في PDB ، أو على الأقل عدد كبير منهم.

أنا على دراية بقاعدة البيانات العديدة التي تحتوي على بيانات ربط محددة تجريبياً للمجمعات الهيكلية البروتينية. على سبيل المثال ، Binding Moad و Binding DB و PDB-Bind و SC_PDB كلها جيدة لما يفترض القيام به. ومع ذلك ، لديهم (1) تغطية ضعيفة (أي ليس كل المجمعات لديها بيانات تقارب أو أنها لا تتضمن بعض المجمعات) و (2) تستخدم درجات / مقاييس غير متجانسة (مثل IC50 ، KD ، إلخ ...).

هذا هو ليس مثل هذا السؤال ، حيث إنني أبحث عن تغطية شاملة وعشرات محددة حسابيًا ، وليست محددة تجريبياً.


كيفية استخدام X-Score؟

تتمثل الوظيفة الأساسية لـ X-Score في حساب درجة الارتباط لجزيء يجند معين (أو جزيئات يجند متعددة) للبروتين المستهدف. يجب تخزين البروتين في ملف PDB ، ويجب تخزين جزيء (جزيئات) الترابط في ملف Sybyl / Mol2. يتم تجميع جميع المعلمات اللازمة لتشغيل X-Score في ملف إدخال (انقر هنا لعرض مثال). من المفترض أن تقوم بتحرير هذا الملف لتلبية غرضك الخاص.

لتشغيل X-Score ، ما عليك سوى استخدام هذا الملف كمدخل:

مثال: xscore name_of_the_input_file

سيتم شرح المعلمات المحددة في ملف الإدخال بالتفصيل أدناه. يمكنك العثور على مثال لملف الإدخال ضمن دليل & quot المثال / & quot.

يحتاج X-Score إلى بنية ثلاثية الأبعاد لمركب بروتين-يجند لحساب ثابت الربط الخاص به. يمكن تحديد الهيكل تجريبياً أو نمذجته بواسطة برنامج لرسو السفن. نظرًا لأن معظم برامج الالتحام الجزيئي الحالية ستحافظ على البروتين جامدًا أثناء إرساء الروابط ، من أجل الحوسبة الفعالة ، تتطلب X-Score تخزين البروتين والرابطات في ملفين منفصلين.

من المفترض أن يتم تخزين البنية ثلاثية الأبعاد للبروتين في تنسيق PDB. عند تحضير ملف PDB هذا ، تذكر ما يلي: (1) أضف ذرات الهيدروجين القطبية. لن تؤذي إضافة كل ذرات الهيدروجين ولكن هناك حاجة إلى ذرات الهيدروجين القطبية فقط في الحساب. (2) قم بإزالة أي يجند أو عوامل مساعدة عضوية أخرى. (3) قم بإزالة جميع جزيئات الماء. (4) في حالة وجود أيون معدني داخل موقع الربط ويعتقد أنه مهم لربط الترابط ، احتفظ به كجزء من البروتين. تعتبر X-Score هذا النوع من أيونات المعادن في الحساب. وفقًا لاتفاقية PDB ، يجب وصف أيون معدني بخط يبدأ بـ & quotHETATM & quot. يرجى توخي الحذر لأن ليس كل برنامج يكتب ملف PDB قياسي! البعض منهم ، مثل SYBYL v6.8 ، غير قادر حتى على تصدير المعادن إلى ملف PDB. إذا حدث هذا ، فقد ترغب في إضافة سطر للمعادن يدويًا إلى ملف PDB. (5) من حين لآخر ، توجد بعض المخلفات غير الطبيعية على البروتين ، وسوف تتجاهلها X-Score إذا لم تتمكن من العثور على المعلمات المناسبة لها في مكتبات المعلمات.

تحدد المعلمة RECEPTOR_PDB_FILE في ملف الإدخال المسار واسم هذا الملف.

في بعض الأحيان ، يوجد عامل مساعد عضوي يرتبط مع جزيء الترابط داخل جيب الربط ، مثل CoA و NADH وما إلى ذلك ، وربما ترغب في الاحتفاظ به في مكانه عند تقييم تقاربات الارتباط لجزيئات الترابط. توفر X-Score مثل هذا الخيار: ستتعامل مع العامل المساعد كجزء من البروتين. نظرًا لأن هذا النوع من العوامل المساعدة لا يتم تشكيله عادةً بواسطة أي كتل بناء قياسية ، فإن تنسيق PDB ليس مناسبًا لتقديمها. ولكن بدلاً من ذلك ، يمكنك حفظ العامل المساعد بتنسيق SYBYL MOL2 وتحديد مساره واسمه باستخدام المعلمة COFACTOR_MOL2_FILE في ملف الإدخال. لاحظ أنه: (1) يجب تعيين أنواع الذرة وأنواع الروابط في هذا الجزيء بشكل صحيح وفقًا لتعريف SYBYL. (2) يجب إضافة جميع ذرات الهيدروجين إليه. (3) يجب أن يشترك جزيء العامل المساعد في نفس نظام الإحداثيات مع البروتين والرابط. (4) إذا كان العامل المساعد مرتبطًا تساهميًا بالبروتين ، فأنت بحاجة إلى إزالة تلك الرابطة للحفاظ على العامل المساعد كجزيء منفصل. لن يؤثر هذا التعديل على حساب X-Score.

الشيء الأساسي الذي يجب أن يؤخذ في الاعتبار هو: يجب أن يتم إرساء جزيئات الترابط مسبقًا في الجيب المرتبط بالبروتين المستهدف. X-Score ليس برنامج إرساء. يمكنه فقط حساب أرتباطات الربط لمجمعات بروتينية- يجند معينة.

تتطلب X-Score تخزين الروابط في تنسيق SYBYL Mol2. بطبيعة الحال ، نوصي SYBYL لمثل هذا التحضير. يرجى التأكد من أن نوع الذرة ونوع السندات صحيحان وفقًا لاتفاقيات مجال قوة Tripos. X-Score قادرة على تحديد وتصحيح بعض الأخطاء الشائعة في كتابة الذرة وكتابة السندات ولكن بالتأكيد لا يمكنها التعامل مع جميع المواقف المحتملة. قد تدعم برامج النمذجة الجزيئية الأخرى أيضًا تنسيق Mol2. هناك أيضًا بعض البرامج ، مثل Babel ، والتي تم تصميمها خصيصًا لتحويل التنسيقات المختلفة. ومع ذلك ، فإن تجربتنا هي أن تحويل التنسيق لا يتم دائمًا بطريقة خالية من العيوب.

يجب إضافة جميع ذرات الهيدروجين إلى جزيئات الترابط. الشحنات الذرية ليست ضرورية لحساب X-Score.

إذا كان هناك أكثر من جزيء ليجند واحد ، فيجب تعبئتها جميعًا واحدة تلو الأخرى في هذا الملف. يشار إلى هذا غالبًا باسم & quotmultiple & quot ملف Mol2. نظرًا لأن التعامل مع ملف كبير جدًا من المحتمل أن يؤدي إلى إبطاء جهاز الكمبيوتر الخاص بك بشكل كبير ، فإننا لا نوصيك بتعبئة عدد كبير جدًا من الجزيئات في ملف واحد. الحد المقبول عمومًا هو 100000 جزيء (حوالي عدة مئات من الميجابايت من حيث حجم الملف). إذا كان عليك معالجة المزيد من الروابط ، فيمكنك تقسيمها إلى عدة ملفات Mol2 وتشغيل X-Score لكل منها على التوالي.

تحدد المعلمة LIGAND_MOL2_FILE في ملف الإدخال مسار واسم هذا الملف.

في ملف الإدخال ، جميع الأسطر التي تبدأ بعلامة & quot # & quot هي رموز ويتم تجاهلها من قبل البرنامج.

يجب تعيين المعامل FUNCTION على & quot SCORE & quot. هذا يخبر البرنامج بأداء حساب X-Score.

كما ذكرنا في مقدمة في القسم ، هناك ثلاث وظائف تسجيل تم تنفيذها في X-Score ، أي HPScore و HMScore و HSScore. يمكنك العثور على ثلاثة مفاتيح تبديل في ملف الإدخال ، مثل APPLY_HPSCORE و APPLY_HMSCORE و APPLY_HSSCORE. يمكنك تعيين أي منها كـ & quot؛ YES & quot أو & quot؛ NO & quot لاختيار المجموعة التي تريدها. إذا تم تشغيل جميع وظائف التسجيل الثلاث ، فيمكن عادةً معالجة X-Score

10000 جزيء في الساعة على محطة عمل SGI Octane2 / R12000 / 360MHz.

ميزة أخرى لـ X-Score هي خيار الفرز المسبق للروابط حسب الخصائص الجزيئية. هذا معروف أيضًا باسم & quot؛ قواعد ليبنسكي & quot في تصميم الأدوية ، وهي بعض الأحكام البدائية لـ & quot؛ تشابه الدواء & quot. اقترحت العديد من الأساليب أنه من خلال تطبيق مثل هذه القواعد الكيميائية ، يمكن تقليل الإيجابيات الخاطئة التي لوحظت في الفحص الافتراضي بشكل فعال. هناك تسعة معلمات في ملف الإدخال لتعيين مثل هذه القواعد الكيميائية:

يمكن أن تكون مجموعة الغرض العام من هذه القواعد الكيميائية: الوزن الجزيئي بين 200 إلى 600 LogP بين 1 و 5 عدد الذرات المانحة أقل من 6 وعدد الذرات المستقبلة أدناه 6. هنا يتم حساب قيم logP باستخدام خوارزمية XLOGP2.

سيتم تلخيص جميع النتائج في جدول نصي. تحدد المعلمة OUTPUT_MER_FILE في ملف الإدخال هذا الجدول. السطر الأول من هذا الجدول هو سطر العنوان. يشير كل سطر تالي إلى جزيء ليجند واحد (انقر هنا لعرض مثال). معنى كل عمود هو:

  • العمود الأول: رتبة اللجين. يتم ترتيب جميع الروابط بترتيب تنازلي وفقًا لمتوسط ​​تقاربات الربط المتوقعة
  • العمود الثاني: الصيغة الجزيئية
  • العمود الثالث الوزن الجزيئي
  • العمود الرابع: قيمة تسجيل الدخول
  • العمود الخامس: طاقة الإرساء التي تقدمها DOCK (kcal / mol) ، إذا تم إنشاء ملف ligand Mol2 للإدخال بواسطة DOCK
  • العمود السادس: تقارب الربط المعطى بواسطة HPScore (بتنسيق pKd الوحدات)
  • العمود السابع: تقارب الربط المعطى بواسطة HMScore (بتنسيق pKd الوحدات)
  • العمود الثامن: تقارب الربط المعطى بواسطة HSScore (بتنسيق pKd الوحدات)
  • العمود التاسع: متوسط ​​تقاربات الربط المتوقعة (بتنسيق pKd الوحدات) ، محسوبة عن طريق حساب متوسط ​​جميع وظائف التسجيل الممكّنة
  • العمود الأخير: اسم الجزيء كما هو مستخرج من ملف Mol2

تم تنظيم هذا الجدول بتنسيق SYBYL MERGE. إذا فتحت جدول بيانات في SYBYL ، فيمكنك استيراد هذا الجدول مباشرةً. ولكن نظرًا لأن هذا الجدول هو ملف نصي قياسي مفصول بفواصل ، يمكنك أيضًا استخدام أي برامج جداول بيانات أخرى ، مثل Excel و Origin ، لتحميل هذا الجدول.

تسمح لك X-Score أيضًا باستخراج أفضل المرشحين مرتبة وحفظ كل منهم في ملف Mol2 منفصل لتسهيل المزيد من التحليل. يتم الإشارة إلى المعلمتين الأخيرين في ملف الإدخال لهذا:

هناك معلمة أخرى في ملف الإدخال: CALCULATE_ATOM_BIND_SCORE. يمكن ضبطه على & quot ؛ نعم & quot أو & quot NO & quot. إذا تم تعيينه على & quot ؛ نعم & quot ، فسيقوم البرنامج بحساب مساهمة كل ذرة فردية في تقارب الربط الكلي لجزيء الترابط. ستتم كتابة هذه القيم في ملف Mol2 كشحنات ذرية عند حفظ الترابط. لذلك ، يمكنك فحصها من خلال عرض الشحنات الذرية عند عرض الجزيء. تشغيل CALCULATE_ATOM_BIND_SCORE له تأثير ضئيل جدًا على سرعة الحساب.

رسم توضيحي لنقاط الربط الذري (بتنسيق pKd الوحدات)

تمنحك درجة الربط & quot هذه & quot ؛ عادةً فكرة جيدة عن أي جزء من جزيء الترابط يساهم بشكل أكبر في تقارب الربط. وفقًا لذلك ، يمكنك تحسين الجزيء عن طريق تحسين أجزاء & quotgood & quot أو إزالة أجزاء & quotbad & quot. لقد وجدنا ، بالإضافة إلى العديد من المستخدمين ، هذا المفهوم مفيدًا لتصميم الأدوية القائم على الهيكل.

الطريقة القياسية لتشغيل X-Score ، التي تم وصفها أعلاه ، مناسبة لتسجيل جزيئات يجند متعددة مقابل هدف معين. يظهر هذا عادةً في تطبيق فحص قاعدة البيانات الافتراضية. لكن في بعض الأحيان ، يريد المستخدم فقط تسجيل علامة ترابطية معينة ضد هدفه والحصول على ردود فعل سريعة. يوفر X-Score اختصارًا لهذا الغرض:

xscore the_protein_PDB_file الملف_ligand_Mol2_file

xscore the_protein_PDB_file the_cofactor_Mol2_file the_ligand_Mol2_file

في مثل هذه الحالات ، يتم تعيين المعلمات التالية تلقائيًا بواسطة البرنامج على النحو التالي:


مقدمة

يعد استكشاف تفاعلات البروتين - الترابط أمرًا ضروريًا لاكتشاف الأدوية والبيولوجيا الكيميائية في التنقل في مساحة الجزيئات الصغيرة واضطراباتها على الشبكات البيولوجية. مثل هذه التفاعلات ضرورية لتطوير خيوط دوائية جديدة ، والتنبؤ بالآثار الجانبية للأدوية المعتمدة والمرشحين ، وإزالة الضربات المظهرية اليتيمة. لذلك ، فإن التحقق الدقيق والشامل من تفاعلات البروتين الرابط هو أمر أساسي لتطوير الأدوية وعلاج الأمراض. يمكن أن يكون تحديد وتحليل تفاعلات البروتين-الترابط تجريبياً تحديًا 1،2 ، وغالبًا ما يتضمن تجارب منسدل معقدة ومقايسات تحقق متعامدة. لذلك ، تم تكريس العديد من الجهود لتطوير استراتيجيات حسابية سريعة للتنبؤ بتفاعلات البروتين - الترابط من أجل تحديد أولويات التجارب وتبسيط التفكك التجريبي لمساحة التفاعل. على سبيل المثال ، تم تطبيق محاكاة الإرساء ، حيث يتم استخدام الهيكل ثلاثي الأبعاد للهدف لتقييم مدى ارتباط الروابط الفردية المرشحة بالهيكل ، بشكل منتج لتحديد التفاعلات الجديدة بين الأهداف ذات الصلة سريريًا والجزيئات الصغيرة 3،4. من الجدير بالذكر أن عمليات محاكاة الالتحام غير مجدية عندما لا تتوفر الهياكل ثلاثية الأبعاد للأهداف (على سبيل المثال ، تلك المستمدة من التبلور وتجارب حيود الأشعة السينية) ، كما يتضح من العديد من المستقبلات المقترنة ببروتين G (GPCRs) ، وهي بروتينات تمتد عبر الغشاء. بطبيعته من الصعب بلورته. على العكس من ذلك ، يتم تطبيق الأساليب القائمة على الترابط (على سبيل المثال ، البحث عن تشابه بصمات الأصابع ، ونماذج الصيدلة ، وأساليب التعلم الآلي) بشكل متزايد في البحث والتطوير للتنبؤ بالتفاعلات داخل وخارج الهدف ، ولكنها تتطلب في كثير من الأحيان كميات كبيرة من بيانات الترابط المتاحة تحقيق الدقة التنبؤية المطلوبة. هناك استراتيجية حسابية أخرى مستخدمة على نطاق واسع وهي التنقيب عن النصوص ، والتي تستخدم قواعد بيانات المؤلفات العلمية مثل PubMed 5. يعتمد التنقيب عن النص على البحث عن الكلمات الرئيسية وهو محدود في قدرته على اكتشاف الارتباطات الجديدة. يمكن أن تزداد العملية تعقيدًا بسبب تكرار أسماء المركبات أو البروتينات في الأدبيات 6.

في الآونة الأخيرة ، للتحايل على أوجه القصور في الطرق القائمة على الترابط والهدف والاستفادة من جميع المعلومات المتاحة ، ظهرت علم الجينوميات الكيميائي الحسابي (أو النمذجة الكيميائية البروتينية) كمجال نشط للنمذجة التنبؤية. هنا ، تجمع دراسة تفاعلات البروتين - الترابط في وقت واحد بين هدف البروتين ومعلومات الترابط مع مناهج التعلم الآلي لتوفير رؤى قيمة في مساحة التفاعل. على سبيل المثال ، توجد عدة طرق قادرة على التنبؤ بعائلات البروتين المستهدفة ومواقع الارتباط بناءً على الهياكل المعروفة لمجموعة من الروابط 7،8،9،10. ومع ذلك ، مع شح المعلومات حول البروتينات الفعلية ، تكون التفاعلات المتوقعة ، في أحسن الأحوال ، فقط بين الروابط المعروفة وعائلات البروتين المختلفة. بعض الأساليب ، التي تتمحور حول الهدف ، تستفيد استفادة كاملة من خصائص البروتين ، لكنها تفشل في التنبؤ بتفاعلات الترابطات اليتيمة لأن الأخيرة ليس لها روابط معروفة بأي بروتينات 11. تم اقتراح عدة طرق للنظر في كل من متواليات البروتين والتركيبات الكيميائية الرابطة في وقت واحد في التنبؤ 12،13،42.

افترضنا أن النمذجة الكيميائية الجينية يمكن أن تستفيد ليس فقط من تضمين المعلومات حول التشابه بين الترابط والبروتين ولكن أيضًا بشكل صريح على مساحة التفاعل الدوائي وبالتالي العلاقة بين الروابط والبروتينات (الشكل 1 أ). تتكون المعلومات المجمعة من ثلاث مسافات فرعية ، يشبه شكلها ربطة الانحناءة ، ومن هنا جاء اسم مساحة القوس الدوائية. ويغطي مساحة بروتينية تشفر ميزات تسلسل البروتين ، ومساحة ليجند تحتوي على بصمات مركبات كيميائية ، ومساحة تفاعل ، مشفرة من خلال التفاعلات المعروفة التي تربط البروتين والرابط. علاوة على ذلك ، نصف نموذجًا جديدًا للتنبؤ من خلال تطبيق أشجار الانحدار المضافة المضافة (BART) وطرق التعلم الآلي الأخرى على هذه الميزات المجمعة من البروتين والرابط ومعلومات التفاعل. أبرز اختيار الميزة بالإضافة إلى تجارب أخذ العينات الفرعية فائدة جميع المساحات الفرعية للواصف المتاحة وبالتالي مساحة القوس الدوائية (مساحة BOW) التي تم تطويرها حديثًا هنا. بالمقارنة مع خوارزميات تعلم الآلة الكلاسيكية الأخرى ، تفوقت خوارزمية BART على جميع الطرق المختبرة وأظهرت قوة تنبؤ جيدة (دقة 94-99٪ على مجموعات بيانات مختلفة). علاوة على ذلك ، يمكن أن يوفر BART وصفًا كميًا لاحتمالية التفاعلات المتوقعة وبالتالي يوفر مقياسًا مهمًا لعدم اليقين التنبئي. بالإضافة إلى التحليل بأثر رجعي ، نسلط الضوء أيضًا على تنبؤ نموذجي واحد لرابط جديد لبروتين KIF11 تم التحقق من صحته بنجاح باستخدام محاكاة الالتحام وتم تأكيده لاحقًا من خلال دراسة علم البلورات التي نفذتها مجموعة بحثية مستقلة.

مساحة القوس الدوائية. (أ) يمتد الفضاء الدوائي القوسي على ثلاث مساحات فرعية: مساحة البروتين باللون الأزرق ، ومساحة الترابط باللون الأخضر ، ومساحة التفاعل باللون الوردي. الدوائر المملوءة تمثل البروتينات والمثلثات تمثل الروابط. يُشار إلى أزواج البروتين والرابطات للتفاعلات المعروفة من قواعد البيانات المنشورة على أنها "معروفة" في حين يُشار إلى تلك التي لم يتم تنسيقها في قواعد البيانات على أنها "جديدة". تشير الخطوط الصلبة إلى تفاعلات معروفة في مساحة التفاعل بينما توضح الخطوط المتقطعة ثلاثة أنواع من التفاعلات غير المعروفة (بروتين غير معروف مع يجند معروف ② بروتين معروف مع يجند غير معروف ③ بروتين غير معروف مع يجند غير معروف). (ب) الميزات في الفضاء الدوائي القوس.


المواد والأساليب

مجموعة البيانات

تم اختيار 50 مجمعًا ليجند البروتين من ثلاث قواعد بيانات مختلفة لضمان مجموعة واسعة من الأنظمة بدقة جيدة: تم أخذ 20 بنية من قاعدة بيانات Ligand-Protein (http://lpdb.scripps.edu) [15] ، 12 من تمت إضافة قاعدة بيانات التدريب لـ X-Score [16] ، و 18 بنية من بنك بيانات البروتين [17]. جميع الهياكل باستثناء أربعة لها دقة 2.5 & # x000c5 أو أفضل (الجدول 1 ، المواد التكميلية). مجموعة البيانات غير زائدة عن الحاجة حيث يتم تمثيل كل بروتين ورابط مرة واحدة فقط.

الالتحام والتسجيل

تمت معالجة الروابط المستخرجة من ملفات بنك بيانات البروتين بالبروتينات وتحويلها إلى تنسيق mol2 باستخدام InsightII (Accelrys ، Inc. ، San Diego ، CA). لضمان أخذ عينات مطابقة شاملة لكل يجند ، تم إنشاء مطابقة منخفضة الطاقة لكل جزيء باستخدام أوميغا الإصدار 2 (OpenEye Scientific Software ، Santa Fe ، NM). تم استخدام SLIDE [18 & # x0201320] الإصدار 3.1 لربط المحولات في مواقع الربط للبروتينات المستهدفة المقابلة من الهياكل المعقدة. تم التعامل مع السلاسل الجانبية للبروتين والأربطة بمرونة أثناء الالتحام. كان عدد اتجاهات الترابط التي تم الحصول عليها باستخدام هذا البروتوكول بين 71 و 1000 ، بمتوسط ​​622 رصيف لكل مجمع. بشكل افتراضي ، تم تسجيل كل وضع راسخ باستخدام وظيفة التسجيل المحدثة مؤخرًا SLIDE & # x02019s AffiScore ، وهو مجموع مرجح من جهات الاتصال الكارهة للماء ، والروابط الهيدروجينية ، وجسور الملح ، والتفاعلات المعدنية ، والتفاعلات القطبية غير المرضية والمثيرة للاشمئزاز (Zavodszky MI ، Tonero ME ، He L ، Arora S ، Namilikonda S ، و Kuhn LA ، بيانات غير منشورة). تبع ذلك إنقاذ جميع الأوضاع باستخدام التطبيق الأصلي لـ DrugScore [21] و X-Score [16]. عندما تم تدوير السلاسل الجانبية المستهدفة أثناء الالتحام بالرابط ، تم استخدام مطابقة البروتين المتغيرة عند تسجيل الروابط الراسية مع جميع وظائف التسجيل الثلاث.

تحسين التهديف القائم على الارتباط

تم وصف طريقة تحسين التسجيل المعتمدة على الارتباط سابقًا [13]. يتم تلخيصها بإيجاز في ما يلي: بأخذ معقد واحد في كل مرة ، يتم حساب معاملات ارتباط بيرسون بين الدرجة وجذر الانحراف التربيعي المتوسط ​​(RMSD) لكل وضع راسي يستخدم كحالة مرجعية. ثم يتم تعيين معامل الارتباط الناتج إلى الوضع المرجعي باعتباره النتيجة الجديدة القائمة على الارتباط (CBScore). يفترض حساب معامل ارتباط بيرسون وجود علاقة خطية بين الدرجة و RMSD ، ومع ذلك تؤكد الملاحظة التجريبية وجود علاقة غير خطية (الشكل 1). أكدت مقارنة بين معاملات الارتباط للدرجات مقابل RSMD مع معاملات الارتباط للنتائج مقابل lnRMSD أن الدرجات مرتبطة بشكل أفضل مع لوغاريتم RSMD (الشكل 2). وبناءً على ذلك ، تم تعديل الطريقة الأصلية لحساب هذه الدرجة باعتبارها الارتباط بين الدرجات واللوغاريتم الطبيعي لـ RMSD في هذه الدراسة. صيغة حساب CBScore المعدلة للوضع أنا يكون:

أين داي جاي هو RMSD بين الوضعيات أنا و ي, سي هي النتيجة الأصلية للوضع ي، و ن هو عدد الوضعيات الراسية. من الجدير بالذكر أنه في وضع معين أنا، النتيجة المستندة إلى الارتباط سي بي اسكورأنا لا تعتمد على النتيجة الأصلية سأنا من هذا الوضع.

توفر دالة أسية من النوع y = P1 + P2 * (1-exp (-x / P3)) (الخط الصلب) ملاءمة أفضل لبيانات DrugScore مقابل بيانات RMSD من دالة خطية (خط متقطع) كما هو موضح للمركب 1 حبة (أ). نتيجة لذلك ، يوجد ارتباط خطي بين الدرجات واللوغاريتم الطبيعي لـ RMSD (B).

معاملات الارتباط بين الدرجة و RSMD مقابل معاملات الارتباط بين الدرجة و lnRSMD لـ AffiScore (A) و DrugScore (B) و X-Score (C). تمثل نقاط البيانات فوق القطر الحالات التي ترتبط فيها الدرجات بشكل أفضل مع لوغاريتم RSMD مقارنةً بـ RMSD.


VoteDock: طريقة الالتحام الإجماعية للتنبؤ بتفاعلات البروتين - الترابط

يلعب التعرف الجزيئي دورًا أساسيًا في جميع العمليات البيولوجية ، ولهذا السبب تم بذل جهود كبيرة لفهم وتوقع تفاعلات البروتين - الترابط. يعد العثور على جزيء يمكن أن يرتبط بالبروتين المستهدف أمرًا ضروريًا بشكل خاص في اكتشاف الأدوية ولا يزال مهمة باهظة الثمن وتستغرق وقتًا طويلاً. في السيليكو، يتم استخدام الأدوات بشكل متكرر لفحص المكتبات الجزيئية لتحديد مركبات الرصاص الجديدة ، وإذا كانت بنية البروتين معروفة ، فيمكن استخدام برامج إرساء بروتينية مختلفة. الهدف من إجراء الالتحام هو التنبؤ بالوضع الصحيح للرابط في موقع الارتباط للبروتين بالإضافة إلى تسجيلها وفقًا لقوة التفاعل في إطار زمني معقول. كان الغرض من دراستنا هو تقديم نهج الإجماع الجديد للتنبؤ بكل من التركيب المركب للبروتين والليغند وتقارب الارتباط المقابل له. تم استخدام طريقتنا كمدخلات للنتائج من سبعة برامج لرسو السفن (Surflex و LigandFit و Glide و GOLD و FlexX و eHiTS و AutoDock) التي تُستخدم على نطاق واسع لرسو الروابط. قمنا بتقييمه على مجموعة البيانات المعيارية الشاملة المكونة من 1300 زوج من البروتين - الروابط من قاعدة بيانات PDBbind المكررة التي توفرت لها البيانات الهيكلية والتقارب. قارنا بشكل مستقل قدرتها على التسجيل الصحيح والتظاهر بالطرق المقترحة سابقًا. في معظم الحالات ، تكون طريقتنا قادرة على الالتحام بشكل صحيح بحوالي 20٪ من الأزواج أكثر من طرق الإرساء في المتوسط ​​، وأكثر من 10٪ من الأزواج أكثر من أفضل برنامج منفرد. يتم تقليل قيمة RMSD للتشكيل المعقد المتوقع مقابل التشكل الأصلي بمعامل 0.5 Å. أخيرًا ، تمكنا من زيادة ارتباط Pearson لتقارب الربط المتوقع مقارنة بالقيمة التجريبية حتى 0.5. © 2010 Wiley Periodicals، Inc. J Comput Chem 32: 568-581، 2011

يمكن العثور على معلومات إضافية داعمة في النسخة عبر الإنترنت من هذه المقالة.

اسم الملف وصف
JCC_21642_sm_SuppTable1.doc1.2 ميغابايت جدول المعلومات الداعمة 1.
JCC_21642_sm_SuppTable2.doc36.5 كيلوبايت جدول المعلومات الداعمة 2.
JCC_21642_sm_SuppTable3.doc39 كيلوبايت جدول المعلومات الداعمة 3.
JCC_21642_sm_SuppTable4.doc35 كيلو بايت جدول المعلومات الداعمة 4.

يرجى ملاحظة ما يلي: الناشر غير مسؤول عن محتوى أو وظيفة أي معلومات داعمة مقدمة من المؤلفين. يجب توجيه أي استفسارات (بخلاف المحتوى المفقود) إلى المؤلف المقابل للمقالة.


AutoDock و AutoDock Vina

تم تطوير طريقتين لرسو السفن بالتوازي ، للاستجابة لاحتياجات مختلفة. بدأ التطوير مع AutoDock 2،3،5،21،22 ، ولا يزال يمثل منصة للتجارب في طرق الإرساء. تم تطوير AutoDock Vina مؤخرًا لتلبية الحاجة إلى طريقة إرساء جاهزة لا تتطلب معرفة واسعة من الخبراء من المستخدمين 1. تم تحسينه بشكل كبير لإجراء تجارب الإرساء باستخدام طرق افتراضية تم اختبارها جيدًا. كلا الطريقتين متاحتان مجانًا حاليًا. يعد AutoDock Vina سريعًا وفعالًا لمعظم الأنظمة ، بينما يتوفر AutoDock للأنظمة التي تتطلب تحسينات منهجية إضافية.

تم تصميم كلتا الطريقتين لتكونا أدوات إرساء حسابية عامة ، وقبول ملفات الإحداثيات للمستقبلات والرابط ، والتنبؤ بالمطابقة المثلى الراسية. عادةً ما يبدأ المستخدمون بإحداثيات المستقبلات من علم البلورات أو التحليل الطيفي بالرنين المغناطيسي النووي ، وإحداثيات الترابط المتولدة من سلاسل SMILES أو طرق أخرى.

نظرًا لأن طرق البحث عشوائية ، يتم توقع مجموعة من المطابقات المثلى التي يتم إرساءها ، ثم يتم تجميعها مكانيًا لتحليل اتساق النتائج. النتائج المجمعة بشكل كبير هي مؤشر على أن إجراء البحث المطابق شامل بما يكفي لضمان تغطية مساحة التوافق التي يمكن الوصول إليها. نظرًا للطبيعة العشوائية للبحث ، لا يمكن للطريقة ضمان العثور على حد أدنى عالمي. لهذا السبب ، من المهم استخدام تجارب إعادة الالتحام مع المجمعات المعروفة ذات التعقيد المطابق المماثل لتقييم بروتوكول الإرساء المستخدم.

يستخدم AutoDock و AutoDockVina حاليًا العديد من التبسيطات التي تؤثر على النتائج التي تم الحصول عليها. التبسيط الأكثر أهمية هو استخدام مستقبلات جامدة. يقلل هذا التقريب من حجم مساحة التوافق ، مما يسمح بالبحث عنها بشكل موثوق ، ويقلل من الجهد الحسابي لتسجيل كل تشوه تجريبي. عند تطبيق طرق الإرساء هذه على مستقبل معين ، من المهم مراعاة التأثيرات المحتملة لهذا القيد ، وإذا كان النظام يتضمن حركة مستقبلية كبيرة ، فيمكن استخدام عدد من الطرق ، بما في ذلك:

استخدام هياكل المستقبلات المأخوذة من مجمعات مستقبلات - يجند ، حيث توجد بعض التوقعات بأن المستقبل في الشكل المناسب.

الالتحام بمجموعة من هياكل المستقبلات المختلفة ، والتي تغطي النطاق المتوقع من المرونة في المستقبل. يمكن الحصول على هذه من عدة قرارات هيكلية أو محاكاة.

استخدام مرونة السلسلة الجانبية للمستقبلات الصريحة أثناء الإرساء ، إذا كانت المعلومات متاحة على السلاسل الجانبية ذات الصلة (الموضحة في البروتوكول).

تستخدم طرق تسجيل الدرجات أيضًا مجموعة متنوعة من التبسيط التي ستؤثر على النتائج. وظيفة تسجيل النقاط AutoDock Vina تقريبية للغاية ، مع إمكانات رابطة هيدروجين متناظرة كرويًا ، وهيدروجين ضمني ، وعدم وجود مساهمة كهروستاتيكية. لقد ثبت أنه يعمل بشكل جيد مع الروابط ذات الحجم والتكوين البيولوجي النموذجيين. يشتمل مجال قوة AutoDock على مساهمات فيزيائية ، بما في ذلك مصطلح ارتباط هيدروجين اتجاهي مع الهيدروجين القطبي الواضح ، والكهرباء الساكنة. إذا كانت هذه المساهمات مهمة في نظام معين ، فإن AutoDock سيكون الأداة المناسبة. بالإضافة إلى ذلك ، تتوفر معلمات وظيفة تسجيل النقاط AutoDock للمستخدم ، للسماح بضبط أنظمة معينة إذا رغبت في ذلك. على سبيل المثال ، تم تطوير طرق لدمج المذيبات الصريحة والتنبؤ بمطابقات المجمعات التساهمية من خلال تعديل إمكانات AutoDock 23،24


SFCscore: وظائف تسجيل النقاط للتنبؤ بتقارب مجمعات البروتين - يجند

العنوان الحالي: معهد الصيدلة وكيمياء الأغذية ، جامعة فورتسبورغ ، أم هوبلاند ، D-97074 فورتسبورغ ، ألمانيا.

قسم الكيمياء الصيدلية ، جامعة فيليبس ماربورغ ، D-35032 ماربورغ ، ألمانيا

عنوان Paul Sanschagrin الحالي هو Schrodinger، Inc.، 120 W 45th St، New York، NY 10036، USA.

قسم الكيمياء الصيدلية ، جامعة فيليبس ماربورغ ، D-35032 ماربورغ ، ألمانيا

العنوان الحالي: Sanofi-Aventis Deutschland GmbH، Chemical Sciences، Drug Design، Industriepark Höchst، D-65926 Frankfurt am Main، Germany.

قسم الكيمياء الصيدلية ، جامعة فيليبس ماربورغ ، D-35032 ماربورغ ، ألمانيا

قسم الكيمياء الصيدلية ، Philipps-Universität Marburg، Marbacher Weg 6، D-35032 Marburg، Germany === ابحث عن المزيد من الأوراق البحثية لهذا المؤلف

قسم الكيمياء الصيدلية ، جامعة فيليبس ماربورغ ، D-35032 ماربورغ ، ألمانيا

العنوان الحالي: معهد الصيدلة وكيمياء الأغذية ، جامعة فورتسبورغ ، أم هوبلاند ، D-97074 فورتسبورغ ، ألمانيا.

قسم الكيمياء الصيدلية ، جامعة فيليبس ماربورغ ، D-35032 ماربورغ ، ألمانيا

عنوان Paul Sanschagrin الحالي هو Schrodinger، Inc.، 120 W 45th St، New York، NY 10036، USA.

قسم الكيمياء الصيدلية ، جامعة فيليبس ماربورغ ، D-35032 ماربورغ ، ألمانيا

العنوان الحالي: Sanofi-Aventis Deutschland GmbH، Chemical Sciences، Drug Design، Industriepark Höchst، D-65926 Frankfurt am Main، Germany.

قسم الكيمياء الصيدلية ، جامعة فيليبس ماربورغ ، D-35032 ماربورغ ، ألمانيا

قسم الكيمياء الصيدلية ، Philipps-Universität Marburg، Marbacher Weg 6، D-35032 Marburg، Germany === ابحث عن المزيد من الأوراق البحثية لهذا المؤلف

الملخص

تمت معايرة وظائف التسجيل التجريبية لحساب التقاربات الملزمة لمجمعات البروتين - يجند بناءً على البنية التجريبية وبيانات التقارب التي تم جمعها من المصادر العامة والصناعية. تم الحصول على البيانات العامة من قاعدة بيانات AffinDB ، في حين تم الحصول على الوصول إلى البيانات الصناعية من خلال Scoring Function Consortium (SFC) ، وهو جهد تعاوني مع العديد من شركات الأدوية ومركز Cambridge Crystallographic Data Center. تم الحصول على أكثر من 850 مجمعًا من خلال إجراء جمع البيانات واستخدامها لاحقًا لإعداد مجموعات تدريب مختلفة لتحديد معايير وظائف التسجيل الجديدة. تم تقييم أكثر من 60 واصفًا مختلفًا لجميع المجمعات ، بما في ذلك المصطلحات التي تمثل التفاعلات مع وبين أنظمة الحلقة العطرية بالإضافة إلى العديد من المصطلحات التي تعتمد على السطح. بعد تحليل الارتباط الاستكشافي والانحدار ، وإجراءات الاختيار المتغيرة التدريجية والبحث المنتظم ، تم اختيار أنسب الواصفات كمتغيرات لمعايرة وظائف الانحدار عن طريق الانحدار الخطي المتعدد أو تحليل المربعات الصغرى الجزئية. ثمانية وظائف مختلفة معروضة هنا. عبر التحقق من صحتها ص 2 (س 2) قيم تصل إلى 0.72 وأخطاء معيارية (سصحافة) بشكل عام أقل من 1.15 صكأنا تشير الوحدات إلى وظائف تنبؤية عالية. تم إجراء تحقق شامل وغير متحيز من خلال اختبار الوظائف على مجموعات البيانات الكبيرة من قاعدة بيانات PDBbind كما استخدمها وانغ وآخرون. (J Chem Inf Comput Sci 200444: 2114-2125) في تحليل مقارن لوظائف تسجيل النقاط الأخرى. لوحظ أداء متفوق لوظائف SFCscore في كثير من الحالات ، لكن النتائج توضح أيضًا الحاجة إلى مزيد من التحسينات. البروتينات 2008. حقوق النشر © لعام 2008 محفوظة لشركة Wiley-Liss، Inc.

يمكن العثور على المواد التكميلية المشار إليها في هذه المقالة على الإنترنت على http://www.interscience.wiley.com/jpages/0887-3585/suppmat/

اسم الملف وصف
prot22058-Supporting_Information_R2.pdf86.5 كيلوبايت دعم ملف المعلومات prot22058-Supporting_Information_R2.pdf

يرجى ملاحظة ما يلي: الناشر غير مسؤول عن محتوى أو وظيفة أي معلومات داعمة مقدمة من المؤلفين. يجب توجيه أي استفسارات (بخلاف المحتوى المفقود) إلى المؤلف المقابل للمقالة.


إدخال وإخراج الخادم

مدخل

يمكن أن يكون الإدخال إلى خادم COACH-D إما تسلسل الأحماض الأمينية أو الهيكل ثلاثي الأبعاد (3D) لبروتين الاستعلام. بالإضافة إلى ذلك ، يمكن للمستخدمين إرسال ترابط خاص بهم. عند تقديم تسلسل الأحماض الأمينية للبروتين ، سيتم استخدام مجموعة I-TASSER Suite (4) لإنشاء نموذج هيكل ثلاثي الأبعاد أولاً. ثم يتم استخدام الهيكل للتنبؤ بمواقع ربط الترابط والالتحام الجزيئي اللاحق. نود أن نشير إلى أنه باستثناء ConCavity ، تم تصميم خوارزميات المكونات الأخرى في COACH-D لهياكل المونومر. وبالتالي ، سيتم استخراج السلسلة الأولى فقط عند تقديم أوليغومرات. نحن نخطط لتوسيع الخوارزمية بحيث يمكن أن تعمل مع القلة في المستقبل. An option is provided to protect the users’ personal data by checking on the checkbox of ‘Keep my results private’. A password is then assigned to the users to access the modeling results. In general, it takes 2–5 h to complete the modeling for a structure submission with ∼300 residues.

انتاج |

One predicted 3D structure model for the submission with amino acid sequence.

The top five protein–ligand binding pockets and the binding residues in each pocket.

The top five protein–ligand complex structures with the input ligand.

The top five protein–ligand complex structures with the ligands from the PDB template structures.

A summary of ligands that are possible to bind the protein.

All these modeling results are put together into a single tarball, which can be downloaded to a local computer for use. All ligand-binding poses from AutoDock Vina are also put into the tarball. A confidence score (c-score) in the range of [0, 1] is provided to judge the reliability of each prediction. Please refer to the COACH article for more information about the scoring function of c-score ( 7).

Figure 2 illustrates the modeling results for an example submission with a protein structure and a ligand. Explanation about the meaning of each column in the table can be viewed by hovering the mouse pointer over the corresponding question sign. For this example, the first prediction is highly confident, as reflected by the high c-score. A total of 12 residues were predicted to be involved in the ligand binding. The total number of templates used for making this prediction is 329 (i.e. the ‘Cluster size’ shown in the figure) and the one with the highest similarity to the query structure is from the PDB template 1lwxA. The representative ligand AZD (3′-Azido-3′-Deoxythymidine-5′-Diphosphate) was docked into the predicted binding pocket. The complex structures are visualized based on the 3Dmol library ( 20). The default view is for the complex structure built with the input ligand, which can be switched to other complex structures by clicking on the corresponding ‘View’ button under the ‘Pose t ’ and ‘Pose u ’ columns. All complex structures can be downloaded for further analysis and customized visualization with other molecular graphics systems. The docking energies for the complex structures are listed under the ‘Energy t ’ and the ‘Energy u ’ columns.

The output page for each submission to the COACH-D server. The visualization of the complex structure is obtained by the 3Dmol library ( 20). The protein structure is shown in grey surface and orange cartoon. The ligand binding poses are shown in magenta balls and sticks. The consensus binding residues are highlighted in blue sticks.

The output page for each submission to the COACH-D server. The visualization of the complex structure is obtained by the 3Dmol library ( 20). The protein structure is shown in grey surface and orange cartoon. The ligand binding poses are shown in magenta balls and sticks. The consensus binding residues are highlighted in blue sticks.


خيارات الوصول

Get full journal access for 1 year

جميع الأسعار أسعار صافي.
سيتم إضافة ضريبة القيمة المضافة في وقت لاحق عند الخروج.
سيتم الانتهاء من حساب الضريبة أثناء الخروج.

احصل على وصول محدود أو وصول كامل للمقالات على ReadCube.

جميع الأسعار أسعار صافي.


Computational biotechnology: Prediction of competitive substrate inhibition of enzymes by buffer compounds with protein–ligand docking

In vitro enzymatic activity highly depends on the reaction medium. One of the most important parameters is the buffer used to keep the pH stable. The buffering compound prevents a severe pH-change and therefore a possible denaturation of the enzyme. However buffer agents can also have negative effects on the enzymatic activity, such as competitive substrate inhibition. We assess this effect with a computational approach based on a protein–ligand docking method and the HYDE scoring function. Our method predicts competitive binding of the buffer compound to the active site of the enzyme. Using data from literature and new experimental data, the procedure is evaluated on nine different enzymatic reactions. The method predicts buffer–enzyme interactions and is able to score these interactions with the correct trend of enzymatic activities. Using the new method, possible buffers can be selected or discarded prior to laboratory experiments.

يسلط الضوء

► Buffers can inhibit enzyme activity by binding competitively at the active site. ► The inhibitory potential of buffers can be predicted with chemoinformatic methods. ► We apply protein–ligand docking, typically used in drug-design, to this problem. ► Evaluation of the method on nine enzymes shows prediction of the correct trend.


شاهد الفيديو: Cell Membranes, Ligands, Receptors, and Phospholipids (ديسمبر 2022).