معلومة

هل توجد بروتينات بزخارف متعددة؟

هل توجد بروتينات بزخارف متعددة؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

هل يتبنى كل بروتين شكلاً هيكليًا واحدًا محددًا (إصبع الزنك على سبيل المثال) أم أن هناك بروتينات ذات أشكال متعددة على طول السلسلة؟


تحتوي معظم البروتينات الكبيرة على أشكال متعددة ؛ إذا كنت تبحث على الإنترنت عن صور لتراكيب البروتين ، فيجب أن يكون ذلك واضحًا على الفور. هذا مثال من شيء كنت أعمله في ذلك اليوم: تكرار WD40. يظهر في العديد من البروتينات ، لكن هذه البروتينات هي بالتأكيد أكثر بكثير من مجرد مجموعة من وحدات WD40. إذا قمت بفحص بعض البروتينات المدرجة في أسفل صفحة ويكيبيديا هذه ، فيجب أن تكون قادرًا على تأكيد أنها معقدة وتتكون من أنواع مختلفة من المجالات والأشكال والأجزاء.

ذكرت أيضا أصابع الزنك. هذه هي فكرة مرتبطة بالحمض النووي تظهر في العديد من البروتينات المختلفة المرتبطة بالحمض النووي. هذه البروتينات المختلفة المرتبطة بالحمض النووي لها العديد من الوظائف المختلفة ، ويتم التعامل مع خصوصيتها من خلال مجموعة واسعة من الأنواع المختلفة من الأشكال والنطاقات التي تقع أعلى / خارج إصبع الزنك نفسه. تُظهر مقالة ويكيبيديا حول أصابع الزنك العديد من الهياكل المختلفة التي يمكن دمج أصابع الزنك فيها ، وحتى تلك الهياكل ليست سوى أجزاء صغيرة من البروتينات الوظيفية الفعلية التي تؤدي العمل في الخلية.


البحث عن الحافز البنيوي في الوقت الحقيقي في البروتينات باستخدام إستراتيجية الفهرس المقلوب

الانتماءات RCSB Protein Data Bank ، San Diego Supercomputer Center ، University of California ، San Diego ، La Jolla ، California ، USA ، RCSB Protein Data Bank ، Institute for Quantitative Biomedicine ، Rutgers ، The State University of New Jersey ، Piscataway ، New Jersey ، USA ، قسم الكيمياء والبيولوجيا الكيميائية ، روتجرز ، جامعة ولاية نيو جيرسي ، بيسكاتواي ، نيو جيرسي ، الولايات المتحدة الأمريكية ، معهد السرطان بنيوجيرسي ، روتجرز ، جامعة ولاية نيو جيرسي ، نيو برونزويك ، نيو جيرسي ، الولايات المتحدة الأمريكية ، مدرسة سكاجز في الصيدلة والعلوم الصيدلانية ، جامعة كاليفورنيا ، سان دييغو ، لا جولا ، كاليفورنيا ، الولايات المتحدة الأمريكية

تصور الأدوار ، المنهجية ، الإشراف ، التصور ، الكتابة - المراجعة والتحرير

الانتماء RCSB Protein Data Bank ، San Diego Supercomputer Center ، جامعة كاليفورنيا ، سان دييغو ، لا جولا ، كاليفورنيا ، الولايات المتحدة الأمريكية


خيارات الوصول

احصل على الوصول الكامل إلى دفتر اليومية لمدة عام واحد

جميع الأسعار أسعار صافي.
سيتم إضافة ضريبة القيمة المضافة في وقت لاحق عند الخروج.
سيتم الانتهاء من حساب الضريبة أثناء الخروج.

احصل على وصول محدود أو كامل للمقالات على ReadCube.

جميع الأسعار أسعار صافي.


جميع الهياكل فوق الثانوية عبارة عن زخارف ، ولكن ليست كل الأشكال هي هياكل فوقية.

الزخارف ، بالمعنى البيولوجي ، تشبه إلى حد بعيد زخارف الموضة. إنها أنماط تتكرر في العديد من الأماكن المختلفة. الهياكل الثانوية الفائقة عبارة عن زخارف تتكون من عدة هياكل ثانوية. تكون بعض الأشكال أصغر بكثير (يبلغ طول جيوب حمل الأيونات 3-4 أحماض أمينية) ، أو لا تتضمن تفاعلات هيكلية ثانوية (انظر SLMs).

فيما يتعلق بالنصف الثاني من سؤالك ، مجال البروتين (اعتمادًا على من تسأل) هو أي منطقة أو مناطق من البروتين تقوم بشيء ما ، بغض النظر عن كيفية طيها. في كثير من الأحيان ، يمكن طي المجالات بشكل صحيح من تلقاء نفسها. بشكل عام ، لا يتم عادةً إجراء اختبار البروتياز / الوظيفي المطلوب لتحديد ما إذا كان المجال المحتمل حقًا من الناحية الفنية مجالًا. على سبيل المثال ، يعتبر مجال إدراج كيناز الموجود في بعض مستقبلات التيروزين كيناز مجالًا ، على الرغم من كونه أ) صغيرًا جدًا ب) غير قادر على أداء وظيفته بمعزل عن الآخرين (ليس عادلاً تمامًا ، حيث تتمثل وظيفته في فسفرة باقي المستقبلات) .

باختصار: تحتوي مجالات البروتين على تعريفين متنافسين ، لذلك لا يمكنك افتراض أن شيئًا ما يشار إليه باسم "مجال البروتين" قادر على أداء وظيفته عند فصله عن بقية البروتين.

يمكن أن تكون المجالات بأي حجم تقريبًا (نظرًا لتصنيفها الوظيفي وليس الهيكلي) ، ولكن نادرًا ما تكون المجالات الصغيرة جدًا والكبيرة جدًا. يمكن أن تكون مصنوعة من أي عدد من الأشكال ، أو لا شيء على الإطلاق.


إذا كانت متوفرة بكثرة ، فلماذا يصعب العثور عليها؟

سيحتوي الشكل الخطي القصير النموذجي على ثلاث إلى أربع بقايا من الأحماض الأمينية التي تتفاعل مع جزء من سطح مجال الترابط [32]. تملي هذه الوظيفة أن يتم الحفاظ على أوضاع البقايا هذه تطوريًا ، على الرغم من أن بعض المواضع قد تسمح بمجموعة فرعية مرنة من الأحماض الأمينية مثل السلاسل الجانبية الكارهة للماء ذات الحجم المماثل (على سبيل المثال ، Ile ، Leu ، Val) أو السلاسل الجانبية بشحنة مماثلة (على سبيل المثال ، Asp ، جلو) [38]. يدرك عالم المعلومات الحيوية بسرعة أن محتوى المعلومات لمساحة التسلسل لعنصر معين (والذي يمكن تمثيله بواسطة إنتروبيا شانون) ضعيف بشكل ملحوظ وأن البروتين سيحتوي على مثل هذه الأعداد الهائلة من التسلسلات القصيرة التي تطابق أنماط الشكل التي لا يمكن أن تكون وظيفية في معظمها. عندما يتجاوز عدد الإيجابيات الكاذبة عدد الأشكال الحقيقية بشكل كبير ، فإن نسبة الإشارة إلى الضوضاء الضعيفة ستعيق بشكل كبير الاكتشاف الحسابي لحالات الحافز الجديدة. وبالتالي ، لا يزال هناك عدد قليل جدًا من الأمثلة لاكتشاف المعلومات الحيوية والتحقق التجريبي اللاحق [39-41]. وبالمثل ، فإن المختبر التجريبي - الذي يختار كرزًا مرشحًا في بروتينه المفضل - معرض أيضًا لخطر كبير في ملاحقة موقع مستهدف غير صالح.

هناك ثلاثة أسباب على الأقل لعدم الخلط بين الخلية بسبب وفرة متواليات الزخارف الزائفة. الأول هو أن الإشارة مقيدة بإحكام في المكان والزمان ، بحيث لا يمكن أبدًا أن تتقابل معظم العناصر المرشحة لرابطات الزخارف الزائفة جسديًا [42]. والثاني هو أن العديد من الأشكال المرشحة مدفونة في بروتينات مطوية ولا يمكن الوصول إليها تمامًا في مجال الترابط. والثالث هو أنه حتى لو ارتبط أحد الدوافع الخاطئة بمجال شريك ، فلن يؤدي ذلك إلى حدث تنظيمي. وذلك لأن ثابت التفكك النموذجي Kد منخفض الميكرومولار بحيث يكون الوقت المحدد ، عادةً بضع ثوانٍ فقط ، عابرًا جدًا للتسبب في تغيير الحالة. من المهم أن نتذكر أن SLiMs تعمل دائمًا بشكل تعاوني [8 ، 20 ، 32].


بروتين جليكوزيل

الارتباط بالجليكوزيل هو وظيفة حاسمة للمسار الإفرازي الحيوي في الشبكة الإندوبلازمية (ER) وجهاز جولجي. ما يقرب من نصف جميع البروتينات التي يتم التعبير عنها عادةً في الخلية تخضع لهذا التعديل ، والذي يستلزم إضافة تساهمية لأجزاء السكر إلى أحماض أمينية معينة. معظم البروتينات القابلة للذوبان والمرتبطة بالغشاء المعبر عنها في الشبكة الإندوبلازمية تكون غليكوزيلاتي إلى حد ما ، بما في ذلك البروتينات المُفرزة ، والمستقبلات السطحية والروابط ، والبروتينات الموجودة في العضيات. بالإضافة إلى ذلك ، فإن بعض البروتينات التي يتم تهريبها من جولجي إلى السيتوبلازم هي أيضًا جليكوزيلاتي. يمكن أيضًا معالجة الدهون والبروتيوغليكان بالجليكوزيلات ، مما يزيد بشكل كبير من عدد الركائز لهذا النوع من التعديل.

نطاق

يرتبط ارتباط البروتين بالجليكوزيل بوظائف متعددة في الخلية. في ER ، يتم استخدام الارتباط بالجليكوزيل لمراقبة حالة طي البروتين ، حيث يعمل كآلية لمراقبة الجودة لضمان نقل البروتينات المطوية بشكل صحيح فقط إلى Golgi. يمكن ربط شقوق السكر الموجودة على البروتينات القابلة للذوبان بمستقبلات محددة في عبر شبكة Golgi لتسهيل توصيلها إلى الوجهة الصحيحة. يمكن أن تعمل هذه السكريات أيضًا كروابط للمستقبلات الموجودة على سطح الخلية للتوسط في ارتباط الخلية أو تحفيز مسارات نقل الإشارة (1). نظرًا لأنها يمكن أن تكون كبيرة جدًا وضخمة ، يمكن أن تؤثر السكريات قليلة الكثافة على تفاعلات البروتين والبروتين من خلال تسهيل أو منع البروتينات من الارتباط بمجالات التفاعل المماثلة. لأنها محبة للماء ، يمكنها أيضًا تغيير قابلية ذوبان البروتين (2).

توزيع

تم العثور على البروتينات الجليكوزيلية (البروتينات السكرية) في جميع الكائنات الحية التي تمت دراستها تقريبًا ، بما في ذلك حقيقيات النوى والبكتيريا الحقيقية والأركا (3،4). تمتلك حقيقيات النوى أكبر مجموعة من الكائنات الحية التي تعبر عن البروتينات السكرية ، من الكائنات أحادية الخلية إلى الكائنات المعقدة متعددة الخلايا.

تنوع البروتينات السكرية

يزيد الارتباط بالجليكوزيل من تنوع البروتين إلى مستوى لا مثيل له بأي تعديل آخر بعد الترجمة. الخلية قادرة على تسهيل هذا التنوع ، لأنه يمكن تعديل كل جانب من جوانب الارتباط بالجليكوزيل تقريبًا ، بما في ذلك:

  • ارتباط الجليكوسيد—موقع الارتباط بالجليكان (قليل السكاريد)
  • تكوين جليكان—أنواع السكريات المرتبطة ببروتين معين
  • هيكل جليكان- السلاسل الممنوحة أو غير الممنوحة
  • طول الجليكان- سكريات قليلة السلسلة قصيرة أو طويلة السلسلة

يُعتقد أن الارتباط بالجليكوزيل هو أكثر تعديلات ما بعد الترجمة تعقيدًا بسبب العدد الكبير من الخطوات الأنزيمية المتضمنة (5). تتضمن الأحداث الجزيئية للارتباط بالجليكوزيل ربط السكريات الأحادية معًا ، ونقل السكريات من ركيزة إلى أخرى ، وتقليم السكريات من بنية الجليكان. على عكس العمليات الخلوية الأخرى مثل النسخ أو الترجمة ، فإن الارتباط بالجليكوزيل غير مقولب ، وبالتالي ، لا تحدث كل هذه الخطوات بالضرورة خلال كل حدث ارتباط بالجليكوزيل. بدلاً من استخدام القوالب ، تعتمد الخلايا على مجموعة من الإنزيمات التي تضيف السكريات أو تزيلها من جزيء إلى آخر لتوليد البروتينات السكرية المتنوعة التي تُرى في خلية معينة. في حين أنه قد يبدو فوضويًا بسبب جميع الإنزيمات المعنية ، فإن الآليات المختلفة للارتباط بالجليكوزيل هي ردود فعل متدرجة ومرتبة بدرجة عالية يعتمد فيها نشاط الإنزيم الفردي على إكمال التفاعل الإنزيمي السابق. نظرًا لأن نشاط الإنزيم يختلف باختلاف نوع الخلية والمقصورة داخل الخلايا ، يمكن للخلايا تصنيع البروتينات السكرية التي تختلف عن الخلايا الأخرى في بنية الجليكان (5).

تسمى الإنزيمات التي تنقل السكريات الأحادية أو قليلة السكاريد من الجزيئات المانحة إلى سلاسل أو بروتينات قليلة السكريات المتنامية glycosyltransferases (Gtfs). لكل Gtf خصوصية لربط سكر معين من متبرع (نوكليوتيد السكر أو dolichol) إلى ركيزة ويعمل بشكل مستقل عن Gtfs الأخرى. هذه الإنزيمات واسعة النطاق ، حيث تم اكتشاف روابط جليكوسيدية في كل مجموعة وظيفية بروتينية تقريبًا ، وقد ثبت أن الارتباط بالجليكوزيل يشتمل على معظم السكريات الأحادية الشائعة إلى حد ما (6).

تحفز Glycosidases التحلل المائي للروابط الجليكوسيدية لإزالة السكريات من البروتينات. هذه الإنزيمات ضرورية لمعالجة الجليكان في ER و Golgi ، ويظهر كل إنزيم خصوصية لإزالة سكر معين (على سبيل المثال ، مانوسيداز).

أنواع الارتباط بالجليكوزيل

يمكن تصنيف روابط Glycopeptide إلى مجموعات محددة بناءً على طبيعة رابطة السكر والببتيد و oligosaccharide المرتبط ، بما في ذلك الارتباط بالجليكوزيل المرتبط بـ N و O و C و glypiation و phosphoglycosylation. نظرًا لأن N- و O-glycosylation و glypiation هما أكثر أنواع الارتباط بالجليكوزيل التي يتم اكتشافها شيوعًا ، فسيتم التركيز بشكل أكبر في هذه المقالة على هذه التعديلات.

أنواع الجليكوزيل
N- مرتبطيرتبط Glycan بالمجموعة الأمينية من الهليون في ER
مرتبط Oترتبط السكريات الأحادية بمجموعة الهيدروكسيل من السيرين أو الثريونين في ER و Golgi و cytosol و nucleus
Glypiationيربط قلب الجليكان بين الفوسفوليبيد والبروتين
سي المرتبطالمانوز يرتبط بحلقة الإندول من التربتوفان
الارتباط بالفوسفوجليكوزيليرتبط جليكان بالسيرين عبر رابطة فوسفوديستر

لا تقتصر البروتينات على نوع معين من الارتباط بالجليكوزيل. في الواقع ، غالبًا ما يتم غليكوزيلات البروتينات في مواقع متعددة بروابط جليكوسيدية مختلفة ، والتي تعتمد على عوامل متعددة بما في ذلك تلك الموضحة أدناه.

1. توافر الانزيم

يتم التحكم في الارتباط بالجليكوزيل عن طريق نقل البروتينات إلى مناطق ذات تركيزات مختلفة من الإنزيمات ، حيث تقوم الخلايا بحبس الإنزيمات في حجرات محددة لتنظيم نشاطها. على سبيل المثال ، بعد بروتين N-glycosylated في ER ، تحدث معالجة الجليكان بطريقة تدريجية عن طريق تهريب البروتينات إلى صهاريج Golgi المتميزة التي تحتوي على تركيزات عالية من Gtfs و glycosidases محددة.

2. تسلسل الأحماض الأمينية

إلى جانب متطلبات الحمض الأميني الصحيح (على سبيل المثال ، Asn لـ N-linked Ser / Thr for O-linked) ، تحتوي العديد من الإنزيمات على متواليات أو أشكال توافقية تتيح تكوين رابطة الجليكوسيد (6).

3. تكوين البروتين (التوافر)

عندما يتم تصنيع البروتينات ، فإنها تبدأ في الانطواء في هيكلها الثانوي الناشئ ، والذي يمكن أن يجعل الأحماض الأمينية المحددة غير قابلة للوصول للارتباط الجليكوسيد. وبالتالي ، يجب أن تكون الأحماض الأمينية المستهدفة متاحة بشكل توافقي لحدوث الارتباط بالجليكوزيل.


ب- الهيكل الثانوي

يشير الهيكل الثانوي إلى الهياكل المحلية المنتظمة للغاية داخل بولي ببتيد (على سبيل المثال ، حلزون) وإما داخل أو بين عديد الببتيدات (أوراق مطوية ب). اقترح لينوس بولينج وزملاؤه هذين النوعين من البنية الثانوية في عام 1951. سيكون القليل من تاريخ لينوس بولينج ذا صلة هنا! بحلول عام 1932 ، كان بولينج قد طور له مقياس الكهربية من العناصر التي يمكن أن تتنبأ بقوة الروابط الذرية في الجزيئات. لقد ساهم كثيرًا في فهمنا للمدارات الذرية ولاحقًا في بنية الجزيئات البيولوجية. حصل على جائزة نوبل في الكيمياء عام 1954 عن هذا العمل. اكتشف هو وزملاؤه في وقت لاحق أن فقر الدم المنجلي كان ناتجًا عن هيموجلوبين غير طبيعي ، واستمروا في التنبؤ بالبنية الثانوية للبروتينات الحلزونية والصفائح المطوية ألفا. في حين أنه لم يربح جائزة نوبل ثانية لهذه الدراسات الجديدة في علم الوراثة الجزيئي ، فقد فاز بجائزة نوبل للسلام لعام 1962 لإقناعه ما يقرب من 10000 عالم بتقديم التماس للأمم المتحدة للتصويت لحظر تجارب القنابل النووية في الغلاف الجوي. مراجعة أكثر تفصيلاً لحياته غير العادية (على سبيل المثال ، في لينوس سيرة بولينج القصيرة) تستحق القراءة!

تحدث مطابقة البنية الثانوية بسبب التكوين التلقائي للروابط الهيدروجينية بين المجموعات الأمينية والأكسجين على طول العمود الفقري متعدد الببتيد ، كما هو موضح في اللوحين الأيسر في الرسم أدناه. لاحظ أن السلاسل الجانبية للأحماض الأمينية لا تلعب دورًا مهمًا في البنية الثانوية.

اللولب أو الصفائح b هي الترتيب الأكثر استقرارًا للروابط H في السلسلة (السلاسل). يمكن فصل هذه المناطق ذات البنية الثانوية المرتبة في بولي ببتيد بأطوال متفاوتة من الببتيد الأقل تنظيماً يسمى ملفات عشوائية. يمكن أن تحدث كل هذه العناصر الثلاثة للبنية الثانوية في عديد ببتيد واحد أو بروتين مطوي في هيكله الثالث ، كما هو موضح على اليمين في الرسم التوضيحي أعلاه. تظهر الأوراق المطوية على شكل شرائط تمثل رؤوس سهام N-to-C أو سي إلى ن قطبية الأوراق. كما ترون ، زوج من مناطق الببتيد التي تشكل صفيحة مطوية قد تفعل ذلك إما في اتجاهات متوازية أو متوازنة (انظر إلى رؤوس الأسهم في الشرائط) ، والتي ستعتمد على التأثيرات الأخرى التي تملي طي البروتين لتشكيل هيكل ثالث. لا تتجاوز بعض الببتيدات أبدًا هيكلها الثانوي ، وتبقى ليفية وغير قابلة للذوبان. ربما يكون الكيراتين هو أفضل مثال معروف عن أ بروتين ليفيوتشكيل الشعر والأظافر وريش الطيور وحتى خيوط الهيكل الخلوي. ومع ذلك ، فإن معظم الببتيدات والبروتينات تنثني وتتخذ بنية ثلاثية ، وتصبح قابلة للذوبان بروتينات كروية.


هل المبادئ المشتركة للتطور التنظيمي توحد العناصر الموجودة في DNA و RNA والبروتين؟

وقد لوحظت العديد من أوجه التشابه في استخدام الحافز على مستوى النسخ ، وما بعد النسخ ، وما بعد الترجمة. على سبيل المثال ، يعد تحديد الاستجابات من خلال العمل التعاوني للمنظمين المعينين المتعددين موضوعًا على جميع مستويات التنظيم (النسخ: [97] ، الربط: [98] ، ميرنا [99] ، الإشارة [11]). تشبه إلى حد كبير مجموعات SLiMs في المناطق المضطربة التي تؤدي إلى مفاتيح تنظيمية اندماجية ما بعد متعدية [55] ، تدمج المحسنات دارات النسخ المعقدة في الجينات الفردية [97]. مثل المناطق التنظيمية لـ DNA و (ما قبل) mRNA ، فإن المناطق المضطربة التي تحتوي على العديد من SLiMs هي بؤر رئيسية حيث يمكن أن يؤدي اكتساب وفقدان العناصر إلى تغييرات معقدة في تنظيم الخلية وعلم وظائف الأعضاء [38 ، 68]. مثال آخر هو تشبيه الجيب الملزم لـ SLiM والتطور المشترك لـ SLiM مع مجال ربط الحمض النووي - التطور المشترك للعنصر التنظيمي للحمض النووي. بسبب تعدد الأشكال المتوقع لتغيرات خصوصية مجال ربط الحمض النووي ، فقد قيل أن مثل هذه التغييرات (في العابرة) يجب أن تكون نادرة نسبيًا بالنسبة للتغيرات في مواقع ربط الحمض النووي المعيارية (في رابطة الدول المستقلة [18]). ومع ذلك ، تم تحديد العديد من الأمثلة على هذه التغييرات والتطور المشترك المقابل لمواقع ربط الحمض النووي فيما بعد (على سبيل المثال ، [100]). مرة أخرى ، توجد أمثلة للتطور المشترك للجيب-SLiM [40 ، 77 ، 78]. أخيرًا ، أشارت التجارب الأخيرة للترسيب المناعي للكروماتين على نطاق الجينوم وتجارب فرط الحساسية DNase إلى أن تفاعلات بروتين الدنا تتطور بسرعة بين الأنواع. تشير هذه النتائج إلى أن العديد من تفاعلات الحمض النووي - البروتين في الجينومات المعقدة لا يتم حفظها خلال التطور بينما يتم الحفاظ على مجموعة فرعية صغيرة من مواقع الارتباط الوظيفية بالقرب من الجينات المستهدفة الرئيسية [101]. هذا مشابه لنموذج الخزان التطوري الموصوف أعلاه ، حيث تكون معظم SLiMs عابرة تطوريًا ، ويتم الحفاظ على عدد قليل من SLiMs الأساسية عن طريق الانتقاء الطبيعي. يتوافق الدوران التطوري السريع لجزء كبير من التفاعلات التنظيمية مع نموذج تكون فيه معظم التغييرات محايدة تقريبًا فيما يتعلق بالاختيار [65 ، 102] (على الرغم من أننا نلاحظ أن الانتقاء الخاص بالنسب على نطاق واسع يمكن أن ينتج أيضًا أنماطًا متشابهة [103 ]). إذا كان النموذج المحايد في الغالب صحيحًا ، فسيتم الحفاظ على جزء صغير فقط من الخزان التطوري الناتج عن العمليات غير التكيفية عن طريق الانتقاء الطبيعي. نظرًا لحجم وتعقيد الجينومات والبروتينات حقيقية النواة والطبيعة القصيرة المتدهورة للأشكال ، فإن معدل من العدم قد يكون اكتساب الحافز سريعًا بدرجة كافية بحيث يوجد عدد كبير من التفاعلات التنظيمية المحايدة على جميع المستويات (DNA و RNA والبروتينات).


خلفية

نظرًا لأن مشاريع التسلسل تولد متواليات بيولوجية بمعدل مذهل ، فإن تحديد التوقيعات الوظيفية مباشرة من المتواليات له قيمة خاصة في علم الأحياء الوظيفي [1 ، 2]. يمكن بعد ذلك استخدام هذه التواقيع للتنبؤ بوظيفة أو بقايا وظيفية مهمة لبروتين جديد. يتم حفظ المخلفات المهمة وظيفيًا للبروتينات بشكل عام أثناء التطور [3]. يمكن تحديد المناطق المحفوظة في تسلسل البروتين من خلال محاذاة بروتين الاستعلام مع متماثلاته في قواعد بيانات البروتين. بدلاً من ذلك ، يعد تعدين الأنماط (ويسمى أيضًا اكتشاف الحافز) طريقة فعالة لتحديد المناطق المحمية [4-7].

تم استخدام خوارزميات العثور على الحافز على نطاق واسع في هذا المجال للعثور على توقيعات التسلسل عند إعطاء مجموعة من التسلسلات ذات الصلة (التنقيب عن الأنماط). ثم يتم استخدام الأشكال الناتجة في التنبؤ بوظيفة البروتين والمواقع الوظيفية عند إعطاء تسلسل جديد (مطابقة النمط). لقد استخدمنا سابقًا البحث عن الحافز بطريقة هجينة: اكتشاف المناطق الوظيفية لتسلسل جديد مباشرةً عن طريق التنقيب في تسلسله جنبًا إلى جنب مع مجموعة من المتماثلات الموجودة في قاعدة بيانات التسلسل (MAGIIC-PRO ، [8]). على غرار محاذاة التسلسل المتعدد (MSA) ، يمكن استدعاء MAGIIC-PRO طالما أن بروتين الاستعلام يمكنه العثور على متماثلات كافية من قواعد البيانات (يمكن تحقيق ذلك بسهولة بعد الانتهاء من مشاريع التسلسل الوفيرة). بهذه الطريقة ، يمكن التنبؤ بالبقايا الوظيفية لبروتين الاستعلام حتى عندما تظل وظيفة المتماثلات المجمعة غير معروفة. حدد MAGIIC-PRO مجموعة من المخلفات التي يتم حفظها بشكل متزامن أثناء التطور. هذا يمكن أن يكمل معلومات الحفظ المقدمة من MSA.

لغة PROSITE هي إحدى الطرق الرسمية للتعبير عن نمط ما [9]. يسمى الحرف الكبير في النمط بالرمز الدقيق. على سبيل المثال ، يحتوي النمط "K-x-L-x (2) -E-x (2،3) -G" على أربعة رموز دقيقة. بالإضافة إلى الأحرف الكبيرة ، يحتوي النمط أيضًا على أحرف بدل ، يُعبر عنها بالرمز "x". يمكن لحرف البدل أن يطابق أي أحرف في تسلسل بيولوجي. يتطابق هذا النمط مع أي تسلسل يحتوي على سلسلة فرعية تبدأ بحرف "K" ، متبوعًا بحرف عشوائي ، متبوعًا بحرفين تعسفيين ، متبوعين بحرفين "E" ، متبوعين بحرفين إلى ثلاثة أحرف عشوائية ، وينتهي بـ "G". يُطلق على كل من 'x' و 'x (2)' فجوات صلبة ، فجوة بطول ثابت. يمكن للفجوة الصلبة أن تتطابق مع عدد معين من البقايا المتتالية التي يُسمح فيها بالطفرات. من ناحية أخرى ، x (2،3) فجوة مرنة ، فجوة ذات أطوال غير منتظمة. يمكن للفجوة المرنة أن تتطابق مع عدد من البقايا التي لا توجد بها طفرات فحسب ، بل يُسمح أيضًا بالإدراج أو الحذف.

بالنسبة للبروتينات ، لا توجد بالضرورة البقايا المرتبطة بموقع وظيفي في منطقة محلية من التسلسل [5 ، 7 ، 10 ، 11]. بدلاً من ذلك ، يتم عادةً تجميع بقايا الموقع الوظيفي في عدة مناطق محلية تشكل معًا بنية أساسية مهمة عند طي البروتين. يُلاحظ أنه داخل عائلات البروتين ، يُسمح فقط بمرونة محدودة في هذه المناطق المحفوظة محليًا ، بينما قد توجد فجوات كبيرة غير منتظمة بين هذه المناطق طالما أن الأجزاء المدرجة أو المحذوفة لا تؤثر على وظائف البروتينات [3 ، 12 - 14]. في الشكل 1 ، نقدم مثالاً على هذه الأشكال المنظمة. لوحظ وجود نموذج منظم "RxYSx (54،96) -GxGx (2) -Px (65،111) -YxCG '' على بروتين Findersoxin-NADP [رقم دخول Swiss-Prot: P10933] و 150 Oxidoreductase إضافي FAD / NAD (P) - بروتينات ملزمة تنتمي إلى نفس عائلة البروتين [إدخال InterPro: IPR001433] بـ P10933. يحتوي هذا الشكل على ثلاث كتل ، وفجرتان بين الكتل ، 'x (54،96)' و 'x (65،111) ، كبيرة ومرنة للغاية. يتضح في الشكل 1 أن كتل الأنماط الثلاثة ، على الرغم من تباعدها إلى حد كبير في التسلسل ، تتجمع معًا في مساحة ثلاثية الأبعاد وتشكل بشكل جماعي منطقة ربط مرتبطة بربط فلافين أدينين ثنائي النوكليوتيد (FAD) وفوسفات الأدينين ثنائي النوكليوتيد النيكوتيناميد (NADP) ) يجند. تحفز هذه الملاحظة الدراسة الحالية لتطوير خوارزمية لاكتشاف الأشكال المتسلسلة التي تحتوي على فجوات مرنة كبيرة بين مجموعات الرموز الدقيقة. على الرغم من تقديم مثل هذه الأشكال الهيكلية وتحليلها في الدراسات المتعلقة بالعناصر التنظيمية لرابطة الدول المستقلة في الحمض النووي [15-18] ، فقد تم تصميم عدد قليل من الخوارزميات بشكل خاص لتحليل تسلسل البروتين [15 ، 19].

مثال على الزخارف المهيكلة لوحظ هذا الشكل على بروتين Feredoxin-NADP reductase [Swiss-Prot: P10933] و 150 بروتينًا إضافيًا أوكسيريدوكتاز FAD / NAD (P) من إدخال InterPro [InterPro: IPR001433]. يتكون الشكل من ثلاث مناطق محلية محفوظة 'R-x-Y-S' و 'G-x-G-x (2) -P' و 'Y-x-C-G' ، مشقوقة بفجوتين كبيرتين x (54،96) و x (65،111). عندما يتم تعيين كتل الأنماط الثلاثة هذه على الهيكل ثلاثي الأبعاد لمختزل Fizersoxin-NADP ، يتضح أن جميع الكتل الثلاثة قريبة من موقع ربط FAD / NAD (P). يتم رسم كتل النمط في العصي باستخدام ألوان مختلفة. يتم رسم الفجوة الطويلة بين الكتلتين الأولى والثانية (الكتلة الثانية والثالثة) باستخدام شرائط باللون البرتقالي (البنفسجي). يتم عرض الروابط FAD و NADP على شكل الكرة والعصا باللونين الأزرق والأحمر على التوالي.

يؤدي اكتشاف التواقيع الوظيفية ذات الفجوات الكبيرة غير المنتظمة إلى تعقيد إجراءات التعدين. عادةً ما تستخدم خوارزميات إيجاد الحافز قيودًا لإنتاج أنواع معينة من الأنماط التي يتوقعها المستخدمون. يلخص الجدول 1 العديد من نماذج القيود المعروفة للتعامل مع الفجوات عند إجراء اكتشاف الحافز في التسلسلات البيولوجية. الخوارزميات التي تأخذ بعين الاعتبار الكلمات المحفوظة القصيرة (بدون ثغرات) [5 ، 20] أو الفجوات الصلبة [4 ، 6 ، 21-23] تحدد الأشكال القصيرة بكفاءة وفعالية (نموذج 1). ومع ذلك ، تفرض مثل هذه النماذج قيودًا على مساحة البحث الخاصة بالأنماط التي يمكن اكتشافها لأنه لا يُسمح بإدخال أو حذف عبر التسلسلات. من ناحية أخرى ، تقدم خوارزمية برات [19] مفهوم مرونة الفجوة لتوسيع مساحة البحث (النموذج 2). هناك نوع أكثر عمومية من نماذج القيد يحدد الحد الأدنى والأعلى للفجوة على التوالي (النموذج 3). ومع ذلك ، فإن السماح بوجود فجوات مرنة كبيرة بين أي رمزين متجاورين يؤدي إلى ظهور أنماط مشوشة ويؤدي أيضًا إلى تفاقم أداء النظام [24]. يعتبر نموذج قيد فجوة آخر مجموعة من الكلمات المستمرة المشذرة بفجوات مرنة غير محدودة (نموذج 4) [7 ، 11 ، 14]. هذا النموذج ذو قيمة حيث يمكن التعامل مع عمليات الإدراج والحذف الكبيرة التي تحدث أثناء التطور بشكل صحيح. ومع ذلك ، فإن استخدام الكلمات المستمرة للمناطق المحفوظة محليًا يحد من تطبيقها في تحليل تسلسل البروتين ، حيث يتم ملاحظة البدائل المحافظة بشكل متكرر. بالإضافة إلى ذلك ، تؤدي مرونة الفجوة غير المحدودة في النموذج 4 أيضًا إلى حدوث ضوضاء.

تم اقتراح النموذج 5 المعروض في الجدول 1 مسبقًا في عملنا الأخير [24] تستخدم خوارزمية MAGIIC مجموعة من قيود الفجوة داخل وبين الكتل لاكتشاف الزخارف المنظمة مثل 'AxCx (2،3) -DFx (10،198) - RGx (0،1) -D '. يتم تجميع رموز هذه الأنماط في العديد من كتل الأنماط ، حيث تسمى الفجوات داخل كتلة نمط فجوات داخل الكتلة وتسمى الفجوات بين كتلتين متتاليتين الفجوات بين الكتل. لقد أوضحنا في الدراسة السابقة [24] أن استخدام مزيج من قيود الفجوة داخل وبين الكتلة يحسن بشكل كبير من كفاءة التعدين. تتشابه أنماط MAGIIC مع الزخارف المهيكلة المقترحة لاكتشاف العناصر التنظيمية لرابطة الدول المستقلة [15]. على الرغم من أنه تم تطويره في البداية لتعدين تسلسل الحمض النووي ، يمكن أيضًا استخدام الحزمة RISOTTO لتعدين متواليات البروتين.

بعد استخدام MAGIIC إلى حد كبير لتحديد الأشكال الوظيفية لتسلسل البروتين ، لاحظنا أن تقييد الفجوات داخل الكتلة على الفجوات الصلبة فقط يمكن أن يزيد من تحسين نتائج التعدين بشكل كبير. في هذا الصدد ، فإن خادم الويب المقترح لاحقًا MAGIIC-PRO يستخدم ببساطة فجوات جامدة داخل الكتلة للتعامل مع الطفرات المحلية. في MAGIIC-PRO ، يتم تعيين الحد الأقصى لطول الفجوة الصلبة داخل الكتلة على قيمة صغيرة ، مثل اثنين أو ثلاثة. فيما يتعلق بالفجوات بين الكتل ، قام كل من MAGIIC و RISOTTO بتعيين الحد الأدنى (الحد الأدنى) والحد الأقصى (الحد الأعلى) للمسافات بين الكتل مسبقًا. عند تطوير برنامج MAGIIC-PRO ، لاحظنا أن تحديد المسافات الدنيا والقصوى بين الكتل قبل اكتشاف الحافز أمر صعب للغاية. يمكن حل هذه المشكلة عند وجود بروتين استعلام أثناء تعدين النمط. وهذا يعني أنه يمكن تعيين الحد الأدنى والحد الأقصى للمسافات بين الكتل ديناميكيًا وفقًا للفجوات الموجودة في تسلسل الاستعلام. مع طول الفجوات التي لوحظت في تسلسل الاستعلام ، تم تصميم قيد جديد يسمى "المرونة النسبية القصوى" لحساب الحدود الدنيا والعليا المسموح بها بين المتماثلات لهذه الفجوة بالذات. تسمى الأنماط التي تفي بنموذج القيد المقترح في MAGIIC-PRO أنماط W.

تهدف هذه الدراسة إلى تقديم خوارزمية WildSpan لاكتشاف أنماط W بكفاءة. في هذه الورقة ، أوضحنا أن الحد الأقصى من المرونة النسبية للقيد له بعض الخصائص الجيدة ، وبالتالي يمكن استخدام استراتيجيات التقليم القوية بواسطة WildSpan لتحسين الكفاءة. يتم تقييم أداء WildSpan بطريقتين. تكشف المقارنة بين أنماط W والزخارف المشروحة في قواعد البيانات الحالية أن أنماط W يمكنها التقاط التوقيعات الوظيفية للبروتينات جيدًا. تكشف مقارنة WildSpan مع الخوارزميات الحالية التي تؤدي مهمة مماثلة أن أنماط W أكثر قوة في اكتشاف المناطق الوظيفية للبروتين من نماذج القيود الحالية.

في هذه الورقة ، نوضح أيضًا كيف يمكن استدعاء WildSpan باعتباره وضع التعدين القائم على البروتين أو القائم على الأسرة لتطبيقات البروتينات المستقبلية. تكشف نتائج التنقيب عن التعدين القائم على البروتين أن WildSpan يمكنه تحديد التواقيع الوظيفية أو الهيكلية لبروتين الاستعلام بشكل فعال وفعال من تسلسل البروتين. من ناحية أخرى ، تكشف نتائج التعدين الخاص بالتعدين الأسري أنه يمكن استخدام WildSpan لتحديد تواقيع التسلسل لعائلات البروتين للتنبؤ بالوظيفة المستقبلية والتعليق التوضيحي للتسلسل. تم دمج فكرة التعدين القائم على البروتين في خوادم الويب الخاصة بنا MAGIIC-PRO [8] في عام 2006 و iPDA [25] في عام 2007 لتعليق تسلسل البروتين. من ناحية أخرى ، تم دمج فكرة التعدين القائم على الأسرة في خادم الويب E1DS في عام 2008 [26] للتنبؤ بمواقع الإنزيم التحفيزي والمخلفات. باختصار ، على الرغم من أن العديد من الدراسات المستقلة قد أظهرت بنجاح فائدة نماذج القيد W ، إلا أن تصميم خوارزمية WildSpan لم يتم تناوله مسبقًا ونشره في مكان آخر. بالإضافة إلى ذلك ، فإن الحزمة المستقلة ورموز WildSpan مفتوحة المصدر جاهزة الآن للتنزيل ويمكن استخدامها في دراسات البروتينات واسعة النطاق في المستقبل.


حواشي

المقالات نشرت على الإنترنت قبل الطباعة. مول. بيول. الخلية 10.1091 / mbc.E03-02-0120. يتوفر تاريخ المقالة والنشر على www.molbiolcell.org/cgi/doi/10.1091/mbc.E03-02-0120.

الاختصارات المستخدمة: CI-M6PR ، مستقبلات مانوز 6-فوسفات مستقلة عن الكاتيون EEA1 ، مستضد إندوسومي مبكر -1 GST ، الجلوتاثيون س-نقل lgp ، غشاء lysosomal glycoprotein NCL ، داء الغشاء الدهني العصبي NRK ، كلى الفئران العادي PDI ، بروتين ثنائي كبريتيد أيزوميراز PBS ، محلول ملحي مخزّن بالفوسفات ، PFA ، بارافورمالدهيد TMD ، وزن مجال الغشاء ، النوع البري.


شاهد الفيديو: وظائف البروتينات المتعددة (كانون الثاني 2023).