معلومة

هل ترتبط عوامل النسخ بكلا خيوط الحمض النووي؟

هل ترتبط عوامل النسخ بكلا خيوط الحمض النووي؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

هل ترتبط عوامل النسخ (أو البروتينات عمومًا) بشريط واحد فقط من الحمض النووي أو كلا الخيطين؟ نظرًا لأنه يمكن أن يكون لها روابط غير تساهمية لكلا الخيوط نظريًا. أود أن أعرف الآلية. أي كتب مرجعية أو أوراق أو روابط ستكون مفيدة.


الملخص القصير هو أن الصناديق النموذجية ترتبط وتقرأ على حد سواء تتشابك معًا ، كتسلسل أساسي. تتعرف بعض البروتينات بدلاً من ذلك على موقع على الحلزون من خلال موقعه الشكل والمرونة. من الواضح أن البروتينات المرتبطة بـ ssDNA تربط خيطًا واحدًا لكنها تفعل ذلك في غير محدد طريقة. تتعرف بروتينات ربط الحمض النووي الريبي على التسلسل على خيط واحد عن طريق إدخال مخلفات مستوية مقسمة بين القواعد! كل هذا ملزم غير تساهمية.

تتعرف عوامل النسخ على المواقع الموجودة في dsDNA ، مع مجالات ربط الحمض النووي. قد يحيط باقي البروتين (جزئيًا ، وبدرجات متفاوتة) بالسطح الخارجي السلبي للحلزون المزدوج dsDNA بسطح موجب الشحنة ، من أجل الاحتفاظ به في الحمض النووي أثناء مسحه (ربما) بطول طوله.

مجالات ربط الحمض النووي: أخدود رئيسي

تم العثور على المجالات التالية في العديد من عوامل النسخ ، وكلها تعرف على حد سواء خيوط. بشكل صحيح ، هم يدركون قاعده ازواج وتوجههم. توضح الصفحات الخمس الأولى من عرض شرائح المحاضرة هذا أن المجموعات الكيميائية الموجودة على جانب أزواج القاعدة ، والتي يمكن الوصول إليها في الأخدود الرئيسي ، تسمح للبروتينات بالتمييز A: T ، T: A ، C: G & G: C بترتيب المتبرعين برابطة الهيدروجين والمقبلين ومجموعة الميثيل.

ومن ثم ، تتعرف TFs على سلسلة من الأزواج الأساسية - الموجهة بحيث تكون خصلة واحدة (على سبيل المثال) صتيصجصأصجي، والشريط التكميلي هو pجصتيصجيصأ؛ وقد "يجلس" الجزء الأكبر من البروتين على خصلة واحدة أو أخرى - أو قد يحدد الجين القريب محليًا خصلة واحدة أو أخرى على أنها خيط الترميز لكن هذا لا يعني أن هذا الخيط الواحد قد تمت قراءته.

  • تسبر أصابع الزنك الأخدود الرئيسي باستخدام حلزونات القراءة.
  • تفعل الأشكال الحلزونية الحلزونية نفس الشيء.
  • كما أن سحابات Leucine تفعل الشيء نفسه.

هذه هي المجالات الشائعة التي تتعرف جميعها على الأزواج الأساسية في الأخدود الرئيسي من خلال التفاعلات مع البقايا على حلزون aplha المجس.

بروتين ربط TATA: أخدود طفيف

يعتبر بروتين ربط TATA (TBP) حالة مختلفة ومثيرة للاهتمام. إنه يربط "صندوق تاتا" عبر الأخدود الصغير ، حيث تميز المجموعات الكيميائية المكشوفة فقط [A / T] من [C / G] ، ولكن ليس اتجاهها. هذا يعني أنه لا يمكن قراءة التسلسلات الموجودة على كل خصلة بسهولة من الأخدود الصغير. بدلاً من ذلك ، يتعرف TBP على شكل ومرونة الحلزون المزدوج في صندوق TATA ، `` يمسكه '' من خلال الأخدود الصغير ويثني الحمض النووي ، مما يساعد على ذوبان الخيوط في `` فقاعة '' النسخ.

عادةً ما يكون تسلسل صندوق TATA هو pتيصأصتيصأصأصأ على شريط الترميز المنبع لبداية النسخ. هذا ال اتفاقية. معاهدة عند إعطاء تسلسل موقع ربط TF ، لكن لا يمكنك القول أن TBP يقرأ بالفعل TATAAA - إنه لا يفعل ذلك!

هنا مجموعة أخرى مماثلة من شرائح المحاضرة.

والأفضل من ذلك ، هذه هي نفس المادة التي تمت تغطيتها في كتاب مدرسي مشهور.


إضافة إلى الإجابة التي قدمها تيج.

ترتبط عوامل النسخ بكلتا الخيطين ولكن سؤالك شمل أيضًا البروتينات بشكل عام.

يظل الحمض النووي مزدوج الشريطة والتواء مثل اللولب في معظم الأوقات ؛ ترتبط معظم البروتينات بكلتا الخيوط كما هو مذكور في الإجابة السابقة. ومع ذلك ، فإن بعض البروتينات مثل SSB (بروتين ربط أحادي الخيط) و Rad52 ترتبط بـ ssDNA أثناء النسخ وإعادة التركيب على التوالي (هناك المزيد من الأمثلة). هذه ليست عوامل النسخ بالرغم من ذلك.


وجوده في كلا الاتجاهين: عوامل النسخ التي تربط الحمض النووي والحمض النووي الريبي

تتحدى البروتينات متعددة الوظائف النموذج التقليدي "بروتين واحد - وظيفة واحدة". نلاحظ هنا البروتينات الواضحة متعددة الوظائف مع شركاء الحمض النووي ، مع جدولة ثمانية أمثلة. ثم نركز بعد ذلك على ثماني حالات إضافية لعوامل النسخ التي تربط الحمض النووي مزدوج الشريطة بخصوصية التسلسل ، ولكن يبدو أيضًا أنها تعيش حياة بديلة كبروتينات مرتبطة بالـ RNA. من الأمثلة على بروتين Xenopus TFIIIA النموذجي ، ومؤخرًا بواسطة mammalian p53 ، تشتمل قائمة عوامل النسخ هذه على WT-1 و TRA-1 و bicoid والوحدة الفرعية سيجما البكتيرية (70) و STAT1 و TLS / FUS. يوفر وجود عوامل النسخ التي تربط كل من الحمض النووي والحمض النووي الريبي لغزًا مثيرًا للاهتمام. لا يُعرف سوى القليل عن الأدوار البيولوجية لتفاعلات الأحماض النووية والبروتينات البديلة ، ولا يُعرف سوى القليل عن الأساس الهيكلي لخصوصية الحمض النووي المزدوج. نناقش كيف حفزتنا هذه الأمثلة الطبيعية على تحديد تسلسل الحمض النووي الريبي الاصطناعي الذي يمنع بشكل تنافسي عامل النسخ المرتبط بالحمض النووي غير المعروف أن له شريكًا طبيعيًا للحمض النووي الريبي. يثير تحديد مثل هذه الرنا احتمال أن يكون ارتباط الحمض النووي الريبي ببروتينات ربط الحمض النووي أكثر شيوعًا مما هو معروف حاليًا.

الأرقام

تصوير تخطيطي لـ 5S rRNA ...

تصوير تخطيطي للتنظيم التلقائي للـ 5S rRNA الممكن رسميًا بسبب ...

التركيب الجزيئي لجزء ...

التركيب الجزيئي لجزء من TFIIIA مرتبط بـ dsDNA. ستة N- محطة ...

نموذج تخطيطي للجينات و ...

نموذج تخطيطي للتنظيم الجيني والكيميائي الحيوي جيم الرجلين tra-1 و tra-2 .…

الكيمياء الحيوية للبروتين والتنظيمية المفترضة ...

الكيمياء الحيوية للبروتين والتفاعلات التنظيمية المفترضة لـ p53. ( أ ) بروتين p53 ...

حمض نووي طبيعي وصناعي ...

روابط الأحماض النووية الطبيعية والاصطناعية من أجل NF-B البشري. ( أ ) قوي…


نتائج

بروتينات ApiAP2 ذات بنية المجال المختلفة.

اخترنا بنيتين مختلفتين من المتصورة المنجلية AP2 التي تشبه معمارية مصنع المجال الفردي والترادفي. الجين الأول pf14_0633، يشفر بروتين 813-aa ، يتم التعبير عنه بأقصى حد خلال مرحلة الحلقة من التطور (2) ويحتوي على مجال واحد 60-aa AP2 ومجال ربط DNA ربط AT مجاور (16). PF14_0633 لا يحتوي فقط على تقويم العظام في جميع التسلسلات الأخرى المتصورة الجينومات وأيضًا في جميع جينومات Apicomplexan المتسلسلة الأخرى (الشكل 1). على الرغم من أن AT-hook يتم حفظه فقط في المتصورة spp. ، يتم حفظ المخلفات داخل مجال AP2 جيدًا في الكل Apicomplexa.

محاذاة مجال AP2 من PF14_0633 (الأحماض الأمينية 63-123) إلى أطباء تقويم العظام في خمسة إضافيين المتصورة النيابة. وستة أنواع Apicomplexan. مجال AP2 (محاصر) محفوظ بشكل كبير في جميع الأنواع. يعد حفظ المخلفات أكثر أهمية في ثلاثة خيوط (أصفر مظلل) من مجال AP2 وهو أقل أهمية في الحلزون α (أزرق مظلل). تم العثور على مجال ربط AT (المظلل باللون الأخضر) في بداية مجال AP2 في المتصورة النيابة. (خط أسود عمودي). يتم تمييز البقايا المحفوظة تمامًا والتي من المحتمل أن تكون متورطة في ربط الحمض النووي باللون الأحمر. تم إجراء تنبؤات البنية الثانوية باستخدام Jnet (39). PF ، المتصورة المنجلية PVX ، المتصورة النشيطة PKH ، المتصورة نولسي PB ، المتصورة البرغي السنة التحضيرية، yoelii المتصورة الكمبيوتر، المتصورة تشابودي 583, T. جوندي TP ، عطر Theileria تا ، Theileria annulata BBOV ، بابيزيا بوفيس تشرو ، كريبتوسبوريديوم هومينيس cgd2 ، كريبتوسبوريديوم بارفوم.

تم فحص جين ApiAP2 الثاني ، pff0200c، يُظهر التعبير الأقصى في الطفيليات في المرحلة المتأخرة ويشفر بروتين 1،979-aa يمتلك نطاقي AP2 جنبًا إلى جنب ، مرتبطين بتسلسل 17-aa محفوظ. في المتصورة spp. ، فإن هوية تسلسل الأحماض الأمينية عبر مجالات AP2 المتعامدة المتعامدة لـ PFF0200c تقترب من 95٪ [المعلومات الداعمة (SI) الشكل S1]. في المقابل ، تشترك مجالات AP2 الفردية لـ PFF0200c في هوية 35٪ فقط مع بعضها البعض. في النباتات ، ثبت أن نطاقي AP2 المترادفين لـ AINTEGUMENTA في A. thaliana، التي تشترك في هوية 43٪ ، تربط شكلين مختلفين من الحمض النووي (22). الأهمية الوظيفية لهذا الاختلاف التسلسلي بين المجالات الترادفية في المتصورة المنجلية ما زال مجهولا.

المتصورة المنجلية ترتبط مجالات AP2 بزخارف الحمض النووي المحددة.

لتوضيح ما إذا كانت نطاقات AP2 المعزولة من المتصورة المنجلية ربط الحمض النووي ، وإذا كان الأمر كذلك ، لتحديد خصوصية الربط ، قمنا بتقييم نطاقات AP2 المنقى باستخدام PBMs. PBMs هي منهجية تستخدم لتحديد خصوصية تفاعلات البروتين والحمض النووي وقد استخدمت على نطاق واسع لوصف عوامل النسخ من الخميرة إلى الإنسان (20). المصفوفة ليست خاصة بالكائن الحي ولكنها تحتوي على جميع متواليات الحمض النووي ذات الـ 10 ميكرات الممكنة المنتشرة عبر 44000 من الحمض النووي مزدوج الشريطة 60-mers ، مما يوفر ضوابط خصوصية سلبية وإيجابية واسعة عبر المصفوفة (20). كدليل على المبدأ ، قمنا أولاً بقياس ارتباط 63-aa A. thaliana نطاق ERF1 AP2 (المخلفات 144-206) واستعاد الشكل المربع الخليجي المتوقع المبلغ عنه في الأدبيات (البيانات غير معروضة) (23).

باستخدام PBMs ، حصلنا على أشكال تسلسل DNA مميزة ومحددة للغاية لمجال AP2 الفردي من PF14_0633 ومجال AP2 المزدوج من PFF0200c. كما هو شائع بالنسبة لمواقع ربط عامل النسخ ، فإن هذه الأشكال متجانسة ، حيث تربط PF14_0633 تسلسل الإجماع TGCATGCA و GTGCAC المرتبط بـ PFF0200c (الشكل 2 ، Dataset S1). الزخارف ل المتصورة المنجلية كانت نطاقات AP2 أكثر ثراءً بشكل ملحوظ بـ AT من الزخارف المتعارف عليها في دول مجلس التعاون الخليجي المرتبطة بنطاقات المصنع AP2. هذا يتوافق مع التوقعات بأن الأشكال التنظيمية ستكون أكثر ثراءً بـ AT من غيرها من حقيقيات النوى رابطة الدول المستقلة- تمثيل الزخارف ، بالنظر إلى أن محتوى AT في المنطقة الجينية من المتصورة المنجلية تقترب من 90٪ (16 ، 19).

تم توقع أشكال الحمض النووي المرتبطة على وجه التحديد بنطاقات AP2 باستخدام PBMs والتحليل الحسابي (خوارزمية FIRE). (أ) النيوكليوتيدات الأساسية (المعبأة) في الشكل المرتبط على وجه التحديد بـ المتصورة المنجلية مجال AP2 الخاص بـ PF14_0633 يشبه إلى حد كبير تلك المرتبطة به C. parvum تقويم العظام cgd2_3490 (قمة و وسط). الأشكال المحددة من PBM تشبه إلى حد بعيد الزخارف المتوقعة باستخدام خوارزمية FIRE (قاع، متوقع) (24). (ب) الشكل المشتق من PBM المرتبط بنطاقات AP2 الترادفية لـ PFF0200c (قمة) يشبه إلى حد كبير الحافز المرتبط بالمجال الأول وحده (وسط). لم يربط المجال 2 من PFF0200c شكل DNA معين (البيانات غير معروضة). تتطابق كل من الأشكال المشتقة من PBM لـ PFF0200c مع الفكرة المتنبأ بها حسابيًا (قاع).

من بين 26 بروتينًا ApiAP2 في المتصورة المنجلية، كلها محفوظة في التسلسل الآخر المتصورة spp. ، في حين أن مجموعة فرعية صغيرة فقط تغطي جميع جينومات Apicomplexan. مجال AP2 من C. parvum الجين cgd2_3490 له هوية 47٪ (تشابه 68٪) إلى plasmodial PF14_0633 (الشكل 1). لتحديد ما إذا كانت البقايا المحفوظة بين أخصائيي تقويم العظام البعيدين تطوريًا كافية لمنح خصوصية ربط الحمض النووي المماثلة ، قمنا باختبار مجال cgd2_3490 AP2 بواسطة PBM. بشكل ملحوظ ، تظهر نتائجنا أن ملف C. parvum AP2 و PF14_0633 الخاص به المتصورة يتمتع أطباء تقويم العظام بخصائص ربط DNA متشابهة للغاية (الشكل 2). توضح هذه النتيجة غير المتوقعة أن طفيليات Apicomplexan لم تحافظ فقط على بنية مجال ربط الحمض النووي لـ AP2 ، ولكن أيضًا خصوصية التسلسل.

على الرغم من أن منطقة AP2 لـ PF14_0633 محفوظة بين Apicomplexa، تم العثور على شكل ربط الحمض النووي AT-hook فقط في المتصورة النيابة. (رسم بياني 1). اختبرنا المساهمة المحتملة لهذا المجال الإضافي في ربط الحمض النووي باستخدام بروتين GST-fusion الذي يحتوي على كل من AT-hook ومجال AP2 من PF14_0633 ولم نجد أي تغيير في نموذج ربط الحمض النووي المعترف به (البيانات غير معروضة). يشير هذا إلى أن ربط الحمض النووي بواسطة مجال AP2 كافٍ للربط المحدد ، على الرغم من أنه من الممكن أن تزيد منطقة خطاف AT من التقارب من خلال تفاعلات غير محددة مع الحمض النووي.

في النباتات ، تم إثبات أن البروتينات ذات هياكل مجال AP2 الترادفية تتطلب تمامًا كلا المجالين لربط الحمض النووي المحدد (22). لاستكشاف المساهمة النسبية لكل مجال AP2 في بنية PFF0200c الترادفية AP2 ، قمنا بتشريح البروتين واختبرنا كل مجال على حدة باستخدام PBMs. من المثير للدهشة أن المجال 1 من PFF0200c كان كافيًا لربط الحمض النووي المحدد وربط شكل GTGCAC المتطابق كمجال ترادفي كامل الطول لـ PFF0200c (الشكل 2). لم يُظهر المجال المعزول PFF0200c 2 أي تفاعل محدد بين البروتين والحمض النووي. تشير هذه النتائج إلى أنه ، على عكس النباتات ، قد لا يساهم مجال AP2 الثاني في PFF0200c في خصوصية ربط الحمض النووي للبروتين.

التنبؤ والتحقق من صحة جينات الهدف AP2.

في النهاية ، نحن مهتمون بالجينات التي يمكن أن تنظمها بروتينات ApiAP2 في المتصورة. يتشابه موقعان الارتباط المحددان كيميائياً في هذه الدراسة إلى حد كبير مع شكلين تنبأ بهما Elemento بشكل مستقل. وآخرون. (24) باستخدام خوارزمية إيجاد عناصر تنظيمية إعلامية (FIRE) (الشكل 2). تقوم خوارزمية FIRE بتجميع قائمة بالجينات المستهدفة المرشحة المرتبطة بكل نموذج متوقع (Dataset S2). تشترك هذه الجينات المستهدفة في خاصيتين: (أنا) حالة واحدة على الأقل من الفكرة المدروسة في مناطق المروج الخاصة بهم و (ثانيا) ذروة مستويات وفرة mRNA خلال مرحلة معينة من نسخة IDC المخصبة بشكل كبير في الجينات التي تحتوي محفزاتها على الفكرة (2). قارنا ملف تعريف تعبير PFF0200c بالملف الشخصي المتوسط ​​لأعلى مجموعة أهداف ثقة (66 جينًا مستهدفًا متوقعًا ، مجموعة البيانات S2) التي تحتوي على نموذج GTGCA (الشكل 3). تشير علاقة بيرسون الإيجابية للغاية (0.97) بين PFF0200c وأهدافها المفترضة إلى أنها تعمل على تنشيط هذه المجموعة من الجينات (الشكل 3). نلاحظ أيضًا أن تحريض التعبير الجيني (20-35 ساعة بعد الغزو) لـ PFF0200c يسبق متوسط ​​ملف تعريف التعبير للجينات المستهدفة المفترضة بمقدار 1-2 ساعة. ومع ذلك ، فإن الملف الشخصي المتوسط ​​من الكتلة العلوية (34 جينًا) الذي يحتوي على نموذج الإجماع PF14_0633 ، لا يرتبط ارتباطًا وثيقًا بملف تعريف التعبير PF14_0633 (ارتباط بيرسون = 0.25) (الشكل S2 ، مجموعة البيانات S2) وقد يشير إلى عوامل تنظيمية مساعدة أخرى تشارك في توقيت التعبير. يشير التقارب المذهل والمستقل بين تنبؤات الحوافز الحسابية هذه مع نتائج خصوصية ربط الحمض النووي البيوكيميائية لدينا بقوة إلى أن هذه الأشكال لها أهمية بيولوجية كبيرة.

ملف تعريف التعبير الجيني في مرحلة الدم لبروتين PFF0200c ApiAP2 مقارنة بملفات تعريف التعبير المتوسط ​​للجينات المستهدفة المتوقعة من FIRE. ترتبط ملفات تعريف التعبير الجيني لمدة 48 ساعة ارتباطًا إيجابيًا بمعامل ارتباط بيرسون البالغ 0.97.

من مجموعات الجينات التي تنبأت بها FIRE ، اخترنا الجينات المرشحة ليتم اختبارها من أجل تفاعلات معينة بين الحمض النووي والبروتين بواسطة EMSA. تم العثور على تسلسل 40 نقطة أساس مشعًا (الجدول S1) ، قبل الجين المستهدف المفترض pfi0540w والتي تحتوي على شكل TGCATGCA ، يمكن تحويلها على وجه التحديد باستخدام مجال AP2 المنقى من PF14_0633 (الشكل 4). يمكن أن يتنافس هذا التفاعل من خلال قليل النوكليوتيد غير المرخص له من تسلسل متماثل ، ولكن زيادة 50 ضعفًا من قليل النوكليوتيد المتحول ذي الصلة (تغيير AT إلى GC في الشكل) لم يعطل الارتباط. أكدنا أيضًا على تفاعل ربط PFF0200c باستخدام تسلسل قليل النوكليوتيد من منطقة المنبع لجين مستهدف مرشح mal7p تحتوي على عزر DNA GTGCAC (الشكل 4). تتحقق هذه النتائج من صحة بيانات PBM الخاصة بنا وتوسع هذا التحليل من خلال إثبات أن مجالات ApiAP2 يمكن أن ترتبط على وجه التحديد بالتسلسلات الموجودة في الجزء العلوي من الجينات المستهدفة المفترضة في المتصورة الجينوم.

EMSA لنطاقات AP2. مجال AP2 من PF14_0633 (العلوي) ومجالات AP2 الترادفية من PFF0200c (أدنى) لتحويل 40 نقطة أساس من مسبار الحمض النووي المسمى إشعاعيًا المشتق من منطقة المنبع لجينات مستهدفة متوقعة حسابيًا (PFI0540w و MAL7P1.119 ، على التوالي) (الممر 2). تظهر تجارب المنافسة أن منافسًا محددًا غير محدد (SC) يمكنه استنفاد النطاق المغير المسمى (الممرات 3-6). لا يمكن لمنافس متحور غير مسمى (MC ، الممران 7 و 8) أو منافس عشوائي (RC ، الممر 9) أن يستنفد التحول.

تحليل اللوائح المفترضة.

تتوقع خوارزمية FIRE إجمالي 194 هدفًا مفترضًا (Dataset S2) تحتوي على نموذج GTGCAC المرتبط بـ PFF0200c ، منها 115 (59.3٪) مشروحة على أنها افتراضية. يكشف تحليل علم الوجود الجيني (GO) عن إثراء كبير للجينات المشاركة في تعديل البروتين (ص القيمة = 9.85e-5) ، وخاصة فسفرة البروتين (ص = 3.83e-4) ونشاط ببتيداز السيستين (ص = 1.30e-3) وفي الجينات المرتبطة بعضية rhoptry (ص = 4.12e-5) ومركب قمي (ص = 6.81e-6) أو تشارك في آلية الغزو (ص = 1.30 هـ -3). تشمل هذه الأهداف البروتينات المرتبطة بـ rhoptry RAP1 و RAP2 و RAP3 وبروتينات سطح المرزويت MSP1 و MSP7 و MSP9 والبروتينات اللاجنسية المرتبطة بالترابط الخلوي CLAG2 و CLAG3.1 و CLAG3.2 و CLAG9. يشير هذا إلى أن PFF0200c ينظم جينات المرحلة المتأخرة المشاركة في العملية الحاسمة لإعداد الطفيل لتمزق الخلايا المضيفة وإعادة غزوها.

قادتنا الحفظ العالي للغاية بين مواقع الربط PF14_0633- و cgd2_3490 إلى مقارنة أنظمةها المفترضة لتحديد ما إذا كانت هذه البروتينات تنظم مجموعات جينية مماثلة. من 5،460 المتصورة المنجلية الجينات ، 31.5 ٪ (1722) لديهم متماثلات في جيم بارفوم. من المثير للدهشة أن 26 فقط من 127 هدفًا تنبأت به FIRE لعزر PF14_0633 (20.4٪ ، ص = 3.43e − 3) بين هذه الكائنات ، مما يشير إلى أنه في حين أن خصوصية التسلسل لهذين المجالين AP2 محفوظة تمامًا ، حدثت إعادة توصيل كبيرة لشبكة النسخ منذ تباعد هذه الأنواع. في المقابل ، لا يوجد انحراف كبير عن تماثل تردد الخلفية للأهداف الـ 194 المتوقعة من FIRE لـ PFF0200c (37.6٪ ، ص = 0.972) ، كما هو متوقع بسبب عدم وجود متماثل PFF0200c في C. parvum.

استخدمنا ScanACE لفحص مناطق المنبع 2.0-kbp 5 من كل جين في المتصورة المنجلية و C. parvum الجينوم لحدوث عزر الحمض النووي PF14_0633 و cgd2_3490 AP2 ، على التوالي. 1،003 C. parvum يتم إثراء الجينات التي تحتوي على مثيل واحد على الأقل من نموذج ربط الحمض النووي cgd2_3490 بشكل ملحوظ لبروتينات الغشاء (ص = 5.40e-9) ، في حين أن الأهداف المفترضة 775 PF14_0633 هي الأكثر إثراءً من أجل التحمل الخلوي إلى الأوعية الدموية الدقيقة (ص = 2.51e-12). لا توجد تعليقات توضيحية مثرية مشتركة بين المجموعتين ، مما يشير إلى أنهما يستهدفان أنظمة مختلفة للغاية. ومن المثير للاهتمام أننا وجدنا أعضاء من شركتي UPSB و UPSC فار الفصائل الجينية الفرعية في المجموعة المستهدفة PF14_0633. ال فار الجينات في المتصورة المنجلية ترميز PfEMP1 (بروتين غشاء كرات الدم الحمراء) أحد المستضدات السطحية الرئيسية المشاركة في التحمل الخلوي والتهرب المناعي للمضيف (25). كشفت محاذاة التسلسل لمناطق المنبع upB عن مثيل محفوظ تمامًا تقريبًا لعزر PF14_0633 الإجماعي CATGCA بين 1،478 و 1،352 نقطة أساس من ATG وحالة أخرى بين 1،218 و 1،093 نقطة أساس في المنبع ، والتي تتوافق مع موقع SPE1 الذي حدده Voss وآخرون. (15). تشير هذه البيانات إلى أن PF14_0633 قد تلعب دورًا في فار تنظيم الجينات. بالإضافة إلى ذلك ، تشتمل المجموعة المستهدفة المحتملة أيضًا على PFF0200c ، والذي يحتوي على تطابق تام مع تسلسل TGCATGCA 1،746 نقطة أساس من بداية ATG. وهذا يثير الاحتمال المثير للاهتمام أن PFF0200c هو نفسه منظم بواسطة PF14_0633 ، فيما قد يكون رابطًا واحدًا في سلسلة تنظيمية لـ ApiAP2 (الشكل S3).


تأثير مثيلة الحمض النووي على ارتباط TF

مثيلة الحمض النووي تثبط ارتباط TF

بدأ التحقيق في حساسية TF إلى مثيلة الحمض النووي في المختبر في أواخر الثمانينيات وبدا أن الصناديق المختلفة بالفعل لها حساسيات مختلفة [24]. تم تحديد العديد من TFs على أنها حساسة لمثيلة الحمض النووي بواسطة EMSA (الشكل 2 أ). مثيلة CpG (mCpG) المركزية لعزر MLTF (وتسمى أيضًا USF) منعت ارتباط TFs وتثبط التعبير عن المروج المتأخر الرئيسي للفيروس الغدي ، في حين أن مثيلة أزواج قاعدة CpG 6 بعيدًا لم يكن لها أي تأثير [25]. أدت مثيلة مواقع الربط CREB أيضًا إلى فقدان نشاط ارتباط TF والنسخ [26]. تم قمع TFs الأخرى ، مثل AP-2 و MYC و E2F و NF-kB و ETS من الارتباط بواسطة mCpG داخل مواقع الربط الخاصة بهم [24 ، 27].

السيناريوهات المحتملة التي يمكن أن تؤثر بها مثيلة الحمض النووي على ارتباط TF

(أ) يتم قمع TFs الحساسة لمثيلة الحمض النووي من الارتباط بواسطة mCpGs داخل أشكالها ، مما يتسبب في إعاقة أو تغيير في شكل الحمض النووي. (ب) تتعرف بروتينات مجال ربط الميثيل (MBDs) على mCpGs بطريقة مستقلة عن التسلسل. تربط TFs أشكال التسلسل التي تحتوي على mCpGs من خلال التقارب المباشر. (ج) تربط TFs غير الحساسة لميثيل الحمض النووي أشكالها بغض النظر عن حالة مثيلة الحمض النووي في المنطقة المحيطة.

(أ) يتم قمع TFs الحساسة لمثيلة الحمض النووي من الارتباط بواسطة mCpGs داخل أشكالها ، مما يتسبب في إعاقة أو تغيير في شكل الحمض النووي. (ب) تتعرف بروتينات مجال ربط الميثيل (MBDs) على mCpGs بطريقة مستقلة عن التسلسل. تربط TFs أشكال التسلسل التي تحتوي على mCpGs من خلال التقارب المباشر. (ج) تربط TFs غير الحساسة لميثيل الحمض النووي أشكالها بغض النظر عن حالة مثيلة الحمض النووي في المنطقة المحيطة.

في وقت لاحق من عام 2000 ، تبين أن CTCF حساس لمثيلة الحمض النووي في منطقة التحكم المطبوعة لجينات الفئران Igf2-H19 على حد سواء في المختبر و لاحقا في الجسم الحي [28] ، وبالتالي إنشاء CTCF كنموذج لحساسية TF لمثيلة الحمض النووي (الإطار 2).

يعد إصبع الزنك CTCF أحد أكثر TFs التي تمت دراستها. تم تحديده لأول مرة في الدجاج [29] وبعد ذلك بوقت قصير في البشر ، كمنظم سلبي لـ ج- myc الجين [30] ومُنشِّط سلائف بروتين بيتا أميلويد (AmBP) [31]. تم إثبات أنه يعمل كعامل عازل في موضع غلوبين الدجاج ، حيث يمنع المحسنات من تنشيط الجينات البعيدة [28]. من خلال إضعاف وتشكيل حلقة الربط ، يعمل على بنية الجينوم وينظم التعبير الجيني [32 ، 33].

من خلال التحقيق في الجينات المطبوعة ، وجد أن CTCF حساس لميثيل الحمض النووي في موضع Igf2-H19 في الفأر. عند ارتباطه بأليل الأمهات غير الميثيل ، يعمل CTCF كعامل عازل ، مما يقيد عمل مُحسِّن المصب على H19 الجين. بينما ، على الأليل الأبوي الميثلي ، لا يمكن ربط CTCF وينشط المعزز جين Igf2 [28]. تم عرضه لاحقًا من خلال الطفرات النقطية في مواقع CTCF الأربعة في الجسم الحي أدى ضعف ارتباط CTCF إلى زيادة مثيلة الحمض النووي المحلي في الفئران حديثي الولادة على الرغم من أن ارتباط CTCF لم يكن مطلوبًا لإنشاء حالة غير ميثلة أثناء تكوين البويضات [34]. بالإضافة إلى ذلك ، تم إظهار مثيلة اثنين من أشكال CTCF في موضع الحثل العضلي من النوع 1 (DM1) لإلغاء ارتباط CTCF وبالتالي تغيير التعبير عن DMPK و SIX5 الجينات [35].

بعد عشر سنوات ، مكّن تطوير مناهج التسلسل عالية الإنتاجية للتحقيق في أنماط مثيلة الحمض النووي (تسلسل الجينوم الكامل بيسلفيت) وربط TF (ChIP-seq) ، من دراسة جينوم ربط CTCF على نطاق واسع وتحدي الآراء التقليدية. في الخلايا الجذعية الجنينية للفأر (ES) ، تم العثور على مواقع ربط CTCF موجودة بشكل أساسي في المناطق التي لا تحتوي على مستويات منخفضة من مثيلة الحمض النووي [20]. ومع ذلك ، لم يربط CTCF مواقع إضافية في غياب مثيلة الحمض النووي (خروج المغلوب الثلاثي DNMTs) ، باستثناء المواقع المطبوعة المعروفة ، مما يشير إلى أن ارتباط CTCF لم يتم قمعه بواسطة جينوم مثيلة الحمض النووي على نطاق واسع في الجسم الحي. أظهرت عمليات التحقق باستخدام عمليات الإدخال المستقرة لبناء المراسل الذي يحتوي على نموذج CTCF أن CTCF يمكن أن يربط الحمض النووي الميثلي ويؤدي إلى إزالة الميثيل المحلي بينما لم تكن أشكال CTCF المتحولة مرتبطة وبقيت ميثلة [20]. لذلك ، على عكس ما كان متوقعًا ، بدا أن CTCF غير حساس لجينوم مثيلة الحمض النووي على نطاق واسع في الجسم الحي [20] ، والذي تم تأكيده أيضًا في خلايا HCT116 [36]. أظهر التنميط CTCF عبر 19 نوعًا مختلفًا من الخلايا أنه بينما يربط CTCF مواقع متميزة في أنواع مختلفة من الخلايا ، فإن 41٪ من مواقع الارتباط المتغيرة مرتبطة بمثيل الحمض النووي [37]. عند النظر إلى حالات ظهور نموذج CTCF داخل الجينوم ، فإن 25٪ تحتوي على CpGs [38] بينما تحتوي 45٪ من تلك الموجودة ضمن مواقع ربط CTCF ChIP-seq. هذا يسلط الضوء على حقيقة أن جزءًا فقط من مواقع الربط المفترضة لـ CTCF يحتمل أن تتأثر بمثيل الحمض النووي. حققت التقارير الأخيرة في مساهمة CpGs المحددة في ربط الحمض النووي الميثيلي باستخدام المعلومات الهيكلية ومقايسة التقارب الملزمة (Methyl-Spec-seq) ويمكن أن تحدد أن السيتوزين الميثيل في الموضع 5 في نموذج JASPAR هو الذي يمنع على وجه التحديد ربط CTCF [39 ، 40].

باختصار ، على الرغم من وصف CTCF في الأصل كعامل حساس للميثيل في موضع Igf2-H19 المطبوع ، إلا أن مجموعة محدودة فقط من في الجسم الحي ستكون مواقع ربط CTCF ، التي يُفترض أنها تحتوي على CpGs في أشكالها ، حساسة لمثيلة الحمض النووي. قد تساعد مواقع الربط المرنة الخاصة بها في تنظيم العمليات التنموية والخلوية المعقدة. يوضح CTCF تمامًا حقيقة أن حساسية TF لمثيل الحمض النووي ، على الرغم من اكتشافه المبكر ، لا تزال سؤالًا مفتوحًا. شكل CTCF رقم تعريف JASPAR: MA0139.1.

تم تمكين تطوير تقنيات عالية الإنتاجية لاحقًا لاختبار حساسية العديد من TFs في المختبر. حدد نهج قياس الطيف الكتلي الكمي ZBTB2 و JUND و CREB1 و ATF7 على أنها مرتبطة بشكل تفضيلي بالسيتوزينات غير الميثيلية على تلك الميثيلية [41]. وجدت طريقة باستخدام المصفوفات الدقيقة الملزمة الميثيلية أن مثيلة الحمض النووي تمنع ارتباط سحاب الليوسين الأساسي (BZIP) TFs CREB و ATF4 و JUN و JUND و CEBPD و CEBPG [42]. كانت TFs التي تم تحديدها على أنها مكبوتة من الارتباط بواسطة مثيلة الحمض النووي متوافقة جيدًا في كل من الدراسات والدراسات السابقة.

كان NRF1 أول TF أظهر أنه حساس لجينوم مثيلة الحمض النووي على مستوى الجينوم في الجسم الحي [43]. تم تحديد TFs الحساسة في الخلايا الجذعية الجنينية للفأر (ES) عن طريق تحديد مناطق الكروماتين المفتوحة في وجود وغياب مثيلة الحمض النووي (باستخدام DNMTs الثلاثي خروج المغلوب (TKO) الخلايا) حيث كان من المتوقع أن تربط مواقع جديدة يمكن الوصول إليها في غياب مثيلة الحمض النووي. حدد تحليل الحافز NRF1 بالإضافة إلى MYC / USF / CREB و GABPA / ETS باعتبارها TFs حساسة للميثيل. ثم تم التحقق من صحة NRF1 في الجسم الحي بواسطة ChIP-seq ، حيث يمكن أن تربط العديد من المواقع الجديدة في غياب مثيلة الحمض النووي. علاوة على ذلك ، أظهرت عمليات التحقق باستخدام إدخالات ثابتة لبناء المراسل الذي يحتوي على نموذج NRF1 أنه لا يمكنه إلا ربط شكله غير الميثيل ولم يكن قادرًا على الارتباط عند الميثيل [43].

أكثر حداثة في المختبر أدت الأساليب التي تستخدم SELEX الحساسة للميثيل إلى توسيع كتالوج TFs المعروف أنه تم قمعه من الارتباط عن طريق مثيلة الحمض النووي. فحصت الدراسة الأولى 519 TFs باستخدام methyl-SELEX و bisulfite-SELEX ووجدت أن 23٪ (117 من أصل 519) تم تثبيطها بواسطة mCpG (يسمى ميثيل ناقص) [44]. يمكن لتحليلهم العالمي تحديد عائلات TF التي تميل إلى تثبيطها بواسطة mCpG مثل الحلزون الحلزوني الأساسي (BHLH) و BZIP و ETS TFs. الغالبية (96 TFs ، 82 ٪) كان لديها CpGs في شكلها الأصلي وتم التحقق من صحة TFs الحساسة المعروفة مثل MYC و USF و CREB و ATF و AP (JUN و FOS) و E2F و ETS على الرغم من عدم ذكر NRF1 في دراستهم. ومع ذلك ، التنميط من MYC ملزم في الجسم الحي في الخلايا التي تفتقر إلى مثيلة الحمض النووي (ChIP-seq في DNMTs TKO) أظهر أن مثيلة الحمض النووي لها تأثير ضئيل فقط على مواقع الارتباط [44].

فحصت دراسة أخرى حساسية ATF4 باستخدام methyl-SELEX [45]. نظرًا لأن الشكل لا يحتوي على CpG بارز ، فقد وجدوا أن الأشكال التي لا تحتوي على CpG لم تُظهر ارتباطًا تفضيليًا للحمض النووي الميثيلي أو غير الميثيل ، ولم تكن الأشكال التي تحتوي على CpGs في المركز مرتبطة عند الميثيلة والزخارف مع CpGs في الخاصرة كانت ملزمة عند الميثيل [ 45]. هذا يؤكد أن ليس فقط mCpG ولكن أيضًا موقعه داخل النموذج أمر بالغ الأهمية لمنع ارتباط TF.

في موازاة ذلك ، أ في المختبر حددت الدراسة في النباتات 234 TFs (72٪ من 327 مختبرة) ليتم تثبيطها من الارتباط بواسطة mCpGs [46] على الرغم من أن النباتات لديها ذخيرة مختلفة من TF.

تتفق معظم الدراسات على أن التثبيط بواسطة mCpG قد يكون بسبب عائق صارم لربط TF [26 ، 44]. في الآونة الأخيرة ، تم وصف شكل الحمض النووي على أنه ميزة إضافية لربط TF [7] وتم العثور على أشكال DNA ذات اللفائف والمروحة لتتأثر بشدة بـ mCpGs [47]. بالإضافة إلى ذلك ، يرتبط وضع النيوكليوسوم وتعديلات الهيستون بمثيلات الحمض النووي وقد تؤثر أيضًا على ارتباط TF [48 ، 49].

حددت هذه الدراسات المختلفة العديد من TFs التي يجب تثبيطها من الارتباط بواسطة mCpGs وبالتالي فهي حساسة لمثيلة الحمض النووي ، مما يشير إلى وجود آلية واسعة النطاق (الشكل 2 أ). من الجدير بالذكر أن معظم هذه الملاحظات جاءت من في المختبر دراسات قليلة في الجسم الحي تؤكد الدراسات حساسيتها. لذلك ، لا يزال التأثير الوظيفي لهذه الحساسية على نطاق الجينوم بأكمله بحاجة إلى مزيد من التحقيق.

يعزز مثيلة الحمض النووي ارتباط TF

بالتوازي مع اكتشاف TFs التي تثبطها mCpGs ، تم تحديد البروتينات التي تتعرف على mCpGs على وجه التحديد من خلال مجال ربط الميثيل (MBD): MeCp2 و MBD1 و MBD2 و MBD4 [50-52]. ومع ذلك ، يمكن اعتبار هذا الاعتراف مستقلاً عن تسلسل الحمض النووي الأساسي ، على عكس TFs التي تتعرف على أشكال معينة لتسلسل الحمض النووي [51].

في وقت لاحق ، كل من الإنتاجية الفردية والعالية في المختبر حددت الدراسات TFs الخاصة بالتسلسل التي تربط mCpGs (الشكل 2B). توصف أيضًا بأنها حساسة لمثيلة الحمض النووي لأنها تتطلب ربط mCpG بدلاً من TFs الحساسة التي تثبطها mCpGs. حدد نهج قياس الطيف الكتلي الكمي 19 بروتينًا على أنها مرتبطة بشكل تفضيلي بـ mCpGs على غير الميثيل (MeCP2 ، MBD1 ، MBD4 ، UHRF1 ، RFX1 / 5 ، ZFHX3 ، KLF2 / 4/5) على الرغم من أنه لا يفسر خصوصية التسلسل [41]. حدد اختبار المنافسة على المصفوفات الدقيقة للبروتين الميثلي 41 TFs و 6 عوامل مساعدة (3٪ من 1321 TFs و 210 عوامل مساعدة تم اختبارها) لربط الأشكال بشكل تفضيلي مع mCpGs على الرغم من وجود فائض بمقدار عشرة أضعاف من التسلسلات غير الميثيلية [53]. ومع ذلك ، فقد تعرفت الغالبية على العديد من الزخارف المتميزة ولم يتعرف سوى 22 منها على أقل من ثلاثة أشكال مختلفة. تم التحقق من صحة ثمانية من أصل أحد عشر بواسطة EMSA (بما في ذلك TFs ARNT2 و DIDO1 و MEF2A و HOXA9) مما يشير إلى معدل إيجابي كاذب بنسبة 27٪ [53]. تم العثور على NRF1 لربط كلتا الحالتين ، ولكن بقوة أكبر للميثيل من الأشكال غير الميثيلية [53] ، على الرغم من أنه ثبت لاحقًا أنه تم تثبيته من الارتباط بواسطة mCpG في الجسم الحي [43]. حددت دراسة أجريت على النباتات 14 TFs (4.3٪ من 327 مختبرة) ، والتي تربط بشكل تفضيلي الأشكال الميثيلية [46]. في الآونة الأخيرة ، وجد نهج يستخدم methyl-SELEX و bisulfite-SELEX أن 34 ٪ (175 من 519) من TFs المختبرة يمكن أن تربط mCpGs (تسمى methyl-plus) مثل KAISO / ZBTB33 ، CEBPB / E / G ، KLF ، OCT4 أو HOX أو PAX أو SP1 [44]. ومع ذلك ، فقط 49٪ من هؤلاء (85 من 175) كان لديهم CpG في شكلهم الكنسي بينما تعرف الآخرون على موقع ميثلي أضعف [44]. هناك طريقة أخرى تسمى تسلسل الميثيل ، والتي تقيس تأثير mCpGs على تقارب ربط TF في كل موضع داخل موقع الربط ، ويمكن أن تحدد المواضع المحددة التي أثرت على ربط ZFP57 و CTCF و BATF1 و GLI1 و HOXB13 ، بما في ذلك ميثيل الهيميثيل لواحد من شقين [40].

تم وصف أصبع الزنك Cys2His2 (C2H2) TF KAISO (ويسمى أيضًا ZBTB33) لأول مرة لربط mCpGs بواسطة EMSA في المختبر [54] وكذلك من خلال تقرير هيكلي أظهر الأساس الجزيئي للتعرف على KAISO ثنائي الوسائط لكل من CpGs غير الميثيل والميثيل [55]. إعادة تحليل مواقع ربط KAISO وأنماط مثيلة الحمض النووي في الجسم الحي يقترح أن KAISO لا تربط الحمض النووي الميثلي بل معززات نشطة للغاية تتميز بمستويات عالية من هيستونات الأسيتيل [56] ، على الرغم من أن هذا التفسير لا يأخذ ديناميكيات مثيلة الحمض النووي في الاعتبار.

تم التعرف على بروتينات أصابع الزنك الأخرى كقراء للحمض النووي الميثلي [57] ، مثل ZBTB4 و ZBTB38 الشبيه بـ KAISO في حالات العدوى العابرة في الفئران [58]. ZFP57 هو مثال معروف على TF الذي يربط الحمض النووي الميثلي في المناطق المطبوعة في جينوم الفأر في الجسم الحي [59-61] وقد تبين أن تفضيل ربط mCpG الخاص به غير متماثل [40].

تم التعرف على بروتين عائلة أصبع زنك آخر KLF4 على أنه mCpGs ملزم في نهج قائم على البروتينات وعن طريق سحب الحمض النووي [41]. إعادة تحليل مواقع ربط KLF4 في خلايا ES للماوس في الجسم الحي حددت 18.5٪ كميثلة [41]. It was also found by a methylated microarray approach although it could bind both methylated and unmethylated sites, but displaying different sequence preferences [53]. Re-analysis of KLF4 binding sites in human ES cells في الجسم الحي identified that of the KLF4 binding sites having a CpG, 48% were methylated [53], but represented only 3% of all binding sites [62]. Probing the methylation levels of KLF4 binding sites at four different loci في الجسم الحي by ChIP bisulfite sequencing found that it could bind two unmethylated sites (TACpGCC) and two methylated sites (CCmCpGCC) [53].

Several members of the BZIP CEBP TF family were found to bind mCpGs. CEBPA was shown to bind mCpG within the CRE motif by EMSA في المختبر [63]. An approach using methylated binding microarrays found that mCpGs promoted binding of CEBPA and CEBPB although CEBPD and CEBPG, which bind similar motifs, were inhibited [42]. Profiling of CEBPB by ChIP-seq في الجسم الحي identified only 11% of its methylated motifs as bound, in contrast with 54% of its unmethylated motifs, located in open-chromatin regions [42]. However, TFs are known not to bind all their motif occurrences in a certain context. Further, a similar re-analysis identified 25% of the CEBPB binding sites as methylated [62], which is surprisingly high since most TF binding sites are located in unmethylated open chromatin regions. More recently, a methyl-SELEX approach identified CEBPB only as weakly binding to mCpGs (called methyl-plus) as well as CEBPE and CEBPG [44]. A different methyl-SELEX approach found that CEBPB could bind both methylated and unmethylated sequences suggesting that CEBPB could tolerate DNA methylation [45]. The methyl-SELEX approach identified several other TFs that could bind to mCpGs [44]. OCT4 (also called POU5F1) was classified as a methyl-plus TFs although it does not have a CpG in its canonical motif. They further tested its sensitivity في الجسم الحي by profiling OCT4 binding by ChIP-seq in WT and DNMTs TKO mouse ES cells and could identify a few sites that lost OCT4 binding in absence of DNA methylation, suggesting that OCT4 requires DNA methylation at these sites في الجسم الحي [44].

Additionally, several HOX TFs were also classified as methyl-plus TFs, with some containing CpGs in their motifs. They showed that HOXC11 could specifically drive luciferase activity of an exogenously inserted construct containing its motif only when methylated [44]. HOXA9 was also previously found to bind mCpGs by EMSA [53]. Structural reports further showed the recognition of HOX TFs to mCpGs, such as HOXB13 [44] and the PBX-HOXA9 complex [45]. However, in the case of HOXB13, only the mCpG on the top strand contributes to binding whereas the other strand does not [40].

Structural reports proposed mechanisms for TF binding to mCpGs. Studies on the HOX TFs suggest that a mCpG in their motif could mimic a thymidine base, which could explain different sensitivities among HOX paralogs, and could be generalized to other TFs [44,45]. Other structural reports suggest that the binding of several TFs to mCpGs such as KAISO, ZFP57 and KLF4 depends on an arginine preceding the first zinc-binding histidine (called the arginine-histidine (RH) motif) [64], although the presence of an RH motif in zinc-finger proteins may not be a good predictor of mCpG binding [65,66].

These different studies identified many TFs as able to bind mCpGs and therefore were sensitive to DNA methylation (Figure 2B), suggesting a widespread mechanism. However, most results report في المختبر affinities and some are contradictory. Recent studies have compiled the methylation status of TF binding sites from في الجسم الحي datasets [67,68] although those analyses are static and only correlative. Therefore, the functionality of TFs binding to mCpGs remains to be further investigated experimentally.

DNA methylation does not affect TF binding

Alongside the discovery of TFs sensitive to DNA methylation, others appeared not to be affected and are therefore called insensitive to DNA methylation (Figure 2C). In 1988, SP1 was the first TF to be described as insensitive to mCpGs located both at the center and at the periphery of the SP1 motif by EMSA في المختبر [69,70]. However, a later study found that an mCpG affected SP1 binding في المختبر and that the aberrant methylation of the retinoblastoma gene promoter in cancer was suggested to prevent SP1 binding في الجسم الحي [71]. The YY1 TF was then identified as insensitive to DNA methylation at the Surf genes promoter whereas ETS TFs were blocked by mCpGs [27].

More recently high-throughput في المختبر approaches identified more TFs as insensitive to DNA methylation. A study in plants identified 79 insensitive TFs (24% out of 327 tested) [46]. An approach using methyl-SELEX and bisulfite-SELEX found that 40% (202 out of 519) of the tested TFs were not affected and the majority (84%, 169 out of 202) did not have CpGs in their motifs [44].

The first evidence for TF insensitivity في الجسم الحي came in 2011, when upon removal of DNA methylation (using DNMTs TKO cells), CTCF binding sites were globally unaltered, suggesting that DNA methylation was not preventing CTCF binding in WT mouse ES cells [20]. This was surprising knowing that CTCF was a well-known example of TF sensitivity to DNA methylation (Box 2) and that a similar approach identified NRF1 as sensitive [43]. CTCF as well as REST were then validated using stable insertions of methylated reporters containing their motifs where they could bind methylated regions and lead to local demethylation [20]. In fact, relatively few new regions of open chromatin bound by TFs were identified in absence of DNA methylation in mouse ES cells suggesting that most TFs did not seem to be affected by DNA methylation في الجسم الحي in this cell type [43].


الملخص

Epigenetic DNA modification impacts gene expression, but the underlying molecular mechanisms are only partly understood. Adding a methyl group to a cytosine base locally modifies the structural features of DNA in multiple ways, which may change the interaction with DNA-binding transcription factors (TFs) and trigger a cascade of downstream molecular events. Cells can be probed using various functional genomics assays, but it is difficult to disentangle the confounded effects of DNA modification on TF binding, chromatin accessibility, intranuclear variation in local TF concentration, and rate of transcription. Here we discuss how high-throughput في المختبر profiling of protein–DNA interactions has enabled comprehensive characterization and quantification of the methylation sensitivity of TFs. Despite the limited structural data for DNA containing methylated cytosine, automated analysis of structural information in the Protein Data Bank (PDB) shows how 5-methylcytosine (5mC) can be recognized in various ways by amino acid side chains. We discuss how a context-dependent effect of methylation on DNA groove geometry can affect DNA binding by homeodomain proteins and how principled modeling of ChIP-seq data can overcome the confounding that makes the interpretation of في الجسم الحي data challenging. The emerging picture is that epigenetic modifications affect TF binding in a highly context-specific manner, with a direction and effect size that depend critically on their position within the TF binding site and the amino acid sequence of the TF. With this improved mechanistic knowledge, we have come closer to understanding how cells use DNA modification to acquire, retain, and change their identity.


نسخ الحمض النووي | التعريف والمراحل & # 038 الرسم التخطيطي

في نسخ الحمض النووي ، يتم نسخ (نسخ) تسلسل الحمض النووي للجين من أجل تكوين جزيء من الحمض النووي الريبي. إنها الخطوة الأولى في التعبير عن الجين. تتم عملية نسخ الحمض النووي بواسطة الإنزيمات المعروفة باسم بوليميراز RNA. بكلمة أخرى ، نسخ الحمض النووي هو عملية يتم من خلالها إعادة كتابة المعلومات. نستخدم عملية النسخ في حياتنا اليومية ، وتقوم خلايانا بذلك أيضًا بطريقة متخصصة. في الشكل الجيني ، النسخ هو عملية نسخ تسلسل الحمض النووي للجين e من أجل صنع جزيء RNA.

تعريف النسخ:

النسخ هو المرحلة الأولى من التعبير الجيني الذي يتم من خلاله استخدام المعلومات الجينية لبناء منتج وظيفي مثل البروتين. الغرض من عملية النسخ هو إنشاء RNA ، نسخة من تسلسل الحمض النووي للجين. تقوم نسخة RNA ، أو النسخة النصية ، بتنفيذ المعلومات المطلوبة لإنشاء بولي ببتيد لجين مشفر بالبروتين. يتطلب نسخ الحمض النووي في حقيقيات النوى إجراء بعض خطوات المعالجة قبل الترجمة إلى بروتينات.

مراحل النسخ:

يُعرَّف النسخ بأنه نسخة من تسلسل الحمض النووي للجين من أجل تكوين جزيء الحمض النووي الريبي. عالج نسخ الحمض النووي للجين مهمته باستخدام ثلاث مراحل بدء واستطالة وإنهاء.

Initiation:

الاستهلال هو المرحلة الأولى من النسخ ، حيث يربط بوليميراز الحمض النووي الريبي تسلسل جزيئات الحمض النووي المعروفة باسم المروج. وجدت قرب بداية الجين. كل من الجينات لها مروجها الخاص. بعد الربط ، يتم فصل بوليميراز الحمض النووي الريبي إلى خيوط الحمض النووي ، عن طريق إعطاء القالب أحادي الخيط المطلوب للنسخ.

بدء النسخ: البدء هو الخطوة الأولى أو النسخ. It lies when the RNA polymerase named enzyme binds to an area or region of a gene, known as promoter . The signals to the DNA for unwinding, so the enzymes can be read as the bases in one of the DNA strands. Then, the enzymes ready to create a strand of mRNA by a complementary sequence of bases.

2. Elongation:

Elongation is the second stage, in which one strand of DNA or the template strand works as a template for RNA polymerase. This template one base at a time, the polymerase creates an RNA molecule out of complementary nucleotides, by making a chain, which grows from 5 to 3 . The RNA transcription has the same information as a non-template strand of DNA by copying the information, but it consists of the base uracil (U) instead of the thymine (T).

RNA Polymerase: The RNA polymerase is the main enzyme involved in the transcription that uses a single strand DNA template in order to synthesize a complementary strand for RNA molecule. In simple words, RNA polymerase creates an RNA strand in the 5 to 3 direction, by adding each new nucleotide to the 3 end of the strand.

3.Termination:

Termination is the last stage of DNA Transcription. The RNA transcription is completed by the sequence called terminator signals . After they are transcribed, or copy out, they cause the transcript to release from the RNA polymerase.

Transcription Termination: Various processes of regulator transcription termination had discovered in eukaryotes and bacteria. RNA polymerase works for the two principal mechanisms of the termination of transcription occurs in E. coli. In the additional protein, the transcription termination factor known as Rho, which is a need in one mechanism but not in another mechanism. These two mechanisms are referred to as Rho-independent and Rho-dependent termination. The process of the ending of transcription is known as transcription termination and occurs once the polymerase transcribes in a DNA sequence called terminator .

Termination in Bacteria:

The two main mechanisms are found in bacteria Rho-dependent and Rho-independent.

Rho-dependent termination: In the mechanism of Rho-dependent termination, the RNA consists of a binding site for a protein known as the Rho factor . The Rho factor binds the sequence and begins climbing up the transcription toward the RNA polymerase.

Rho-independent termination: In the mechanism of Rho-independent termination, it depends on the particular sequence in the DNA template strand. RNA polymerase approach at the end of the gene being transcribed, it hits an area or region rich in C and G nucleotides. The transcription of RNA begins from this region folds back and complementary C and G nucleotides bind with each other. As a result, a stable hairpin occurs that causes the RNA polymerase to the stall.

Transcription happens for Individual Genes:

All genes cannot be transcribed all the time. In fact, transcription controlled for each gene individually. Cells carefully and accurately regulate the process of DNA Transcription and transcribing just for those genes whose products are required at a specific moment.

Transcription Regulators

Promoters in Bacteria:

Promoter in bacteria is the common feature of DNA transcription regulators in their ability to recognizes the particular DNA pattern to modulate gene expression. The upstream regulation of the region of bacterial coding consists of a promoter, which is the DNA sequence that determines the particular recognition by the RNAP holoenzyme.

In bacteria, the RNAP holoenzyme contains five subunits and an additional sigma subunit factor. The collection of different subunits works as key regulation in bacterial gene expression.

Promoters in Humans:

A member of the PPAR subfamily is PPARgamma in nuclear receptors. In humans, the structure of human PPARgamma cDNA and the genome was defined, and its promoter and particular tissue expression were characterized functionally. The two PPAR isoforms detected in humans such as PPARgamma 1 and PPARgamma 2. In all analysis tissues, PPARgamma 2 was less abundant than the PPARgamma 1.

What happens to the RNA Transcription?

In the process of RNA transcription, in which a DNA sequence of the gene is copied out or transcribed to create an RNA molecule. The main enzyme involved in RNA transcription is known as RNA polymerase. The process of transcription starts when RNA polymerase binds a promoter sequence near the start location of the gene. The process of RNA transcription ends in the process known as termination . The termination depends on the sequence in RNA that gives the signal that transcription is finished.

Eukaryotic RNA Modifications:

RNA transcription works as messenger RNAs (mRNAs) in bacteria. While in eukaryotes, protein-coding gene transcription is known as pre-mRNA , and it has must go through extra processing before it can direct translated. Eukaryotic pre-mRNAs have must be modified ends by the addition of a 5 cap (from the beginning) and 3 poly-A tail (at the end). Many of eukaryotic pre-mRNAs can undergo splicing. Parts of the pre-mRNA are known as introns . During this process, introns are chopped out and the remaining pieces, known as exons , are stuck back together. The modification ends to raise the stability of the mRNA on the other hand, splicing provides the correct sequence of mRNA.


Sandwalk

This post is about a paper recently published in علم (Dec. 13, 2013) by John Stamatoyannopoulos and his collaborators at the University of Washington in Seattle, Washington, USA.

Stergachis, A.B., Haugen, E., Shafer, A., Fu, W., Vernot, B., Reynolds, A., Raubitschek, A., Ziegler, S., LeProust, E.M., Akey, J.M. and Stamatoyannopoulos, J.A. (2013) Exonic Transcription Factor Binding Directs Codon Choice and Affects Protein Evolution. Science 342:1367-1372. [doi: 10.1126/science.1243490] [Abstract] [PDF]

Stamatoyannopoulos is one of the ENCODE workers. He recently gave a talk at the University of Toronto where he defended the idea that pervasive transcription and pervasive transcription factor binding are evidence of widespread function in the human genome. This paper looks at transcription factor binding sites in exon sequences (coding sequences) and finds lots of them. What this means is that stretches of coding region contain codons AND transcription factor binding sites (duh!).

This is such an important discovery (not!) that Stergachis et al. coined a new word, "duons," to describe sequences that have two meanings. The ridiculous hype over this paper is covered in a separate post []. Here, I want to look at the science.

Let's start by reviewing what we know about DNA binding proteins. Some of these proteins bind to specific sequences in DNA. The classic examples are the restriction enzymes (restriction endonucleases) produced by various bacterial species to protect themselves against invasion by foreign DNA. These enzymes recognize short sequences of DNA. They bind and cleave the DNA by cutting both strands [see Restriction, Modification, and Epigenetics].

Typical DNA binding proteins recognize specific sequences of about six base pairs. The restriction enzyme سابقة بمعنى البيئةR1, for example, binds to the sequence GAATTC. This sequence will occur quite often in any random stretch of DNA. You can calculate the frequency by determining the probability of GAATTC: it's 4 6 or one in 4096 base pairs. What this means is that سابقة بمعنى البيئةR1 will bind to any DNA about once every 4000 bp (4Kb). 1

Back in the olden days, before DNA sequencing became cheap and easy, we used to construct restriction maps of DNA to define genes. Here's an example from a paper we published over thirty years ago. It shows the DNA binding sites of various restriction enzymes on ذبابة الفاكهة سوداء البطن DNA clones containing hsp70 heat shock genes (Moran et al. 1979).

The important point here is that none of these bacterial enzymes will ever see Drosophila DNA outside of the laboratory but because of their binding properties they recognize their specific binding sequence whenever they encounter it. I could have done the same experiment using transcription factors. If I had several dozen transcription factors from human cells, I could have mapped their binding sites on my Drosophila DNA and made a figure just like the one shown above. Of course, none of those binding sites would be biologically relevant since the binding of a human transcription factor to fruit fly DNA isn't ever gong to happen in the real world.

The coding regions of the genes are shown by the solid black bars in the figure. (These genes have no introns.) Note that the restriction enzyme binding sites are distributed fairly randomly but many of them bind to the coding region. What this means is that certain sequences in the coding region have a dual "meaning." Not only do they specify codons, they also specify the binding site for a restriction endonuclease. I suppose we could have made a big deal of this back in 1979 and called those sequences "duons" but I doubt very much this would have got past the reviewers. It's too obvious and it's not biologically relevant.

Same with transcription binding sites. If I had published a map of human transcription factor binding sites on Drosophila DNA nobody would think this remarkable enough to coin a new word for codons that are also transcription factor binding sites.

This brings us back to the Stergachis et al. (2013) paper. What they did was to map the sites in human DNA that bind human transcription factors. Recall that there have to be lots of these sites in our genome since most of them recognize specific sequences of about 6bp. Like restriction enzyme binding sites, these sequences will occur once every 4Kb (4000 bp) in random sequences of DNA. The human genome is not exactly random DNA but it's close enough for our purposes. For any given transcription factor, there will be about 800,000 binding sites in the human genome. Only a tiny percentage of these sites will be be biologically relevant leading to regular transcription of a nearby gene.

Stergachis et al. did not map transcription factor binding sites to naked human DNA. Instead, they mapped the binding sites في الجسم الحي which means that a given cell type had to produce the transcription factor and the DNA binding site had to be accessible. The latter distinction is important because a lot of our DNA is tightly bound to nucleosomes to make chromatin and in higher order chromatin structures the naked DNA is not "visible" to DNA binding proteins. When a gene is active, the chromatin opens up to form an "open" chromatin region where the DNA is exposed to transcription factors and RNA polymerase transcription complexes.

What this means is that only a subset of possible transcription factor binding sites can be detected in any given cell type. Many of these will be in or near active genes where the chromatin is in an "open" conformation. This includes protein coding genes and coding regions.

Stergachis et al. (2013) found a total of 11,588,043 transcription factor binding sites in 81 different cell types. The average was 1,018,514 different binding sites in a typical cell. They found a total of 24,842 binding sites within protein-coding exons. This corresponds to 1.8% of the total. In other words, 98.2% of the binding sites were in noncoding DNA and 1.8% were in coding DNA. This is pretty close to the distribution of coding and noncoding DNA in the genome suggesting strongly that the method is detecting random non-functional binding of transcription factors.

I conclude that the authors are detecting transcription factors binding to non-functional sites within coding regions. The vast majority of these sites have no biological relevance. They simply reflect the occurrence of fortuitous binding sites in the genome that just happen to match the specific binding site consensus sequence. This is not a big deal. In fact, it is predicted simply on the basis of our understanding of DNA binding proteins.

The authors do not address this possibility in their paper. Instead, they conclude .

While the authors are entitled to their opinion, they are NOT entitled to ignore other possible interpretations of their data. Especially since, in this case, the other interpretation contradicts the main conclusions of the paper. This is not how science should be done. This paper should never have been published as it is. The reviewers should be named and shamed. The editor(s) at علم should be fired. 2

1. It's actually a bit more complicated than that. Most DNA binding proteins bind nonspecifically to any piece of DNA. It's not just part of the intrinsic affinity for a negatively charged double-helix, it's also biologically relevant since these proteins usually bind weakly to DNA and then scan the DNA in one dimension looking for their specific binding site [see Slip Slidin' Along - How DNA Binding Proteins Find Their Target]. This kind of binding would not show up in the methods used by Stergachis et al. However, specific DNA binding proteins will recognize sequences that are closely related, but not identical, to their binding site and these interactions could be detected. سابقة بمعنى البيئةR1, for example, will bind with appreciable affinity to sites that differ by just one base pair from GAATTC.

2. No editor at علم should be unaware of the controversy surrounding the ENCODE publicity fiasco of 2012. Thus, editors should be on high alert every time they receive a paper from another ENCODE lab. They should go out of their way to choose reviewers who have been critical of the claims of pervasive functionality.


Transcription factors may inadvertently lock in DNA mistakes

Transcription factor proteins are the light switches of the human genome. By binding to DNA, they help turn genes "on" or "off" and start the important process of copying DNA into an RNA template that acts as a blueprint for a new protein.

By being choosy about which genes they turn on, transcription factors determine which rooms in the house are lighted and which aren't, or rather, which components of a person's genome are activated.

A team of Duke researchers has found that transcription factors have a tendency to bind strongly to "mismatched" sections of DNA, sections of the code that were not copied correctly. The strong binding of transcription factors to mismatched sections of regulatory DNA might be a way in which random mutations become a problem that leads to disease, including cancer.

The findings appear Oct. 21 in the journal طبيعة سجية.

Most of the time, DNA replication in the body goes smoothly, with nucleotides locking arms with their complementary base pair and marching through the cycle together in intended A-T and C-G fashion. However, as Gordan describes it, "no polymerase is perfect" and every now and then, a nucleotide will be paired with the wrong partner, resulting in a mismatch.

Pipetting transcription factor proteins on slides pre-blotted with thousands of DNA molecule samples, a research team led by Duke computational biologist Raluca Gordan Ph.D., showed that the proteins had a stronger bond with the sections of DNA with the mismatched base pairs than with those with perfectly matched base pairs, or "normal" DNA structure.

But what makes these 'mistakes' an attractive binding site for transcription factor proteins? For insight, Gordan, an associate professor in the Department of Biostatistics and Bioinformatics and the Department of Computer Science, reached out to Hashim Al-Hashimi, Ph.D., a James B. Duke Professor of Biochemistry, and expert in DNA structure and dynamics who works just across the street.

Al-Hashimi studies nucleic acids (DNA and RNA) and their interactions with proteins and small molecules, with the idea that how these biomolecules look and move is as important for their function as their chemical properties.

Looking at the experimental results, Gordan and Al-Hashimi came to the conclusion that the strong interaction between transcription factor proteins and mismatched DNA has a lot to do with laziness. When a transcription factor protein binds to DNA, it must spend energy distorting the site, for example by bending the DNA to its will. However, mismatched sections of DNA are already distorted, so the transcription factor protein has to do less work.

"That's when the transcription factor doesn't need to pay that energetic penalty" to get the job done, Gordan said.

"If we are ever to attain a deep and predictive understanding of how DNA is recognized by proteins in cells, we need to go beyond the conventional description in terms of static structures and move towards describing both DNA and the protein molecules that bind to them in terms of dynamic structures that have different preferences to adopt a wide range of shapes," Al-Hashimi said.

Gordan said that going forward, the team hopes to understand how this interaction relates to disease development. If a mismatched base pair, bound strongly by a transcription factor, makes it through the DNA replication cycle without being repaired by another type of protein -- known as a repair enzyme -- it can become a mutation, and mutations can lead to genetic diseases like cancer and neurodegeneration.

"We are now convinced that the interactions between transcription factors and mismatches are really strong," she said. "So the next step is to understand what this means for the cell."

"We already know that regulatory regions of the genome harbor more cancer mutations than expected by chance. We just do not know why. The strong interactions between transcription factors and DNA mismatches, which could interfere with repair of the mismatches, provide a novel mechanism for the accumulation of mutations in regulatory DNA."


13059_2005_1138_MOESM1_ESM.pdf

Additional data file 1: A figure depicting the effective length and fuzziness of motifs as a function of the number of binding sites in the promoter region (PDF 17 KB)

13059_2005_1138_MOESM2_ESM.pdf

Additional data file 2: A figure depicting the correlation between fit of binding sites to the motif and the length of the motif (PDF 14 KB)

13059_2005_1138_MOESM3_ESM.pdf

Additional data file 3: A figure depicting the distribution of promoters according to the number of associated transcription factors/binding sites (PDF 19 KB)

13059_2005_1138_MOESM4_ESM.pdf

Additional data file 4: A figure depicting average promoter and gene properties as a function of the number of transcription factors (PDF 20 KB)

13059_2005_1138_MOESM5_ESM.pdf

Additional data file 5: A figure depicting average promoter and gene properties as a function of the number of binding sites, for promoters to which exactly one factor binds (PDF 20 KB)

13059_2005_1138_MOESM6_ESM.pdf

Additional data file 6: A figure depicting average promoter and gene properties as a function of the number of binding sites, for promoters for which each factor has exactly one binding site (PDF 20 KB)

13059_2005_1138_MOESM7_ESM.pdf

Additional data file 7: A figure depicting the distribution of correlations between motif length and number of binding sites in randomly shuffled data (PDF 14 KB)


ملخص & # 8211 بدائية النواة مقابل النسخ حقيقية النواة

النسخ هو الخطوة الأولى في التعبير الجيني ، تليها الترجمة. على الرغم من أن آلية النسخ هي نفسها في بدائيات النوى وحقيقيات النوى ، إلا أن هناك اختلافات عديدة بينهما. الفرق الرئيسي بين النسخ بدائية النواة والنسخ حقيقية النواة هو أن النسخ بدائية النواة يحدث في السيتوبلازم بينما يحدث النسخ حقيقية النواة في النواة. علاوة على ذلك ، يتضمن النسخ بدائية النواة واحدًا فقط من بوليميريز RNA بينما يتضمن النسخ حقيقية النواة ثلاثة أنواع من بوليميراز الحمض النووي الريبي. علاوة على ذلك ، فإن تسلسل الرنا المرسال من بدائيات النوى يكون متعدد الخلايا بينما في حقيقيات النوى ، يكون تسلسل الرنا المرسال أحادي النواة. ليس هذا فقط ، في حقيقيات النوى ، تحدث تعديلات ما بعد النسخ بينما في بدائيات النوى ، لا تحدث. هذا هو ملخص الفرق بين النسخ بدائية النواة والنسخ حقيقية النواة.

المرجعي:

1. كوبر ، جيفري م. "النسخ في بدائيات النوى." تقارير علم الأعصاب وعلوم الأعصاب الحالية. ، المكتبة الوطنية الأمريكية للطب ، 1 يناير 1970. متاح هنا
2. "النسخ حقيقيات النوى." ويكيبيديا ، مؤسسة ويكيميديا ​​، 17 يناير 2019. متاح هنا

الصورة مجاملة:

1. & # 8221 تخليق البروتين البكتيري & # 8221 بقلم جوان إل سلونكزوسكي ، جون دبليو فوستر & # 8211 علم الأحياء الدقيقة: علم متطور ، (CC BY-SA 3.0) عبر Commons Wikimedia
2. & # 8221 النسخ النوى # 8221 بقلم فرانك ستارمر (CC BY 1.0) عبر ويكيميديا ​​كومنز


شاهد الفيديو: From DNA to protein - 3D (قد 2022).