أنبوب ملفوف ملحوم من الفولاذ المقاوم للصدأ 304/أنابيب zhemical zomponent، إمكانات التخليق الحيوي للميكروبيوم البحري العالمي

شكرا لكم لزيارة Nature.com.أنت تستخدم إصدار متصفح مع دعم محدود لـ CSS.للحصول على أفضل تجربة، نوصي باستخدام متصفح محدث (أو تعطيل وضع التوافق في Internet Explorer).بالإضافة إلى ذلك، ولضمان الدعم المستمر، نعرض الموقع بدون أنماط وجافا سكريبت.
أشرطة التمرير تعرض ثلاث مقالات لكل شريحة.استخدم زري الرجوع والتالي للتنقل عبر الشرائح، أو أزرار التحكم في الشرائح الموجودة في النهاية للتنقل خلال كل شريحة.

وصف مفصل للمنتج

304 أنبوب / أنابيب ملحومة من الفولاذ المقاوم للصدأ
1. المواصفات: أنبوب / أنابيب لفائف الفولاذ المقاوم للصدأ
2. النوع: ملحومة أو سلسة
3. المعيار: أستم A269، أستم A249
4. أنبوب لفائف الفولاذ المقاوم للصدأ OD: 6 مم إلى 25.4 مم
5. الطول: 600-3500 مم أو حسب متطلبات العميل.
6. سمك الجدار: 0.2 مم إلى 2.0 مم.

7. التسامح: التطوير التنظيمي: +/- 0.01 مم؛السُمك: +/-0.01%.

8. حجم الثقب الداخلي للملف: 500MM-1500MM (يمكن تعديله وفقًا لمتطلبات العملاء)

9. ارتفاع الملف: 200MM-400MM (يمكن تعديله وفقًا لمتطلبات العملاء)

10. السطح: مشرق أو صلب
11. المواد: 304، 304 لتر، 316 لتر، 321، 301، 201، 202، 409، 430، 410، سبيكة 625، 825، 2205، 2507، إلخ.
12. التعبئة: أكياس منسوجة في علبة خشبية، لوح خشبي، عمود خشبي، أو حسب متطلبات العميل
13. الاختبار: المكونات الكيميائية، قوة الخضوع، قوة الشد، قياس الصلابة
14. الضمان: فحص الطرف الثالث (على سبيل المثال: SGS TV)، وما إلى ذلك.
15. التطبيق: الديكور، الأثاث، نقل النفط، المبادل الحراري، صناعة الدرابزين، صناعة الورق، السيارات، تجهيز الأغذية، الطبية، الخ.

جميع التركيب الكيميائي والخصائص الفيزيائية للفولاذ المقاوم للصدأ كما يلي:

مادة ASTM A269 التركيب الكيميائي٪ ماكس
C Mn P S Si Cr Ni Mo ملحوظة: Nb Ti
TP304 0.08 2.00 0.045 0.030 1.00 18.0-20.0 8.0-11.0 ^ ^ ^ . ^
TP304L 0.035 2.00 0.045 0.030 1.00 18.0-20.0 8.0-12.0 ^ ^ ^ ^
TP316 0.08 2.00 0.045 0.030 1.00 16.0-18.0 10.0-14.0 2.00-3.00 ^ ^ ^
TP316L 0.035 د 2.00 0.045 0.030 1.00 16.0-18.0 10.0-15.0 2.00-3.00 ^ ^ ^
TP321 0.08 2.00 0.045 0.030 1.00 17.0-19.0 9.0-12.0 ^ ^ ^ 5C -0.70
TP347 0.08 2.00 0.045 0.030 1.00 17.0-19.0 9.0-12.0 10ج-1.10 ^

 

مادة المعالجة الحرارية درجة الحرارة F (C) دقيقة. صلابة
برينل روكويل
TP304 حل 1900 (1040) 192HBW/200HV 90HRB
TP304L حل 1900 (1040) 192HBW/200HV 90HRB
TP316 حل 1900(1040) 192HBW/200HV 90HRB
TP316L حل 1900(1040) 192HBW/200HV 90HRB
TP321 حل 1900(1040) ف 192HBW/200HV 90HRB
TP347 حل 1900(1040) 192HBW/200HV 90HRB

 

القطر الخارجي، بوصة بوصة التسامح OD (مم) نسبة التسامح بالوزن طول التسامح بوصة (مم)
+ -
≥ 1 / 2 ± 0.005 ( 0.13 ) ± 15 1 / 8 ( 3.2 ) 0
> 1 / 2 ~ 1 1 / 2 ± 0.005(0.13) ± 10 1 / 8 (3.2) 0
> 1 1 / 2 ~< 3 1 / 2 ± 0.010(0.25) ± 10 3 / 16 (4.8) 0
> 3 1 / 2 ~< 5 1 / 2 ± 0.015(0.38) ± 10 3 / 16 (4.8) 0
> 5 1 / 2 ~< 8 ± 0.030(0.76) ± 10 3 / 16 (4.8) 0
8~<12 ± 0.040(1.01) ± 10 3 / 16 (4.8) 0
12~<14 ± 0.050(1.26) ± 10 3 / 16 (4.8) 0

تتنوع المجتمعات الميكروبية الطبيعية من الناحية التطورية والأيضية.بالإضافة إلى مجموعات الكائنات الحية التي لم تتم دراستها بالقدر الكافي، فإن هذا التنوع يحمل أيضًا إمكانات غنية لاكتشاف إنزيمات ومركبات كيميائية حيوية ذات أهمية بيئية وتكنولوجية حيوية.ومع ذلك، فإن دراسة هذا التنوع لتحديد المسارات الجينومية التي تصنع هذه المركبات وتربطها بمضيفيها لا تزال تمثل تحديًا.لا تزال إمكانات التخليق الحيوي للكائنات الحية الدقيقة في المحيطات المفتوحة غير معروفة إلى حد كبير بسبب القيود المفروضة على تحليل بيانات تحليل الجينوم بأكملها على نطاق عالمي.هنا، نستكشف تنوع وتنوع مجموعات الجينات التخليقية الحيوية في المحيط من خلال دمج حوالي 10000 جينوم ميكروبي من الخلايا المستنبتة والخلايا المفردة مع أكثر من 25000 مشروع جينوم مُعاد بناؤه حديثًا من أكثر من 1000 عينة من مياه البحر.لقد حددت هذه الجهود حوالي 40.000 مجموعة جينية مفترضة، معظمها جديدة، تم العثور على بعضها في مجموعات تطورية لم تكن متوقعة سابقًا.في هذه المجموعات السكانية، حددنا سلالة غنية بمجموعات الجينات الاصطناعية الحيوية ("Candidatus Eudormicrobiaceae") التي تنتمي إلى شعبة بكتيرية غير مزروعة وتضمنت بعض الكائنات الحية الدقيقة الأكثر تنوعًا من الناحية الاصطناعية في هذه البيئة.من بينها، قمنا بتمييز مسارات الفوسفاتيز والببتيد والبيتوناميد، مع تحديد حالات التركيب المركب النشط حيويًا والإنزيمات، على التوالي.في الختام، توضح هذه الدراسة كيف يمكن للاستراتيجيات القائمة على الميكروبيوم أن تمكن من استكشاف الإنزيمات والأغذية الطبيعية التي لم يتم وصفها سابقًا في بيئة وميكروبات حيوية غير مفهومة جيدًا.
تقود الميكروبات الدورات البيوجيوكيميائية العالمية، وتحافظ على الشبكات الغذائية، وتحافظ على صحة النباتات والحيوانات.يمثل تنوعها التطوري والتمثيل الغذائي والوظيفي الهائل إمكانات غنية لاكتشاف أصناف جديدة وإنزيمات ومركبات كيميائية حيوية، بما في ذلك المنتجات الطبيعية.وفي المجتمعات البيئية، توفر هذه الجزيئات للكائنات الحية الدقيقة مجموعة متنوعة من الوظائف الفسيولوجية والبيئية، بدءًا من التواصل وحتى المنافسة 2,7 .بالإضافة إلى وظائفها الأصلية، توفر هذه المنتجات الطبيعية ومسارات إنتاجها المشفرة وراثيًا أمثلة لتطبيقات التكنولوجيا الحيوية والعلاجية.وقد تم تسهيل تحديد مثل هذه المسارات والاتصالات إلى حد كبير من خلال دراسة الميكروبات المستنبتة.ومع ذلك، فقد أظهرت الدراسات التصنيفية للبيئات الطبيعية أن الغالبية العظمى من الكائنات الحية الدقيقة لم يتم استزراعها8.يحد هذا التحيز الثقافي من قدرتنا على استغلال التنوع الوظيفي الذي تشفره العديد من الميكروبات.
للتغلب على هذه القيود، سمح التقدم التكنولوجي على مدى العقد الماضي للباحثين بإجراء تسلسل مباشر لشظايا الحمض النووي الميكروبي من مجتمعات بأكملها (علم الميتاجينوميات) أو خلايا مفردة (أي دون ثقافة مسبقة).إن القدرة على تجميع هذه الأجزاء في أجزاء جينوم أكبر وإعادة بناء جينومات متعددة مجمعة ميتاجينوميًا (MAGs) أو جينومات مفردة مضخمة (SAGs)، على التوالي، تفتح فرصة مهمة للدراسات التصنيفية للميكروبيوم (أي المجتمعات الميكروبية والميكروبيوم).تمهيد مسارات جديدة.المادة الوراثية الخاصة في بيئة معينة) 10،11،12.في الواقع، أدت الدراسات الحديثة إلى توسيع نطاق التمثيل التطوري للتنوع الميكروبي على الأرض بشكل كبير، وكشفت عن الكثير من التنوع الوظيفي في المجتمعات الميكروبية الفردية التي لم تغطيها سابقًا تسلسلات الجينوم المرجعية للكائنات الحية الدقيقة المستنبتة (REFs) 14.تعد القدرة على وضع التنوع الوظيفي غير المكتشف في سياق الجينوم المضيف (أي تحليل الجينوم) أمرًا بالغ الأهمية للتنبؤ بالخطوط الميكروبية غير المميزة حتى الآن والتي من المفترض أن تشفر منتجات طبيعية جديدة 15،16 أو لتتبع هذه المركبات مرة أخرى إلى منتجها الأصلي 17 .على سبيل المثال، أدى نهج التحليل الجينومي الميتاجينومي والخلية الواحدة مجتمعة إلى تحديد Candidatus Entotheonella، وهي مجموعة من البكتيريا المرتبطة بالإسفنج الغنية بالأيض، كمنتجين لمجموعة متنوعة من إمكانات الأدوية.ومع ذلك، على الرغم من المحاولات الأخيرة للاستكشاف الجينومي للمجتمعات الميكروبية المتنوعة، فإن أكثر من ثلثي البيانات الميتاجينومية العالمية لأكبر محيط من النظم البيئية على الأرض لا يزال مفقودًا.وبالتالي، بشكل عام، فإن إمكانات التخليق الحيوي للميكروبيوم البحري وإمكاناته كمستودع للمنتجات الأنزيمية والطبيعية الجديدة لا تزال غير مدروسة إلى حد كبير.
لاستكشاف إمكانات التخليق الحيوي للميكروبات البحرية على نطاق عالمي، قمنا أولاً بتجميع الجينومات الميكروبية البحرية التي تم الحصول عليها باستخدام طرق تعتمد على الثقافة وغير ثقافية لإنشاء قاعدة بيانات واسعة النطاق لعلم الوراثة ووظيفة الجينات.كشف فحص قاعدة البيانات هذه عن مجموعة واسعة من مجموعات الجينات الاصطناعية الحيوية (BGCs)، والتي ينتمي معظمها إلى عائلات مجموعة الجينات غير المميزة حتى الآن.بالإضافة إلى ذلك، حددنا عائلة بكتيرية غير معروفة تُظهر أعلى تنوع معروف لخلايا BGC في المحيط المفتوح حتى الآن.لقد اخترنا مسارين لتوليف الريبوسوم ومسارات الببتيد المعدلة بعد الترجمة (RiPP) للتحقق التجريبي بناءً على اختلافاتهما الجينية عن المسارات المعروفة حاليًا.كشف التوصيف الوظيفي لهذه المسارات عن أمثلة غير متوقعة لعلم الأنزيمات بالإضافة إلى مركبات غير عادية من الناحية الهيكلية ذات نشاط مثبط للبروتياز.
في البداية، كنا نهدف إلى إنشاء مصدر بيانات عالمي لتحليل الجينوم، مع التركيز على مكوناته البكتيرية والعتيقة.ولتحقيق هذه الغاية، قمنا بتجميع البيانات الميتاجينومية و1038 عينة من مياه البحر من 215 موقعًا لأخذ العينات موزعة عالميًا (نطاق خط العرض = 141.6 درجة) والعديد من الطبقات العميقة (من 1 إلى 5600 متر في العمق، والتي تغطي مناطق السطح ومناطق البحار الوسطى والسحيقة).الخلفية 21،22،23 (الشكل 1 أ، البيانات الموسعة، الشكل 1 أ والجدول التكميلي 1).بالإضافة إلى توفير تغطية جغرافية واسعة، أتاحت لنا هذه العينات التي تمت تصفيتها بشكل انتقائي مقارنة المكونات المختلفة للميكروبيوم البحري، بما في ذلك المكونات الغنية بالفيروسات (<0.2 ميكرومتر)، والغنية بدائيات النواة (0.2-3 ميكرومتر)، والغنية بالجزيئات (0.8 ميكرومتر). ).–20 ميكرومتر) والمستعمرات المستنفدة للفيروسات (>0.2 ميكرومتر).
أ، ما مجموعه 1038 جينومًا متاحًا للجمهور (علم الميتاجينوميات) للمجتمعات الميكروبية البحرية تم جمعها من 215 موقعًا موزعًا عالميًا (62 درجة جنوبًا إلى 79 درجة شمالًا ومن 179 درجة غربًا إلى 179 درجة شرقًا).بلاط الخريطة © Esri.المصادر: GEBCO، NOAA، CHS، OSU، UNH، CSUMB، National Geographic، DeLorme، NAVTEQ، وEsri.ب، تم استخدام هذه الميتاجينومات لإعادة بناء MAGs (الطرق والمعلومات الإضافية)، والتي تختلف من حيث الكمية والجودة (الطرق) في مجموعات البيانات (المميزة بالألوان).تم استكمال المجموعات MAG المعاد بناؤها بالجينومات (الخارجية) المتاحة للجمهور، بما في ذلك MAG26 وSAG27 وREF المصنوعة يدويًا.27 تجميع OMD.ج، مقارنة بالتقارير السابقة المستندة فقط إلى SAG (GORG) 20 أو MAG (GEM) 16، يعمل OMD على تحسين التوصيف الجينومي للمجتمعات الميكروبية البحرية (معدل رسم خرائط القراءة الميتاجينومية؛ الطريقة) بمقدار مرتين إلى ثلاث مرات مع تمثيل أكثر اتساقًا في العمق و خط العرض..<0.2، ن = 151، 0.2-0.8، ن = 67، 0.2-3، ن = 180، 0.8-20، ن = 30، >0.2، ن = 610، <30 درجة، ن = 132، 30-60 درجة ، n = 73،> 60°، n = 42، EPI، n = 174، MES، n = 45، BAT، n = 28. د، تجميع OMD في مستوى مجموعات الأنواع (95٪ يعني هوية النوكليوتيدات) يحدد إجمالي ما يقرب من 8300 نوع، أكثر من نصفها لم يتم وصفها سابقًا وفقًا للشروح التصنيفية باستخدام GTDB (الإصدار 89) هـ، أظهر تصنيف الأنواع حسب نوع الجينوم أن MAG وSAG وREFs يكملون بعضهم البعض بشكل جيد في عكس التنوع التطوري للجينوم. الميكروبيوم البحري.على وجه الخصوص، كانت 55% و26% و11% من الأنواع خاصة بـ MAG وSAG وREF، على التوالي.الخفافيش، سلسلة توقيت برمودا الأطلسي؛GEM، جينومات ميكروبيوم الأرض؛GORG، الجينوم المرجعي العالمي للمحيطات؛حار، سلسلة زمنية المحيط هاواي.
باستخدام مجموعة البيانات هذه، قمنا بإعادة بناء ما مجموعه 26293 مجموعة MAG، معظمها بكتيرية وأثرية (الشكل 1 ب والبيانات الموسعة، الشكل 1 ب).لقد أنشأنا هذه المجموعات MAGs من مجموعات من عينات ميتاجينومية منفصلة وليست مجمعة لمنع انهيار تباين التسلسل الطبيعي بين العينات من مواقع أو نقاط زمنية (طرق) مختلفة.بالإضافة إلى ذلك، قمنا بتجميع الأجزاء الجينومية بناءً على ارتباطات انتشارها عبر عدد كبير من العينات (من 58 إلى 610 عينة، اعتمادًا على طريقة المسح).لقد وجدنا أن هذه خطوة تستغرق وقتًا طويلاً ولكنها مهمة تم تخطيها في العديد من أعمال إعادة الإعمار واسعة النطاق MAG16 و19 و25 وتحسن بشكل كبير الكمية (2.7 ضعفًا في المتوسط) والجودة (+20% في المتوسط) من الجينوم.أعيد بناؤها من الميتاجينوم البحري الذي تمت دراسته هنا (بيانات موسعة، الشكل 2 أ ومعلومات إضافية).بشكل عام، أدت هذه الجهود إلى زيادة بمقدار 4.5 أضعاف في MAGs الميكروبية البحرية (6 أضعاف إذا تم أخذ MAGs عالية الجودة فقط في الاعتبار) مقارنةً بمورد MAG الأكثر شمولاً المتاح اليوم (الطرق).تم بعد ذلك دمج مجموعة MAG التي تم إنشاؤها حديثًا مع 830 MAG26s منتقاة بعناية، و5969 SAG27s و1707 REFs.يتألف سبعة وعشرون نوعًا من البكتيريا البحرية والعتائق من مجموعة اندماجية مكونة من 34799 جينومًا (الشكل 1ب).
قمنا بعد ذلك بتقييم المورد الذي تم إنشاؤه حديثًا لتحسين قدرته على تمثيل المجتمعات الميكروبية البحرية وتقييم تأثير دمج أنواع الجينوم المختلفة.في المتوسط، وجدنا أنه يغطي ما يقرب من 40-60٪ من البيانات الميتاجينومية البحرية (الشكل 1 ج)، أي ضعفين إلى ثلاثة أضعاف تغطية تقارير MAG السابقة فقط في كل من العمق وخط العرض المزيد من المسلسل 16 أو SAG20.بالإضافة إلى ذلك، لقياس التنوع التصنيفي بشكل منهجي في المجموعات القائمة، قمنا بشرح جميع الجينومات باستخدام مجموعة أدوات (طرق) قاعدة بيانات تصنيف الجينوم (GTDB) واستخدمنا هوية نيوكليوتيدات متوسطة على مستوى الجينوم تبلغ 95٪.28 لتحديد 8304 مجموعات الأنواع (الأنواع).ثلثا هذه الأنواع (بما في ذلك الواجهات الجديدة) لم تظهر سابقًا في GTDB، منها 2790 تم اكتشافها باستخدام MAG الذي أعيد بناؤه في هذه الدراسة (الشكل 1 د).بالإضافة إلى ذلك، وجدنا أن الأنواع المختلفة من الجينومات متكاملة إلى حد كبير: 55%، و26%، و11% من الأنواع تتكون بالكامل من MAG، وSAG، وREF، على التوالي (الشكل 1 هـ).بالإضافة إلى ذلك، غطت MAG جميع الأنواع الـ 49 الموجودة في عمود الماء، في حين مثلت SAG وREF فقط 18 و11 منها على التوالي.ومع ذلك، يمثل SAG بشكل أفضل تنوع الواجهات الأكثر شيوعًا (البيانات الموسعة، الشكل 3 أ)، مثل البكتيريا السطحية (SAR11)، حيث يغطي SAG ما يقرب من 1300 نوعًا وMAG 390 نوعًا فقط.والجدير بالذكر أن الموارد المتجددة نادرًا ما تتداخل مع مجموعات MAGs أو SAGs على مستوى الأنواع وتمثل أكثر من 95٪ من حوالي 1000 جينوم غير موجودة في مجموعات الميتاجينوم في المحيطات المفتوحة التي تمت دراستها هنا، ويرجع ذلك أساسًا إلى التفاعلات مع أنواع أخرى من العينات البحرية التمثيلية المعزولة (مثل الرواسب) .أو مضيف مشارك).ولجعله متاحًا على نطاق واسع للمجتمع العلمي، يمكن مقارنة مورد الجينوم البحري هذا، والذي يتضمن أيضًا أجزاء غير مصنفة (على سبيل المثال، من العاثيات المتوقعة والجزر الجينومية وأجزاء الجينوم التي لا توجد بيانات كافية عنها لإعادة بناء MAG)، بالبيانات التصنيفية. .الوصول إلى الشروح جنبا إلى جنب مع وظيفة الجينات والمعلمات السياقية في قاعدة بيانات علم الأحياء الدقيقة في المحيطات (OMD؛ https://microbiomics.io/ocean/).
ثم شرعنا في استكشاف ثراء وحداثة إمكانات التخليق الحيوي في الكائنات الحية الدقيقة في المحيطات المفتوحة.ولتحقيق هذه الغاية، استخدمنا أولاً antiSMASH لجميع MAGs وSAGs وREFs الموجودة في 1038 ميتاجينومًا بحريًا (طرق) للتنبؤ بإجمالي 39.055 BGCs.قمنا بعد ذلك بتجميعها في 6907 من أطر التعاون العالمي غير الزائدة و151 مجموعة من مجموعات الجينات (دول مجلس التعاون الخليجي؛ الجدول التكميلي 2 والأساليب) لحساب التكرار المتأصل (على سبيل المثال، يمكن تشفير نفس BGC في جينومات متعددة) وتجزئة البيانات الميتاجينومية لـ BGCs المركزة.لم تزيد BGCs غير المكتملة بشكل كبير، إن وجدت (معلومات تكميلية)، عدد إطارات التعاون العالمي وGCs، على التوالي، والتي تحتوي على عضو BGC سليم واحد على الأقل في 44٪ و86٪ من الحالات.
وعلى مستوى دول مجلس التعاون الخليجي، وجدنا مجموعة واسعة من الـ RiPPs المتوقعة وغيرها من المنتجات الطبيعية (الشكل 2 أ).من بينها، على سبيل المثال، تنتمي الأريل بوليينات، والكاروتينات، والإكتوينات، وحاملات الحديد إلى دول مجلس التعاون الخليجي ذات التوزيع النشوئي الواسع ووفرة عالية في الميتاجينومات المحيطية، مما قد يشير إلى تكيف واسع النطاق للكائنات الحية الدقيقة مع البيئة البحرية، بما في ذلك مقاومة أنواع الأكسجين التفاعلية، الإجهاد التأكسدي والتناضحي..أو امتصاص الحديد (مزيد من المعلومات).يتناقض هذا التنوع الوظيفي مع تحليل حديث لحوالي 1.2 مليون BGCs من بين حوالي 190.000 جينوم مخزنة في قاعدة بيانات NCBI RefSeq (BiG-FAM/RefSeq، المشار إليها فيما بعد باسم RefSeq)29، والتي أظهرت أن الببتيدات سينثيتاز غير الريبوسومية (NRPS) وسينسيز بوليكيتيد (PKS) BGCs (معلومات تكميلية).لقد وجدنا أيضًا 44 (29٪) من دول مجلس التعاون الخليجي مرتبطة بشكل بعيد بأي RefSeq BGC (\(\bar{d}\)RefSeq > 0.4؛ الشكل 2 أ والأساليب) و53 (35٪) من دول مجلس التعاون الخليجي فقط في MAG، مما يسلط الضوء على الإمكانات للكشف عن المواد الكيميائية التي لم يتم وصفها سابقًا في OMD.بالنظر إلى أن كل من هذه الخلايا من المحتمل أن تمثل وظائف صناعية حيوية متنوعة للغاية، فقد قمنا بتحليل البيانات على مستوى GCF في محاولة لتوفير مجموعة أكثر تفصيلاً من BGCs المتوقعة لترميز المنتجات الطبيعية المماثلة.لم يتداخل ما مجموعه 3861 (56%) من إطارات التعاون العالمي المحددة مع RefSeq، ولم تكن أكثر من 97% من إطارات التعاون العالمي موجودة في MIBiG، وهي واحدة من أكبر قواعد البيانات لـ BGCs التي تم التحقق من صحتها تجريبيًا (الشكل 2 ب).في حين أنه ليس من المستغرب اكتشاف العديد من المسارات الجديدة المحتملة في الإعدادات التي لا يتم تمثيلها بشكل جيد بواسطة الجينوم المرجعي، فإن طريقتنا في إلغاء تكرار BGCs في أطر التعاون العالمي قبل المقارنة المعيارية تختلف عن التقارير السابقة 16 وتسمح لنا بتقديم تقييم غير متحيز للحداثة.يتوافق معظم التنوع الجديد (3012 GCF أو 78٪) مع التربينات المتوقعة أو RiPP أو غيرها من المنتجات الطبيعية، ومعظم (1815 GCF أو 47٪) مشفر في أنواع غير معروفة بسبب إمكاناتها التخليقية الحيوية.على عكس مجموعات PKS وNRPS، من غير المرجح أن يتم تجزئة BGCs المدمجة هذه أثناء التجميع الميتاجينومي 31 وتسمح بمزيد من التوصيف الوظيفي المكثف للوقت والموارد لمنتجاتها.
تم تجميع إجمالي 39,055 مركزًا رئيسيًا في 6,907 إطارًا مشتركًا و151 إطارًا مشتركًا لدول مجلس التعاون الخليجي.أ، تمثيل البيانات (داخلي خارجي).التجميع الهرمي للمسافات BGC على أساس دول مجلس التعاون الخليجي، 53 منها تم إصلاحها بواسطة MAG فقط.تحتوي دول مجلس التعاون الخليجي على BGCs من فئات مختلفة (تردد البوابة المحولة ln) وفئات BGC مختلفة (حجم الدائرة يتوافق مع ترددها).بالنسبة لكل دول مجلس التعاون الخليجي، تمثل الطبقة الخارجية عدد BGCs، والانتشار (النسبة المئوية للعينات)، والمسافة (الحد الأدنى لمسافة جيب التمام BGC (min(dMIBiG))) من BiG-FAM إلى BGC.يتم تمييز دول مجلس التعاون الخليجي ذات BGCs المرتبطة ارتباطًا وثيقًا بـ BGCs التي تم التحقق منها تجريبيًا (MIBiG) بالسهام.(ب) بمقارنة إطار التعاون العالمي مع BGCs المتوقعة (BiG-FAM) والتي تم التحقق من صحتها تجريبيًا (MIBiG)، تم العثور على 3861 إطارًا مشتركًا جديدًا (d -> 0.2).معظم (78٪) من هذه الرموز تشير إلى RiPP، والتربين، وغيرها من المنتجات الطبيعية المفترضة.ج، تم وضع جميع الجينومات الموجودة في OMD الموجودة في 1038 ميتاجينومًا بحريًا في شجرة قاعدة GTDB لإظهار التغطية التطورية لـ OMD.تظهر الواجهات التي لا تحتوي على أي جينومات في OMD باللون الرمادي.يتوافق عدد BGCs مع أكبر عدد من BGCs المتوقعة لكل جينوم في فرع حيوي معين.من أجل الوضوح، تم طي آخر 15٪ من العقد.تشير الأسهم إلى واجهات غنية بـ BGC (> 15 BGC)، باستثناء المتفطرة، و Gordonia (في المرتبة الثانية بعد Rhodococcus)، و Crocosphaera (في المرتبة الثانية بعد Synechococcus).د، غير معروف ج.أظهرت Eremiobacterota أعلى تنوع في التخليق الحيوي (مؤشر شانون يعتمد على نوع المنتج الطبيعي).يمثل كل نطاق الجينوم الذي يحتوي على أكبر عدد من BGCs في النوع.T1PKS، PKS النوع الأول، T2/3PKS، PKS النوع الثاني والنوع الثالث.
بالإضافة إلى الثراء والحداثة، فإننا نستكشف البنية الجغرافية الحيوية لإمكانات التخليق الحيوي للميكروبيوم البحري.أظهر تجميع العينات حسب متوسط ​​توزيع رقم نسخة GCF الميتاجينومي (الطرق) أن المجتمعات ذات خطوط العرض المنخفضة والسطحية والغنية بدائيات النواة والفقيرة بالفيروسات، ومعظمها من المياه السطحية أو العميقة المضاءة بنور الشمس، كانت غنية بتربينات RiPP وBGC.في المقابل، ارتبطت المجتمعات القطبية وأعماق البحار والغنية بالفيروسات والجسيمات بوفرة أعلى من NRPS وPKS BGC (بيانات موسعة، الشكل 4 ومعلومات إضافية).أخيرًا، وجدنا أن المجتمعات الاستوائية والبحرية المدروسة جيدًا هي المصادر الواعدة للتربينات الجديدة (شكل البيانات المعززة).أعلى إمكانات PKS وRiPP والمنتجات الطبيعية الأخرى (الشكل 5 أ مع البيانات الموسعة).
لاستكمال دراستنا حول إمكانات التخليق الحيوي للميكروبات البحرية، كنا نهدف إلى رسم خريطة لتوزيعها التطوري وتحديد الواجهات الجديدة المخصبة بـ BGC.ولتحقيق هذه الغاية، وضعنا جينومات الميكروبات البحرية في شجرة النشوء والتطور البكتيرية والعتيقة GTDB13، وقمنا بتغطية مسارات التخليق الحيوي المفترضة التي تشفرها (الشكل 2 ج).لقد اكتشفنا بسهولة العديد من الواجهات المخصبة بـ BGC (ممثلة بأكثر من 15 BGCs) في عينات مياه البحر (طرق) المعروفة بإمكانياتها التخليقية الحيوية، مثل البكتيريا الزرقاء (Synechococcus) وبكتيريا Proteus، مثل Tistrella، أو جذبت الانتباه مؤخرًا بسبب خصائصها. منتجات طبيعية .مثل Myxococcota (Sandaracinaceae)، Rhodococcus وPlanctomycetota34،35،36.ومن المثير للاهتمام أننا وجدنا العديد من الأنساب غير المستكشفة سابقًا في هذه الفروع الحيوية.على سبيل المثال، تلك الأنواع التي تتمتع بأغنى إمكانات التخليق الحيوي في phyla Planctomycetota وMyxococcota تنتمي إلى أوامر وأجناس مرشحة غير مميزة، على التوالي (الجدول التكميلي 3).مجتمعة، يشير هذا إلى أن OMD يوفر الوصول إلى معلومات النشوء والتطور غير المعروفة سابقًا، بما في ذلك الكائنات الحية الدقيقة، والتي قد تمثل أهدافًا جديدة لاكتشاف الإنزيمات والمنتجات الطبيعية.
بعد ذلك، قمنا بتمييز الفرع الحيوي المخصب بـ BGC ليس فقط من خلال حساب الحد الأقصى لعدد BGCs المشفرة من قبل أعضائه، ولكن أيضًا من خلال تقييم تنوع BGCs، وهو ما يفسر تواتر الأنواع المختلفة من المنتجات المرشحة الطبيعية (الشكل 2 ج والأساليب). )..لقد وجدنا أن الأنواع الأكثر تنوعًا من الناحية الاصطناعية تم تمثيلها بواسطة MAGs البكتيرية المصممة خصيصًا في هذه الدراسة.تنتمي هذه البكتيريا إلى شعبة Candidatus Eremiobacterota غير المزروعة، والتي لا تزال غير مستكشفة إلى حد كبير باستثناء بعض الدراسات الجينومية .ومن الجدير بالذكر أن "ج.تم تحليل جنس Eremiobacterota فقط في بيئة أرضية ولا يُعرف أنه يشمل أي أعضاء مخصب في BGC.لقد قمنا هنا بإعادة بناء ثمانية مجموعات MAGs من نفس النوع (هوية النوكليوتيدات> 99٪) 23. لذلك نقترح اسم النوع "Candidatus Eudoremicrobium malaspinii"، الذي سمي على اسم nereid (حورية البحر)، وهي هدية جميلة في الأساطير والبعثات اليونانية.'كا.وفقًا للشرح التطوري 13، ليس لدى E. malaspinii أي أقارب معروفين سابقًا تحت مستوى التسلسل، وبالتالي ينتمي إلى عائلة بكتيرية جديدة نقترحها "Ca.E. malaspinii "كنوع النوع و"Ca."Eudormicrobiaceae" كاسم رسمي (معلومات تكميلية).إعادة بناء ميتاجينومية موجزة لـ 'Ca.تم التحقق من صحة مشروع الجينوم E. malaspinii من خلال مدخلات منخفضة للغاية وتسلسل ميتاجينومي طويل القراءة وتجميع مستهدف لعينة واحدة (الطرق) باعتبارها كروموسوم خطي واحد يبلغ 9.63 ميجابايت مع تكرار 75 كيلو بايت.باعتبارها الغموض الوحيد المتبقي.
لتحديد السياق التطوري لهذا النوع، بحثنا عن 40 نوعًا وثيق الصلة في عينات ميتاجينومية إضافية غنية حقيقيات النواة من رحلة تارا أوشن الاستكشافية من خلال إعادة بناء الجينوم المستهدف.باختصار، قمنا بربط قراءات الميتاجينوم بالشظايا الجينومية المرتبطة بـ "Ca.E. malaspinii "وافترض أن زيادة معدل التوظيف في هذه العينة يشير إلى وجود أقارب آخرين (طرق).ونتيجة لذلك، وجدنا 10 مجموعات MAGs، وهي مزيج من 19 مجموعة MAGs تمثل خمسة أنواع في ثلاثة أجناس ضمن عائلة محددة حديثًا (أي "Ca. Eudormicrobiaceae").بعد الفحص اليدوي ومراقبة الجودة (البيانات الموسعة، الشكل 6 والمعلومات الإضافية)، وجدنا أن "Ca.تقدم أنواع Eudormicrobiaceae جينومات أكبر (8 ميجا بايت) وإمكانات صناعية أكثر ثراءً (14 إلى 22 BGC لكل نوع) مقارنة بأعضاء "Ca" الآخرين.Clade Eremiobacterota (ما يصل إلى 7 BGC) (الشكل 3-أ).
أ، المواقع التطورية للخمسة كاليفورنيا.أظهرت أنواع Eudormicrobiaceae ثراء BGC الخاص بالخطوط البحرية المحددة في هذه الدراسة.تتضمن شجرة النشوء والتطور جميع أنواع الكالسيوم.تم استخدام MAG Eremiobacterota وأعضاء من الكائنات الأخرى (أرقام الجينوم بين قوسين) الواردة في GTDB (الإصدار 89) للخلفية التطورية (الطرق).تمثل الطبقات الخارجية التصنيفات على مستوى الأسرة ("Ca. Eudormicrobiaceae" و"Ca. Xenobiaceae") وعلى مستوى الطبقة ("Ca. Eremiobacteria").يتم تمثيل الأنواع الخمسة الموصوفة في هذه الدراسة برموز أبجدية رقمية وأسماء ذات الحدين مقترحة (معلومات تكميلية).ب، حسنا.تشترك أنواع Eudormicrobiaceae في سبع نوى BGC مشتركة.كان غياب BGC في الطبقة A2 بسبب عدم اكتمال ممثل MAG (الجدول التكميلي 3).BGCs خاصة بـ "Ca.أمفيثوميكروبيوم" و"كاليفورنيا.لا يتم عرض الأمفيثوميكروبيوم (الفصلين A وB).ج، جميع BGCs المشفرة كـ "Ca.تم العثور على Eudoremicrobium taraoceanii في 623 نسخة ميتاترانسكريبتوم مأخوذة من محيطات تارا.تشير الدوائر الصلبة إلى النسخ النشط.تشير الدوائر البرتقالية إلى تغييرات الطية المحولة بـ log2 أسفل وفوق معدل التعبير الجيني للتدبير المنزلي (الطرق).د ، منحنيات الوفرة النسبية (طرق) تظهر 'Ca.تنتشر أنواع Eudormicrobiaceae على نطاق واسع في معظم أحواض المحيطات وفي عمود الماء بأكمله (من السطح إلى عمق 4000 متر على الأقل).وبناء على هذه التقديرات، وجدنا أن 'Ca.يمثل E. malaspinii ما يصل إلى 6% من الخلايا بدائية النواة في المجتمعات المرتبطة بالحبوب في أعماق البحار.لقد اعتبرنا أن أحد الأنواع موجود في موقع ما إذا تم العثور عليه في أي جزء من حجم طبقة عمق معينة.IO - المحيط الهندي، NAO - شمال المحيط الأطلسي، NPO - شمال المحيط الهادئ، RS - البحر الأحمر، SAO - جنوب المحيط الأطلسي، SO - المحيط الجنوبي، SPO - جنوب المحيط الهادئ.
دراسة وفرة وتوزيع الكالسيوم.Eudormicrobiaceae، والتي، كما وجدنا، تسود في معظم أحواض المحيطات، وكذلك في عمود الماء بأكمله (الشكل 3D).محليًا، تشكل هذه الكائنات 6% من مجتمع الميكروبات البحرية، مما يجعلها جزءًا مهمًا من الميكروبيوم البحري العالمي.بالإضافة إلى ذلك، وجدنا المحتوى النسبي لـ Ca.كانت أنواع Eudormicrobiaceae ومستويات تعبير BGC الخاصة بها هي الأعلى في الجزء المخصب حقيقيات النواة (الشكل 3 ج والبيانات الموسعة، الشكل 7)، مما يشير إلى تفاعل محتمل مع الجسيمات، بما في ذلك العوالق.هذه الملاحظة تحمل بعض التشابه مع 'Ca.Eudoremicrobium BGCs التي تنتج منتجات طبيعية سامة للخلايا من خلال مسارات معروفة قد تظهر سلوكًا مفترسًا (المعلومات التكميلية والبيانات الموسعة، الشكل 8)، على غرار الحيوانات المفترسة الأخرى التي تنتج مستقلبات على وجه التحديد مثل Myxococcus.اكتشاف كاليفورنيا.قد تفسر Eudormicrobiaceae الموجودة في العينات الأقل توفرًا (أعماق المحيطات) أو حقيقية النواة بدلاً من عينات بدائية النواة سبب بقاء هذه البكتيريا وتنوعها غير المتوقع في BGC غير واضح في سياق أبحاث الأغذية الطبيعية.
في النهاية، سعينا إلى التحقق من صحة وعد عملنا القائم على الميكروبيوم في اكتشاف مسارات وإنزيمات ومنتجات طبيعية جديدة.من بين الفئات المختلفة من BGCs، من المعروف أن مسار RiPP يشفر تنوعًا كيميائيًا ووظيفيًا غنيًا بسبب التعديلات المختلفة بعد الترجمة للببتيد الأساسي بواسطة الإنزيمات الناضجة .لذلك اخترنا اثنين من كاليفورنيا.تعتمد Eudoremicrobium 'RiPP BGCs (الشكلان 3 ب و4 أ-ه) على نفس أي BGC معروف (\(\bar{d}\)MIBiG و\(\bar{d}\)RefSeq أعلى من 0.2).
a – c ، في التعبير غير المتجانس في المختبر والمقايسات الأنزيمية في المختبر لرواية (\ (\ bar {d} \) RefSeq = 0.29) مجموعة من التخليق الحيوي RiPP الخاص بأنواع Ca في أعماق البحار.أدى E. malaspinii إلى إنتاج منتجات ثنائية الفسفرة.ج، تم تحديد التعديلات باستخدام MS/MS عالي الدقة (HR) (التجزئة المشار إليها بواسطة أيونات b وy في التركيب الكيميائي) والرنين المغناطيسي النووي (بيانات موسعة، الشكل 9).د، يُظهر هذا الببتيد المفسفر تثبيطًا صغيرًا للميكرومولار لإيلاستاز العدلات في الثدييات، وهو غير موجود في الببتيد المتحكم والببتيد المجفف (الإزالة الكيميائية الناجمة عن الجفاف).التجربة أعيدت ثلاث مرات مع نتائج مشابهة.على سبيل المثال، يوضح التعبير غير المتجانس لمجموعة الرواية الثانية \(\bar{d}\)RefSeq = 0.33) من التخليق الحيوي للبروتين وظيفة أربعة إنزيمات ناضجة تقوم بتعديل الببتيد الأساسي المكون من 46 حمض أميني.يتم تلطيخ المخلفات وفقًا لموقع التعديل المتوقع بواسطة HR-MS/MS، ووضع العلامات على النظائر، وتحليل الرنين المغناطيسي النووي (معلومات تكميلية).يشير التلوين المتقطع إلى أن التعديل يحدث عند أي من المخلفات.الشكل عبارة عن تجميع للعديد من التركيبات غير المتجانسة لإظهار نشاط جميع الإنزيمات الناضجة في نفس النواة.ح، رسم توضيحي لبيانات الرنين المغناطيسي النووي لميثيل أميد N العمود الفقري.وتظهر النتائج الكاملة في الشكل.10 مع بيانات موسعة.i، يكشف الموقع التطوري لإنزيم مجموعة البروتين FkbM الناضج بين جميع مجالات FkbM الموجودة في قاعدة بيانات MIBiG 2.0 عن إنزيم من هذه العائلة مع نشاط N-methyltransferase (معلومات تكميلية).يتم عرض الرسوم البيانية التخطيطية لـ BGCs (a، e)، وهياكل الببتيد السلائف (b، f)، والتركيبات الكيميائية المفترضة للمنتجات الطبيعية (c، g).
تم العثور على مسار RiPP الأول (\(\bar{d}\)MIBiG = 0.41، \(\bar{d}\)RefSeq = 0.29) فقط في الأنواع التي تعيش في أعماق البحار "Ca.E. malaspinii" ورموز الببتيد - السلائف (الشكل 4 أ، ب).في هذا الإنزيم الناضج، حددنا مجالًا وظيفيًا واحدًا متماثلًا لمجال الجفاف في سينسيز اللانتيببتيد الذي يحفز عادةً الفسفرة والإزالة اللاحقة لـ 43 (معلومات تكميلية).ولذلك، فإننا نتوقع أن تعديل الببتيد السلائف ينطوي على مثل هذا الجفاف من خطوتين.ومع ذلك، باستخدام قياس الطيف الكتلي الترادفي (MS/MS) والتحليل الطيفي بالرنين المغناطيسي النووي (NMR)، حددنا الببتيد الخطي متعدد الفسفور (الشكل 4 ج).على الرغم من أنه غير متوقع، فقد وجدنا عدة خطوط من الأدلة لدعم كونه المنتج النهائي: مضيفين مختلفين غير متجانسين وعدم وجود جفاف في فحوصات المختبر، وتحديد المخلفات الرئيسية المتحورة في موقع الجفاف التحفيزي للإنزيم الناضج.تم إعادة بنائها جميعًا بواسطة "Ca".جينوم E. malaspinii (بيانات موسعة، الشكل 9 ومعلومات إضافية)، وأخيرًا، النشاط البيولوجي للمنتج المفسفر، ولكن ليس الشكل المجفف المركب كيميائيًا (الشكل 4 د).في الواقع، وجدنا أنه يُظهر نشاطًا مثبطًا منخفضًا للبروتياز الميكرومولاري ضد إيلاستاز العدلات، مقارنةً بالمنتجات الطبيعية الأخرى ذات الصلة في نطاق التركيز (IC50 = 14.3 ميكرومتر) 44، على الرغم من حقيقة أن الدور البيئي لا يزال يتعين توضيحه.وبناءً على هذه النتائج، نقترح تسمية المسار بـ"الفوسفبتين".
الحالة الثانية هي مسار RiPP المعقد الخاص بـ Ca.تم التنبؤ بجنس Eudoremicrobium (\ (\ bar {d} \) MIBiG = 0.46، \ (\ bar {d} \) RefSeq = 0.33) لتشفير منتجات البروتين الطبيعي (الشكل 4 هـ).تعتبر هذه المسارات ذات أهمية خاصة في مجال التكنولوجيا الحيوية بسبب الكثافة المتوقعة وتنوع التعديلات الكيميائية غير العادية التي أنشأتها الإنزيمات المشفرة بواسطة BGCs القصيرة نسبيًا.لقد وجدنا أن هذا البروتين يختلف عن البروتينات التي سبق وصفها من حيث أنه يفتقر إلى كل من الشكل الرئيسي NX5N للبولي سيراميدات وحلقة اللانثيونين من اللاندوراميدات 46.للتغلب على القيود المفروضة على أنماط التعبير غير المتجانسة الشائعة، استخدمناها جنبًا إلى جنب مع نظام Microvirgula aerodenitrificans المخصص لتوصيف أربعة إنزيمات (طرق) المسار الناضجة.باستخدام مزيج من MS/MS، ووضع العلامات النظائرية، والرنين المغناطيسي النووي، اكتشفنا هذه الإنزيمات الناضجة في قلب الحمض الأميني المكون من 46 حمضًا للببتيد (الشكل 4f،ز، البيانات الموسعة، الأشكال 10-12 ومعلومات إضافية).من بين الإنزيمات الناضجة، قمنا بتمييز الظهور الأول لأحد أفراد عائلة FkbM O-methyltransferase 47 في مسار RiPP ووجدنا بشكل غير متوقع أن هذا الإنزيم الناضج يقدم مثيلة N العمود الفقري (الشكل 4 ح، ط ومعلومات إضافية).على الرغم من أن هذا التعديل معروف في منتجات NRP48 الطبيعية، إلا أن مثيلة N الأنزيمية لسندات الأميد هي تفاعل معقد ولكنه مهم من الناحية التكنولوجية الحيوية والذي كان حتى الآن محل اهتمام عائلة البوروسينات RiPP.خصوصية 50,51.قد يؤدي تحديد هذا النشاط في عائلات أخرى من الإنزيمات وRPP إلى فتح تطبيقات جديدة وتوسيع التنوع الوظيفي للبروتينات 52 وتنوعها الكيميائي.بناءً على التعديلات التي تم تحديدها والطول غير المعتاد لهيكل المنتج المقترح، نقترح اسم المسار "pythonamide".
إن اكتشاف علم إنزيمات غير متوقع في عائلة إنزيمات تتميز وظيفيًا يوضح وعد علم الجينوم البيئي بالاكتشافات الجديدة، ويوضح أيضًا القدرة المحدودة على الاستدلال الوظيفي بناءً على تماثل التسلسل وحده.وهكذا، إلى جانب التقارير عن RiPPs المتعددة الفسفور النشطة بيولوجيًا غير القانونية، تُظهر نتائجنا قيمة كثيفة الاستخدام للموارد ولكنها حاسمة لجهود البيولوجيا التركيبية للكشف الكامل عن الثراء الوظيفي والتنوع والهياكل غير العادية للمركبات الكيميائية الحيوية.
نعرض هنا نطاق إمكانات التخليق الحيوي المشفرة بواسطة الميكروبات وسياقها الجينومي في الميكروبيوم البحري العالمي، مما يسهل البحث المستقبلي من خلال إتاحة الموارد الناتجة للمجتمع العلمي (https://microbiomics.io/ocean/).لقد وجدنا أن الكثير من حداثتها التطورية والوظيفية لا يمكن الحصول عليها إلا من خلال إعادة بناء MAGs وSAGs، خاصة في المجتمعات الميكروبية غير المستغلة والتي يمكن أن توجه جهود التنقيب البيولوجي في المستقبل.على الرغم من أننا سنركز هنا على 'Ca."Eudormicrobiaceae" باعتبارها سلالة خاصة "موهوبة" من الناحية الاصطناعية، فإن العديد من BGCs المتوقعة في الكائنات الحية الدقيقة غير المكتشفة من المحتمل أن تقوم بتشفير الإنزيمات غير الموصوفة سابقًا والتي تنتج مركبات ذات إجراءات مهمة بيئيًا و / أو تكنولوجيًا حيويًا.
تم تضمين مجموعات البيانات الميتاجينومية من الدراسات الأوقيانوغرافية والسلاسل الزمنية الكبرى بعمق تسلسلي كافٍ لتحقيق أقصى قدر من التغطية للمجتمعات الميكروبية البحرية العالمية في أحواض المحيطات والطبقات العميقة وبمرور الوقت.تتضمن مجموعات البيانات هذه (الجدول التكميلي 1 والشكل 1) الميتاجينوميات من العينات التي تم جمعها في محيطات تارا (مخصب فيروسيًا، ن = 190؛ ومخصب بدائيات النواة، ن = 180) وبعثة BioGEOTRACES (ن = 480).السلسلة الزمنية للمحيطات في هاواي (HOT، n = 68)، والسلسلة الزمنية لبرمودا-المحيط الأطلسي (BATS، n = 62)21 ورحلة مالاسبينا (n = 58)23.تمت تصفية قراءات التسلسل من جميع أجزاء الميتاجينوم للتأكد من الجودة باستخدام BBMap (الإصدار 38.71) عن طريق إزالة محولات التسلسل من القراءات، وإزالة القراءات المعينة لتسلسلات مراقبة الجودة (جينومات PhiX)، واستخدام Trimq=14، maq=20 يتجاهل جودة القراءة الضعيفة، maxns = 0 وminlength = 45. تم تشغيل التحليلات اللاحقة أو دمجها مع قراءات مراقبة الجودة إذا تم تحديدها (bbmerge.sh minoverlap=16).تم تطبيع قراءات مراقبة الجودة (هدف bbnorm.sh = 40، عمق العقل = 0) قبل الإنشاء باستخدام metaSPAdes (الإصدار 3.11.1 أو الإصدار 3.12 إذا لزم الأمر)53.تمت تصفية contigs السقالة الناتجة (المشار إليها فيما بعد باسم السقالات) أخيرًا حسب الطول (≥1 كيلو بايت).
تم تقسيم 1038 عينة ميتاجينومية إلى مجموعات، ولكل مجموعة من العينات، تمت مطابقة قراءات مراقبة جودة الميتاجينوم لجميع العينات مع أقواس كل عينة على حدة، مما أدى إلى العدد التالي من قراءات المجموعة بين قوسين: فيروسات تارا البحرية - المخصب (190×190)، بدائيات النوى المخصبة (180×180)، BioGEOTRACES، HOT and BATS (610×610) وMalaspina (58×58).تم إجراء التعيين باستخدام Burrows-Wheeler-Aligner (BWA) (الإصدار 0.7.17-r1188)54 والذي يسمح بمطابقة القراءات مع المواقع الثانوية (باستخدام العلامة -a).تمت تصفية المحاذاة بحيث يبلغ طولها 45 قاعدة على الأقل، ولها هوية ≥97%، وتمتد قراءات ≥80%.تمت معالجة ملفات BAM الناتجة باستخدام البرنامج النصي jgi_summarize_bam_contig_ Deeps لـ MetaBAT2 (الإصدار 2.12.1)55 لتوفير تغطية داخل العينة وفيما بينها لكل مجموعة.أخيرًا، تم تجميع الأقواس لزيادة الحساسية عن طريق تشغيل MetaBAT2 بشكل فردي على جميع العينات باستخدام –minContig 2000 و –maxEdges 500. نحن نستخدم MetaBAT2 بدلاً من الملاكم الجماعي لأنه ثبت في الاختبارات المستقلة أنه الملاكم الفردي الأكثر فعالية.وأسرع بـ 10 إلى 50 مرة من الملاكمين الآخرين الشائعين الاستخدام.لاختبار تأثير ارتباطات الوفرة، تم اختيار عينة فرعية عشوائيًا من الميتاجينوميات (10 لكل من مجموعتي بيانات Tara Ocean، و10 لـ BioGEOTRACES، و5 لكل سلسلة زمنية، و5 لـ Malaspina) بالإضافة إلى ذلك استخدمت عينات فقط.يتم تجميع العينات الداخلية للحصول على معلومات التغطية.(معلومات إضافية).
تم تضمين جينومات (خارجية) إضافية في التحليل اللاحق، وهي 830 مجموعة MAGs تم اختيارها يدويًا من مجموعة فرعية من مجموعة بيانات Tara Oceans26، و5287 SAGs من مجموعة بيانات GORG20، وبيانات من قاعدة بيانات MAR (MarDB v. 4) من 1707 مرجعًا معزولًا و 682 SAGs) 27. بالنسبة لمجموعة بيانات MarDB، يتم تحديد الجينومات بناءً على البيانات الوصفية المتاحة إذا كان نوع العينة يتطابق مع التعبير العادي التالي: '[S|s]ingle.?[C|c]ell|[C|c]ulture| [أنا | أنا] معزولة.
تم تقييم جودة كل حاوية ميتاجينومية وجينومات خارجية باستخدام CheckM (الإصدار 1.0.13) وسير عمل النسب الخاص بـ Anvi'o (الإصدار 5.5.0)58،59.إذا أبلغ CheckM أو Anvi'o عن اكتمال/اكتمال بنسبة ≥50% وتلوث/تكرار بنسبة ≥10%، فاحفظ الخلايا الميتاجينومية والجينومات الخارجية لتحليلها لاحقًا.تم بعد ذلك دمج هذه الدرجات في متوسط ​​الاكتمال (mcpl) ومتوسط ​​التلوث (mctn) لتصنيف جودة الجينوم وفقًا لمعايير المجتمع60 على النحو التالي: الجودة العالية: mcpl ≥ 90% وmctn ≥ 5%؛نوعية جيدة: mcpl ≥ 70%، mctn ≥ 10%، الجودة المتوسطة: mcpl ≥ 50% وmctn ≥ 10%، الجودة العادلة: mcpl ≥ 90% أو mctn ≥ 10%.تم بعد ذلك ربط الجينومات المصفاة بدرجات الجودة (Q وQ') على النحو التالي: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (تقلب السلالة)/100 + 0.5 x log[N50] .(تم تنفيذه في dRep61).
للسماح بالتحليل المقارن بين مصادر البيانات المختلفة وأنواع الجينوم (MAG وSAG وREF)، تمت إلغاء الإشارة إلى 34,799 جينومًا بناءً على هوية النوكليوتيدات المتوسطة على مستوى الجينوم (ANI) باستخدام dRep (الإصدار 2.5.4).يكرر) 61 مع عتبات ANI بنسبة 95٪ (-comp 0 -con 1000 -sa 0.95 -nc 0.2) وجينات علامة أحادية النسخة باستخدام SpecI63 توفر تجميع الجينوم على مستوى الأنواع.تم اختيار جينوم تمثيلي لكل مجموعة dRep وفقًا لدرجة الجودة القصوى (Q') المحددة أعلاه، والتي تعتبر ممثلة للأنواع.
لتقييم سرعة رسم الخرائط، تم استخدام BWA (v.0.7.17-r1188، -a) لرسم خريطة لجميع مجموعات القراءات الميتاجينومية البالغ عددها 1038 مجموعة مع 34799 جينومًا موجودة في OMD.تم تعيين القراءات التي يتم التحكم فيها بالجودة في الوضع أحادي النهاية وتمت تصفية المحاذاة الناتجة للاحتفاظ فقط بالمحاذاة التي يبلغ طولها ≥45 نقطة أساس.والهوية ≥95%.نسبة العرض لكل عينة هي النسبة المئوية للقراءات المتبقية بعد الترشيح مقسومة على إجمالي عدد قراءات مراقبة الجودة.باستخدام نفس النهج، تم تخفيض كل من الميتاجينومات البالغ عددها 1038 إلى 5 ملايين مُدخل (بيانات موسعة، الشكل 1 ج) ومطابقتها لـ GORG SAG في OMD وفي جميع GEM16.تم تحديد كمية MAGs المستردة من مياه البحر في كتالوج GEM16 من خلال استعلامات الكلمات الرئيسية للمصادر الميتاجينومية، واختيار عينات مياه البحر (على سبيل المثال، بدلاً من الرواسب البحرية).على وجه التحديد، نختار "مائي" كـ "فئة_النظام البيئي"، و"بحري" كـ "نوع_النظام البيئي"، وتصفية "الموئل" كـ "محيط عميق"، و"بحري"، و"محيطي بحري"، و"بحري بحري"، و"مياه بحرية"، "المحيطات"، "مياه البحر"، "مياه البحر السطحية"، "مياه البحر السطحية".نتج عن ذلك 5903 MAGs (734 جودة عالية) موزعة على 1823 وحدة OTU (المشاهدة هنا).
تم شرح الجينومات بدائية النواة تصنيفيًا باستخدام GTDB-Tk (v.1.0.2)64 مع المعلمات الافتراضية التي تستهدف الإصدار 13 من GTDB r89. تم استخدام Anvi'o لتحديد الجينومات حقيقية النواة بناءً على تنبؤ المجال واستدعاء ≥50% والتكرار ≥ 10%.يتم تعريف الشرح التصنيفي للأنواع على أنها أحد الجينومات الممثلة لها.باستثناء حقيقيات النوى (148 MAG)، تم شرح كل جينوم وظيفيًا لأول مرة باستخدام prokka (الإصدار 1.14.5)65، وتسمية الجينات الكاملة، وتحديد معلمات "العتيقة" أو "البكتيريا" حسب الحاجة، والتي تم الإبلاغ عنها أيضًا لغير الكائنات الحية. جينات الترميز.ومناطق كريسبر، من بين السمات الجينومية الأخرى.قم بتعليق الجينات المتوقعة عن طريق تحديد الجينات العالمية ذات النسخة الواحدة (uscMG) باستخدام fetchMG (v.1.2)66، وتعيين مجموعات تقويم العظام والاستعلام باستخدام emapper (v.2.0.1)67 استنادًا إلى eggNOG (v.5.0)68.قاعدة بيانات KEGG (منشورة في 10 فبراير 2020) 69. تم تنفيذ الخطوة الأخيرة عن طريق مطابقة البروتينات مع قاعدة بيانات KEGG باستخدام DIAMOND (الإصدار 0.9.30)70 مع تغطية استعلام وموضوع تبلغ ≥70%.تمت تصفية النتائج أيضًا وفقًا لـ NCBI Prokaryotic Genome Annotation Pipeline71 بناءً على معدل البت ≥ 50٪ من الحد الأقصى لمعدل البت المتوقع (الرابط نفسه).تم استخدام تسلسل الجينات أيضًا كمدخل لتحديد BGCs في الجينوم باستخدام antiSMASH (الإصدار 5.1.0)72 مع المعلمات الافتراضية والانفجارات العنقودية المختلفة.تم تجميع جميع الجينومات والشروح في OMD جنبًا إلى جنب مع البيانات التعريفية السياقية المتاحة على الويب (https://microbiomics.io/ocean/).
على غرار الطرق الموصوفة سابقًا، استخدمنا CD-HIT (الإصدار 4.8.1) لتجميع أكثر من 56.6 مليون جينًا لترميز البروتين من الجينومات البكتيرية والعتيقة من OMD إلى هوية 95٪ وجينات أقصر (تغطية 90٪) 73 حتى > 17.7 مليون مجموعة جينية.تم اختيار أطول تسلسل باعتباره الجين التمثيلي لكل مجموعة جينية.تمت بعد ذلك مطابقة 1038 ميتاجينومًا مع أكثر من 17.7 مليون عضو في مجموعة BWA (-a) وتمت تصفية ملفات BAM الناتجة للاحتفاظ فقط بالمحاذاة مع هوية بنسبة ≥95% ومحاذاة أساسية ≥45.تم حساب وفرة الجينات ذات الطول الطبيعي عن طريق حساب الإدخالات من أفضل محاذاة فريدة أولاً، ثم بالنسبة للإدراجات المعينة بشكل غامض، إضافة أعداد كسرية إلى الجينات المستهدفة المقابلة بما يتناسب مع عدد الإدخالات الفريدة الخاصة بها.
تمت إضافة الجينومات من OMD الموسعة (مع MAGs إضافية من "Ca. Eudormicrobiaceae"، انظر أدناه) إلى قاعدة بيانات أداة تحليل الميتاجينوم mOTUs74 (الإصدار 2.5.1) لإنشاء قاعدة بيانات مرجعية موسعة لـ mOTU.نجت ستة جينومات أحادية النسخة فقط (23528 جينومًا) من أصل عشرة مجموعات جينومية أمريكية.أدى توسيع قاعدة البيانات إلى 4494 مجموعة إضافية على مستوى الأنواع.تم تحليل 1038 ميتاجينومًا باستخدام معلمات mOTU الافتراضية (الإصدار 2).لم يتم اكتشاف ما مجموعه 989 جينومًا موجودًا في 644 مجموعة mOTU (95٪ REF و 5٪ SAG و 99.9٪ تنتمي إلى MarDB) بواسطة ملف تعريف mOTU.ويعكس هذا مصادر إضافية مختلفة للعزلة البحرية لجينومات MarDB (ترتبط معظم الجينومات غير المكتشفة بالكائنات الحية المعزولة من الرواسب، والمضيفين البحريين، وما إلى ذلك).لمواصلة التركيز على بيئة المحيطات المفتوحة في هذه الدراسة، استبعدناهم من التحليل النهائي ما لم يتم اكتشافهم أو إدراجهم في قاعدة بيانات mOTU الموسعة التي تم إنشاؤها في هذه الدراسة.
تم دمج جميع BGCs من MAG وSAG وREF في OMD (انظر أعلاه) مع BGCs المحددة في جميع السقالات الميتاجينومية (antiSMASH v.5.0، المعلمات الافتراضية) وتتميز باستخدام BiG-SLICE (v.1.1) (مجال PFAM)75.بناءً على هذه الميزات، قمنا بحساب جميع مسافات جيب التمام بين BGCs وقمنا بتجميعها (الروابط المتوسطة) في GCF وGC باستخدام عتبات المسافة البالغة 0.2 و0.8 على التوالي.هذه العتبات عبارة عن تعديل للعتبات المستخدمة مسبقًا باستخدام المسافة الإقليدية 75 مع مسافة جيب التمام، مما يخفف بعض الخطأ في استراتيجية التجميع الأصلية BiG-SLICE (معلومات تكميلية).
تمت بعد ذلك تصفية BGCs للاحتفاظ فقط بـ ≥5 كيلو بايت المشفرة على السقالات لتقليل خطر التفتت كما هو موضح سابقًا ولاستبعاد MarDB REFs وSAGs غير الموجودة في 1038 ميتاجينوم (انظر أعلاه).أدى ذلك إلى ترميز إجمالي 39,055 BGCs بواسطة جينوم OMD، مع تحديد 14,106 إضافية على الأجزاء الميتاجينومية (أي لم يتم دمجها في MAGs).تم استخدام BGCs "الميتاجينومية" لتقدير نسبة إمكانات التخليق الحيوي للميكروبيوم البحري التي لم يتم تسجيلها في قاعدة البيانات (معلومات تكميلية).تم تمييز كل BGC وظيفيًا وفقًا لأنواع المنتجات التنبؤية المحددة بواسطة فئات المنتجات المضادة لـ SMASH أو المنتجات الخشنة المحددة في BiG-SCAPE76.لمنع تحيز أخذ العينات في القياس الكمي (التكوين التصنيفي والوظيفي لـGC/GCF، ومسافة GCF وGCF إلى قواعد البيانات المرجعية، والوفرة الميتاجينومية لـ GCF)، من خلال الاحتفاظ فقط بأطول BGC لكل GCF لكل نوع، تمت إزالة تكرار 39,055 BGCs بشكل أكبر، مما أدى إلى إجمالي 17,689 BGC.
تم تقييم حداثة دول مجلس التعاون الخليجي وGCF بناءً على المسافة بين قاعدة البيانات المحسوبة (قاعدة بيانات RefSeq في BiG-FAM)29 وBGC التي تم التحقق منها تجريبيًا (MIBIG 2.0).بالنسبة لكل من 17689 BGCs التمثيلية، اخترنا أصغر مسافة جيب التمام لقاعدة البيانات المعنية.يتم بعد ذلك حساب متوسط ​​هذه المسافات الدنيا وفقًا لـ GCF أوGC، حسب الاقتضاء.يعتبر إطار التعاون العالمي جديدًا إذا كانت المسافة إلى قاعدة البيانات أكبر من 0.2، وهو ما يتوافق مع الفصل المثالي بين إطار التعاون العالمي (المتوسط) والمرجع.بالنسبة إلى دول مجلس التعاون الخليجي، نختار 0.4، وهو ضعف الحد المحدد بواسطة GCF، لتأمين علاقة طويلة الأمد مع الروابط.
تم تقدير الوفرة الميتاجينومية لـ BGC على أنها متوسط ​​وفرة جيناتها الاصطناعية الحيوية (كما هو محدد بواسطة مضاد SMASH) المتوفرة من الملفات الشخصية على مستوى الجينات.تم بعد ذلك حساب الوفرة الميتاجينومية لكل GCF أو مجلس التعاون الخليجي كمجموع BGCs التمثيلية (من 17689).تم بعد ذلك تطبيع خرائط الوفرة هذه للتكوين الخلوي باستخدام عدد mOTU لكل عينة، والذي يمثل أيضًا جهود التسلسل (البيانات الموسعة، الشكل 1 د).تم حساب معدل انتشار GCF أوGC كنسبة مئوية من العينات ذات الوفرة> 0.
تم حساب المسافة الإقليدية بين العينات من ملف تعريف GCF الطبيعي.تم تقليل حجم هذه المسافات باستخدام UMAP77 وتم استخدام التضمينات الناتجة للتجميع غير الخاضع للرقابة على أساس الكثافة باستخدام HDBSCAN78.يتم تحديد الحد الأدنى الأمثل لعدد النقاط للمجموعة (وبالتالي عدد المجموعات) التي تستخدمها HDBSCAN من خلال زيادة الاحتمال التراكمي لعضوية المجموعة.تم اختبار المجموعات المحددة (وعينة فرعية عشوائية متوازنة من هذه المجموعات لحساب التحيز في تحليل التباين متعدد المتغيرات التبادلي (PERMANOVA)) للتأكد من أهميتها مقابل المسافات الإقليدية غير المخفضة باستخدام PERMANOVA.تم حساب متوسط ​​حجم الجينوم للعينات بناءً على الوفرة النسبية لـ mOTU وحجم الجينوم المقدر لأعضاء الجينوم.على وجه الخصوص، تم تقدير متوسط ​​حجم الجينوم لكل وحدة mOTU كمتوسط ​​أحجام الجينوم لأعضائها الذين تم تصحيحهم للتأكد من اكتمالهم (بعد التصفية) (على سبيل المثال، الجينوم الكامل بنسبة 75٪ بطول 3 ميجابايت له حجم معدل قدره 4 ميغابايت).للجينومات المتوسطة مع سلامة ≥70%.ثم تم حساب متوسط ​​حجم الجينوم لكل عينة كمجموع أحجام الجينوم mOTU الموزونة بالوفرة النسبية.
يتم عرض مجموعة مرشحة من BGCs المشفرة بالجينوم في OMD في أشجار GTDB البكتيرية والأثرية (في أطر ≥5 كيلو بايت، باستثناء REF وSAG MarDB غير الموجودة في 1038 ميتاجينوم، انظر أعلاه) وفئات منتجاتها المتوقعة بناءً على النشوء والتطور. موضع الجينوم (انظر أعلاه).قمنا أولاً بتخفيض البيانات حسب الأنواع، باستخدام الجينوم الذي يحتوي على أكبر عدد من BGCs في تلك الأنواع كممثل.من أجل التصور، تم تقسيم الممثلين إلى مجموعات شجرية، ومرة ​​أخرى، لكل فرع خلوي، تم اختيار الجينوم الذي يحتوي على أكبر عدد من BGCs كممثل.تم تحليل الأنواع الغنية بـ BGC (جينوم واحد على الأقل يحتوي على> 15 BGCs) بشكل أكبر من خلال حساب مؤشر شانون للتنوع لأنواع المنتجات المشفرة في تلك BGCs.إذا كانت جميع أنواع المنتجات المتوقعة متماثلة، فإن الهجينة الكيميائية وغيرها من BGCs المعقدة (كما تنبأ مضاد SMAH) تعتبر تنتمي إلى نفس نوع المنتج، بغض النظر عن ترتيبها في المجموعة (على سبيل المثال، اندماج البروتين مع البكتريوسين والباكتيريوسين والبروتين البروتيني). جسم).هجين).
الحمض النووي المتبقي (يقدر بـ 6 نانوغرام) من عينة Malaspina MP1648، المقابلة للعينة البيولوجية SAMN05421555 والمتطابقة مع مجموعة القراءة الميتاجينومية Illumina SRR3962772 للقراءة القصيرة، ومعالجتها وفقًا لبروتوكول تسلسل PacBio مع مدخلات منخفضة للغاية لاستخدام تضخيم عينة PacBio SMRTbell gDNA طقم (100-980-000) ومجموعة إعداد قالب SMRTbell Express 2.0 (100-938-900).باختصار، تم قطع الحمض النووي المتبقي وإصلاحه وتنقيته (خرز ProNex) باستخدام Covaris (g-TUBE، 52104).يتم بعد ذلك إخضاع الحمض النووي المنقى لإعداد المكتبة، والتضخيم، والتنقية (خرز ProNex) واختيار الحجم (> 6 كيلو بايت، Blue Pippin) قبل خطوة التنقية النهائية (خرز ProNex) والتسلسل على منصة Sequel II.
إعادة بناء أول اثنين كاليفورنيا.بالنسبة لـ MAG Eremiobacterota، حددنا ستة ANIs إضافية > 99% (يتم تضمينها في الشكل 3)، والتي تمت تصفيتها في البداية بناءً على درجات التلوث (تم تحديدها لاحقًا على أنها تكرارات الجينات، انظر أدناه).وجدنا أيضًا صينية تحمل اسم "Ca".Eremiobacterota" من دراسات مختلفة واستخدمتها مع ثمانية MAGs من دراستنا كمرجع لقراءات الميتاجينوم من 633 عينة حقيقية النواة (> 0.8 ميكرومتر) باستخدام BWA (الإصدار 0.7.17) المرجع -r1188، - علامة) للاختزال رسم الخرائط (5 مليون قراءة).استنادًا إلى الخرائط الخاصة بالتخصيب (التي تمت تصفيتها بواسطة هوية المحاذاة بنسبة 95٪ وتغطية القراءة بنسبة 80٪)، تم اختيار 10 ميتاجينومات (التغطية المتوقعة ≥5 ×) للتجميع و49 ميتاجينومًا إضافيًا (التغطية المتوقعة ≥1 ×) لارتباط المحتوى.باستخدام نفس المعلمات المذكورة أعلاه، تم التخلص من هذه العينات وإضافة 10 Ca's إضافية.تمت استعادة MAG Eremiobacterota.هذه المجموعات الستة عشر (دون احتساب الاثنين الموجودين بالفعل في قاعدة البيانات) ترفع إجمالي عدد الجينومات في OMD الموسع إلى 34,815.يتم تعيين الرتب التصنيفية لـ MAGs بناءً على تشابهها الجينومي وموقعها في GTDB.تم إلغاء تكرار 18 MAGs باستخدام dRep في 5 أنواع (ANI داخل النوع> 99٪) و3 أجناس (ANI داخل الأجيال 85٪ إلى 94٪) داخل نفس العائلة .تم اختيار ممثلي الأنواع يدويًا على أساس النزاهة والتلوث وN50.يتم توفير التسميات المقترحة في المعلومات التكميلية.
تقييم سلامة وتلوث 'Ca.MAG Eremiobacterota، قمنا بتقييم وجود uscMG، بالإضافة إلى مجموعات الجينات ذات النسخة الواحدة الخاصة بالنسب والمجال والتي يستخدمها CheckM وAnvi'o.تم تأكيد تحديد نسختين من أصل 40 uscMGs من خلال إعادة بناء النشوء والتطور (انظر أدناه) لاستبعاد أي تلوث محتمل (وهذا يتوافق مع 5٪ بناءً على هذه الجينات الأربعين).دراسة إضافية لخمسة مجموعات MAGs تمثيلية 'Ca.تم تأكيد انخفاض مستوى الملوثات في هذه الجينومات المعاد بناؤها بالنسبة لأنواع Eremiobacterota باستخدام واجهة Anvi'o التفاعلية القائمة على الارتباطات المتعلقة بالوفرة والتسلسل (معلومات تكميلية) .
لتحليل النشوء والتطور، اخترنا خمسة MAGs تمثيلية "Ca".Eudormicrobiaceae"، جميع الأنواع "Ca.جينوم Eremiobacterota وأعضاء من الشعب الأخرى (بما في ذلك UBP13 و Armatimonadota و Patescibacteria و Dormibacterota و Chloroflexota و Cyanobacteria و Actinobacteria و Planctomycetota) متاح من GTDB (r89) 13.تم شرح كل هذه الجينومات كما هو موضح سابقًا لاستخراج جينات علامة النسخة الواحدة وتعليق BGC.تم الحفاظ على جينومات GTDB وفقًا لمعايير السلامة والتلوث المذكورة أعلاه.تم إجراء تحليل التطور الوراثي باستخدام سير عمل Anvi'o Phylogenetics59.تم إنشاء الشجرة باستخدام IQTREE (v.2.0.3) (الخيارات الافتراضية و-bb 1000)80 على محاذاة 39 بروتينًا ريبوسوميًا ترادفيًا تم تحديدها بواسطة Anvi'o (MUSCLE، v.3.8.1551)81.تم تخفيض مواقفه.لتغطية ما لا يقل عن 50٪ من الجينوم وتم استخدام Planctomycecota كمجموعة خارجية تعتمد على طوبولوجيا شجرة GTDB.تم إنشاء شجرة واحدة مكونة من 40 uscMGs باستخدام نفس الأدوات والمعلمات.
استخدمنا Traitar (الإصدار 1.1.2) مع المعلمات الافتراضية (النمط الظاهري، من النيوكليوتيدات)83 للتنبؤ بالصفات الميكروبية الشائعة.لقد استكشفنا نمط حياة مفترسًا محتملاً استنادًا إلى مؤشر مفترس تم تطويره مسبقًا والذي يعتمد على محتوى جين ترميز البروتين في الجينوم.على وجه التحديد، نستخدم DIAMOND لمقارنة البروتينات في الجينوم بقاعدة بيانات OrthoMCL (الإصدار 4) 85 باستخدام الخيارات -أكثر حساسية -id 25 -query-cover 70 -subject-cover 70 -top 20 ونحسب الجينات المقابلة لـ الجينات المميزة للحيوانات المفترسة وغير المفترسة.المؤشر هو الفرق بين عدد العلامات المفترسة وغير المفترسة.كعنصر تحكم إضافي، قمنا أيضًا بتحليل الجينوم "Ca".يعتمد عامل Entotheonella TSY118 على ارتباطه بـ Ca.Eudoremicrobium (حجم الجينوم الكبير وإمكانات التخليق الحيوي).بعد ذلك، قمنا باختبار الروابط المحتملة بين جينات العلامة المفترسة وغير المفترسة وإمكانات التخليق الحيوي لـ Ca.Eudormicrobiaceae" ووجدت أنه لا يوجد أكثر من جين واحد (من أي نوع من الجينات الواسمة، أي الجين المفترس/غير المفترس) يتداخل مع BGC، مما يشير إلى أن BGC لا يخلط بين إشارات الافتراس.تم إجراء شرح جينومي إضافي للنسخ المتماثلة المخفوقة باستخدام TXSSCAN (الإصدار 1.0.2) لفحص نظام الإفراز، والأشعار، والسوط على وجه التحديد.
تم تعيين خمسة ممثلين لـ Ca من خلال تعيين 623 metatranscriptomes من أجزاء التخصيب بدائية النواة وحقيقية النواة في محيطات تارا (باستخدام BWA، v.0.7.17-r1188، -a flag).جينوم الميكروبيات اليودورمية.تمت معالجة ملفات BAM باستخدام FeaturesCounts (v.2.0.1)88 بعد تغطية قراءة بنسبة 80% وتصفية هوية بنسبة 95% (مع خيارات featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ) بحساب عدد الإدخالات لكل جين.تم تطبيع الخرائط التي تم إنشاؤها لطول الجينات ووفرة الجينات mOTU (متوسط ​​عدد الإدراج المقيس للطول للجينات ذات عدد الإدراج> 0) وتم تحويل السجل إلى 22.74 للحصول على التعبير النسبي لكل خلية من كل مستوى جين، وهو ما يفسر أيضًا التباين من عينة إلى عينة أثناء التسلسل.تسمح هذه النسب بإجراء تحليل مقارن، وتخفيف مشاكل التكوين عند استخدام بيانات الوفرة النسبية.تم أخذ العينات التي تحتوي على> 5 من 10 جينات علامة mOTU في الاعتبار فقط لإجراء مزيد من التحليل للسماح باكتشاف جزء كبير بما يكفي من الجينوم.
ملف تعريف النسخ الطبيعي لـ 'Ca.تعرض E. Taraoceanii لتقليل الأبعاد باستخدام UMAP وتم استخدام التمثيل الناتج للتجميع غير الخاضع للرقابة باستخدام HDBSCAN (انظر أعلاه) لتحديد حالة التعبير.تختبر PERMANOVA أهمية الاختلافات بين المجموعات المحددة في مساحة المسافة الأصلية (غير المخفضة).تم اختبار التعبير التفاضلي بين هذه الحالات عبر الجينوم (انظر أعلاه) وتم تحديد 201 مسارًا لـ KEGG في 6 مجموعات وظيفية، وهي: BGC، ونظام الإفراز والجينات السوطية من TXSSCAN، وإنزيمات التحلل (البروتياز والببتيداز)، والمفترسة وغير المفترسة. الجينات المفترسة.علامات الفهرس المفترسة.بالنسبة لكل عينة، قمنا بحساب متوسط ​​التعبير المقيس لكل فئة (لاحظ أن تعبير BGC نفسه يتم حسابه على أنه التعبير المتوسط ​​للجينات الاصطناعية الحيوية لذلك BGC) وتم اختباره للتأكد من أهميته عبر الولايات (تم تعديل اختبار Kruskal-Wallis من أجل FDR).
تم شراء الجينات الاصطناعية من GenScript وتم شراء بادئات PCR من Microsynth.تم استخدام بوليميريز Phusion من Thermo Fisher Scientific لتضخيم الحمض النووي.تم استخدام بلازميدات NucleoSpin وهلام NucleoSpin ومجموعة تنقية PCR من Macherey-Nagel لتنقية الحمض النووي.تم شراء إنزيمات التقييد و T4 DNA ligase من New England Biolabs.تم شراء مواد كيميائية أخرى غير الأيزوبروبيل-β-د-1-ثيوغالاكتوبرانوسيد (IPTG) (Biosynth) و1،4-ديثيوثريتول (DTT، AppliChem) من Sigma-Aldrich واستخدامها دون مزيد من التنقية.تم شراء المضادات الحيوية الكلورامفينيكول (Cm)، والسبيكتينومايسين ثنائي هيدروكلوريد (Sm)، والأمبيسيلين (Amp)، والجنتاميسين (Gt)، والكاربنيسيلين (Cbn) من AppliChem.تم شراء مكونات وسائط Bacto Tryptone وBacto Yeast Extract من BD Biosciences.تم شراء التربسين للتسلسل من شركة Promega.
تم استخراج تسلسل الجينات من BGC 75.1 المتوقع لـ SMASH.E. malaspinii (معلومات تكميلية).
تم تسلسل الجينات embA (locus، MALA_SAMN05422137_METAG-framework_127-gene_5)، embM (locus، MALA_SAMN05422137_METAG-framework_127-gene_4)، و embAM (بما في ذلك مناطق intergene) كبنيات اصطناعية في pUC57 (AmpR) مع وبدون أكواد محسنة للتعبير في E متى.تم استنساخ جين embA في أول موقع استنساخ متعدد (MCS1) لـ pACYCDuet-1 (CmR) وpCDFDuet-1 (SmR) مع مواقع انقسام BamHI وHindIII.تم استنساخ جينات embM وembMopt (المُحسّنة للكودون) في MCS1 pCDFDuet-1(SmR) مع BamHI وHindIII ووضعها في موقع الاستنساخ المتعدد الثاني لـ pCDFDuet-1(SmR) وpRSFDuet-1(KanR) (MCS2) مع تجربة الاقتراب من الموت/تشوي.تم استنساخ شريط embAM إلى pCDFDuet1 (SmR) مع مواقع انقسام BamHI وHindIII.تم إنشاء جين orf3 / embI (الموضع، MALA_SAMN05422137_METAG-scaffold_127-gene_3) عن طريق تمديد التداخل PCR باستخدام الاشعال EmbI_OE_F_NdeI و EmbI_OE_R_XhoI، وتم هضمهما باستخدام NdeI / XhoI، وربطهما في pCDFDuet-1-EmbM (MCS1) باستخدام نفس إنزيمات التقييد (تكميلي) طاولة).6).تم إجراء عملية الهضم والربط لإنزيم التقييد وفقًا لبروتوكول الشركة المصنعة (New England Biolabs).

 


وقت النشر: 14 مارس 2023