Nature Communications 14권, 기사 번호: 2676(2023) 이 기사 인용
1390 액세스
4 알트메트릭
측정항목 세부정보
건축 환경(BE)의 바이러스는 공중 보건 문제를 야기하지만 일반적으로 박테리아보다 덜 연구되었습니다. BE의 바이러스 역학을 더 잘 이해하기 위해 이 연구는 점유율이 낮거나 높은 4가지 유형의 BE에 걸쳐 11개 서식지의 바이롬을 평가합니다. 바이롬의 다양성, 구성, 대사 기능 및 생활 방식은 서식지에 따라 달라지는 것으로 밝혀졌습니다. Caudoviricetes 종은 BE의 표면 서식지 어디에나 존재하며, 그 중 일부는 다른 환경에 존재하는 종과 다릅니다. 항균제 내성 유전자는 거주자가 자주 접촉하는 표면에 서식하는 바이러스와 거주자의 피부에 서식하는 바이러스에서 확인됩니다. 다양한 CRISPR/Cas 면역 시스템과 항-CRISPR 단백질은 각각 박테리아 숙주와 바이러스에서 발견되며, 이는 강력하게 결합된 바이러스-숙주 연결과 일치합니다. 특정 서식지 방식으로 숙주 적응을 잠재적으로 돕는 바이러스의 증거는 독특한 유전자 삽입을 통해 식별됩니다. 이 연구는 바이러스-숙주 상호 작용이 BE에서 자주 발생하고 바이러스가 BE 미생물 군집의 필수 구성원임을 보여줍니다.
바이러스는 인간의 건강에 잠재적으로 해로운 영향을 미칠 수 있지만1 많은 생태계에서 중요한 역할을 하기 때문에 우리의 관심이 필요합니다2,3,4. 사람들이 일반적으로 대부분의 삶을 보내는 건축 환경(BE)에는 다양한 미생물이 서식하고 있지만5, BE에 대한 대부분의 연구는 바이러스를 간과하면서 박테리아와 곰팡이에 주로 초점을 맞춰 왔습니다6,7. BE에 포함된 바이러스의 총 농도는 입방미터당 ~105개의 입자로 추정됩니다8. 대부분의 BE의 환경 조건은 빈 영양 상태이고 미생물 생활에 적합하지 않은 것으로 간주되지만9 전염병 관련 바이러스(예: SARS-CoV-210 및 황열병 바이러스11)를 포함한 눈에 띄는 다양한 바이러스가 공기 중 미생물 군집에서 발견되었습니다. 그리고 BE의 표면에도 있습니다. 공공 건물(예: 어린이집 및 화장실)의 바이롬에 대한 몇 가지 연구는 주로 작은 공간 규모와 제한된 샘플 유형에 초점을 맞추었으며 바이러스의 박테리아 숙주를 조사하지 않았습니다12,13,14. 바이러스 농축 없이 대량 메타게놈 시퀀싱을 적용한 최근 세계적 규모의 연구는 바이러스가 BEs15의 공공 표면에 어디에나 존재한다는 증거를 제공했습니다.
바이러스-숙주 상호작용은 다양한 생태계에서 미생물군집의 생태계와 진화의 핵심입니다4,16,17. 생물정보학 도구의 최근 발전으로 인해 분자 신호(즉, 규칙적으로 간격을 두고 배치된 짧은 회문 반복(CRISPR) 스페이서, 통합 게놈 및 tRNA가 클러스터링됨)의 정확한 일치와 일관된 일치를 포함하여 메타게놈 유래 바이러스와 잠재적 박테리아 숙주 사이의 연관성을 정확하게 예측할 수 있게 되었습니다. k-mer 주파수18. 파지는 번식을 위해 숙주의 세포 기계를 활용하기 위해 온대 용해성 수명주기 전환, 형질 도입 및 숙주 유전자 파괴와 같은 다양한 생활 방식 및 전달 전략을 발전시켜 왔습니다. 대부분의 해양 및 토양 환경에서 파지는 매우 다양하고 풍부하여 일상적으로 미생물 숙주의 상당 부분을 감염시킵니다. 이는 숙주 게놈에서 바이러스로 암호화된 보조 대사 유전자(AMG)의 발현과 함께 중요한 역할을 합니다. 글로벌 영양 순환4,20,21. 생태학적 관점에서 볼 때, 미생물 군집의 파지는 "승자 죽이기" 및 "승자 피기백" 모델을 포함하여 잘 확립된 여러 생태학적 모델을 통해 용균성 감염을 확립함으로써 박테리아 종 간의 경쟁을 중재할 수 있습니다.
파지는 박테리아의 급속한 유전적 및 표현형 변화를 유도할 수 있지만, 박테리아 숙주는 새로운 돌연변이 및 기타 분자 메커니즘을 통해 파지 공격에 대응하기 위한 방어 메커니즘을 쉽게 진화시킬 수도 있습니다23. 최근 박테리아의 다양한 기능적 CRISPR/CRISPR 관련(Cas) 시스템이 신체 전체의 인간 메타게놈 연구에서 확인되었습니다. 그러나 숙주 면역 체계에 길항하기 위해 파지는 감염 중에 박테리아 Cas 뉴클레아제를 비활성화하기 위해 항-CRISPR(Acr) 단백질을 진화시켰습니다25. 억제제 파지에 의한 CRISPR/Cas의 장기간 불활성화는 일부 박테리아 계통에서 CRISPR/Cas의 손실 및 부재로 이어질 수 있습니다26.
1 kb, as determined by Virsorter2 (Vs2) and DeepVirFinder (DVF) and assessed by CheckV. The number of contigs (n) is indicated. Boxplots represent the median, the first quartiles and third quartiles with whiskers drawn within the 1.5 interquartile range value. Points outside the whiskers are outliers. b Accumulation curves of the viral genomes in the combined, pier, public facility, residence, and subway datasets. c Metadata and taxonomy of 1174 viral genomes with >50% completeness. d Principal coordinate analysis of the Bray–Curtis dissimilarity matrix for all of the samples. The color and shape of the symbols indicate the built environments and surface materials, respectively./p> 0.85 (Fig. S2d), suggesting that no habitat had dominant vOTUs./p>50 genes mostly encoded proteins with functions in membrane transport (i.e., ABC transporter) and direct/indirect transcriptional regulation to control gene expression, genome replication, and transmission to other host cells (i.e., response regulator) (Fig. 3e). Other common viral functions, such as packaging, assembly, and lysis, were also found in the largest clusters (Fig. 3e)./p>50 genes. The protein-coding gene cluster that encodes beta-lactamase is highlighted in red. f The number of viral genes with putative beta-lactamase domains based on the Pfam and Kyoto Encyclopedia of Genes and Genomes (KEGG) databases. g The number of antimicrobial resistance genes (ARGs) encoding beta-lactamases based on the Resistance Gene Identifier (RGI) and Resfams databases. The Venn diagram summarizes the number of identified ARGs in the two databases, and the bar plot indicates the distribution of ARGs across BE habitats./p> 80) based on the AlphaFold2 tool. d Comparison of the high-confidence structures (plDDT > 80) of the four novel predicted Acr proteins with their closest reference./p> 80]) (Fig. S9). Comparison of the high-confidence structures of the four novel predicted Acr proteins with their closest references revealed differences, which may be responsible for the variations in their functions (Fig. 5d). Several predicted Acr proteins were located in complete circular vOTUs (with lysogenic and lytic cycles) of unknown families (Fig. S10a-b), suggesting that these proteins play roles in the evolution of poorly characterized Caudoviricetes viruses. Some Acr proteins were located between the integrase and terminase subunits in viruses with lysogenic cycles (Fig. S10a), while others were close to the terminase subunits in viruses that make lytic cycles (Fig. S10b), indicating that the Acr-encoding genes are expressed not only upon initial entry and during lysogeny but also upon transition to the lytic cycle to prevent the cleavage of progeny phage genomes by CRISPR/Cas systems, as previously demonstrated in Listeria phages50. Additionally, a set of lytic genes, including those encoding endolysins, the Rz lysis protein, holin, and holin–antiholin, were carried by specific complete circular vOTUs with lysogenic cycles (Fig. S10a). Conversely, one complete circular vOTU (SL336690_c_82__full) that makes lytic cycles still harbored an integrase (Fig. S10b), suggesting that this virus undergoes a transition from a lysogenic to a lytic cycle if the environmental condition changes51./p>90% completeness), and medium-quality (50–90% completeness) genomes were retained30 (Supplementary Data 2). For genomes that contained predicted proviruses, only the proviral regions were retained. PHASTER) (https://phaster.ca/)80 and VIBRANT (v.1.2.1)81 were separately applied to identify proviral sequences according to the following two criteria, as previously proposed21: (i) the viral contigs were from contigs with non-viral (host) flanking sequences or (ii) the viral contigs harbored lysogenic marker proteins (i.e., integrase and serine recombinase). In total, 332 unique proviruses were identified using the two aforementioned tools and CheckV, and only those (127) that were integrated into a bacterial genome had high confidence (the prophage region's total score was >90 in PHASTER) and were included in the downstream analysis./p>50% completeness were clustered into species-level vOTUs on the basis of 95% average nucleotide identity (ANI) of >85% alignment fraction relative to the shorter sequence based on centroid-based clustering30. Genus- and family-level vOTUs were generated using a combination of gene sharing and amino acid identity (AAI) based on Markov clustering82 as described previously30. Briefly, viral genomes with <20% AAI or <10% gene sharing and an inflation factor of 1.2 were clustered into family-level vOTUs, while those with <50% AAI or <20% gene sharing and an inflation factor of 2.0 were clustered into genus-level vOTUs./p>70% of the annotated proteins. At the family and genus ranks, a genome must have a minimum of two annotated proteins with >30% average AAI or three annotated proteins with >40% average AAI, respectively, aligned to a reference genome from the IMG/VR database30./p>5% amino acid representation in the total alignment length were retained. A concatenated protein phylogenetic tree was inferred from the multiple sequence alignment using FastTreeMP (v.2.1.11) with the auto model87. The tree was midpoint-rooted and visualized using iToL (v.6; https://itol.embl.de/)./p>60% to the reference sequences in the CARD database (v.3.0.9)90, and using the NCBI AMRFinderPlus (v.3.8.4) tool41, with the default options of 60% coverage and 80% identity, to the reference sequences in the Resfams database (v.1.2)40. The search was performed using the hmmsearch utility in the HMMER tool (v.3.1b2), with an E-value ≤ 1e−5 and a gathering threshold score ≥40. The Resfams annotation with the best score was adopted when an ARG received different annotations from the databases./p>1000 bp were binned into MAGs using MetaWRAP (v.1.2.1)78. The resulting MAGs were further refined using the "bin_refinement" function of MetaWRAP78 and dereplicated using the "dRep dereplicate" function of dRep (v.3.2.2)97. In total, 860 bacterial rMAGs with contamination ≤10% and completeness ≥50% were generated. The ORFs in the contigs of rMAGs were predicted using Prokka (v.1.14.6)98, and the functions were annotated using EggNOG-mapper (v.2.0.1)99./p>