VIRE:世界最大規模のウイルスデータ基盤―約170万ゲノムを網羅
発表日:2025.12.02
東京大学大学院新領域創成科学研究科 附属生命データサイエンスセンターの西嶋特任准教授と欧州分子生物学研究所(EMBL)のPeer Bork博士らの研究グループは、世界中の公共メタゲノム10万件超を解析し、約170万のウイルスゲノムを収集・統合した「VIRE(Viral Integrated Resource across Ecosystems)」データベースを構築した。本データベースは、ヒト腸内から海洋、土壌、極限環境まで多様な生息地に由来するウイルス情報を網羅し、既存のウイルスデータベースを大きく上回る規模と網羅性を実現している(掲載誌:Nucleic Acids Research)。
ヒト腸内や海洋・土壌などに生息するウイルスは、微生物群集との相互作用を通じて生態系機能を制御する重要な存在である。しかし、バクテリオファージは培養が難しく、その多様性や生態的役割は長らく未解明であり、ウイルスの分類や宿主、遺伝子機能を地球規模で把握することは極めて困難であった。そこで本研究では、最新のウイルス検出技術を用いてメタゲノムデータからウイルスゲノムを高精度に抽出し、分類情報、宿主推定、遺伝子機能解析データを統合した。特筆すべきは、CRISPRスペーサー配列(細菌がウイルス感染履歴として保持するDNA断片)を活用することで、ウイルスが感染する宿主種を高精度に推定したこと。また、京都大学のバイオインフォマティクスセンターが運用しているKEGGや、米国のNCBIが運用しているCOGなど、複数のデータベースを用いて遺伝子機能を体系的に整理したことである。これにより、VIREはウイルスの分類・宿主・機能を横断的に解析できる世界最大規模のプラットフォームとなった。
研究グループは、VIREが「ウイルス生態学、微生物進化学、環境科学など幅広い分野におけるデータ駆動型研究を支援し、ウイルスと微生物群集との相互作用の解明や環境変動・健康・疾病との関連研究の発展に寄与すること」を期待している。