Epidemieprävention wird organisiert

Erick Jan-Vareschard, AWS Frankreich.Und Mittwoch, 27. April 2022

Die Pandemie hat weltweites Chaos verursacht, indem sie die Gesundheitsinfrastruktur destabilisiert und die Wirtschaft gestört hat. Die Mittel, um eine neue Pandemie zu verhindern, sind heute vorhanden, wie das Projekt beweist Ceratos, ein Open-Source-Cloud-Computing-Framework, das einen Sequenzvergleich in Petabyte-Größe ermöglicht. Dank letzterem kann eine riesige Menge wissenschaftlicher Informationen mit einem in der Cloud gehosteten Supercomputer in begrenzter Zeit und zu geringeren Kosten genutzt werden.

Die nächste Pandemie verhindern: Die Antwort liegt in den Daten

Die Technologie arbeitete daran, die Epidemie zu bekämpfen, konnte sie jedoch nicht verhindern. Als wir das COVID-Virus identifizieren konnten, beschleunigte sich alles. Mittels Hochdurchsatz-Sequenzierung wurde der unbekannte Erreger innerhalb weniger Wochen rekonstruiert und Screening-Tests entwickelt. Impfstoffe wurden mithilfe von mRNA-Technologien in Rekordzeit hergestellt. Aber wir haben das eigentliche Problem übersehen: die Vermeidung dieser Epidemie, indem der betreffende Infektionserreger so schnell wie möglich entdeckt und identifiziert wird. Es ist unvorstellbar, dass ein solches Szenario noch einmal passieren würde. Von den meisten neuen Infektionskrankheiten ist bekannt, dass sie durch RNA-Viren verursacht werden, die von Tieren auf Menschen übertragen werden. Ebola, MERS, SARS, Zika, Influenzaviren und SARS-2-Viren werden durch diese artenübergreifende Übertragung verursacht. Um bekannte und unbekannte Viren zu identifizieren, verfügen Forscher über riesige Datenbanken, die immer größer werden. Allein das Sequence Read Archive (SRA) enthält Millionen von Gigabyte genetischer Sequenzen, die Hunderttausende neuer Viren identifizieren könnten. Trotz aller Informationen haben wir zu spät von diesem Coronavirus erfahren, da wir diese Datenmasse nicht schnell auswerten können.

Die Cloud gibt dem Biological Computing neue Impulse

Angesichts des exponentiellen Wachstums von Genomdaten sind herkömmliche Hochleistungscomputer an ihre Grenzen gestoßen. Es würde mehr als ein Jahr dauern, die SRA-Datenbank mit großem Aufwand zu analysieren. So kam ein internationales Forscherteam auf die Idee, die Leistungsfähigkeit der AWS-Cloud zu nutzen, um in Zusammenarbeit mit dem Centre for Cloud Innovation (CIC) der University of British Columbia in Kanada die „Serratus-Plattform“ zu schaffen. Dieses mit Open Source konzipierte Wissenschaftsprojekt zielt darauf ab, alle bekannten und unbekannten Coronaviren als Reaktion auf die COVID-19-Pandemie sehr schnell zu identifizieren und zu katalogisieren. Es wird erwartet, dass die Hochdurchsatz-Sequenzierungs-Alignment-Plattform die Bioinformatik in den kommenden Jahren grundlegend verändern wird, beginnend mit der Virologie. Serratus erfüllt alle Kompetenzfelder. Das gesamte Projekt kostet nur 20.000 Euro und acht Wochen reichen aus, um eine Anordnung von 22.500 Computern in einer hochparallelen Architektur zu erstellen. Die Ergebnisse überzeugen. Serratus durchsuchte 5,7 Millionen weltweit gesammelte biologische Proben oder 20 Millionen Gigabyte an Daten und lieferte Ergebnisse in nur 11 Tagen, während es mit einem einzigen Computer mehr als 2.000 Jahre gedauert hätte.

Zur sofortigen Prävention vor der nächsten Pandemie

Die Serratus-Plattform hat bereits den Nachweis von 132.000 neuen RNA-Viren und neun neuen Arten von Coronaviren ermöglicht. Vor Serratus waren nur 15.000 RNA-Viren in öffentlichen Datenbanken identifiziert worden. Diese Entwicklungen werden dazu beitragen, ein globales Überwachungssystem zu schaffen, in dem die Datenbank und Sequenzen, die unter dem Namen “Open Virome” zusammengefasst sind, in Diagnose- und Forschungswerkzeuge integriert werden können. Serratus könnte auch eine Rolle bei der Impfstoffentwicklung spielen, indem es angereicherte Evolutionsdaten liefert, die es uns ermöglichen zu verstehen, wie sich die Oberflächenproteine ​​von Viren im Laufe der Zeit verändern. Dieses fundierte Wissen des Serratus-Projekts hilft, den Ursprung der Epidemie zu bestimmen, aber vor allem die nächste zu verhindern. Um dies zu erreichen, ist es notwendig, die Ausbreitung des Virus so schnell wie möglich zu stoppen. Nachdem alle erforderlichen Tools zur Verarbeitung und Analyse der Sequenzierungsdaten eingerichtet wurden, werden sich die Forscher auf die Prävention von Epidemien in Echtzeit konzentrieren. Dies wird durch die Automatisierung der Datenanmerkungen verkörpert, die zum Identifizieren unbekannter Viren erforderlich sind.

Die Pandemie hat erneut die wesentliche Rolle von Daten in der modernen Welt deutlich gemacht. Die Sammlung und Analyse von Daten in allen Bereichen der Biomedizin revolutioniert Forschung und Versorgung. Künstliche Intelligenz ist auch für genaue Analysen und Diagnosen zunehmend präsent. Dies erfordert eine erhebliche Rechenleistung, die nur die Cloud zu vernünftigen Kosten erhalten kann.


Autor

Erick Jan-Vareschard ist Leiter des öffentlichen Sektors von Amazon Web Services (AWS) in Frankreich. Er verfügt über fünfzehn Jahre Erfahrung in der Unterstützung öffentlicher Akteure bei ihrer Transformation, jeweils bei Cisco und Symantec und seit 2016 bei AWS.

#Wolke#Cloud Computing# Rechnen#Anregung# bereitgestellt


Leave a Comment