Variant Transforms ist ein Open-Source-Tool, das mit Cloud Life Sciences verwendet wird. Er basiert auf Apache Beam und nutzt Dataflow.
Sie können Variant Transforms verwenden, um Folgendes auf skalierbare Weise zu transformieren und zu laden:
- Hunderttausende von Dateien
- Millionen von Beispielen
- Milliarden von Einträgen
Mit dem Präprozessor von Variant Transforms können Sie VCF-Dateien prüfen und Inkonsistenzen feststellen.
Der typische Workflow bei der Verwendung des Tools besteht aus diesen Schritten:
- VCF-Rohdatendateien in Cloud Storage speichern
- VCF-Dateien mit dem Tool Variant Transforms aus Cloud Storage in BigQuery laden
Anschließend können Sie die Varianten mit BigQuery analysieren.
Machen Sie sich mit dem BigQuery-Variantenschema vertraut, damit Sie wissen, wie das Tool VCF-Dateien in BigQuery-Tabellen lädt.