October 9, 2024

Biotechnologie News

Classe Mondiale Technologie

Amazon Omics vise à optimiser l’analyse des données biologiques à grande échelle

Amazon Omics vise à optimiser l’analyse des données biologiques à grande échelle

Lors de sa conférence annuelle re:Invent, Amazon Web Services a lancé mardi un nouveau service, baptisé Amazon Omics, conçu pour aider les bioinformaticiens, les chercheurs et les scientifiques à stocker et à analyser les types de données génomiques et biologiques afin d’accélérer les avancées scientifiques de la médecine de précision.

Les omiques font généralement référence à des domaines d’études en biologie qui se terminent par le suffixe « omiques », comme la génomique, la transcriptomique (l’étude de l’ARN dans une cellule), la protéomique (l’étude des protéomes ou des ensembles de protéines) et la métabolomique (l’étude de molécules dans les cellules). Les omiques impliquent généralement des études à grande échelle avec de grands ensembles de données.

Le nouveau service, selon la société, peut être utilisé par les scientifiques non seulement pour créer un énorme magasin de données, mais également pour importer de gros fichiers de données brutes tels que des séquences de génomes ou d’autres fichiers de données utilisés en médecine de précision, un domaine médical qui utilise le génome et les protéines. données pour optimiser le traitement des maladies.

Amazon Omics peut également vous aider à configurer un flux de travail bioinformatique de base et à analyser les résultats à l’aide d’AWS existant. analytique et apprentissage automatique services, a déclaré AWS, ajoutant que le service approvisionne automatiquement l’infrastructure sous-jacente à mesure que l’utilisation augmente.

Stockage de données optimisé pour la bioinformatique

Le nouveau service fonctionne sur la base de trois composants principaux : un stockage optimisé, un calcul géré pour les flux de travail et des magasins de données adaptés à des types d’analyse spécifiques, a écrit Channy Yun, principal défenseur des développeurs chez Amazon, dans un article de blog.

Afin de réduire les coûts, Amazon Omics utilise des options de stockage compatibles avec la bioinformatique pour stocker les données de séquence brutes. Afin d’optimiser les données pour l’exécution de l’analyse, Amazon Omics importe les données brutes dans un magasin de variantes et les transforme en un schéma prêt pour les requêtes disponible sous forme de table Apache Iceberg, selon la société.

Le service est livré avec deux classes de stockage : active et archive.

“L’archivage automatique est activé par défaut, ce qui signifie qu’Amazon Omics déplacera automatiquement les données vers la classe de stockage la moins chère si elles ne sont pas régulièrement consultées (pendant plus de 30 jours), similaire à Amazon Simple Storage Service (Amazon S3) Intelligent-Tiering classe de stockage, entraînant des économies pour les clients », a écrit Tehsin Syed, directeur général de Health AI chez AWS, dans un article de blog.

Amazon Omics prend également en charge l’importation de données brutes dans un magasin d’annotations. Les données marquées ou étiquetées par types de fichiers sont appelées données annotées.

Les scientifiques et autres utilisateurs peuvent commencer à importer des données dans le stockage d’objets via la console du service.

Le composant de calcul géré du service fournit des ressources aux scientifiques pour exécuter des flux de travail bioinformatiques qui contiennent des scripts d’une série de tâches coordonnées conçues pour distiller de grandes quantités de données de séquence brutes, du stockage Amazon Omics ou Amazon S3, à de petites quantités de données analytiques, telles que en tant que mutations du génome, a déclaré la société, ajoutant que les scientifiques et les autres utilisateurs doivent simplement spécifier les ressources de calcul nécessaires pour chaque tâche.

“En retour, cela supprime tout le travail lourd indifférencié associé à l’exécution et à la gestion de ces flux de travail à grande échelle”, a écrit Syed, ajoutant que les scripts à l’intérieur des flux de travail peuvent être écrits dans des langages tels que Nextflow ou Workflow Description Language.

Le nouveau service, qui peut être utilisé en combinaison avec d’autres services tels qu’Amazon HealthLake, est désormais disponible aux États-Unis Est (Virginie du Nord), États-Unis Ouest (Oregon), Asie-Pacifique (Singapour), Europe (Francfort), Europe (Irlande ) et Europe (Londres).

La prise en charge de davantage de régions devrait suivre prochainement. Le service est tarifé sur un modèle de consommation.

Copyright © 2022 IDG Communications, Inc.