Avec des données plus critiques que jamais pour le succès des entreprises, Python se répand au-delà du domaine des professionnels des données et est adopté par les analystes commerciaux et d’autres utilisateurs moins techniques. Mais quelles sont les opportunités si vous êtes relativement nouveau dans Python et quelles sont les bonnes pratiques à connaître pour assurer votre succès ?

Les professionnels des données sont une denrée précieuse et dans de nombreuses organisations, les exigences de l’entreprise ont dépassé les ressources et la capacité des équipes de données. Dans le même temps, les analystes commerciaux se heurtent aux limites de ce que les outils de BI peuvent faire pour eux et recherchent des moyens d’effectuer des analyses plus avancées. Python est la clé du succès ici.

L’utilisation de Python se développe rapidement. Dans un enquête sur plus de 20 000 développeurs plus tôt cette année, Python s’est classé deuxième derrière JavaScript en termes de popularité, et Python a ajouté 3,3 millions de nouveaux utilisateurs nets au cours des six mois précédents pour atteindre 15,7 millions d’utilisateurs dans le monde.

Ces dernières années, la communauté Python a créé de nouveaux frameworks et packages qui rendent le langage plus accessible aux développeurs non professionnels pour l’analyse avancée, l’apprentissage automatique et le développement d’applications. Les exemples comprennent NumPyune bibliothèque Python open source pour les données numériques ; Prophètepour l’exécution des prévisions, et H3un projet lancé chez Uber pour manipuler des données géospatiales.

La propagation de Python aux développeurs non professionnels n’est pas sans précédent. Un schéma similaire s’est produit avec l’essor des outils de BI en libre-service et avec les hommes d’affaires apprenant à créer des scripts pour leurs propres macros Excel. L’utilisation étendue de Python aura encore plus d’impact car le langage lui-même est tellement capable.

Premiers pas avec l’analyse Python

Les utilisateurs professionnels comprennent souvent mieux que les développeurs professionnels quelles informations spécifiques seront les plus utiles à leurs unités commerciales, et il existe plusieurs cas d’utilisation d’entrée de gamme où ils peuvent commencer à mettre Python au travail. Voici trois exemples :

Matrices de corrélation

Une matrice de corrélation est un tableau qui montre les coefficients de corrélation pour différentes variables. Cela peut vous permettre d’analyser différentes dimensions d’un ensemble de données pour déterminer si une personne qui présente le comportement A, par exemple, est également susceptible de présenter le comportement B. Les matrices de corrélation sont utiles pour déterminer les articles à placer les uns à côté des autres dans une épicerie. magasin, ou quels articles supplémentaires offrir lorsqu’un utilisateur de commerce électronique passe à la caisse.

Analyse des composants principaux

Un autre point de départ possible est l’analyse en composantes principales, qui peut réduire la taille d’un ensemble de données bruitées et déterminer quels attributs ont le pouvoir prédictif le plus élevé pour un résultat donné. Si une entreprise vend des prêts hypothécaires, par exemple, une analyse en composantes principales peut révéler quels facteurs démographiques (revenu, code postal, état civil, etc.) sont les plus prédictifs d’une vente, aidant ainsi à cibler les campagnes et les offres.

Prévision

Un autre problème courant pour les entreprises est la prévision. Pensez à prédire la demande des clients, les ventes ou les revenus, ce que toutes les entreprises matures doivent faire. Imeuble prévisions est un moyen d’explorer l’analyse prédictive, en utilisant des bibliothèques open source telles que Prophet ou Scikit-Learn en Python.

Une grande puissance, comme on dit, implique une grande responsabilité, et il existe de bonnes pratiques que les nouveaux utilisateurs de Python devraient utiliser pour s’assurer que les applications qu’ils créent sont robustes et sécurisées.

Soin et alimentation des pythons

Un problème est de maintenir les packages Python pour s’assurer que les dépendances sont correctement gérées. Anaconda est utile ici, car il simplifie grandement la gestion et le déploiement des packages. Avec le Snowpark pour Python de Snowflake, nous préinstallons les packages Python les plus populaires de l’Anaconda canal par défaut dans notre environnement d’exécution Python afin qu’ils n’aient pas à être installés manuellement. Nous avons également intégré le Conde gestionnaire de packages dans Snowpark pour gérer les packages Python et leurs dépendances.

Comme tout projet de données, il existe des problèmes de sécurité et de gouvernance dont il faut être conscient, mais les plates-formes de données cloud modernes fournissent un environnement d’exécution déjà configuré et configuré, et les utilisateurs peuvent tirer parti des fonctionnalités de sécurité et de gouvernance intégrées à ces plates-formes. Par exemple, le runtime Python dans Snowpark interdit l’accès au réseau externe par défaut pour se protéger contre les problèmes de sécurité courants tels que l’exfiltration de données. L’utilisation d’un environnement d’exécution Python sécurisé préconfiguré comme Snowpark est beaucoup plus facile pour les utilisateurs novices de Python par rapport à la création et à la maintenance de vos propres environnements ou conteneurs.

C’est encore tôt, et avec le temps, je m’attends à ce que d’autres outils et ressources Python destinés spécifiquement aux développeurs non professionnels émergent. Un domaine qui doit évoluer concerne les méthodes par lesquelles les utilisateurs de Python peuvent partager les résultats de leur travail avec des collègues qui ne souhaitent pas apprendre le langage eux-mêmes. L’achat de Streamlit par Snowflake visait en partie à résoudre ce problème. L’outil open source permet aux équipes de données de créer des applications qui donnent vie visuellement aux données pour les utilisateurs non techniques. Python lui-même est un langage puissant pour créer des applications, donc son utilisation dans la création d’applications de données pour les utilisateurs finaux rendra le langage encore plus largement adopté.

Pour commencer, RealPython propose une solution complète Guide du débutant à Python, et Full Stack Python liens vers de nombreuses ressources ici. La Python Software Foundation a un actif communauté où les utilisateurs expérimentés fournissent des conseils et répondent aux questions pour tous les niveaux de capacité.

Si vous êtes un utilisateur de Snowflake, découvrez notre environnement de développement Snowpark ici, qui prend en charge nativement le développement Python. Vous pouvez également rejoindre l’un des nombreux Snowflake groupes d’utilisateurs de la communauté dans le monde entier, qui organisent des rencontres pour discuter des développements techniques et des opportunités.

Torsten Grabs est directeur de la gestion des produits chez Flocon de neige.

Le New Tech Forum offre un lieu pour explorer et discuter des technologies d’entreprise émergentes avec une profondeur et une ampleur sans précédent. La sélection est subjective, basée sur notre sélection des technologies que nous pensons importantes et les plus intéressantes pour les lecteurs d’InfoWorld. InfoWorld n’accepte pas les supports marketing pour publication et se réserve le droit de modifier tout le contenu contribué. Envoyez toutes les demandes à [email protected].

Copyright © 2022 IDG Communications, Inc.

Leave a Reply