Paris, France
Description :
Cette journée permet aux analystes de maîtriser les techniques de scraping web et d’automatisation des données en Python. Vous apprendrez à collecter, nettoyer et structurer des données issues de sites web, puis à automatiser ces workflows pour des analyses régulières et fiables.
Objectifs pédagogiques :
- Comprendre les principes et bonnes pratiques du web scraping (respect des CGU, robots.txt).
- Utiliser les bibliothèques Python (requests, BeautifulSoup, Scrapy) pour extraire des données.
- Automatiser l’exécution de scripts et la mise à jour des données via cron ou scheduler Python.
- Mettre en place un pipeline de traitement des données (nettoyage, transformation, export).
Public concerné :
Analystes de données, data scientists débutants, toute personne souhaitant automatiser la collecte de données web.
Durée :
1 journée (9h–12h30 et 13h30–17h).
Nombre de participants :
Maximum 12 personnes.
Pré-requis :
Connaissance de base de Python et notions d’HTML/CSS.
Programme :
Matin : Fondamentaux du scraping
- Introduction au scraping et cadre légal.
- Extraction de données avec requests et BeautifulSoup.
- Gestion des sites dynamiques : utilisation de Selenium ou Playwright.
- Atelier : extraire des tableaux et listes depuis un site public.
Après-midi : Automatisation et pipeline
- Création d’un projet Scrapy pour crawler plusieurs pages.
- Nettoyage et structuration des données avec pandas.
- Planification de scripts via cron ou schedule.
- Atelier pratique : automatiser la mise à jour et l’export vers CSV ou base de données.
Tarif :
- Inter-entreprises : 700 € HT par participant
- Intra-entreprise : sur devis selon vos besoins
Méthodes mobilisées :
- Démonstrations techniques
- Ateliers pratiques guidés
- Cas concrets d’automatisation
Évaluation :
- Quiz de validation des acquis
- Revue des scripts réalisés et feedback
Modalités mobilisées :
Formation disponible en présentiel ou visioconférence (Microsoft Teams). Un ordinateur avec Python et accès Internet est requis.
Délai d’accès :
Inscription possible jusqu’à 7 jours ouvrés avant la session.
Assistance technique & Réclamations :
- Pour tout problème technique (accès à la formation, connexion à une session à distance, utilisation des supports numériques, des liens de visioconférence…) ou pour tout autre incident technique, contactez-nous à l’adresse : assistance@eurekia-learning.com.
- Pour toute autre réclamation, vous pouvez nous écrire à l’adresse : reclamations@eurekia-learning.com.
Nos sessions sont accessibles aux personnes en situation de handicap. Pour adapter nos modalités, merci de contacter notre référente handicap Jihane Khouzaimi à l’adresse accessibilite@eurekia-learning.com, ou jihane@eurekia-learning.com.
-
- Responsable pédagogique et administratif : Hatim Khouzaimi (hatim@eurekia-learning.com)
- Responsable qualité et handicap : Jihane Khouzaimi (jihane@eurekia-learning.com)
Remarque :
Cette formation vous donnera les compétences nécessaires pour automatiser la collecte et la préparation des données web, facilitant ainsi vos analyses et reportings.
Contactez-nous !
Vous souhaitez amorcer une démarche IA claire et concrète dans votre organisation ?
Vous voulez former vos équipes ou identifier des cas d’usage adaptés à vos métiers ?
Nous serons ravis d’en discuter avec vous, sans jargon ni engagement.
Un simple échange peut suffire à déclencher le bon déclic.


