Рет қаралды 55,654
🔥 15$ de crédit gratuit sur brightdata.com : brdta.com/CodeAvecJonathan
Le scraping est une technique qui vous permet d'extraire des informations depuis des sites web.
Ce tutoriel de programmation sur le web scraping avec Python va vous permettre :
- De faire vos premiers pas en scraping (pour débuter avec requests et beautifulsoup)
- D'apprendre et de contourner les mécanismes de protections contre le scraping
- De connaitre les règles légales concernant le scraping
- De créer un projet avancé qui vous permettra de scraper n'importe quel site.
- D'utiliser l'IA (ChatGPT) pour vous aider sur la génération du code.
----------------------------------------------------------
Prérequis :
- Connaitre les bases sur le langage Python : • APPRENDRE PYTHON [TUTO...
- Installer Visual Studio Code : code.visualstudio.com/download
----------------------------------------------------------
Les liens :
1️⃣ Cette vidéo est en partenariat avec Brightdata (solution de scraping professionnelle), qui vous offre 15$ de crédit en passant par ce lien : brdta.com/CodeAvecJonathan
(ce lien ne m'apporte aucune commission, il vous permet juste de suivre ce tutoriel gratuitement)
2️⃣ Téléchargez tous les codes source de ce tutoriel : codeavecjonathan.com/scraping...
3️⃣ Toutes mes formations au meilleur prix : codeavecjonathan.com/formations
----------------------------------------------------------
Le programme :
00:00:00 Introduction
00:01:50 Prérequis
00:02:10 Le programme
00:02:31 PARTIE 1 - Vos premiers pas en scraping
00:04:18 Faire une requête HTTP (requests)
00:13:36 Extraire les informations (titre + description)
00:23:33 Récupérer plusieurs éléments (ingrédients)
00:27:40 Exercice : Etapes de préparation
00:30:22 Conseils pour aller plus loin (générez du code avec ChatGPT / entrainez vous avec scrapethissite.com)
00:33:16 PARTIE 2 - Les protections contre le scraping
00:36:34 User-agent : se faire passer pour un navigateur
00:41:28 Problèmes liés au Javascript
00:44:13 Headless browsing : contourner les problèmes liés à Javascipt
00:45:42 Solutions de scraping pro : Rotations IPs, Proxys, Anti-captcha…
00:48:03 PARTIE 3 - Est-ce que le scraping est légal ?
00:50:56 PARTIE 4 - Projet de scraping avancé
00:52:23 Sites protégés : Limites du script actuel
00:55:51 Les etapes du projet
00:56:54 Création de votre compte sur BrightData.com
00:58:18 Comprendre : Le WebUnlocker et ScrapingBrowser
00:59:37 Utilisation du Web Unlocker
01:11:44 Utilisation du Scraping Browser
01:17:39 Bypasser le mode scraping
01:21:22 Extraction des informations (titre)
01:26:53 Extraction des informations (nb évaluations, prix, description)
01:37:19 Plusieurs urls, stocker les données, scheduler
01:42:53 Reformuler du contenu avec l’API ChatGPT
01:45:57 Conclusion
----------------------------------------------------------
A propos :
Développeur passionné avec plus de 19 ans d'expérience professionnelle, je suis actuellement développeur freelance spécialisé dans les applications mobiles iOS et Android, et les serveurs WEB. Je travaille à distance avec mes clients.
Sur cette chaine, je vous propose de découvrir la programmation d'une manière différente : je vous apporte ma pédagogie et mes techniques professionnelles.
L'objectif ? Vous permettre d'apprendre la programmation, de devenir un meilleur développeur, de vous professionnaliser, et pourquoi pas de changer de vie.
Abonnez-vous à la chaine pour accéder aux nouvelles vidéos sur les sujets suivants:
- Tuto programmation (Python, C#, .NET, ...)
- Devenir développeur freelance
- Utiliser les IA génératives (ChatGPT, Midjourney...)
Mon profil Linked-In : / rouxjonathan
Mon site de freelance : jonathanroux.fr
Mon site de formations : codeavecjonathan.com