Projet 1 : Web scraping
Posted on mar. 22 février 2022 in Projet étudiant
Pitch du projet :
Automatisation d'un suivi des prix des livres d'occasion via un programme (un scraper) développé en Python, capable d'extraire les informations tarifaires et images d'une librairie en ligne.
Compétences travaillées :
- Configurer un environnement Python
- Factoriser du code par l'usage des fonctions
- Utiliser le contrôle de version avec Git et GitHub :
Premiers pas sur GitHub avec la création d'un repo et gestion au travers du terminal
Elaboration de mon premier README.md et requirements.txt - Appliquer les bases de la programmation en Python
- Gérer les données à l'aide du processus ETL (Extraction, transformation, chargement) :
Extraction d'informations et d'images
Écriture des données dans un fichier CSV distinct pas catégorie
Téléchargement et enregistrement du fichier image
Technologies et outils :
Python 3.9 ; BeautifulSoup4 ; GitHub ; Gitbash ; PyCharm