fr en

Projet 1 : Web scraping

Posted on mar. 22 février 2022 in Projet étudiant

Pitch du projet :

Automatisation d'un suivi des prix des livres d'occasion via un programme (un scraper) développé en Python, capable d'extraire les informations tarifaires et images d'une librairie en ligne.

Compétences travaillées :

  1. Configurer un environnement Python
  2. Factoriser du code par l'usage des fonctions
  3. Utiliser le contrôle de version avec Git et GitHub :
    Premiers pas sur GitHub avec la création d'un repo et gestion au travers du terminal
    Elaboration de mon premier README.md et requirements.txt
  4. Appliquer les bases de la programmation en Python
  5. Gérer les données à l'aide du processus ETL (Extraction, transformation, chargement) :
    Extraction d'informations et d'images
    Écriture des données dans un fichier CSV distinct pas catégorie
    Téléchargement et enregistrement du fichier image

Technologies et outils :

Python 3.9 ; BeautifulSoup4 ; GitHub ; Gitbash ; PyCharm

Repo du projet :

« Utilisez les bases de Python pour l'analyse de marché »