Archives de catégorie : J’aime le Code

From scratch : Enquête de fréquentation culturelle

Cet article présente un projet professionnel lié à la data. L’objectif était de refondre un process de collecte, de stockage et de traitement de données, pour la réalisation d’une enquête de fréquentation des sites culturels (musées/monuments) parisiens.

Tour Eiffel, musée du Louvre, Arc de triomphe, musée de l’éventail… tout y passe !

Continuer la lecture

Les mots de la crise : synthèse présendentielle

Attaques terroristes de 2015 ; mouvement des Gilets jaunes et crise de la covid-19 : quels mots ont été utilisés par les présidents François Hollande et Emmanuel Macron au cours de ces crises ? Réponses grâce à Python, par une analyse sémantique de douze discours adressés aux français.

Continuer la lecture

Les mots de la crise : Hollande et le terrorisme

Quels mots ont été utilisés par François Hollande, président de la République lors des attentats du 7,8 et 9 janvier 2015 ; et ceux du 13 novembre 2015 ? Réponses grâce à Python, par une analyse sémantique de quatre discours adressés aux français.

Continuer la lecture

#RuesDeFrance : une histoire de code

Se confronter à 7 millions d’entrées… les malaxer, les masser, les mélanger etc. Et en tirer le meilleur pour en faire quelque chose de joliment structuré. Comment filtrer de la donnée et l’enrichir avec Wikidata? Réponse avec des librairies Python de datascience (Pandas & Numpy); une pincée de regex et un cas de scraping (BeautifulSoup).

Continuer la lecture

Data athlétisme : 100 mètres et des centièmes

Usain Bolt a battu le record du monde du 100 mètres le 16 août 2009. Et depuis ? Personne, à l’exception de Yohan Blake, n’est descendu en dessous de 9,70 secondes. Depuis Jim Hines et Carl Lewis, tout se joue à quelques battements de cils… comment on évolué les temps au fil du temps ? J’ai scrappé sur World Athletics plus des 20 000 meilleures performances de la discipline entre 1958 et 2022.

Continuer la lecture