Archives de catégorie : Tous les articles

Les mots de la crise : Hollande et le terrorisme

Quels mots ont été utilisés par François Hollande, président de la République lors des attentats du 7,8 et 9 janvier 2015 ; et ceux du 13 novembre 2015 ? Réponses grâce à Python, par une analyse sémantique de quatre discours adressés aux français.

Continuer la lecture

#RuesDeFrance : une histoire de code

Se confronter à 7 millions d’entrées… les malaxer, les masser, les mélanger etc. Et en tirer le meilleur pour en faire quelque chose de joliment structuré. Comment filtrer de la donnée et l’enrichir avec Wikidata? Réponse avec des librairies Python de datascience (Pandas & Numpy); une pincée de regex et un cas de scraping (BeautifulSoup).

Continuer la lecture

Data athlétisme : 100 mètres et des centièmes

Usain Bolt a battu le record du monde du 100 mètres le 16 août 2009. Et depuis ? Personne, à l’exception de Yohan Blake, n’est descendu en dessous de 9,70 secondes. Depuis Jim Hines et Carl Lewis, tout se joue à quelques battements de cils… comment on évolué les temps au fil du temps ? J’ai scrappé sur World Athletics plus des 20 000 meilleures performances de la discipline entre 1958 et 2022.

Continuer la lecture