… pour la faire parler. J’aime le mystère des chiffres et toute la technicité pour les exploiter. Je manie des langages de traitement (R, Python, SQL) ; des techniques de scraping et des logiciels de data visualisation (Tableau, Power BI, Data Studio).
Je travaille à l’apprentissage de nouveaux outils, langages. Je présente ici des projets personnels.
# La Valse des Prénoms
Jean, Marie, Kevin et Beyoncé… Comment ont évolué les prénoms donnés en France entre 1900 et 2020 ? Qu’est ce que ces évolutions disent de nous ?
> Trois dashboards pour y voir plus clair.
- Palmarès des prénoms : quels ont été les prénoms les plus attribués en France de 1900 à nous jours ?
- Croissance Prénominale brute (CPB) : analyse de la croissance du nombre de prénoms. Proposition d’indicateur.
- Modes et prénoms : intemporel, générationnel, épiphénomène etc. A chaque prénom son histoire.
# Les mots de la crise
Attaques terroristes de 2015 ; mouvement des Gilets jaunes et crise de la covid-19 : quels mots ont été utilisés par les présidents François Hollande et Emmanuel dans leurs discours aux français ?
Analyse sémantique de 12 discrours grâce à Python.
> Quatre articles pour y voir plus clair.
- François Hollande et les attentats de 2015 (17 172 mots)
- Emmanuel Macron et les Gilets jaunes (11 592 mots)
- Emmanuel Macron et la covid-19 (118 13 mots)
- Compilation : les mots de la crise
# De quoi nos rues sont-elles le nom ?
Rien n’est plus commun qu’une rue. Qu’est ce que leurs noms disent de nous ? #RueDeFrance est une projet de code et de visualisation des 786 000 rues françaises, avec un zoom sur leurs occurrences et sur les personnalités. Quelle est la place accordée aux femmes ? Quelles sont leurs origines ? Quelles professions jugeons nous digne de nous représenter ?
> Cinq articles pour y voir plus clair.
- #RuesDeFrance : un projet data. Quel est l’intérêt et quels sont les objectifs du projet ?
- #RuesDeFrance : une histoire de code. Faire face à 7 millions d’entrées… les malaxer, les masser, les mélanger. Datascience et scraping… plongeons dans le code Python !
- #RuesDeFrance : analyse des occurrences de rues. Combien de rues portent x fois le même nom ?
- #RuesDeFrance : le Top 100. Quelles sont les 100 noms de rues les plus répandues en France ?
- #RuesDeFrance : analyse des personnalités. Quelles sont les personnalités qui portent un (ou plusieurs!) nom(s) de rue ? Quels sont les noms de notre imaginaire commun ?
# Data : Smombies in Paris
ILS sont parmi nous…
C’est à la terrasse d’un café du 3ème arr. de Paris que la question m’a traversée : quel est le % de passant qui utilise un smartphone dans la rue ? C’est ce que j’ai cherché à savoir par un exercice vintage de collecte de données.
- Outil : Smart Counter App
# From scratch : fréquentation culturelle
Présentation d’un projet professionnel. L’objectif était de refondre un process de collecte, de stockage et de traitement de données, pour la réalisation d’une enquête de fréquentation des sites culturels (musées/monuments) parisiens.
Tour Eiffel, musée du Louvre, Arc de triomphe, musée de l’éventail… tout y passe !
- Outils : hébergement o2switch, Tableau Software
- Langages : Python, HTML/CSS, PHP, SQL
# Don’t Look Up : cartographie mondiale des impacts de météorites
Une carte du monde dark et en mode gruyère : plus de 600 000 tonnes de cailloux recensées entre 860 et 2013 et une question de fond… quelles sont les chances pour qu’une météorite nous tombe réellement sur la tête ?
> Une carte pour y voir plus clair.
# Athlétisme : 100 mètres et des centièmes
Comment ont progressé les meilleures performances du 100 mètres homme, de 1958 à 2022 ? De Jim Hines à Usain Bolt, cela fait déjà quelques décennies que tout se joue au centième. Mais jusqu’à quelle limite ?
> Un dashboard pour y voir plus clair.