#RuesDeFrance : analyse des occurrences de rues

Combien de rues portent x fois le même nom ? « Un bon croquis vaut qu’un long discours« … cet article aborde le procédé de création d’une visualisation Matplotlib, support d’une analyse sur les ‘occurrences des rues de France.

Continuer la lecture

#RuesDeFrance : une histoire de code

Se confronter à 7 millions d’entrées… les malaxer, les masser, les mélanger etc. Et en tirer le meilleur pour en faire quelque chose de joliment structuré. Comment filtrer de la donnée et l’enrichir avec Wikidata? Réponse avec des librairies Python de datascience (Pandas & Numpy); une pincée de regex et un cas de scraping (BeautifulSoup).

Continuer la lecture