From scratch : EnquĂȘte de frĂ©quentation culturelle

Cet article prĂ©sente un projet professionnel liĂ© Ă  la data. L’objectif Ă©tait de refondre un process de collecte, de stockage et de traitement de donnĂ©es, pour la rĂ©alisation d’une enquĂȘte de frĂ©quentation des sites culturels (musĂ©es/monuments) parisiens.

Tour Eiffel, musĂ©e du Louvre, Arc de triomphe, musĂ©e de l’Ă©ventail… tout y passe !

Outils : hébergement o2switch, Tableau Software
Langages : Python, HTML/CSS, PHP, SQL

EnquĂȘte de frĂ©quentation culturelle : quid ?

L’enquĂȘte de frĂ©quentation des sites culturels parisiens est un projet professionnel, rĂ©alisĂ© chaque annĂ©e pour le compte de Parisjetaime.com. L’objectif est de rĂ©colter auprĂšs de quelques 200 sites parisiens des donnĂ©es de frĂ©quentation (collections/expositions temporaires) ; l’origine et la typologie des visiteurs (individuels/groupes, entrĂ©e payantes etc.) et leur prĂ©sence sur les rĂ©seaux sociaux.

Ci-dessous l’Ă©dition 2020 de cette enquĂȘte.

La compilation de ces donnĂ©es donne une idĂ©e de l’activitĂ© culturelle de la destination Paris. Elle permet Ă©galement aux sites de mieux se situer sur le marchĂ©.

Récolte et traitement de la donnée : un process à revoir

Le process de rĂ©colte/traitement de la donnĂ©e Ă©tait Ă  l’origine « archaĂŻques » : un questionnaire Word envoyĂ© au contact cible, suivi d’un traitement manuel sur Excel ; d’une rĂ©daction d’un document de synthĂšse et d’une mise en page.

Ce process Ă©tait chronophage. Une porte ouverte Ă  toutes les coquilles.
On pouvait faire mieux.

J’ai donc automatisĂ© la rĂ©colte et le traitement de la donnĂ©e.
En front tout se passe maintenant sur un site : http://culture.parisjetaime.com/

Ci-dessous le process schématisé :

Nouveau process : quels Ă©tapes ? quels outils ?

Phase 1 : récolte de la donnée

La rĂ©colte s’effectue par un questionnaire codĂ© from scratch, juste quelques pages, avec du HTML/CSS, du PHP et du SQL. L’utilisateur est invitĂ© Ă  rĂ©pondre Ă  une batterie de questions, avec la possibilitĂ© de les modifier, puis de les confirmer.

Page d’accueil – Prototype

Une fois le questionnaire validĂ©, l’utilisateur reçoit un email rĂ©capitulatif de ses donnĂ©es dans un fichier PDF gĂ©nĂ©rĂ© avec fpdf ; envoyĂ© avec PHPMailer.

On rentre alors dans la machine.

Phase 2 : stockage de la donnée

Les donnĂ©es de frĂ©quentation : les information rĂ©coltĂ©es/modifiĂ©es sont stockĂ©es dans 9 tables d’une base MySQL. Cette base comprend Ă©galement l’ensemble des donnĂ©es historiques de frĂ©quentation. La plus « vieille entrĂ©e » est datĂ©e de 1889 ! Date de l’inauguration de la tour Eiffel.

Base MySQL

Les donnĂ©es personnelles : pour ĂȘtre en totale conformitĂ© avec les rĂšgles RGPD les donnĂ©es des contacts ne sont envoyĂ©es que par email Ă  mon adresse professionnelle. Rien n’est enregistrĂ© dans la base de donnĂ©e. Un traitement python des emails permet de structurer une base sur Excel gardĂ©e en lieu sĂ»r.

Phase 3 : traitement de la donnée

La base MySQL est mise en relation avec le logiciel BI Tableau. Les données sont agrégées et présentées de maniÚre exploitable.

BI Tableau

Il reste bien sĂ»r un travail d’analyse, de rĂ©daction et de mise en page. Sans compter une vĂ©rification des donnĂ©es… (on n’est pas Ă  l’abri d’une coquille cĂŽtĂ© utilisateurs !). Mais les Ă©tapes de traitement permettent de gagner un temps prĂ©cieux pour l’analyse.

Quel impact carbone ?

La lourdeur du process est certes anecdotique… mais pour le principe je me suis amusĂ© Ă  calculer l’impact carbone liĂ© Ă  la rĂ©alisation de cette enquĂȘte. Je me suis basĂ© sur le poids des emails gĂ©nĂ©rĂ©s et sur le stockage des donnĂ©es. Le process Ă©quivaut sur cette base Ă  l’Ă©quivalent d’une bouchĂ©e de steak hachĂ©.

Quelles perspectives ?

Le process permet d’abord de gagner du temps. Et d’en consacrer davantage Ă  l’analyse et/ou Ă  des entretiens qualitatifs pour approfondir certains sujets qui animent la communautĂ© musĂ©ale parisienne (yieldmanagement, numĂ©risation des parcours, gestion des files d’attente etc.)

Il permet d’envisager, dans un second temps, un Ă©largissement des donnĂ©es rĂ©coltĂ©es en implĂ©mentant de nouvelles questions/bases (tranches d’Ăąge des visiteurs, donnĂ©es sur les expositions virtuelles etc.)

Il fournit enfin un modĂšle rĂ©plicable/extensible Ă  d’autres territoires touristiques.

Lancement en 2023 !