Le moment où l'appli a "trouvé quelque chose"
Tu suis ton humeur depuis quelques semaines. Puis l'analyse te montre un lien : "Les jours avec café, ton humeur est plus haute." Le premier réflexe est clair. Plus de café, meilleure humeur.
Hélas, cela ne fonctionne pas ainsi. La phrase décrit une corrélation, c'est-à-dire une apparition conjointe. Sur la cause, elle ne dit rien. C'est précisément ici que se produisent les erreurs de raisonnement les plus fréquentes du suivi de soi, et c'est précisément ici que se décide si tes données t'aident ou t'égarent.
Cet article est la compétence de base avec les données pour quiconque mesure l'humeur, le sommeil ou des facteurs. Pas un cours de statistique, mais quatre erreurs de raisonnement et comment les éviter.
Ce que signifie une corrélation, et ce qu'elle ne signifie pas
Une corrélation mesure la force avec laquelle deux grandeurs varient ensemble. La valeur se situe entre moins un et plus un. Rien de plus. Une corrélation ne contient aucune direction ni aucune cause, c'est une pure observation de la forme "ces deux choses bougent ensemble".
Une corrélation fallacieuse presque parfaite
La consommation de margarine par habitant
évolue pendant des années en parallèle avec
le taux de divorce dans le Maine
r ≈ 0,99et pourtant aucun lienLa preuve la plus connue en sont les Spurious Correlations de Tyler Vigen. Là, la consommation de margarine est corrélée presque parfaitement avec le taux de divorce dans le Maine. Personne ne prétendrait que l'un cause l'autre. Les courbes évoluent en parallèle par hasard.
Dans la science aussi, cette distinction est un sujet à part entière. Les statisticiens Naomi Altman et Martin Krzywinski le résument par une formule dans Nature Methods : corrélation signifie association, mais pas causalité. Dans tes données, c'est seulement moins évident.
Les quatre erreurs de raisonnement les plus fréquentes
1. Direction inversée. L'appli dit : "Les jours avec beaucoup d'activité physique, ton humeur est meilleure." La direction inverse est tout aussi plausible. Les jours où tu te sens déjà bien, tu sors plus volontiers et fais du sport. Alors c'est la bonne humeur qui génère l'activité, et non l'inverse. La plupart du temps, les deux directions agissent en même temps.
2. Le troisième facteur caché. L'erreur la plus traîtresse. Deux choses sont corrélées parce qu'une troisième, non mesurée, les pousse toutes deux. Ton humeur est plus haute les jours de café ? La vraie cause peut être le sommeil. Après une bonne nuit, tu es plus éveillé, tu as plus d'allant et tu savoures ton café. Le sommeil est le facteur de confusion, le café ne fait que suivre.
3. Le hasard avec peu de données. Avec dix jours, un lien quelconque apparaît presque toujours, simplement par hasard. Plus tu analyses de facteurs à la fois et moins tu as de jours, plus la probabilité qu'un schéma soit du pur bruit est élevée. Combien de jours il te faut, c'est ce qu'éclaircit Combien de jours de suivi avant que les schémas apparaissent.
4. Le récit après coup. Notre cerveau trouve une histoire à presque chaque donnée. "Bien sûr, voilà pourquoi mardi a été si mauvais." Ces histoires convainquent parce qu'elles naissent après les données et collent parfaitement. Le test est : l'aurais-tu aussi prédit à l'avance ?
Quatre pièges en lisant tes données
Direction inversée
Peut-être que la bonne humeur génère l'activité, et non l'inverse.
Troisième facteur caché
Le sommeil pousse le café et l'humeur en même temps. Le café ne fait que suivre.
Hasard avec peu de données
Dix jours livrent presque toujours un schéma apparent quelconque.
Récit après coup
Une histoire qui ne colle que parce qu'elle naît après les données.
Comment conclure malgré tout de façon solide
La corrélation n'est pas sans valeur, elle est le début. Voici comment en tirer davantage :
De la corrélation à la connaissance
De "est lié à" tu passes à "Et si je le changeais ?"
Qu'est-ce qui pourrait pousser les deux côtés à la fois ? Suis-le aussi.
Changer une chose à dessein, garder le reste identique, observer deux semaines.
La cause vient avant l'effet. Les effets différés sont souvent plus parlants.
Le levier le plus fort pour un particulier, c'est l'expérience sur soi-même. Quand tu changes un facteur à dessein au lieu de seulement l'observer, tu te rapproches d'un véritable test de cause à effet. L'action génère des données, la simple observation non. Et fais attention au temps : si un mauvais sommeil le lundi est lié à une humeur basse le mardi, la direction est au moins plausible. Plus à ce sujet dans Comment le sommeil influence ton humeur.
Pourquoi InnerPulse parle d'"observation"
C'est précisément pour cela qu'InnerPulse formule ses analyses comme des observations, non comme des diagnostics. Une phrase telle que "Les jours avec du sport, tu as bien mangé 40 pour cent plus souvent" est délibérément descriptive. Elle n'affirme aucune cause, elle t'invite à poursuivre la réflexion toi-même. Comment l'appli forme ces schémas, c'est ce qu'explique Reconnaître les schémas dans l'humeur, et le cadre plus large est fourni par le guide InnerPulse.
Cette prudence n'est pas un manque de confiance, mais le traitement honnête de ce que les données d'observation peuvent apporter. Qui promet plus te vend une certitude que les données ne donnent pas.
La seule phrase à retenir
La prochaine fois que ton appli te montre un lien, remplace mentalement "cause" par "est lié à" et ajoute une question : "Que se passerait-il si je le changeais ?" Cette petite reformulation transforme une vérité apparente séduisante en un outil. Tes données prouvent rarement quelque chose, mais elles te montrent de façon fiable où il vaut la peine de regarder de plus près.
Cet article ne remplace pas un avis médical. Il t'aide à mieux situer tes propres observations.
Pour aller plus loin
- Combien de jours de suivi avant que les schémas apparaissent éclaircit la question des données suffisantes.
- Reconnaître les schémas dans l'humeur montre comment interpréter les liens en pratique.
- 90 jours de suivi de l'humeur : un retour d'expérience montre comment les schémas se dégagent au fil du temps.
- Pourquoi les séries nuisent en cas de dépression explique pourquoi plus de données ne valent pas automatiquement mieux.
- Mise en perspective scientifique : Altman & Krzywinski, Nature Methods (2015)
- Exemple parlant : Spurious Correlations de Tyler Vigen