Précision de la prédiction de période accrue jusqu'à 15 %.

Précision de la prédiction de période accrue jusqu'à 15 %.
Le client est une entreprise de médias et de divertissement basée au Japon. L'entreprise propose diverses applications pour harmoniser les besoins de différents clients à travers le monde.
Le client a développé une application d'analyse prédictive. Il s'agit d'un traqueur de cycle menstruel qui offre des informations précieuses sur le cycle menstruel. Il a pour objectif de suivre et prédire les règles (jour suivant des règles, durée des règles, jour d'ovulation, probabilité de conception) et fournit à l'utilisateur un fil de discussion.
Le client cherchait une expertise en machine learning en tant que service et a demandé à notre équipe d'améliorer la précision globale des prévisions.
Même avec l'abondance d'applications de suivi de cycle menstruel sur le marché des applications mobiles, les femmes ont encore du mal à suivre leurs cycles en utilisant des applications de prédiction ou à concevoir. Il peut y avoir plusieurs raisons à cela, mais une chose reste la même : la précision des prédictions offertes par les applications modernes.
Récemment, nous avons réalisé un projet similaire lié à la prédiction du cycle menstruel pour une start-up célèbre. Ce projet peut être un bon exemple de fouille de données prédictive.
Ayant de l'expérience dans le développement d’applications d’analytique prédictive, nous avons été heureux de partager notre expertise avec le client et de lui fournir une solution précise et efficace.
Notre équipe a été mise au défi d'améliorer la solution actuelle pour les prédictions de périodes sans affecter les performances de l'application.
Sachant que l'application de prédiction compte de nombreux utilisateurs, nous avons dû opter pour une solution robuste capable de traiter des milliers de requêtes utilisateur par minute. Pour ce faire, nous avons décidé d'utiliser des modèles prédictifs basés sur le machine learning.
L'approche commune au développement d'applications prédictives est d'utiliser des techniques de fouille de données.
Notre tâche principale était de prédire le nombre de jours restants jusqu'au début du prochain cycle menstruel à partir de n'importe quel jour du cycle actuel. Les informations suivantes sont obtenues jusqu'au jour actuel du cycle (journaux des menstruations précédentes, informations sur le profil utilisateur, enregistrements du poids, enregistrements de température, historique des événements, événements survenus durant le cycle actuel). Toutes ces données étaient complètement anonymisées, nous n'avions pas accès aux données personnelles des utilisateurs.
Avec toutes ces informations en place, nous pourrions calculer la prochaine date de début des menstruations en utilisant la formule suivante : date actuelle + jours restants prédits.
Examinez de plus près notre approche :

Notre équipe a pris les données brutes, a extrait quelques caractéristiques numériques. Ensuite, nous avons utilisé ces caractéristiques et l'objectif calculé (le nombre de jours restants avant le début du cycle) pour entraîner un modèle capable de prédire le même objectif, mais pour les nouveaux utilisateurs.
Notre équipe a choisi des modèles prédictifs linéaires car ils sont plus rapides à entraîner que d'autres approches d'apprentissage automatique telles que les réseaux neuronaux. De plus, les modèles linéaires nécessitent moins de RAM. Et il est beaucoup plus facile de les implémenter à la fois côté serveur et côté application.
Nous avons proposé une phase d’investigation des données. Les principaux objectifs de cette phase sont de estimer la précision atteignable par une approche d'apprentissage automatique, pour déterminer les types de données utiles pour les prédictions et sélectionner les classes de modèles pour la modélisation ultérieure.
Les résultats de la phase proposée sont :
DataSqueeze, spécialisé dans le développement d'applications de fouille de données et l'analytique prédictive, a fourni au client une solution haute capacité pour améliorer significativement la précision de l'application de suivi des cycles.
Le client a bénéficié de la coopération avec nous dans les domaines suivants :