Dernièrement, la 3D pose estimation a pris une place particulière dans la communauté de computer vision. Le potentiel de cette technologie pour répondre à la demande actuelle du marché et générer des profits est énorme. Divertissement et les médias, la surveillance, la santé et le sport sont les quatre principaux secteurs où l'estimation de la pose humaine en 3D peut briller. Concentrons-nous sur la façon dont cette technologie est révolutionnant l’industrie du sport aujourd’hui.
Meilleurs cas d'usage de la technologie d'estimation de pose 3D dans le sport
Prévention des blessures pendant les séances de yoga et de pilates
Le Pilates et le yoga gagnent en popularité, car ils répondent au besoin croissant de restructuration mentale et de bien-être. De nos jours, de nombreuses personnes se tournent vers des cours virtuels sur Zoom pour rester sur la voie du bien-être. Et il est sûr de dire que l'engouement autour du yoga a commencé bien avant l'apparition du coronavirus. Selon l'étude réalisée par Yoga Alliance et les rapports de Yoga Journal, le pourcentage d'Américains pratiquant le yoga a augmenté de 50 % pour dépasser 36 millions en 2016.
Le pilates et le yoga sont assez faciles à faire à la maison avec l'aide d'applications sportives pilotées par IA. Les applications basées sur l'estimation de poses en 3D peuvent facilement remplacer les entraîneurs de fitness humains. Elles utilisent une richesse de données de suivi des mouvements provenant de millions d'ensembles de données pour analyser chaque mouvement de l'utilisateur et lui fournir des retours détaillés en direct. Ce type de 'collaboration' avec un coach virtuel aide le yogi à prévenir les blessures lorsqu'il fait des poses avancées de yoga.

Source : Unsplash
Estimer la qualité des éléments du patinage artistique
Estimation de pose peut être utilisé pour évaluer la qualité des éléments de patinage. L'application technologique est double. D'abord, elle fournit des méthodes robustes pour l'évaluation de la qualité des actions dans les vidéos. Il existe de nombreuses approches pour faire fonctionner cela. Par exemple, des modèles de régression peuvent être formés à partir de différentes poses jusqu'au système du Code des Points utilisé pour évaluer le patinage artistique. Ces avancées technologiques ont le pouvoir d'aider les juges à comprendre comment les participants performent.
Deuxièmement, la technologie peut également aider les performeurs en leur fournissant des retours détaillés sur la manière dont ils peuvent améliorer leurs sauts, pirouettes, levées, rotations et autres mouvements. Par exemple, un sportif peut pratiquer des pirouettes debout devant une caméra et obtenir une note honnête en temps réel. Les retours fournis encouragent les sportifs à perfectionner leurs techniques et à obtenir de meilleurs résultats à l'avenir.

Source : Upi.com
Amélioration des coups de pied au football
Quand il s’agit du domaine de la performance, les footballeurs et entraîneurs veulent savoir ce qui fait un footballeur légendaire et comment réaliser les coups francs parfaits. Et c’est là que la technologie devient utile. Celle-ci aide à suivre et estimer diverses poses 3D du joueur même si la vidéo est floue par le mouvement ou de mauvaise résolution. D’autres difficultés comme les occlusions, le mauvais éclairage, un corps humain très articulé et certaines parties difficiles à détecter (lors du croisement des jambes) ne peuvent toutefois pas altérer l’estimation globale.
En marquant un coup franc ou un coup de pied en touche devant la caméra, le joueur de football reçoit des retours en direct qui l'aident à faire les bons mouvements. En utilisant judicieusement l'estimation de posture 3D, les footballeurs ont la possibilité de perfectionner leurs techniques et de surpasser leurs concurrents.

Source : Unsplash
Analyse des sauts de haute hauteur simplifiée
Les sauts de haute hauteur ont été inventés en Écosse au début du 19e siècle. Le temps passe, mais c'est toujours l'un des sports les plus populaires au monde. L'analyse des sauts gagne également du terrain. Des centaines d'applications utilisant la technologie d'estimation de pose 3D et de capture de mouvement inondent désormais le marché. Elles peuvent capturer et estimer différents types de sauts, des sauts en chute et des squats aux sauts en contre-mouvement.

Source : Unsplash
L'approche existante permet une estimation rapide et précise de la posture et un suivi lors des sessions de saut. En termes d'analyse, le sportif peut bénéficier de la technologie de la manière suivante :
- Vérification de la coordination et diagnostic global des performances
- Retour en temps réel sur la technique de saut
- Prévention des blessures
- Entraînement à l'endurance
Approches pour la mise en œuvre
Estimation de pose multi-vue
L'estimation de pose multi-vue est un mélange de vision par ordinateur et le Deep-learning. De nos jours, c'est la meilleure méthode pour exploiter les annotations ground truth pour l'estimation de pose 3D. Comparée aux approches visual-inertial et à capture de mouvement par markers, la technique multi-view arrive en tête. Étant donné que les installations multi-caméras sont désormais disponibles dans la plupart des applications sportives ou de vie assistée, la triangulation multi-view peut être utilisée pour suivre directement la pose humaine en temps réel.
Il existe deux approches pour implémenter l'estimation de pose 3D – l'approche classique et l'approche basée sur le deep learning. La classique utilise des algorithmes et méthodes plus simples comme la géométrie épipolaire. Les approches basées sur le deep learning utilisent des réseaux neuronaux profonds. L'une des approches prometteuses est la suivante :
Pour commencer, des méthodes de triangulation en computer vision sont utilisées. Ensuite, le deep learning intervient pour améliorer les résultats actuels. Puis, le réseau end-to-end est entraîné. Pour inférer une pose 3D à partir des coordonnées 2D des articulations, une approche multi-étapes est employée. Pour obtenir des heatmaps des articulations 3D, les images de toutes les vues sont passées dans le backbone convolutional neural network. Les positions maximales dans les heatmaps sont utilisées pour inférer la pose 3D dans l’espace de pose prior. Ensuite, elle est reprojetée dans les vues caméra. Puis elle est réévaluée à partir de la heatmap des maxima, et le processus se répète. Cela permet de corriger les prédictions via la pose humaine réelle.
Estimation de la pose 3D à vue unique via Deep Learning
L'estimation de la pose 3D à vue unique basée sur le deep learning peut être divisée en deux sous-catégories. La première catégorie implique l'utilisation de moteurs d'estimation de pose 2D de haute qualité avec la levée simultanée des coordonnées 2D en 3D via des réseaux neuronaux. Cette approche est plus facile à mettre en œuvre que la seconde. Elle est rapide et peut être entraînée en utilisant des données de capture de mouvement. La seconde infère les coordonnées 3D directement à partir des images à l'aide de réseaux neuronaux convolutifs.
Dernières réflexions
L'estimation de pose 3D est l'une des tâches les plus intéressantes et les plus complexes en vision par ordinateur. Aujourd'hui, la technologie offre une multitude d'opportunités pour répondre à la demande croissante de l'industrie du sport. Elle aide les sportifs à améliorer leurs techniques, à éviter les blessures et à renforcer leur endurance. Et à l'avenir, elle pourra apporter encore bien plus.
Commencez votre Projet de Vision par ordinateur avec DataSqueeze !
Vous avez une excellente idée mais ne savez pas comment la mettre en œuvre ? Contactez-nous à info@datasqueeze.fr. Nous serions ravis de discuter des opportunités de coopération.


