Cours de maître : Comment générer des ensembles
de données synthétiques en utilisant des techniques d'apprentissage automatique comme la randomisation
des domaines
Masterclass: How to generate synthetic data sets using machine learning techniques like domain randomization
DESCRIPTION DU COURS DE MAÎTRE :
DESCRIPTION OF THE MASTERCLASS:
Hugo Ponte (CTO de Zumo Labs) donnera un cours de maître sur la façon de générer des ensembles de données synthétiques en utilisant des techniques d’apprentissage automatique comme la randomisation de champs. L’utilisation d’ensembles de données synthétiques est particulièrement utile pour former des modèles de vision par ordinateur pour des caméras pointées sur des personnes dont la vie privée est en jeu, par exemple, dans la cabine d’un avion. Les données synthétiques sont également utiles pour générer de grands ensembles de données détaillées couvrant des données difficiles à obtenir pour des cas spécifiques de bord. Dans le cadre du cours, Hugo parlera de la manière de combler le fameux fossé entre la simulation et la réalité et de ce que cela signifie pour l’avenir de la formation en vision par ordinateur.
Hugo Ponte (CTO of Zumo Labs) will give a masterclass on how to generate synthetic data sets using machine learning techniques like domain randomization. Utilising synthetic data sets is especially useful when training computer vision models for cameras pointed at people where privacy concerns are at issue, for example, in an airplane cabin. Synthetic data is also useful to generate large, detailed, data sets covering hard to get data for specific edge cases. As part of the class, Hugo will speak to bridging the famed sim-to-real gap and what this means for the future of computer vision training.
Ce que vous allez apprendre :
What you will learn :
De meilleures données. Les données synthétiques bénéficient d’une connaissance complète du monde simulé et produisent ainsi des données avec des étiquettes au pixel près et des annotations de vérité de terrain.
Des données sûres. Simuler des êtres humains signifie garantir le respect de la vie privée et la conformité avec l’ACFPC et la GD.
Better data. Synthetic data benefits from full state knowledge of the simulated world and thus produces data with pixel-perfect labels and ground-truth annotations.
Safe data. Simulated humans means guaranteeing privacy and compliance with CCPA and GDPR.