Project

General

Profile

Objectifs du projet

L'objectif principal du projet consiste à développer, pour la communauté des scientifiques en Sciences de la Terre et de l’Univers, de nouvelles techniques d’analyse des grandes masses de données issues des campagnes d’observation terrestres ou satellitaires. Ces données sont caractérisées à la fois par leurs grandes tailles et leurs imperfections (données bruitées, incohérentes, incomplètes, biaisées) dues aux erreurs de transmission et aux défaillances matérielles des instruments de mesure. Une analyse efficace de ces données doit satisfaire deux contraintes majeures : (i) elle doit se faire le plus rapidement possible et (ii) les résultats doivent être pertinents du point de vue des experts en Sciences de la Terre et de l’Univers et les plus exacts possibles malgré la qualité très inégale des données disponibles. Pour atteindre le premier objectif, plusieurs approches doivent être combinées : le calcul parallèle, la construction de résumés, l’utilisation d’algorithmes approximatifs, la réduction des dimensions et la prise en compte des caractéristiques distributionnelles des données. Il faut concevoir des interfaces intuitives facilitant la compréhension des résultats ainsi que l’interaction avec les experts. A ce titre, l’implication de spécialistes de la visualisation de l’information est primordiale. Par ailleurs, chaque processus d’analyse des données pour répondre à des grandes questions scientifiques (par exemple, la découverte d’une nouvelle planète, l’explication des changements climatique) correspond à une succession d’opérations pouvant être décrite sous la forme d’un workflow dont il est essentiel de garder la trace de chaque étape expérimentale à des fins d’optimisation, de recommandation et de répétabilité.

La diversité et la complémentarité des différents partenaires constituent une des originalités du projet. En effet, cette diversité permet d’aborder toute la boucle d’exploration des données :