Project

General

Profile

Quelques notions

Le système climatique

Le système climatique est un système thermodynamique alimenté par le rayonnement solaire incident au sommet de l'atmosphère. Le système est en équilibre radiatif sur le long terme du fait de l'émission du rayonnement tellurique infra-rouge équivalent en intensité au rayonnement solaire absorbé par le système. Au-delà de cet équilibre à long-terme (actuellement mis à mal par l'augmentation très rapide de la concentration atmosphérique des gaz à effet de serre liée aux activités anthropiques). La variabilité climatique en général concerne toute forme de variation autour de la valeur moyenne. On distingue en général deux causes possibles : (1) les causes "externes" au système climatique, c'est-à-dire les éléments qui modifient de façon unilatérale le bilan énergétique (l'énergie qui nous parvient depuis le soleil n'est par exemple pas constante dans le temps) et (2) les causes "internes", c'est-à-dire l'ensemble des rétroactions au sein du système climatique. Un exemple de cause "interne" est par exemple le phénomène couplé El Nino Southern Oscillation (ENSO) qui influence de nombreuses anomalies dans le monde en particulier dans la zone tropicale. Un important volet des recherches actuelles concernent la caractérisation de la variabilité climatique spatio-temporelle, sa compréhension et sa prévision. Ces objectifs reposent en premier lieu sur les données d'observation et les simulations numériques du climat. Il y a enfin des données hybrides où on assimile des données observées dans un modèle numérique de telle sorte que les données constituent un rappel du modèle vers la situation réellement observée. Ces données hybrides s'appellent les réanalyses. Il en existe principalement deux; celles produites par l'ECMWF européen et celles produites par le NCEP américain. Des réanalyses ont été aussi réalisées par une équipe japonaise. Dans le cas des données réanalysées ou même dans celui des simulations numériques, les données observées restent cruciales pour valider (ou pas) la climatologie actuelle produite par ces simulations.

La prévision climatique vs prévision météorologique

La prévision climatique est de nature différente de la prévision météorologique. Dans ce dernier cas, la contrainte majeure est la connaissance des conditions initiales car on sait que l'atmosphère a un comportement chaotique ce qui interdit toute prévision déterministe. On fixe la limite théorique à une quinzaine de jours et on est encore très loin d'un résultat fiable à cette échéance. Par exemple, la figure 1 Figure 1

présente la prévision de 3 altitudes du niveau 500 hPa (~ 1/2 de la masse atmosphérique) à t+24h depuis samedi 24/11/2012 à 00h TU. Les 3 niveaux donnent une idée de la position des crêtes chaudes (par exemple sur l'ouest de l'Atlantique Nord et sur l'Europe) et des vallées froides (par exemple sur le centre de l'Atlantique). Les différentes couleurs sont des intégrations numériques (20 dans ce cas) intialisées différemment le 24/11/2012. On voit que les solutions convergent très bien et la solution moyenne est donc robuste. A une échéance supérieure de t+120h (Figure 2), Figure 2

la convergence est encore assez correcte et on voit que la vallée froide s'est amplifiée et s'est décalée sur l'ouest de l'Europe avec potentiellement de fortes pluies à l'avant de cette vallée froide. Enfin à une échéance de t+216h (Figure 3), Figure 3

il n'y a plus de convergence et l'incertitude est considérable. Dans ce cas, on peut simplement dire que l'air chaud sera en moyenne au sud et l'air froid sera en moyenne au nord, c'est-à-dire ce qui correspond au contexte saisonnier et planétaire.

La prévision climatique procède d'autre chose. Là, la question posée est plutôt ; qu'elle va être la réponse moyenne de l'atmosphère (ou du couple océan-atmosphère, ou encore de l'ensemble du climat) à une contrainte aux limites (par exemple la surface océanique pour l'atmosphère ou bien la concentration atmosphérique des gaz à effet de serre pour le système climatique dans son ensemble). Cette prévision est de nature probabiliste et correspond en gros au même principe que de dire "il fera plus chaud en juillet 2035 à Marseille qu'en janvier 2035". On peut le prévoir car l'amplitude saisonnière de la contrainte du rayonnement solaire incident est nettement supérieure (et parfaitement prévisible à cette échéance) au "bruit" lié par exemple aux mouvements de l'atmosphère qui sont eux totalement imprévisibles > 15 jours. Dans ce cas, les conditions initiales n'ont aucune importance en tant que telle et ne servent finalement qu'à mesurer le degré d'incertitude de la solution finale. La simulation de la réponse du système climatique à la hausse de la concentration atmosphérique en gaz à effet de serre ou bien la prévision saisonnière des pluies/températures trimestrielles à partir des champs de température de surface océanique sont deux exercices de prévision climatique. Dans le cas de la prévision saisonnière qui nous intéresse particulièrement dans le projet, on utilise des modèles statistiques, des modèles numériques et des modèles hybrides, mais tous sont validés et/ou élaborés avec des données d'observation. Un bon point de départ pour les prévisions saisonnières est http://portal.iri.columbia.edu/portal/server.pt?open=512&objID=944&PageID=7868&mode=2&cached=false. Ces prévisions sont données usuellement en terciles par rapport à une distribution observée et concernent toujours des espaces assez vastes. Elles sont aussi incertaines de nature et la prévision courante par exemple est hyper-incertaine avec très peu de secteurs resssortant du tercile moyen. Cela est dû en grande partie du fait que la source majeure de la prévisibilité à cette échéance est l'ENSO. Or l'ENSO est actuellement en mode presque neutre (http://portal.iri.columbia.edu/portal/server.pt?open=512&objID=945&PageID=0&cached=true&mode=2&userID=2).

Le projet

Les données d'observation sont à la fois un moyen indispensable de la caractérisation de la variabilité climatique contemporaine qu'une source très imparfaite (valeurs manquantes, incertitudes multiples, brièveté, couverture spatio-temporelle très disparate et très discontinue etc.). L'objectif principal du projet est de considérer les différentes sources de données et voir comment extraire de l'information de ces bases. Cette "information" peut être par exemple une moyenne spatiale des anomalies régionales ou bien un mode de variation. Un objectif lié est de combiner une information quelconque avec un degré d'incertitude afin de qualifier cette information. Même si les méthodes peuvent être testées sur des jeux de données divers, un accent particulier portera sur les pluies tropicales, car (1) on sait qu'une partie de la variabilité saisonnière est prévisible, pas seulement du fait de l'ENSO mais parce que l'atmosphère tropicale est partiellement forcée par les gradients thermiques et d'humidité dans les basses couches et (2) le monde tropical est beaucoup plus vulnérable que le monde extratropical et encore fortement dominé par les activités agricoles. La réussite ou l'amélioration des prévisions saisonnières actuelles seraient absolument décisives. Or cela passe par une caractérisation plus fiable de la variabilité spatio-temporelle et notamment l'extraction des signaux covariants (= les plus susceptibles d'être prévus par l'ENSO par exemple) et le bruit local qui est totalement imprévisible à cette échéance.

Les données

Contexte général des données de base (stations météorologiques, postes poluviométriques, etc.)

Il existe de très nombreuses bases de données publiques dans le domaine de la climatologie. Il s'agit parfois de données qui ont été validées, alors que d'autres bases contiennent les données brutes. Toutes ces données ont en point commun d'être hétérogène dans l'espace et avoir de très nombreuses valeurs manquantes. De plus, elles sont assez brèves (les enregistrements commencent dans la plupart des cas au 20ème siècle et les réseaux de surface se dégradent nettement à partir des années 60-70 dans la majorité des pays tropicaux). Un bon point de départ des données climatiques publiques est par exemple la base de métadonnées de l'IRI (http://iridl.ldeo.columbia.edu/index.html). Une base de donnée qui donne lieu à de nombreuses publications dans le domaine de la climatologie est le fichier GHCN version 2 qui contient les données mensuelles de nombreuses stations à l'échelle globale (http://iridl.ldeo.columbia.edu/SOURCES/.NOAA/.NCDC/.GHCN/.v2beta/). Il existe aussi une version quotidienne (http://iridl.ldeo.columbia.edu/SOURCES/.NOAA/.NCDC/.GHCN_Daily/.version1/) mais qui est encore plus hétérogène dans l'espace. Vous pouvez accéder à ces données et créer des fichiers sous de nombreux formats (txt, binaire, netCDF etc.). Les deux bases de données du GHCN sont en tout cas bien représentatives du contexte actuel de la documentation permettant de calculer des moyennes régionales et/ou planétaires. Avec l'avènement des satellites (du point de vue de la climatologie, cela commence dans les années 1970 et surtout depuis 1979), des fichiers continus dans l'espace ont été réalisés comme par exemple le fichier CMAP (http://iridl.ldeo.columbia.edu/SOURCES/.NOAA/.NCEP/.CPC/.Merged_Analysis/) pour les précipitations moyennes mensuelles. Ces fichiers utilisent en plus des estimations satellitaires, des données observées (quand il y en a) mais il y a rarement une validation globale de la qualité des fichiers. Même si on peut retrouver le nombre de stations au sol par point de grille, il n'y a pas de véritable mesure de l'incertitude liée à la documentation au sol. C'est d'autant plus crucial dans la zone tropicale car les pluies sont priincipalement d'origine convective, et donc très anisotropes et très intermittentes même si cette forte variation spatiale instantanée est organisée par des phénomènes emboités de plus vaste échelle. D'autres bases de données satellitaires existent à des résolutions spatio-temporelles plus fines comme CMORPH (http://iridl.ldeo.columbia.edu/SOURCES/.NOAA/.NCEP/.CPC/.CMORPH/). Une autre base de données quotidiennes sans validation réelle est le "global summary of the day". Beaucoup de fichiers "secondaires" (par exemple en point de grille) de données au sol sont constitués à partir de cette base. Vous pouvez accéder à cette base du site NCDC (http://www.ncdc.noaa.gov/oa/gsod.html).