Vous êtes ici : Accueil / Recherche / Thèses / Resume / VRAC

VRAC

Mathieu Vrac

ANALYSE ET MODELISATION DE DONNEES PROBABILISTES PAR DECOMPOSITION DE MELANGE DE
COPULES ET APPLICATION A UNE BASE DE DONNES CLIMATOLOGIQUES

le vendredi 6 décembre 2002 à 15H30
dans la salle D 520 des thèses de l'Université Paris IX Dauphine

sous la direction de M Alain Chédin et M Edwin Diday

devant le jury composé de

Mme Lynne Billard     ---------------> Rapporteur
M Gérard Govaert      ---------------> Rapporteur
M Gérard Mégie        ---------------> Examinateur
M Georges Oppenheim   ---------------> Examinateur
M Gilbert Saporta     ---------------> Examinateur
M Berthold Schweizer  ---------------> Rapporteur
M Fabrice Rossi       ---------------> Examinateur


---------------------------------------------------------------------------

RESUME:

Nous étendons les méthodes de décomposition de mélange de densités de
probabilité au cas des données "fonctions de repartition", permettant ainsi de
classifier ces fonctions et de modéliser une loi pour ces données fonctionnelles
particulières.

Cette loi est donnée par la notion de "fonctions de distribution de
distributions" (FDD), basée sur la définition d'une fonction de répartition pour
des variables aléatoires à valeurs dans un espace probabiliste.

Les extensions sont effectuées en associant les FDD aux fonctions "copules" par
le théorème de Sklar. Les copules "couplent" les fonctions de répartition à n
dimensions (jointes) et à 1-dimension (marginales) d'un n-uplet de variables
aléatoires. Nous regardons principalement une classe de copules paramétriques,
les copules Archimédiennes, et proposons trois nouvelles méthodes d'estimation
des paramètres dans le cas de copules multivariés : par coefficients de
corrélation de Kendall, ou de Spearman, et par maximisation de la vraisemblance.

L'association des FDD et des copules caractérise l'évolution des données
fonctionnelles (i.e. la forme de ces fonctions) entre différents points à
l'intérieur des classes pour chaque variable, et donne une mesure de dépendance
entre les variables utilisées.

Les méthodes sont tout d'abord développées pour une variable, puis diverses
généralisations sont proposées pour n dimensions. Certains points théoriques
sont ensuite discutés, tels que la convergence de l'algorithme et le fait que la
méthode par copules est une généralisation du cas classique.

Une application de la méthode "approche classification" par copules est réalisée
sur des données climatiques de l'atmosphère terrestre. Le but est la
classification de "profils" atmosphériques verticaux (température, humidité) et
l'estimation de la loi sous-jacente des données. Les résultats sont comparés
avec ceux de méthodes de classification "classiques", prouvant ainsi les
performances nettement supérieures de la méthode par décomposition de
mélange de copules (DMC) et l'intéret de l'utilisation des données
probabilistes.
Recherche