Laboratoire

Paul Painlevé


Laboratoire de Mathématiques

Présentation Equipes Séminaires Congrès Annuaire Liens Secrétariat/Formulaires Webmail (Sogo/Horde)
 
Colloquium
Colloquium
Séminaires
Analyse Fonctionnelle
Analyse Géométrique
Analyse numérique - Equations aux dérivées partielles
Arithmétique
Doctorants/Post-Doctorants
Formes automorphes
Géométrie Algébrique
Géométrie Dynamique
Histoire des mathématiques
Physique Mathématique
Probabilités et Statistiques
Singularités et Applications
Théorie de Galois Différentielle
Topologie
Groupes de travail
Analyse harmonique et théorie analytique
Champs
Déformations des singularités de surfaces
EDP, aléatoire, particules
Equations aux dérivées partielles
Extraction du signal
Formes automorphes et applications
Géométrie Stochastique
Leçons d'analyse
Sélection de modèle
Théorie de Galois et méthodes explicites
Topologie
Transports et Sécurité Routière
Probabilités

Probabilités et Statistiques

Le mercredi à 10h30 - Salle séminaire M3-324
Responsables : Antoine AYACHE  
Viet Chi TRAN  

1) Christine Tuleau, 2) D. Varron (1. Orsay , 2. Louvain (Belgique))
Session de deux exposés:
Mercredi 01 mars 2006 - 10h00 - Salle Kampé de Fériet - M2
Résumé :
1. "La sélection de variables : théorie et méthodologie"

La sélection de variables consiste à extraire, parmi toute l'information disponible, celle capable d'expliquer le phénomène étudié. Plus précisément, étant donné un échantillon d'apprentissage $\mathcal{L}=\{(X_1,Y_1),\ldots,(X_n,Y_n)\}$ où $Y_i$ est la réponse associé à l'essai $i$ et $X_i=(X_i^1,\ldots,X_i^p)$ le vecteur des $p$ variables explicatives, on cherche à déterminer, au regard des données, les variables permettant d'expliquer la réponse.
En général, on cherche, de plus, à déterminer le plus petit paquet possible, notamment si l'on considère des problèmes industriels.
En ce qui concerne la nature des variables explicatives, elles peuvent soit être réelles, soit être de type fonctionnel. Selon la nature de ces variables, le traitement du problème de sélection de variables est différent.
Dans le cadre des variables explicatives réelles ($\forall j \in \{1,\ldots,p\}, X_i^j \in \mathbb{R}$), la procédure de sélection de variables proposée traite le cas de la classification binaire et de la régression. Il s'agit d'une procédure exhaustive (qui prend en compte l'ensemble des $2^p$ paquets de variables explicatives) et théorique qui utilise l'algorithme CART et recourt à la théorie de la sélection de modèles, ce qui conduit à l'obtention d'inégalité dite ``oracle'' et surtout permet de mettre en \oeuvre une sélection de variables par pénalisation d'un contraste empirique.
Un travail sur simulations illustre cette méthode et montre qu'une procédure ne prenant en considération qu'une petite famille de paquets de variables conduit à une procédure plus appliquée et tout aussi performante.
En ce qui concerne le cadre des variables de type fonctionnel, la sélection de variables proposée s'opère selon une méthodologie divisée en trois grandes phases que sont : le prétraitement des données, la compression par ondelettes et la sélection. Ce dernier point met en \oeuvre l'algorithme CART, l'importance des variables ainsi qu'une stratégie pas à pas.
Cette méthodologie a été proposée dans le cadre d'un travail de type ``industriel'' réalisé en partenariat avec la Direction de la Recherche de Renault.

2. "Lois limites fonctionnelles d'Erdös-Rényi pour les accroissements de la f.d.r empirique composée"

La fonction de répartition empirique composée est la f.d.r empirique, dont les sauts ne sont pas égaux à 1/n, mais son des variables aléatoires, non necessairement indépendantes de l'échantillon. Les accroissements des cette f.d.r composée sont naturelement liés à l'estimation nonparamétriqe de la régression (Noyau, M-estimation locale,
Ondelettes). Nous présentons ici une loi limite fonctionelle que nous qualifions de "loi d'Erdös-Rényi". En effet, notre résultat présente beaucoup de similarités avec la lois des grands nombres d'"Erdös-Rényi" et ses extensions fonctionnelles (Deheuvels, Borobkov, Lynch et Sethuraman).
Les conditions sur les queues de distributions des "sauts" de nos processus jouent un rôle crucial, car ils déterminene en quelque sorte le cadre topologique dans lequel nos résultats ont lieu.
Les outils principaux necessaire à l'établissement de notre résultat sont:
-les principes de grandes déviations pour les processus stochastisques
-les inégalités "exponentielles" via l'utilisation de la fonction de
Cramér-Chernoff
(Travail en collaboration avec Myriam Maumy, université Louis Pasteur,
Strasbourg.)
Retour

CNRS

U.M.R. CNRS 8524
U.F.R. de Mathématiques
59 655 Villeneuve d'Ascq Cédex
Tél : +33 (0)3 20 43 48 50 - Fax : +33 (0)3 20 43 43 02

USTL
B 2 R M
Fédération de Recherche Mathématique
du Nord Pas de Calais
Copyright © (2004) UMR CNRS 8524