Bonjour,
je donne une définition mathématique assez générale du problème de regression.
Soit un ensemble de couples
, où chaque
est élément de
(ce qui signifie que chaque x_i est en fait un ensemble de n valeurs réelles), et chaque
est élément de
.
Moralement le problème de régression consiste à trouver, dans une classe de fonction donnée, la fonction f qui représente le mieux le lien entre x_i et y_i.
Pour cela il faut définir :
- la classe de fonction F dans laquelle on cherche notre relation
- ce que signifie "représenter le mieux"
Représenter le mieux en maths cela signifie minimiser une distance. Ici on parle donc de minimiser la distance entre les différentes prédictions
. Le problème s'écrit donc
où f(X)=(f(x_1),...,f(x_N)) et Y= (y_1,...,y_N).
Supposons pour simplifier que m=1, c'est à dire que les f(x_i) et les y_i sont des réels. Dans ce cas l'un des choix les plus classiques de distance sur R^N sera celle issue de la norme 2 :
Ainsi le problème sera le fameux problème des moindres carrés. On peut aussi considérer d'autres distances issues de normes :
Reste un point important : ici la variable sur laquelle on minimise est une fonction, soit a priori un truc qui vit dans un espace de dimension infini. Si on ne mets pas de contraintes fortes sur ces fonctions il est facile de trouver une fonction (même continue ou C^\infty) qui donne une distance nulle. Quasi-systématiquement on souhaite que la fonction f puisse être paramétrée par un nombre fini de paramètres. Dans un autre fil Dlzlogic a donné un certain nombre d'exemples de classe de fonctions. J'en rappelle une ou deux (par simplicité je suppose aussi que n=1) ici pour être complet :
Ensemble des fonctions linéaires :
Fonction polynomiale de degré donné (par exemple 3)
Fonction puissance
etc...
Ainsi la minimisation de
devient une minimisation sur un nombre fini de paramètres. On peut donc appliquer des algo de minimisation classique (avec un peu de chance la distance choisie est convexe et différentiable et on peut appliquer une méthode de Gradient ou de Newton). Si la norme est la norme 2 et que l'on prends pour F les fonction linéaires on a des formules explicites.
Le choix de la classe de fonction F ne relève pas vraiment des mathématiques. Il doit être guidé par :
- la connaissance de la physique du phénomène étudié
- une obvservation globale du phénomène
- éventuellement une comparaison de différentes classes de fonctions. Dans ce cas il faut faire attention à ne pas mettre trop de paramètres par rapport au nombre de données. En effet, pour les polynomes par exemple, il y a toujours un polynome de degré n qui passe exactement par n points, par contre son comportement n'est pas forcément un qui représente bien le lien entre les x et les y.
P.S : si des choses ne sont pas claires je modifirais le message, et si des gens conteste le framework je donnerais un lien ou deux.
Merci de répondre aux questions posées, ce sont des indications pour vous aider à résoudre vos exercices.