La formule de changement de repère est
Xn = a Xa + b Ya +TX
Yn = c Xa + d Ya +TY
En effet 3 points sont nécessaires (donc 6 paramètres) pour calculer ce changement de repère.
Si il s'agissait d'une similitude, il n'y aurait que 2 paramètre (a=d et b=c au signe près).
Un point (Xa, Ya) du repère a aura pour coordonnées (Xa', Ya') dans le repère n.
Ce que l'on cherche à minimiser c'est
S=Somme((Xa'-Xn)² + (Ya'-Yn)²) pour tout point [a] correspondant à [n] et transformé en [a']
autre forme S=Somme((dist(a',n))²)
Soit, j'ai supposé que le repère avait la même origine, ce qui est évidemment une hypothèse forte (et généralement non vérifiée). Cela ne change rien à la théorie.
Il est vrai que on peut appeler "fonction" toute opération mathématique. Mais on m'a bien expliqué qu'un fonction donnait un résultat, une valeur et que c'était une hérésie d'écrire "Soit la surface S définie par la fonction f(x,y)".
Personnellement, pour la relation indiquée plus haut, je préfère le terme "formule" plutôt que le terme "fonction".
Une fonction ça a un ensemble de définition, et un ensemble d'arrivée. L'ensemble d'arrivée n'est pas du tout obligé d'être R. "La surface définie par la fonction f(x,y)" signifierais que f est une fonction à valeur dans un ensemble de surfaces paramétrées par x et y. Tu peux préférer le terme formule, cela ne me dérange pas, je te montre juste que cela se met sous la forme "minimiser somme des ||f(x_i)-y_i||²" où f varie dans un ensemble de fonctions.
Il y a lieu de préciser que la méthode des moindres carrés a pour but de calculer les 6 paramètres utiles, à la "fonction" ou "formule" de changement de repère.
Oui c'est ce que je dis : on cherche la meilleure fonction dans une classe donnée. Cette fonction est donc définie par un certain nombre de paramètres (6 ici), et identifier les paramètres ou identifier la fonction c'est exactement la même chose.
Autre point à préciser : la méthode ds moindre carrés ne dépend de rien d'autre que des éléments mesurés, quels que soient les références, repères etc. Alors que la méthode de régression qui minimise l'écart en Y dépend du système dans lequel sont précisée les coordonnées des points. Ce qui ne serait pas le cas si la valeur que l'on cherche à minimiser était la distance à la droite.
Je pense que c'est exact.
La moyenne arithmétique est la base de toute la théorie, le TCL l'appelle élégamment "moyenne empirique".
Sauf qu'elle n'apparaît toujours pas dans ta présentation du problème.
Donc dans ta première définition où tu disais :
Soit des mesures d'une même chose. Le terme "mesure" est à prendre dans le sens le plus général ainsi que le terme "chose".
Il y des mesures en sur-nombre, la préoccupation est de calculer le résultat le plus probable.
On démontre (de façon parfaitement rigoureuse) que le résultat le plus probable est celui qui minimise la somme des carrés des écarts entre la moyenne arithmétique et chacune des mesures.
il me semble bien que tu t'étais mélangé les pinceaux puisque tu parle d'écart entre des mesures et leur moyenne, et non entre les "prédictions" et les valeurs effectives, où les "prédictions" sont les f(x) avec mes notations générales, et les a' avec les notations de ton dernier message ; et les valeurs effectives les y de mes notations, et les n de tes notations.
Pour revenir avec le lien avec le TCL (que je n'oublie pas) : il n'y en a pas dans la
formulation du problème des moindres carrés. Et il n'est pas du tout évident d'en faire apparaître un dans un cadre général pour l'
interprétation du résultat obtenu. En particulier affirmer que l'estimateur des moindres carrés fournit le "résultat le plus probable" nécessite des hypothèses supplémentaires (typiquement des hypothèses de normalité et d'hétérodascité du bruit).
Et finalement la phrase "le résultat le plus probable" nécessite une définition pas évidente du tout à donner. En effet cela signifie d'avoir défini une probabilité sur l'ensemble des résultats possible... En fait il faudrait plutôt dire le résultat le plus "vraisemblable" c'est à dire que c'est avec ce changement de repère là (pour garder le dernier exemple) qu'on avait le plus de chance d'obtenir le résultat qu'on a en pratique. Mais pour ça il faut avoir modélisé les erreurs...
Exemple :
On fait l'hypothèse que
Xn,i = a Xa,i + b Ya,i +TX + ex,i
Yn,i = c Xa,i + d Ya,i +TY + ey,i
où ex et ey sont des variables aléatoires. Et c'est sur elle qu'on fait des hypothèses. Pour simplifier revenons en dimension 1, avec Y la nouvelle variable :
Y = a X +b + e
a et b sont les coefficients à déterminer, e est une variable aléatoire. En fait on considère la collections des données à disposition :
Yi = a Xi +b + ei
où
- ei sont iid
- ei est supposée être normale
alors les a et b optimaux du problème de moindre carré seron aussi ceux tel que les réalisations dont on dispose soit le plus probable possible. Et cela ne vient pas du TCL mais des propriétés de la loi normale. Après si les erreurs sont le résultat d'une somme d'erreurs individuelles indépendantes, alors il s'agit d'une loi normale (grâce au TCL).
Je ne suis pas sûr d'avoir été limpide sur le sujet, mais je veux juste te montrer que la phrase "résultat le plus probable" n'a pas de sens sans hypothèses de modélisation supplémentaires. Cela n'empêche pas d'utiliser les moindres carrés pour obtenir une "bonne" valeur des paramètres sans entrer plus avant dans l'interprétation.
Merci de répondre aux questions posées, ce sont des indications pour vous aider à résoudre vos exercices.