Essayons d'expliquer en gros le problème, pour ceux que ça intéresseraient et qui n'auraient pas le temps de lire les liens volumineux donnés plus haut.
Un son correspond à une fréquence donnée. Une fréquence double donne un son dont intuitivement on dit "c'est le même", mais plus haut. Le musicien dira que c'est la même, mais une octave plus haut.
Un autre intervalle "physique" est la quinte : le passage d'une note à la note située une quinte au dessus correspond à une multiplication de la fréquence par 3/2. Là où c'est magique, c'est que
est presque égal à
, c'est à dire qu'en montant de quintes en quintes 12 fois, on se retrouve quasiment 7 octaves plus haut que la note de départ. On va donc pouvoir définir 12 notes (et seulement 12) juste avec des quintes et des octaves.
Oui mais voilà, j'ai écrit "presque" égal, et c'est ce presque qui crée tous les problèmes : il faut s'occuper de la petite différence entre 12 quintes et 7 octaves. C'est là l'objet des tempéraments : "camoufler" cette différence de manière acceptable pour l'oreille.
Pour donner deux exemples simples : la gamme pythagoricienne est construite à partir d'une note de référence et de 11 quintes parfaitement justes, la douzième, dite "quinte du loup", étant franchement fausse. Le tempérament égal, utilisé majoritairement aujourd'hui, divise l'octave en douze demi-tons égaux : toutes les octaves sont justes, mais tous les autres intervalles sont (plus ou moins) faux.
Tout ceci ne concerne que la musique occidentale, pour le reste du monde, c'est encore un autre problème...