A la fin du 19ème siècle, on remarque que les équations de Maxwell, qui semblaient être si bien vérifiées, ne sont pas invariantes par changement de référentiel galiléen. Les théoriciens se heurtent alors à un problème : Soit la théorie de Maxwell est fausse. Soit il faut rendre la mécanique classique et la théorie de Maxwell de l'électromagnétisme compatibles, en faisant appel à des concepts qui n'ont par ailleurs aucune raison d'être. Soit les postulats de la mécanique classique sont faux.
La première hypothèse paraissait improbable au vu des nombreux succès de la théorie de Maxwell, notamment à travers les expériences de Hertz.
La seconde voie conduisit à la création de l'Ether, référentiel privilégié, le seul où les équations de Maxwell sont strictement vérifiées. L'étude des aberrations dans les images des étoiles montra que la terre se déplaçait par rapport à l'ether alors que l'expérience de Michelson et Morley montra que ce n'était pas le cas. Cette hypothèse était donc également invalide.
Lorentz et Poincaré vont alors s'aventurer dans la troisième voie, jusqu'à présent inimaginée, la reformulation des équations des changements de référentiels conservant la validité des équations de Maxwell.
L'addition des vitesses en mécanique classique se fait instinctivement.
Cependant, pour conserver la validité des équations de Maxwell, il faut revoir nos méthodes de calcul.
En effet, Lorentz a montré que lorsqu'un référentiel (R') se déplace par rapport à un référentiel (R) avec une vitesse v parallèle à l'axe (Ox), les nouvelles coordonnées sont données par la formule ci-contre
(cliquez sur l'image pour la voir en bonne qualité).
Tout d'abord, on peut constater que pour les petites valeurs de v, c'est à dire Bêta proche de 0 et Gamma proche de 1, on retrouve les résultats de la mécanique classique.
On voit par ailleurs que, nécessairement, v est inférieure à c. Ceci va conduire à un des postulat de base de la relativité restreinte : tout signal se déplace à une vitesse inférieure à celle de la lumière.
Considérons un objet AB de longueur L, immobile dans le référentiel (R). Dans un référentiel (R') en mouvement parallèle à AB, on constate aisément d'après les formules donnant la transformation de Lorentz, que la longueur de l'objet est désormais Gamma fois L. On traduit ceci en disant que L est la longueur propre de l'objet (longueur mesurée dans le référentiel où l'objet est au repos), et que la longueur mesurée dans tout autre référentiel lui est inférieure.
Considérons maintenant une horloge fixe dans le référentiel (R') et se déplaçant dans le référentiel (R). La transformation de Lorentz montre que le temps entre deux instants dans (R) est Gamma fois inférieur au temps mesuré dans (R'). On traduit ceci en disant que le temps mesuré dans (R') est le temps propre de l'objet (temps mesuré dans le référentiel où la particule est au repos), et que le temps mesuré dans tout autre référentiel lui est supérieur.
Considérons deux jumeaux. Plaçons l'un d'entre eux dans un vaisseau spatial et faisons s'éloigner à vitesse constante de son frère, resté sur terre. Le temps se déroulant sur terre va donc sembler inférieur à celui se déroulant dans le vaisseau puisque celui se déplace par rapport à la terre. Le premier jumeau doit donc être plus vieux que le second.
Regardons maintenant la scène du vaisseau spatial : le second jumeau s'éloigne du vaisseau avec la terre, à vitesse constante, et le temps va donc se dérouler plus vite. Le premier jumeau doit donc être plus jeune que le second, ce qui est contradictoire.
Ce problème illustre bien le fait que la Relativité nous conduit à confondre entre les différents temps. En effet, comme on l'a vu plus haut, le temps mesuré entre deux événements diffère suivant le référentiel. Mais ici, le problème est encore plus profond. En fait, lorsqu'on se met à la place du premier jumeau, on ne peut pas étudier le problème dans un unique référentiel galiléen puisque le jumeau va forcément finir par faire demi-tour. L'ajout du temps mesuré pendant le trajet aller et de celui pendant le retour n'a donc en fait aucun sens puisque ces deux valeurs correspondent à des référentiels galiléens différents.
Dans sa Théorie de la Relativité Restreinte en 1905, Einstein introduit le postulat principal, l'invariance de la vitesse de la lumière par rapport au référentiel.
Cette notion apparaît claire maintenant que nous connaissons les transformations de Lorentz mais a été très difficile à accepter pour les scientifiques de l'époque.
Par contre, cela a permis de formaliser les lois mécaniques pour les systèmes sans masses de la même façon que pour les systèmes massifs. Les équations ci-contre donnent les impulsions et énergies d'une particule quelconque. Ces valeurs dépendent bien entendu du référentiel choisi. On peut remarquer que la formule donnant l'impulsion peut conduire à considérer que la masse d'une particule est en fait Gamma fois la masse au repos et qu'elle augmente donc avec la vitesse.
Les calculs en relativité apparaissent très compliqués. Pour faciliter leur tâche, les scientifiques se sont attachés à définir des vecteurs se transformant comme le vecteur position lors d'un changement de référentiel, ce sont des Quadrivecteurs. Plus précisément, le quadrivecteur espace-temps est (x,y,z,ct). La transformation de Lorentz revient alors à multiplier par une matrice T. N'importe quel quadrivecteur V se transformera par changement de référentiel associé à la matrice T, en le quadrivecteur V'=TV.
Si on définit le produit scalaire comme ci-dessus, on peut remarquer que T est unitaire pour la norme associée, c'est à dire que la norme d'un quadrivecteur est indépendante du référentiel.
Les scientifiques se sont donc attachés à trouver pour chaque quantité classique, un quadrivecteur qui en soit proche et qui permette des calculs plus simples. Une liste non-exhaustive se trouve ci-dessus. Enfin, pour pouvoir écrire toutes les équations qui leurs étaient nécessaires, avec ce formalisme, ils ont également introduit la quadrinabla définie ci-dessous.
A noter également que selon la terminologie utilisée, la coordonnée x4 est parfois placée en 1ère position et est alors notée x0.
En mécanique classique, deux événement sont dits simultanés s'il se produisent au même instant. Cette notion doit être revue en relativité car les temps ne se déroulant pas à la même vitesse dans tous les référentiels, la simultanéité perd son sens.
Pour résoudre ce problème, on introduit la notion d'intervalle entre deux points de l'espace-temps comme étant la norme du quadri-vecteurs reliant ces deux points. Cette norme étant invariante par changement de référentiel, l'intervalle de temps permet une mesure sûre de la distance entre deux points. On dit alors que deux événements sont simultanés s'ils se produisent en deux points entre lesquels l'intervalle est nul.
On peut remarquer que deux événements sont simultanés lorsque la lumière peut parcourir la distance les séparant dans un référentiel pendant exactement le temps les séparant dans ce référentiel. L'intervalle est alors dit de genre "lumière". Lorsque l'intervalle est négatif, la lumière parcourt cette distance avant que la différence des temps ne soit écoulée. La différence de temps est donc trop grande. On dit alors que l'intervalle est du genre "temps". Si l'intervalle est positif, la distance est trop importante pour que la lumière ne puisse relier les deux points. L'intervalle est alors du genre "espace".
Après avoir modifié la théorie de la mécanique pour satisfaire les exigences de l'électromagnétisme de
Maxwell, il convient de regarder comment on peut désormais ce formaliser le tout.
L'équation de conservation de la charge se transforme très simplement grâce aux quadrivecteurs nabla et densité de courant introduits précédemment.
Les équations de Maxwell peuvent être résumées en une seule relation.
Enfin, les vecteurs champs électriques et magnétiques ne pouvant être regroupés dans un même quadrivecteurs, on les place dans une matrice 4x4 souvent notée F et que l'on multiplie à gauche et à droite par la matrice T de la transformation de Lorentz, pour obtenir les champs dans un autre référentiel.
Par ailleurs, on peut signaler que le produit scalaire (classique) des deux champs électromagnétiques est invariant par les transformations de Lorentz, tout comme la quantité E²+B²/c².
Cependant, nous ne développerons pas ici plus en avant, l'électromagnétisme relativiste car cela nécessiterait l'introduction du formalisme tensoriel.
La mécanique classique prévoit une modification de la longueur d'onde d'un signal lorsque celui-ci est observé dans un référentiel se déplaçant parallèlement au signal.
La relativité va plus loin en prouvant que la longueur d'onde est également modifiée si l'observateur se déplace orthogonalement à ce signal. Par ailleurs, l'effet Doppler peut également s'appliquer aux rayons lumineux puisque la vitesse de la lumière est invariante par changement de référentiel.
Si une onde vient d'un point faisant un angle Alpha avec le vecteur vitesse d'un observateur, la longueur vue par cet observateur est donnée en fonction de l'originale par la relation ci-contre. On retrouve donc le fameux décalage vers le rouge observé dans le spectre des galaxies, en raison de l'expansion de l'univers.