miércoles, 18 de marzo de 2009

Rotaciones y transformaciones

En la geometría Euclideana no-relativista en dos dimensiones, al hablar acerca de una rotación podemos estar haciéndolo en dos sentidos completamente equivalentes: la rotación de un objeto con respecto a los ejes coordenados manteniendo los ejes coordenados fijos, y la rotación de los ejes coordenados manteniendo al objeto fijo. En el primer caso, podemos suponer que tenemos un vector v0 al cual le imprimimos una rotación en sentido contrario al giro de las manecillas del reloj en un ángulo θ, situándolo en su nueva posición como el vector v’:





Para llevar a cabo matemáticamente esta operación de rotación, tomamos el vector original expresando en sus componentes rectangulares:

v0 = (x, y)

y le aplicamos un operador, específicamente, una matriz de rotación Rθ:

v’ = Rθ v0

Con mayor detalle, la matriz de rotación en este caso es una matriz 2x2 que consta de los siguientes componentes:



En el segundo caso, podemos suponer que tenemos el mismo vector v0 al cual sin moverlo del lugar en donde está le imprimimos una rotación a los ejes coordenados en los que está especificado, siendo dicha rotación también una rotación en sentido contrario al giro de las manecillas del reloj en un ángulo θ, situándolo en su nueva posición como el vector v:





Esta operación de rotación de ejes coordenados se lleva a cabo matemáticamente en forma semejante al caso anterior:

v = R’θ v0

en donde lo único que cambia es la matriz de rotación R’θ, la cual es ahora la siguiente matriz 2x2:



En realidad, para obtener la matriz de rotación R’θ, lo único que se hace es substituír el ángulo θ por el ángulo - θ en la matriz Rθ, lo cual equivale a un giro en un ángulo negativo (en sentido contrario), usando además el hecho de que sen(- θ) = - sen(θ) y cos(- θ) = cos(θ). En ambos casos, tanto Rθ como R’θ a fin de cuentas son lo mismo, una rotación de ejes.

En la teoría del Álgebra Linear, el primer caso en el cual se rota el vector manteniéndose fijos los ejes coordenados la rotación es conocida como una rotación Alibi, mientras que en el segundo caso en el cual se rotan los ejes coordenados manteniéndose fijo el vector la rotación es conocida como una rotación Alias (la figura de ejemplo muestra un vector de color rojo y de longitud igual a la unidad);





Las rotaciones que se han llevado a cabo han sido sobre un espacio bi-dimensional Euclideano en torno al tercer eje, el eje-z:





Podemos llevar a cabo, desde luego, una rotación tal que dicha rotación no esté limitada exclusivamente a un plano bi-dimensional, sino que se lleve a cabo con respecto a los tres ejes sobre ángulos α, β y γ, en cuyo caso las matrices de rotación en torno a cada eje se pueden especificar de una manera como la siguiente:



Estamos interesados ahora en extender el concepto de una rotación del espacio tri-dimensional Euclideano al espacio cuatri-dimensional relativista. Sin embargo, esto no es un asunto tan sencillo, en virtud de que mientras que la magnitud (la longitud) invariante de un vector en el espacio Euclideano está definida usando signos positivos en la adición vectorial de los componentes del vector:

V║² = Vx² + Vy² + Vz²

en la Teoría de la Relatividad el equivalente que viene siendo el intervalo relativista tiene revueltos signos negativos y positivos:

Δs² = (cΔt)² - (Δx)² - (Δy)² - (Δz)²

Esto significa que cualquier intento por aplicar las relaciones trigonométricas que definen a los ángulos a una rotación que se ha de llevar a cabo en el espacio cuatri-dimensional relativista se va a venir abajo.

¿Significa esto que no podemos definir el equivalente de una rotación en el espacio cuatri-dimensional de la Teoría de la Relatividad?

Interesantemente, esto aún es posible. Pero para lograrlo, tenemos que prescindir de la trigonometría regular y recurrir en cambio a otro tipo de funciones matemáticas que comparten muchas similitudes con las funciones e identidades de la trigonometría clásica. Nos estamos refiriendo a las funciones hiperbólicas, de las cuales podemos empezar con la primera de ellas, el seno hiperbólico definido de la siguiente manera:



Además del seno hiperbólico, tenemos la definición del coseno hiperbólico:



Con estas dos definiciones, podemos definir la tangente hiperbólica de la misma manera en la que se define en la trigonometría clásica como la razón que hay entre el seno y el coseno de un ángulo:



Con estas definiciones en nuestras manos, estamos en mejores condiciones para atacar el asunto al cual le queremos dar solución.

PROBLEMA: Demuéstrese que las ecuaciones de transformación de Lorentz que conectan a dos sistemas de referencia S y S pueden ser expresadas de la manera siguiente:

x’ = x cosh(α) - ct senh(α)

y’ = y

z’ = z

ct’ = - x senh(α) + ct cosh(α)

en donde tanh(α) = V/c. Demuéstrese que esta transformación de Lorentz corresponde a una rotación a lo largo de un ángulo α en el espacio cuatri-dimensional.

Primero que nada, empezaremos con las transformaciones de Lorentz convencionales:

x’ = γx - γVt

y’ = y

z’ = z

ct’ = γct - (γV/c) x

Puesto que el “empuje” (boost) de Lorentz se lleva a cabo aquí únicamente a lo largo del eje-x común sobre el cual hay un movimiento relativo a una velocidad V, podemos ignorar las componentes y’ y z’, lo cual equivale a afirmar que la rotación que se llevará a cabo será una rotación limitada a dos dimensiones dentro del espacio cuatri-dimensional relativista. Con un ligero reacomodo podemos escribir las dos ecuaciones relevantes de modo tal que prepararemos el sistema para su representación en forma de matriz:

x’ = γx - γVt

ct’ = - (γV/c) x + γct

Este sistema de ecuaciones, así como está escrito, se puede representar matricialmente de la siguiente manera:



Para guiarnos mejor en lo que estamos haciendo, estableceremos una analogía entre esta representación matricial en la geometría del espacio-tiempo y la representación matricial para una rotación llevada a cabo en la geometría bi-dimensional Euclideana. Ya vimos arriba que la matriz para una rotación de coordenadas efectuada en la geometría bi-dimensional Euclideana es:



Tentativamente, todo parece indicar que podemos establecer las siguientes correspondencias entre las funciones trigonométricas y las funciones hiperbólicas para reemplazarlas en el caso de una rotación llevada a cabo en el espacio 4-dimensional relativista:

cos(θ) cosh(α) γ

sen(θ) ↔ senh(α) γV/c

Si hacemos:

cosh(α) = γ

senh(α) = γV/c

Tenemos entonces las siguientes transformaciones modificadas de Lorentz:

x’ = x cosh(α) - ct senh(α)

ct’ = - x senh(α) + ct cosh(α)

Esta es la transformación que estabamos buscando, la cual puede ser puesta en forma matricial de la siguiente manera:



Geométricamente hablando, la matriz simple de Lorentz lleva a cabo una rotación de coordenadas a través de un ángulo α en el espacio 4-dimensional propio de la Teoría de la Relatividad.

El lector observador posiblemente objetará que mientras que en la geometría bi-dimensional Euclideana el término sen(θ) dentro de la matriz de rotación tiene signos diferentes, el término correspondiente senh(α) tiene el mismo signo (negativo). Ciertamente, tenemos una transformación válida, en la forma en la que la hemos definido, pero ¿cómo podemos estar tan seguros de que dicha transformación pueda ser considerada como una rotación del plano x-ct? La respuesta final dependerá del hecho de que la transformación modificada de Lorentz pueda ser capaz de respetar la longitud del intervalo relativista de la misma manera en que una rotación sobre el plano Euclideano deja intacta la longitud de un vector, lo cual confirmaremos un poco más adelante. Empezaremos por aclarar esta duda formulándonos otra pregunta:

¿Por qué razón nos fue posible llevar a cabo una rotación en el espacio 4-dimensional relativista mediante el uso de las funciones hiperbólicas senh(α) y cosh(α)? La respuesta la encontramos en el graficado de dichas funciones. Así como los puntos (cos t, sin t) trazan un círculo unitario (de radio 1), del mismo modo los puntos (cosh α, sinh α) forman la mitad derecha de una hipérbola equilátera. Haciendo:

x = cosh(a)

y = sinh(a)

y trazando este par de ecuaciones paramétricas (ambas dependientes del parámetro a) obtenemos la siguiente gráfica:





en la cual la ecuación de la hipérbola equilátera resultante está dada por la ecuación Cartesiana:

x² - y² = 1

Esta es precisamente la misma hipérbola que se vió en la entrada titulada “Invariantes”.

Comprender lo que acabamos de ver nos prepara mejor para la resolución del siguiente

PROBLEMA: Utilizando la identidad:

cosh²(α) - senh²(α) = 1

demostrar la invariancia del intervalo relativista a partir de estas ecuaciones.

El intervalo relativista entre dos puntos en un marco de referencia S, considerando que no hay movimiento relativo alguno entre los ejes Cartesianos en relación al eje-y y al eje-z, puede ser definido de la siguiente manera:

Δs² = (cΔt)² - (Δx)²

Ya hemos visto que, al pasar de un marco de referencia a otro, este intervalo relativista debe permanecer invariante bajo las ecuaciones de transformación de Lorentz. Para mayor simplicidad notacional, consideraremos un intervalo relativista tal que uno de los puntos extremos del intervalo está situado en el origen del sistema de coordenadas. Con esto, el intervalo relativista puede ser representado en forma más sencilla de la siguiente manera:

Δs² = (ct)² - (x)²

Utilizando funciones hiperbólicas para llevar a cabo geométricamente una rotación de los ejes coordenados en el espacio 4-dimensional, ya vimos arriba que las transformaciones de Lorentz para pasar de un marco de referencia S a otro marco de referencia S’ se pueden escribir de la siguiente manera:

x = x’ cosh(α) - ct’ senh(α)

ct = - x’ senh(α) + ct’ cosh(α)

Procedemos a meter directamente estas ecuaciones de transformación en la definición que tenemos del intervalo relativista:

Δs² = [- x’ senh(α) + ct’ cosh(α)]² - [x’ cosh(α) - ct’ senh(α)]²

Expandiendo y simplificando:

Δs² = (x’)² senh²(α) - 2(x’)(ct’) senh(α) cosh(α) + (ct’)² cosh²(α)
- (x’)² cosh²(α) + 2(x’)(ct’) senh(α) cosh(α) - (ct’)² senh²(α)

Δs² = [cosh²(α) - senh²(α)](ct’)² - [cosh²(α) - senh²(α) ](x’)²

Utilizamos aquí la identidad hiperbólica dada en el enunciado del problema, para obtener:

Δs² = (ct’)² - (x’)²

Δs² = Δs’²

De este modo, el intervalo relativista permanece invariante al haberse llevado a cabo la rotación geométrica de las coordenadas del 4-espacio mediante el uso de las funciones hiperbólicas.


PROBLEMA: La ley de adición de velocidades relativista tiene una forma más sencilla si recurrimos a la ayuda de la tangente hiperbólica. Si usamos la definición:

tanh(α) = V/c

demostrar que la ley de adición de velocidades puede escribirse de la siguiente manera:

V = c tanh(α1 + α2)

en donde α1 es el parámetro de velocidad asociado con una de las velocidades a ser sumada, y α2 es el parámetro de velocidad asociado a la otra velocidad. Obsérvese que, de este modo, los parámetros de velocidad se suma linealmente.

Empezando con la ley de adición de velocidades:



podemos utilizar la definición de la tangente hiperbólica para escribir lo siguiente:

V1 = c tanh(α1)

V2 = c tanh(α2)

Reemplazando estas dos igualdades en la ecuación anterior:



Simplificando:



Dada la enorme semejanza que hay entre las funciones hiperbólicas y las funciones trigonométricas, el aspecto de la ecuación que acabamos de obtener nos hace sospechar sobre la posibilidad de que haya una identidad similar a la que encontramos en la trigonometría clásica. Un búsqueda breve confirma nuestras sospechas, al encontrar la siguiente identidad hiperbólica:



cuya contraparte en la trigonometría clásica es la siguiente identidad trigonométrica:



Con esto obtenemos entonces el resultado que se deseaba demostrar:

V = c tanh(α1 + α2)

PROBLEMA: Suponiendo que dentro de un vagón de ferrocarril moviéndose a una velocidad de 200 kilómetros por segundo, o sea dos terceras partes de la velocidad de la luz, una pelota es arrojada dentro del vagón también a una velocidad de 200 mil kilómetros por segundo, ¿cuál será la velocidad de la pelota vista en tierra a un lado de las vías por un observador en reposo? Trabájese el problema con la fórmula que se acaba de obtener arriba.

Si la pelota es arrojada dentro de un vagón de ferrocarril a una velocidad V1 igual a dos terceras partes de la velocidad de la luz, o sea V1 = 2c/3, entonces el parámetro de velocidad α1 asociado con la pelota es:

tanh( α1) = V1/c

α1 = tanh-1(V1/c)

α1 = tanh-1(2/3)

α1 = 0.805

Siendo V2 = V1 = 2c/3, entonces α2 = α1, con lo cual aplicamos la fórmula:

V = c tanh(α1 + α2) = c tanh(0.805 + 0.805)

V = 0.923 c

La representación matricial de las transformaciones de Lorentz nos permite obtener otra perspectiva diferente sobre lo que se lleva a cabo con dichas transformaciones.

PROBLEMA: Desde una estrella un viajero espacial mide la velocidad de otra estrella que se está alejando a una velocidad de 0.9c. Desde la segunda estrella se mide la velocidad de otra tercera estrella que se está alejando también a 0.9c de la segunda, y así sucesivamente, hasta llegar a cierto número N de estrellas. ¿Cuál es la velocidad de la estrella N relativa a la velocidad de la primera estrella?

La resolución de este problema requiere sumar relativísticamente la velocidad de la primera estrella a la segunda, y tras esto la velocidad de la segunda estrella a la tercera, y así sucesivamente, hasta llegar a la estrella N. Utilizando la fórmula convencional para adición relativista de velocidades el problema se vuelve laborioso. Pero si en lugar de utilizar la fórmula convencional utilizamos la fórmula relativista dada en función de parámetros de velocidad, entonces el problema se reduce a la suma linear de los parámetros de velocidad:

V = c tanh(α1 + α2 + α3 + ... + αn)

Puesto que las velocidades relativas de recesión son iguales (0.9c), entonces los parámetros de velocidad también son iguales:

α1 = α2 = α3 = ... = αn = α

con lo cual:

V = c tanh(Nα)

Pero cada parámetro de velocidad está dado individualmente por:

α = tanh-1(V/c)

Entonces la relación que buscamos resulta ser la siguiente:

V = c tanh[N tanh-1(V/c)]

El intervalo relativista, en su forma más general admitiendo la posibilidad de que pueda haber movimientos relativos entre los cuatro ejes coordenados del sistema de referencia S y del sistema de referencia S’, puede ser definido como:

Δs² = (cΔt)² - (Δx)² - (Δy)² - (Δz)²

tiene a su vez la siguiente representación matricial:



La matriz intermedia representa los 16 componentes de ese objeto que anteriormente ya habíamos dicho que se conoce como el tensor métrico, en este caso el que corresponde a un espacio-tiempo plano (Lorentziano).

Para la derivación que vamos a llevar a cabo, escogemos un intervalo relativista tal que un extremo del mismo tenga el punto situado en el origen (0,0,0,0) común a ambas coordenadas en un tiempo t = 0. De este modo, podemos representar dicho intervalo relativista mediante coordenadas generalizadas:

x0 = cΔt___x1 = x___x2 = y___x3 = z

simplemente como:

Δs² = (x0) ² - (x1) ² - (x2) ² - (x3) ²

y representando a las 16 componentes de la matriz 4x4 a la cual llamaremos G como gij, el triple producto matricial arriba mostrado se puede representar mediante una doble sumatoria de la siguiente manera:



Para un intervalo relativista tipo luminoso en el que Δs² = 0, lo anterior tiene que tener un valor igual a cero:



Bajo una rotación cuatri-dimensional que involucre a las cuatro coordenadas, el intervalo relativista de tipo luminoso debe seguir siendo igual a cero. Esto nos lleva a lo que se conoce como la invariancia del cono de luz, con lo cual:

( x1) ² - ( x2) ² - ( x3) ² - ( x4) ² = 0

y la representación de lo mismo mediante sumatorias es:



De este modo, usando sumatorias, la ecuación de invariancia del cono de luz se puede expresar de la siguiente manera:



En notación matricial explícita, escribiendo todos los elementos de la matriz G = (gij), podemos representar la ecuación de doble sumatoria del lado derecho de la manera siguiente:



En notación matricial compacta, podemos escribir lo mismo en la forma:

X G X T = 0

en donde X T representa un vector columna que viene siendo la transpuesta del vector renglón X .

Por otro lado, la matriz general de Lorentz Λ = (λij):



que lleva al 4-vector en el sistema S:

[ x1__x2 __x3__x4 ]

al siguiente 4-vector en el sistema S:

[ x1__x2 __x3__x4 ]

debe ser necesariamente el arquetipo de la transformación linear, lo cual requiere de la existencia de constantes λij tales que:



Puesto que tenemos dos sumatorias en la ecuación de invariancia del cono de luz que involucran en forma repetida a las coordenadas x, vamos a tener que definir dos transformaciones lineares, una para cada transformación de coordenadas, usando para ello sub-índices diferentes:



Obedeciendo las reglas de multiplicación de matrices, una de estas transformaciones la podemos representar matricialmente escribiendo al vector de coordenadas como un vector renglón para pasar de un sistema S a otro sistema S:



En notación matricial compacta, esto se escribe de la siguiente manera:

X = XΛT

siendo ΛT la matriz transpuesta de la matriz Λ:



La otra transformación la podemos representar escribiendo al vector de coordenadas como un vector columna para pasar de un sistema S a otro sistema S:


En notación matricial compacta, esto se escribe de la siguiente manera:

X T = ΛXT

Obsérvese que podemos obtener rápidamente una representación matricial de la otra usando la propiedad fácilmente verificable para dos matrices de que la transpuesta del producto de dos matrices A y B es igual al producto matricial de las transpuestas tomadas en el orden inverso, o sea:

(AB)T = BTAT

Por extensión:

(ABC)T = CTBTAT


Volviendo a la ecuación de invariancia del cono de luz:

X G X T = 0

si substituímos en la representación de sumatorias las transformaciones para cada uno de los vectores de coordenadas X, obtenemos lo siguiente:



Reagrupando los símbolos y el orden de la tercera y la cuarta sumatorias:



El reagrupamiento en el orden de los factores de las sumatorias que aparecen en el lado derecho de la ecuación no parece haber sido suficiente para poder visualizar una simplificación posterior. A estas alturas, resultará mucho más provechoso intentar acomodar dichos factores de modo tal que la sumatoria multiple se pueda trasladar a una representación matricial. Y de hecho, ya vimos precisamente esto mismo al final de la entrada “Representaciones matriciales”, en donde partiendo de la siguiente sumatoria múltiple:



reacomodamos los factores de la sumatoria usando como guía el requerimiento de que los sub-índices estén apareados conforme son leídos de izquierda a derecha en la sumatoria ya reacomodada:



con lo cual la representación matricial salta a la vista casi de inmediato, la cual en notación matricial compacta resulta ser:

XTΛT G Λ X

Para poder lograr esta representación matricial, tomando en cuenta que la sumatoria múltiple debe producir al final el número cero (que matricialmente viene siendo una matriz que consta de un solo renglón y de una sola columna), la necesidad de aparear los sub-índices nos obligó a tomar la transpuesta de la matriz Λ, la cual representamos de color rojo como ΛT; y también nos obligó a usar la representación del vector columna X como el vector renglón tomando la transpuesta de X y representándolo como XT. Esto significa que en la sumatoria múltiple preparada para su representación matricial en donde aparecen XT y ΛT de color rojo como corresponde a las transpuestas, si bien en lo que respecta al componente xi dentro de la sumatoria el cambio no tiene efecto alguno, el componente λir en caso de llevarse a cabo la sumación sobre esa expresión tiene que ser interpretado no como el elemento dentro de la matriz Λ que está en el renglón i y la columna r sino como el elemento dentro de la matriz que está dentro del renglón r y la columna i.

Así pues, lo que tenemos en el lado derecho de la ecuación original de la ecuación de invariancia del cono de luz representado mediante sumatorias es algo que representado mediante un producto matricial nos involucra el producto de cinco matrices, lo cual si se tratase de matrices 3x3 en vez de matrices 4x4 tendría un aspecto como el siguiente:



Usando vectores con cuatro componentes y matrices 4x4, el número de multiplicaciones y adiciones de componentes requeridas para tratar de llevar a cabo cualquier simplificación posterior parece intimidante. En notación matricial compacta, lo que tenemos en esto último que hemos llevado a cabo es el resultado de las siguientes operaciones:

X G X T = 0

(XΛT) G (ΛXT) = 0

XΛTGΛXT = 0

Esto es justo lo que tenemos arriba tanto en la notación matricial explícita como en la representación mediante sumatorias múltiples.

Usando la representación que más nos convenga, no es difícil demostrar que si:

X G X T = 0

entonces el requerimiento en la ecuación de invariancia del cono de luz:



nos debe resultar en lo siguiente:



o bien en notación matricial compacta:

ΛT = G

El aspecto del lado izquierdo de la ecuación matricial en donde tenemos el producto de tres matrices en la forma XTAX posiblemente resultará familiar para muchos que han tomado un buen curso de Álgebra Linear, ya que la operación XTAX = B es precisamente el tipo de operación que se lleva a cabo para diagonalizar una matriz A, obteniendo el equivalente B de la misma que seguirá poseyendo algunas características importantes de la matriz original excepto que únicamente la diagonal principal de la matriz contendrá valores diferentes de cero, todos los demás elementos fuera de la diagonal principal serán iguales a cero. Sin embargo, y esto es importante, aquí no estamos llevando a cabo una operación para diagonalizar una matriz, ya que la matriz intermedia G queda intacta tras la operación matricial, esto es:

ΛT = G

Aquí lo que estamos haciendo es en cierta forma un procedimiento “al revés”, en el cual tratamos de determinar los valores de los componentes de la matriz Λ para que una vez que se haya efectuado la operación del lado izquierdo obtengamos el resultado que aparece en el lado derecho, o sea G. Este truco que estamos efectuando no es más que la implementación matricial de la validez de la invariancia del cono de luz bajo dos sistemas de coordenadas distintos.

Llevando a cabo las multiplicaciones matriciales en el lado izquierdo de la ecuación matricial e igualando cada uno de los 16 componentes con las entradas que aparecen en la matriz del lado derecho, y eliminando los resultados repetidos, obtenemos las siguientes diez condiciones para determinar si una matriz cualquiera es una matriz general de Lorentz:

00)² - (λ10)² - (λ20)² - (λ30)² = 1

0j)² - (λ1j)² - (λ2j)² - (λ3j)² = - 1___para j = 1, 2, 3

λ0i λ0j - λ1i λ1j - λ2i λ2j - λ3i λ3j = 0___para i ≠ j

PROBLEMA: Demostrar que la siguiente matriz es una matriz general de Lorentz:



Recurriremos a las relaciones que acabamos de obtener arriba, las cuales se deben cumplir si la matriz es realmente una matriz general de Lorentz.

Primera condición, se cumple:

00)² - (λ10)² - (λ20)² - (λ30)² =

(√3)² - (1)² - (1)² - (1)² = 1

Segunda condición, se cumple:

01)² - (λ11)² - (λ21)² - (λ31)² =

(√2)² - (√6/2)² - (√6/2)² - (0)² = - 1

Tercera condición, se cumple:

02)² - (λ12)² - (λ22)² - (λ32)² =

(0)² - (1/2)² - (-1/2)² - (-√2/2)² = -1

Cuarta condición, se cumple:

02)² - (λ12)² - (λ22)² - (λ32)² =

(0)² - (1/2)² - (-1/2)² - (√2/2)² = -1

Quinta condición (multiplicación conjunta de las primeras dos columnas), se cumple:

λ00 λ01 - λ10 λ11 - λ20 λ21 - λ30 λ31 =

(√3)(√2) - (1)(√6/2) - (1)(√6/2) - (0)(0) = 0

Sexta condición (multiplicación conjunta de la primera columna y la tercera columna), se cumple:

λ00 λ02 - λ10 λ12 - λ20 λ22 - λ30 λ32 =

(√3)(0) - (1)(1/2) - (1)(-1/2) - (0)(-√2/2) = 0


Séptima condición (multiplicación conjunta de la primera columna y la cuarta columna), se cumple:

λ00 λ03 - λ10 λ13 - λ20 λ23 - λ30 λ33 =

(√3)(0) - (1)(1/2) - (1)(-1/2) - (0)(√2/2) = 0

Octava condición (multiplicación conjunta de la segunda columna y la tercera columna), se cumple:

λ01 λ02 - λ11 λ12 - λ21 λ22 - λ31 λ32 =

(√2)(0) - (√6/2)(1/2) - (√6/2)(-1/2) - (0)(-√2/2) = 0

Novena condición (multiplicación conjunta de la segunda columna y la cuarta columna), se cumple:

λ01 λ03 - λ11 λ13 - λ21 λ23 - λ31 λ33 =

(√2)(0) - (√6/2)(1/2) - (√6/2)(-1/2) - (0)(√2/2) = 0

Décima condición (multiplicación conjunta de la tercera columna y la cuarta columna), se cumple:

λ02 λ03 - λ12 λ13 - λ22 λ23 - λ32 λ33 =

(0)(0) - (1/2)(1/2) - (-1/2)(-1/2) - (-√2/2)(√2/2) = 0

Habiendose cumplido todas las condiciones requeridas, se concluye que la matriz proporcionada es, en efecto, una matriz general de Lorentz.

PROBLEMA: En la derivación de la condición ΛT = G, al ser llevada a cabo utilizando sumatorias se encontró que el procedimiento era algo tardado y laborioso. Llevar a cabo la derivación de esta misma condición utilizando exclusivamente notación matricial compacta, sin utilizar sumatorias y sin recurrir a notación matricial explícita.

En notación matricial compacta, la ecuación de invariancia del cono de luz puede ser expresada de la siguiente manera:

XTGX = 0 = X TGX

Si la matriz general de transformación de Lorentz Λ preserva X TGX, entonces haciendo :

X = ΛX

tenemos lo siguiente:

XTGX = 0 = (ΛX)TG(ΛX)

XTGX = 0 = XTΛTGΛX

XTGX = 0 = XT(ΛTGΛ)X

con lo cual se concluye que ΛT = G.

Obsérvese cómo el uso de la notación matricial, sobre todo la notación matricial compacta, puede simplificar enormemente la resolución de un problema que involucre varias sumatorias. Esto será de enorme importancia cuando pasemos al estudio de la Teoría General de la Relatividad, en la cual entramos en contacto con notación tensorial que se basa precisamente en el uso intensivo de sumatorias. Al resolver problemas planteados en notación tensorial, la primera prioridad debe ser trasladar la planteación tensorial basada en sumatorias a su representación equivalente utilizando matrices, con lo cual podemos avanzar mucho más rápidamente.

En lo que hemos estado tratando en realidad se ha estado hablando acerca de la preservación de la métrica G bajo las transformaciones de Lorentz. Si hacemos extensiva la condición ΛT = G para cualquier tipo de matriz métrica G, tenemos entonces una conclusión importante: las métricas G de los espacios-tiempos curvos de la Teoría General de la Relatividad son invariantes bajo las transformaciones de Lorentz.

Hemos visto cómo comprobar si una matriz dada es una matriz que representa una transformación general de Lorentz. Pero no hemos visto aún cómo podemos obtener las ecuaciones que nos conduzcan a una transformación general de Lorentz, o sea, cómo obtener dicha matriz. Por ejemplo, si la velocidad entre los ejes coordenados a lo largo del eje-x es Vx = (3/4) c, y si la velocidad entre los ejes a lo largo del eje-y es Vy = (5/6) c, y si la velocidad entre los ejes a lo largo del eje-z es Vz = (1/2) c, ¿cuál es la matriz que representa la transformación general de Lorentz entre el sistema de referencia S y el sistema de referencia S’?

Ya se había mencionado en una entrada anterior que si realmente estamos interesados en derivar las relaciones que corresponden a la transformación general de Lorentz cuando los marcos de referencia están en movimiento relativo el uno con respecto al otro a través de tres ejes coordenados en lugar de uno solo, la demostración se puede simplificar enormemente si recurrimos a notación vectorial clásica denotando como el vector posición x a la ubicación de un punto en el sistema coordenado S:

x = (x, y, z)

y denotando la ubicación del mismo punto en el sistema coordenado S’ como:

x’ = (x’, y’, z’)

simbolizando asimismo a la velocidad relativa V que hay entre los dos marcos de referencia como un vector V (con letra negrita) con componentes relativos en cada uno de los tres ejes Cartesianos:

v = (Vx, Vy, Vz)

Lo anterior lo hacemos en conjunción con la notación vectorial del producto punto ó producto escalar entre dos vectores:

x · v = (x, y, z) · (Vx, Vy, Vz) = xVx + yVy + zVz

Con esta notación, estamos preparados para obtener la transformación general de Lorentz que estamos buscando tanto para las componentes espaciales como para la componente temporal.

PROBLEMA: Suponiendo que el movimiento relativo entre dos sistemas de referencia a una velocidad V se lleva a cabo no sólo a lo largo del eje-x sino también a lo largo del eje-y y del eje-z, demostrar que la transformación general de Lorentz está dada por las siguientes dos relaciones:





Este problema es ni más ni menos que la obtención de las transformación general de Lorentz en la cual el movimiento relativo entre los dos marcos de referencia no está limitado ya a un movimiento relativo entre los ejes-x. La clave para la resolución de este problema radica en darse cuenta que la única transformación Lorentziana de componentes se llevará a cabo únicamente sobre aquellos componentes vectoriales que estén dirigidos en la misma dirección (paralelos, en el espacio tri-dimensional) al vector de velocidad v que ocurre entre ambos marcos de referencia. Los componentes que sean perpendiculares permanecerán inalterados ya que no recibirán un “empuje” (boost) Lorentziano. El vector posición x de un punto en el sistema de referencia S se puede descomponer en la suma vectorial de dos vectores, uno perpendicular (en la misma dirección) que el vector velocidad v, y el otro paralelo al vector velocidad v:



Gráficamente, lo que estamos haciendo es lo siguiente:



La componente perpendicular al vector velocidad v permanecerá inalterada entre ambos marcos de referencia:



mientras que la componente del vector posición paralela al vector velocidad v sufrirá un empuje Lorentziano, el cual vectorialmente es una extensión de la transformación básica de Lorentz:

x’ = γ(x - Vt)

que ya habíamos obtenido anteriormente:



En la derivación que llevaremos a cabo, utilizaremos la siguiente relación vectorial que se demuestra en cualquier curso bueno de Análisis Vectorial:



Esta relación nos dice que si descomponemos a un vector A (que en nuestro caso será el vector posición x) en la suma vectorial de una componente perpendicular a otro vector B y en una componente paralela al vector B (a la cual llamamos la proyección de A sobre B) la componente paralela será igual al producto escalar de los vectores A y B (A·B) entre el cuadrado de la magnitud del vector B (= B²) multiplicado todo por el vector B que le fija dirección a dicha componente en el mismo sentido de B. En nuestro caso, la relación nos garantiza que:



Ahora bien, el vector posición x’ en el sistema de referencia S’ también se debe poder descomponer en dos componentes, una perpendicular y la otra paralela al vector velocidad v:



Introducimos aquí la relación de transformación de Lorentz dada arriba:



Recurrimos ahora a la relación vectorial dada arriba:



A continuación, sacamos fuera de los paréntesis cuadrados el vector velocidad v y metemos el factor γ:



Hacemos uso ahora de la descomposición del vector posición x en sus componentes paralela y perpendicular puesta arriba:



Nuevamente recurrimos a la relación vectorial dada arriba:



Metemos el segundo término dentro de los paréntesis cuadrados:



Por último, factorizando a la constante γ que obra en el primer término y el segundo término de los paréntesis cuadrados, obtenemos la relación general de transformación de Lorentz para las coordenadas espaciales dada arriba.

En lo que respecta a la coordenada del tiempo, la coordenada temporal, tomando como base la transformación de Lorentz para dicha coordenada cuando el movimiento se lleva a cabo única y exclusivamente entre los ejes-x:

t’ = γ(t - Vx/c²)

t’ = γ[t - (V/c²) x]

introducimos para x la magnitud del vector posición (¡no el vector!) que corresponde a la componente paralela al vector velocidad que dá el empuje de Lorentz, y que viene siendo:



Metiendo esta relación arriba para convertirla en una transformación general de Lorentz para la coordenada del tiempo obtenemos el paso que completa las demostraciones pedidas:



Al recurrir a notación vectorial para resolver en forma abreviada lo que de otra manera sería un problema laborioso si usáramos la notación explícita de las componentes rectangulares (Cartesianas) estamos haciendo algo parecido a lo que hizo Einstein al recurrir a la notación tensorial por las mismas razones.