La Mecánica Cuántica: Rotaciones de las matrices de Pauli

A continuación veremos unos ejemplos muy específicos de rotación con el propósito de familiarizarnos con lo que significa el concepto de rotación aplicado no a objetos tangibles sino a elementos matemáticos cuya “rotación” no resulta del todo clara. Una cosa es visualizar un vector que apunta de oeste a este, aplicarle una rotación de 45 grados, y tenerlo apuntando en dirección noreste; y otra cosa muy diferente es aplicarle una rotación a una matriz cuyos elementos inclusive pueden ser números imaginarios o complejos.

Usaremos como punto de partida las matrices de spin S_x, S_y y S_z, las cuales a su vez pueden ser escritas en función de las matrices de Pauli σ_x, σ_y, y σ_z:

siendo las matrices de Pauli:

Considerando al momento angular como el generador de las matrices de rotación, ya hemos visto previamente cómo a partir de las matrices del momento angular del spin S_x, S_y y S_z podemos obtener los operadores de rotación en torno a cada uno de los ejes coordenados. Más aún, si hacemos las substituciones:

S_x = (ħ/2)σ_x___S_y = (ħ/2)σ_y___ S_z =(ħ/2)σ_z

podemos sacar fuera del panorama a la constante de Planck ħ convirtiendo el asunto en algo puramente matemático de naturaleza universal. Y de este modo, si llevamos a cabo la expansión de la función matricial exponencial de rotación para cualquier matriz de Pauli σ_k en series de Taylor, tenemos entonces lo siguiente:

Podemos reacomodar los términos dentro de una parte real y dentro de una parte imaginaria:

Los términos agrupados en la parte real los reconocemos como la expansión en series de Taylor para la función trigonométrica cosenoidal del ángulo φ, mientras que los términos agrupados en la parte imaginaria los reconocemos como la expansión en series de Taylor para la función trigonométrica cosenoidal del ángulo φ, permitiéndonos escribir el operador de rotación matricial general en función de las matrices de Pauli de la siguiente manera:

Ahora vamos a especificar este operador general de rotación para una rotación de 180 grados haciendo φ = π, lo cual nos dá:

En el lado derecho, el primer término se nulifica convirtiéndose en la matriz cero, con lo cual el operador general de rotación para una rotación de 180 grados en función de las matrices de Pauli es simplemente:

Explícitamente, el operador de rotación para cada una de los ejes coordenados será:

Usando cada una de las matrices σ_x, σ_y, y σ_z, los operadores de rotación para obtener una rotación alrededor de cada uno de los ejes coordenados escritos explícitamente en su forma matricial serán los siguientes:

Ahora llevaremos a cabo una rotación de 180 grados de la matriz de Pauli σ_y en torno al eje-x usando la prescripción U_xσ_yU_x^-1 siendo U_x el operador de rotación en torno al eje-x que acabamos de obtener:

El resultado final nos indica que después de la rotación la matriz de Pauli con la que habíamos empezado tendrá un signo contrario al signo de la matriz inicial. Esto, desde luego, tiene mucho sentido físico (aunque el “elemento” σ_y por ser una matriz no sea una cantidad que podamos medir directamente con algún aparato). Después de todo, si se hubiera tratado de un vector ordinario v, después de una rotación de 180 grados estamos acostumbrados a que el vector sea -v, o sea un vector apuntando en el sentido contrario.

La visualización de estas rotaciones de las matrices de Pauli llevadas a cabo sobre un sistema de coordenadas rectangulares Cartesianas (x,y,z) se puede efectuar empleando también coordenadas generalizadas (1,2,3) que en estudios posteriores se prestan más a la representación de las transformaciones de las coordenadas mediantes sumatorias empleando el símbolo Σ. Podemos usar una convención como la siguiente:

en la cual identificamos a la coordenada-x como la coordenada 1, a la coordenada-y como la coordenada 2, y a la coordenada-z como la coordenada 3 (esta asignación es desde luego completamente arbitraria, y es permisible hacer otras asignaciones si ello simplifica en algo los desarrollos algebraicos).

En el ejemplo dado arriba mediante el cual tras una rotación de 180 grados la matriz σ_y (σ₂) es girada para ser convertida en -σ_y (-σ₂), el giro Cartesiano en torno al eje-x (eje-1) puede ser visualizado en coordenadas generalizadas de la siguiente manera:

Estas figuras nos indican que cuando se emplea la misma operación de transformación que se ha empleado arriba, la matriz σ_x (σ₁) deberá permanecer intacta al efectuarse la operación U_xσ_xU_x^-1, mientras que la matriz σ_z (σ₃) debe ser transformada en una matriz -σ_z (-σ₃) al efectuarse la operación U_xσ_zU_x^-1. Esto es válido para todas las combinaciones posibles de operaciones.

PROBLEMA: Obtener las tres matrices de Pauli después de que a cada una de ellas le haya sido aplicada una rotación de 180 grados en torno al eje-y.

Repitiendo los mismos pasos previos, tendremos que después de una rotación de 180 grados alrededor del eje-y las matrices de Pauli rotadas serán las siguientes:

Después de la rotación de 180 grados alrededor del eje-y, la matriz σ_x (σ₁) es rotada a -σ_x (-σ₁), “apuntando” en sentido contrario, mientras que la matriz la matriz σ_z (σ₃) es rotada a -σ_z (-σ₃), también “apuntando” en sentido contrario. ¿Y la matriz de Pauli σ_y (σ₂) utilizada para generar el operador de rotación en torno al eje-z? Permanece inalterada, lo cual era de esperarse. Esquemáticamente, el cambio llevado a cabo es el siguiente:

Las rotaciones en ángulos φ de 180 grados no parecen ser un asunto tan difícil de comprender, después de todo. Haremos ahora algo un poco más interesante. En vez de rotaciones de 180 grados, probaremos suerte con rotaciones de 90 grados. Recurriendo a la fórmula que obtuvimos arriba, el operador de rotación general para una rotación de 90 grados se obtendrá haciendo φ = π/2, con lo cual obtenemos:

Procediendo de manera semejante, obtenemos el operador rotacional inverso U^-1:

Explícitamente, manifestando su naturaleza matricial, para una rotación en torno al eje-x el operador U será:

mientras que el operador inverso U^-1 será:

A continuación, llevaremos a cabo la rotación de la matriz de Pauli σ_y alrededor del eje-x dándole un giro de 90 grados:

El resultado es interesante. La matriz de Pauli σ_y (σ₂) al ser girada 90 grados es “colocada” como -σ_z (-σ₃) , o sea, sobre el eje-z (negativo) que es perpendicular al eje-x sobre el cual estaba puesta la matriz inicial de Pauli sobre la cual se aplicó la operación de rotación (se muestran los efectos de la misma transformación de rotación sobre las otras dos coordenadas):

Empleando un ángulo de igual magnitud pero con signo contrario producirá una rotación de las matrices de Pauli en sentido opuesto a la anterior rotación:

Como puede verse en este último ejemplo, una diferencia marcada entre las rotaciones de las matrices de Pauli que se llevan a cabo a ángulos de 180 grados con respecto a las rotaciones de las matrices de Pauli que se llevan a cabo a ángulos de 90 grados es que en las rotaciones llevadas a cabo a ángulos de 180 grados no importa que la rotación se efectúe en un sentido contrario al que corren las manecillas del reloj (nos estamos refiriendo aquí desde luego a los relojes mecánicos antiguos con manecillas y no a los modernos relojes digitales de carátula numérica) usualmente tomado como positivo (+180°) y de vez en cuando simbolizado en la literatura como rotación CCW (del inglés, counter clock-wise), o en el mismo sentido en el que corren las manecillas del reloj usualmente tomado como negativo (-180°) y de vez en cuando simbolizado en la literatura como rotación CW (del inglés clock-wise), el resultado final será el mismo (un giro de las coordenadas x-y de +π radianes produce el mismo resultado que un giro de las coordenadas x-y de -π radianes); mientras que en el caso de las rotaciones llevadas a cabo a ángulos de 90 grados la posición final de las coordenadas será diferente según sea el giro en el sentido en el que corren las manecillas del reloj o en el sentido contrario al que corren las manecillas del reloj. Como veremos posteriormente en otras entradas, al permitir rotaciones en ángulos menores a los 180 grados, en este caso rotaciones de 90 grados, aparecen nuevas variedades de simetría que no estaban presentes originalmente. Como consecuencia del afinamiento de nuestro “microscopio matemático”, inevitablemente van surgiendo nuevas complejidades que antes no tenían relevancia alguna, como el hecho de que ahora adquiere importancia el sentido del giro dado a la rotación cuando antes no importaba. Este tipo de cosas son las que eventualmente dan lugar a la aparición de lo que se conoce como grupos matemáticos, los cuales se estudian más a fondo en la Teoría de Grupos. Por lo pronto, dejaremos este tema postpuesto para verlo en mayor detalle después con la importancia que merece.

¿Es posible darle una interpretación física a las matemáticas que hemos visto aquí? Desde luego que sí. Es precisamente de lo que se trata todo esto. Para ello, volvamos al experimento clásico de Stern-Gerlach suponiendo que tenemos un aparato que reciba a las partículas acabando de salir del horno, orientado de modo tal (paralelo al eje-z) que nos separe las partículas en aquellas partículas que tienen su spin apuntando “hacia arriba” y aquellas partículas que tienen su spin orientado “hacia abajo”. En términos matemáticos, estaremos midiendo S_z. Los dos eigenvalores de la matriz S_z son precisamente lo que representa a las partículas cuyo spin está apuntando “hacia arriba” (en el sentido positivo del eje-z, ↑) con un valor igual a +ħ/2, y las partículas cuyo spín está apuntando “hacia abajo” (en el sentido negativo del eje-z, ↓) con un valor igual a -ħ/2. Efectuemos ahora una operación de rotación sobre la matriz S_z convirtiéndola en una matriz S_x. Esto equivale a girar el aparato Stern-Gerlach en un ángulo de 90 grados. Viendo directamente hacia el haz de partículas que están saliendo del horno (encaminadas directamente hacia nuestros ojos), la rotación de que le hemos dado al aparato Stern-Gerlach ya no distingue a las partículas cuyo spin está apuntando “hacia arriba” de las partículas cuyo spin está apuntando “hacia abajo”. Al estar alineado el aparato Stern-Gerlach paralelamente al eje-x, perpendicularmente al eje-z, lo que ahora distinguirá serán las partículas cuyo spin está apuntando “hacia la derecha” de las partículas cuyo spin está apuntando “hacia la izquierda”. Los dos eigenvalores de la matriz S_x son precisamente lo que representa a las partículas cuyo spin está apuntando “hacia la derecha” (en el sentido positivo del eje-x) con un valor igual a +ħ/2, y las partículas cuyo spin está apuntando “hacia la izquierda” (en el sentido negativo del eje-z) con un valor igual a -ħ/2. Si de un primer aparato Stern-Gerlach obtenemos un haz de partículas cuyo spin spin está apuntando “hacia la abajo” (↓), y pasamos este haz por un segundo aparato orientado 90 grados con respecto al primer aparato de modo tal que obtengamos partículas cuyo spin spin esté apuntando “hacia la derecha” (→), entonces aparentemente tendríamos ya un haz de partículas cuyas dos componentes agrupadas como un par (S_x,S_z) serían iguales a (+ħ/2,-ħ/2). Sin embargo, al buscar obtener una confirmación (con la ayuda de un tercer aparato Stern-Gerlach) del valor del spin sobre el eje-z de las partículas, encontraríamos con mucha sorpresa que nuevamente volvemos a tener sobre el eje-z dos haces de partículas, un haz de partículas con su spin apuntando “hacia arriba” y otro haz de partículas con su spin apuntando “hacia abajo” en cantidades iguales, confirmando de esta manera que el segundo aparato Stern-Gerlach destruye por completo la información que habíamos obtenido con el primer aparato. Con el segundo aparato, tenemos ya dos haces de partículas, la mitad de las cuales tiene su spin está apuntando hacia la derecha y la otra mitad cuyo spin está apuntando hacia la izquierda, pero hemos obtenido esta información al costo de haber perdido irremisiblemente la información que teníamos sobre la componente S_z. No existe modo alguno en que podamos medir dos componentes perpendiculares del momento angular simultáneamente. Son observables incompatibles. Es precisamente de lo que trata el principio de incertidumbre de Heisenberg.

¿Y qué del caso en el cual recurrimos a una rotación matemática de 90° para representar los eigenvalores de S_y? En tal caso, y pese a que la matriz S_y tiene como entradas números imaginarios, los eigenvalores de la matriz siguen siendo +ħ/2 y -ħ/2. Pero aquí ocurre una cosa muy curiosa. Por la forma en la cual se acostumbra montar el ejes de coordenadas rectangulares Cartesianas en un experimento Stern-Gerlach, una medición del haz de partículas sobre el eje-y implica que estaríamos midiendo el momento angular de las partículas no “hacia arriba” ni “hacia abajo”, ni tampoco “hacia la derecha” o “hacia la izquierda”, sino a lo largo de la misma dirección en la cual las partículas salen del horno, o sea (suponiendo que estamos mirando directamente hacia el orificio desde el cual salen las partículas encaminadas directamente hasta nuestros ojos), estaríamos midiendo el spin de las partículas que están apuntando “hacia adelante” o “hacia atrás”. ¡Y ni siquiera nos hemos puesto a pensar bien sobre cómo nos las arreglaríamos para construír un aparato Stern-Gerlach que pueda medir S_y! Este pequeño detalle es la razón principal por la cual las matrices de Pauli son asignadas en la forma en la que son asignadas, dejando la matriz de Pauli con entradas imaginarias para la medición de S_y, aunque desde el punto de vista estrictamente matemático no hay razón para dar una preferencia especial en la asignación de las coordenadas Cartesianas a las matrices de Pauli. Podemos considerar esto como una cuestión de gustos.

Cabe reflexionar aquí sobre un asunto práctico. En un laboratorio en donde se tenga un aparato Stern-Gerlach recibiendo las partículas que están saliendo del horno, con el aparato alineado en forma tal (posicionado paralelamente con respecto al eje vertical que llamamos eje-z) que el haz de partículas se subdivida en dos haces, un haz de partículas con el spin apuntando “hacia arriba” (↑) y el otro haz de partículas con el spin apuntando “hacia abajo” (↓), el experimentador puede girar el aparato 90° con respecto a la posición original que tenía, estando dada la descripción matemática del proceso de rotación por las matemáticas que se han expuesto aquí. Sin embargo, el laboratorista no está limitado a girar el aparato Stern-Gerlach en ángulos de 90°. También puede girar el aparato en un ángulo arbitrario cualquiera, por ejemplo, en 56°. Y de hecho, en el proceso de ir girando el aparato Stern-Gerlach desde 0° hasta 90°, el aparato en cierto punto estará girado a un ángulo de 56° con respecto a la posición original que tenía (alineado con respecto al eje vertical). La pregunta obvia es: ¿qué aspecto tendrá la matriz que describe a los eigenvalores del momento angular de spin en esa posición? Esto equivale a llenar el hueco intermedio en donde aparece el símbolo de interrogación:

Aún sin haber “llenado el hueco”, sabemos de antemano que los eigenvalores de la matriz desconocida intermedia tienen que ser necesariamente +ħ/2 y -ħ/2, porque el aparato Stern-Gerlach seguirá subdividiendo el haz de partículas entrante en dos haces de partículas, con un haz de partículas apuntando “en cierta dirección” (ya no podemos llamarla ni “hacia arriba” ni “hacia abajo” ni “hacia la derecha” ni “hacia la izquierda”) y con el otro haz de partículas apuntando en la dirección opuesta. Pero esperamos lógicamente que las entradas de la matriz desconocida (no sus eigenvalores, que seguirán siendo +ħ/2 y -ħ/2) dependan de alguna manera del ángulo de rotación que llamaremos θ. Y, desde luego, esperamos que esa matriz de rotación se reduzca a S_z para un ángulo de rotación igual a 0°, y a S_x para un ángulo de rotación igual a 90°, como casos especiales.

Tal vez a estas alturas se vuelva tentador buscar otra alternativa, tal como postular un vector de dos componentes, +ħ/2 y -ħ/2:

sobre el cual actúe una matriz externa que lleve a cabo una rotación sobre dicho vector. Esta posibilidad la estudiaremos más a fondo cuando entremos de lleno en la Mecánica Ondulatoria. Sin embargo, de lo que se trata aquí es de no salir en lo absoluto de la matriz original que codifica los eigenvalores. La matriz no puede actuar sobre ninguna otra cosa fuera de ella puesto que es la misma matriz la que encierra toda la información física del sistema. De esto es precisamente de lo que trata la Mecánica Matricial. La matriz que describe al sistema cuántico lo es todo. Si algo va a cambiar en función del ángulo de rotación, ello deben ser los componentes de la misma matriz. Podemos hacer que algo externo actúe sobre la matriz del sistema físico cambiándola o generalizándola de alguna manera, esto sí es permisible. Lo que actúe sobre la matriz que describe al sistema físico serán los operadores de rotación que esperamos que sean matrices 2x2, pero la matriz sobre la cual actúan es un operando. Y lo que debe quedar bien claro es que cualquier cambio que se haga desde fuera sobre la matriz que describe al sistema físico debe dejar sus eigenvalores intactos, a menos de que el sistema físico en sí vaya a ser objeto de alguna modificación fundamental que alterará lo que está describiendo.

Si vamos a seguir trabajando en el ámbito de la Mecánica Matricial, para construír una matriz que represente a los dos eigenvalores del spin manteniéndolos iguales (+ħ/2 y -ħ/2) conforme se va girando el aparato Stern-Gerlach (que suponemos único) partiendo de mediciones de S_z que se están llevando a cabo con el aparato alineado verticalmente (con el eje-z), y girándolo hasta que el aparato esté llevando a cabo mediciones de S_x al haber sido girado 90°, podemos intentar hacer una combinación de S_x y de S_z usando como factores el seno y el coseno del ángulo de rotación (que llamaremos θ), de forma tal que para un ángulo θ igual a 0° la matriz combinada se reducirá a S_z, y para un ángulo θ igual a 90° la matriz combinada se reducirá a S_x:

Invirtiendo el orden de los términos (no habiendo ninguna otra razón para ello excepto para resaltar con fines didácticos el hecho de que el aparato Stern-Gerlach está inicialmente alineado verticalmente correspondiendo a un ángulo inicial de rotación igual a 0°) y metiendo las matrices de Pauli en lo anterior, se tiene:

Para un ángulo θ igual a 0° el segundo término se vuelve cero, y la matriz combinada se reduce a S_z; mientras que para un ángulo θ igual a 90° el primer término se vuelve cero, y la matriz se reduce a S_z, lo cual cumple con los requerimientos en los casos especiales. Simplificando lo anterior y llamando a la matriz resultante S_xz, se tiene entonces:

La matriz S_xz se parece mucho a algo que es conocido como una matriz ortogonal de rotación en un plano Cartesiano bidimensional (x,y) que al ser aplicada sobre un vector v (premultiplicándolo) nos regresa un vector v’ de la misma longitud que el vector original pero girado en cierto ángulo (al variar en forma sincronizada las dos componentes del vector manteniendo la longitud del vector igual a la longitud original):

Tanto en los cursos de Álgebra Lineal como de Análisis Vectorial, se aprende que la matriz ortogonal de rotación R(θ) es la siguiente:

Sin embargo, y es importante subrayar el hecho, la matriz S_xz que hemos obtenido arriba no es una matriz de rotación. No puede serlo, ya que mientras que las entradas de una matriz de rotación 2x2 R(θ) carecen de dimensiones físicas, las entradas de la matriz S_xz representan eigenvalores de observables físicas (en unidades de momento angular), lo cual se destaca más claramente al introducir multiplicativamente dentro de la matriz de S_xz el factor ħ/2:

La diferencia entre una matriz cuyos eigenvalores codifican valores físicos que se miden en el laboratorio y otra matriz que se le parece pero que lleva a cabo operaciones de rotación geométrica debe ser clara en todo momento. La confusión de estos dos conceptos dispares es quizá una de las fuentes más frecuentes de malentendidos y dolores de cabeza al entrar de lleno (en el estudio posterior de la Mecánica Ondulatoria) en el tema de los operadores de rotación.

PROBLEMA: Demuéstrese que en un sistema físico en el que se describe un experimento Stern-Gerlach representado por la siguiente relación matricial:

los eigenvalores del sistema seguirán siendo los mismos (+ħ/2 y -ħ/2) independientemente del ángulo de rotación θ al que se gire el aparato.

Designando a la relación matricial que describe al sistema como M y substituyendo las matrices de Pauli en la relación, se obtiene lo siguiente:

Si queremos obtener los valores propios eigen de la matriz M, entonces tenemos que resolver la ecuación secular dada por:

Por lo tanto:

Simplificando:

Finalmente:

De acuerdo con esto último, los eigenvalores de la matriz M son +ħ/2 y -ħ/2, independientes por completo del ángulo θ. Esto concuerda con el hecho experimental de que si giramos el aparato Stern-Gerlach que está recibiendo a las partículas acabando de salir del horno (dándole un giro de rotación sobre el plano x-z) esperamos que las partículas se sigan subdividiendo en dos haces.

Podemos llevar a cabo rotaciones sucesivas sobre ejes coordenados distintos en cualquier matriz de Pauli mediante algo que es conocido como una composición de rotaciones. Para ello simplemente tomamos una matriz de Pauli como σ_y aplicándole una primera rotación como U_xσ_yU_x^-1 (en torno al eje coordenado-x), tras lo cual a la matriz resultante le aplicamos una segunda rotación, lo cual equivale a llevar a cabo operaciones como las siguientes:

Como puede apreciarse, la matriz que es girada está “aprisionada” en medio de las otras matrices de rotación como si estuviese en una especie de “sandwich” entre los operadores de rotación que actúan sobre ella. Es importante destacar aquí el hecho de que las rotaciones sucesivas llevadas a cabo en torno a ejes distintos no son conmutativas, lo cual resulta fácil de comprobar con unas cuantas figuras en las cuales se intercambie el orden de las rotaciones. En pocas palabras:

Esto nos lleva a considerar necesariamente dos ángulos distintos de rotación en lugar de uno solo, los cuales podemos designar como α y β. Aunque habiendo tres ejes coordenados rectangulares Cartesianos, todos ellos ortogonales (a ángulos rectos) entre sí, pudiera pensarse que se requiere de la especificación de un conjunto de tres ángulos de rotación (α,β,γ) para poder “mover” una matriz de Pauli en cualquier dirección del espacio Euclideano tridimensional, en realidad solo se requiere de dos ángulos, un ángulo polar y un ángulo azimutal, al igual que solo se requiere de la especificación de la latitud y la longitud para poder ubicar cualquier punto sobre la superficie del globo terráqueo.

martes, 11 de agosto de 2009

Rotaciones de las matrices de Pauli