El número 1,106,427 es una representación reducible de cierta cantidad, la cual está también representada por el producto de números primos mostrados a la derecha de la igualdad, la cual a su vez es una representación irreducible de la misma cantidad.
Ahora bien, tomemos otro número, el número 35. El número 35 se puede representar de dos maneras, ya sea como el producto de dos numeros primos, los números 5 y 7, y también como la suma de un conjunto de numeros primos en la que cada numero primo aparece una sola vez:
(5)(7) = 1 + 2 + 5 + 7 + 9 + 11
La representación en el lado izquierdo de la igualdad es una representación irreducible del número 35, escrita como el producto de dos representaciones irreducibles, los números 5 y 7. Pero en cierta forma también lo es la representación que aparece en el lado derecho de la igualdad, ya que no existe ninguna otra manera en la cual podamos representar al número 35 como una suma de números primos
en la que no haya un número primo que se repita. Este ejemplo sencillo nos muestra que, bajo ciertas condiciones, es posible representar el producto de dos representaciones irreducibles como la suma de representaciones irreducibles.
El producto de los dos números primos irreducibles mostrado arriba, expresado también como la suma de seis números primos irreducibles, pueden ser simbolizados de una forma más general (la cual hace referencia no únicamente a números primos sino a cualquier otra cosa que pueda ser descompuesta en unidades más sencillas) como la siguiente:
En el estudio de la Mecánica Cuántica, estamos obviamente interesados en saber si es posible que muchas de las cosas que hemos estado manejando puedan ser reducidas ya sea a la suma directa o al producto directo de representaciones que son a su vez irreducibles.
¿Y qué podría ser aquello que pudiera servir como base para procurar la obtención de representaciones irreducibles dentro de la Mecánica Cuántica? Después de meditar esta pregunta un rato, la respuesta obvia es el momento angular. ¿Y por qué el momento angular? La primera razón de peso es que el momento angular (al igual que la energía) es precisamente una de esas cantidades que se conservan invariables en todos los procesos físicos que han sido estudiados hasta la fecha, tanto dentro de la mecánica clásica como dentro de la Mecánica Cuántica. El principio de la conservación del momento angular es tan básico que en caso de fuera violado en alguna situación experimental todo el edificio de la física moderna se colapsaría irremisiblemente. En muchas aplicaciones de la física atómica y nuclear, los estados de partículas sujetas a un potencial central son examinados. El momento angular es una cantidad que se conserva en los potenciales centrales, lo cual permite que sus eigenvalores sean utilizados para la clasificación de estados. La segunda razón de peso es que la constante de Planck h, la cual conduce de manera casi obligada a la cuantización de la materia y la energía en muchas situaciones, está dada precisamente en unidades del momento angular. Si la constante de Planck fuera igual a cero, la validez de la física clásica se extendería ilimitadamente hasta el mundo sub-microscópico. Pero no lo es, y porque no lo es se tiene la Mecánica Cuántica. Inclusive la “extraña” ecuación fundamental de Max Born depende para su plena validez del hecho de que la constante de Planck, la unidad fundamental del momento angular, no es igual a cero. Si lo fuera, las matrices posición y momentum conmutarían y no habría principio de incertidumbre de Heisenberg. Es por ello que debemos buscar la manera de definir nuestros “ladrillos de construcción” en base a cosas que tengan que ver con el momento angular.
Un buen punto de partida lo son las matrices 2x2 de Pauli, las cuales ya de por sí son irreducibles, y las cuales son la base fundamental para representar el momento angular intrínseco (momento angular de spin) de partículas cuyo spin es 1/2, tales como el protón y el electrón. No es posible representar ninguna de las matrices de Pauli como el producto o la suma de algo más sencillo que estas matrices definidas como:
Al igual que como ocurre con el caso de los números primos en donde vislumbramos en el ejemplo sencillo dado arriba que es posible representar un número entero cualesquiera que no sea un número primo como la suma de una combinación de números primos, podemos sentirnos tentados a representar una matriz 2x2 A como la suma de una combinación lineal de las matrices de Pauli y la matriz identidad I. Y esto en un principio parece estar justificado.
PROBLEMA: Demuéstrese que es posible representar cualquier matriz 2x2 A como la suma de una combinación lineal de las matrices de Pauli y la matriz identidad I.
Para que sea posible cualquier matriz 2x2 A como la suma de una combinación lineal de las matrices de Pauli y la matriz identidad I, deben existir números reales (o complejos) z0, z1, z2 y z3 tales que lo siguiente sea cierto:
Explícitamente, usando componentes matriciales, se tiene la siguiente descomposición de la matriz A en función de una combinación lineal de la matriz identidad y las matrices de Pauli:
Igualando componentes en ambos lados de esta ecuación matricial, se tiene entonces:
Resolviendo este sistema de ecuaciones, se obtiene:
Dada cualquier matriz A, mediante esta prescripción es posible obtener los valores de los números requeridos para poder representar a la matriz A como la suma de una combinación lineal de las matrices irreducibles de Pauli.
Aparentemente, tenemos ya una prescripción para reducir una matriz a una representación irreducible como una suma de matrices irreducibles. Desafortunadamente, esta prescripción se viene abajo al considerar matrices 3x3, ya que pese a que sí existen matrices irreducibles de Pauli 3x3, aunque resulta un poco más laborioso es posible comprobar que no es posible representar cualquier matriz 3x3 como una combinación lineal de matrices de Pauli 3x3 y la matriz identidad I 3x3. Podemos tomar un poco de consuelo en el hecho de que si bien no es posible representar cualquier matriz 3x3 como una combinación lineal de matrices irreducibles de Pauli 3x3, sí es posible representar cualquier matriz 4x4 como una combinación lineal de matrices de Dirac 4x4. De cualquier manera, y lo peor del caso, es que son precisamente las matrices 3x3 las que son utilizadas para representar los operadores matriciales de rotación. ¿Qué hacer entonces? Lógicamente, tenemos que buscar otra definición de irreducibilidad.
Desde un punto de vista adquirido en el manejo previo que se ha estado llevando a cabo con matrices, sin lugar a dudas una representación incuestionablemente irreducible es la que se obtiene al tomar una matriz susceptible de ser diagonalizada mediante una transformación de semejanza (o similitud) para la cual usamos la ayuda de una matriz M, de forma tal que las únicas entradas diferentes de cero en dicha matriz serán las que aparezcan a lo largo de su diagonal principal:
En lo que a la Mecánica Cuántica concierne, este tipo de simplificación es completamente válido siempre y cuando ambas matrices representen el mismo conjunto de eigenvalores.
¿Y qué del caso en el cual una matriz no pueda ser llevada a su forma diagonal? En una situación así, es justificable intentar una simplificación mediante la cual la matriz pueda ser llevada a una forma “casi” diagonal como la siguiente en la cual la matriz pueda ser subdividida en bloques de modo tal que tanto arriba y abajo como hacia los lados izquierdo y derecho de los sub-bloques matriciales o sub-matrices las entradas sean ceros:
Obsérvese cómo la matriz original ha sido reducida a tres sub-bloques matriciales. Si no es posible reducir los sub-bloques matriciales aún más, podemos decir que tenemos una representación irreducible de la matriz original. En el ejemplo que se acaba de dar, una notación que se acostumbra utilizar con frecuencia para simbolizar la formación de una matriz extendida a partir de sub-bloques matriciales más pequeños puestos a lo largo de su diagonal principal, con ceros hacia arriba, hacia abajo, y hacia ambos lados de cada una de las sub-natrices, es la siguiente (el círculo con la cruz en su interior usado para la operación de construcción de la matriz extendida jamás debe ser confundido con ningún tipo de adición matricial, es simplemente un símbolo que denota un tipo muy específico y peculiar para construír una matriz a partir de otras matrices más pequeñas):
Un ejemplo inmediato de una matriz que puede ser reducida a dos sub-bloques matriciales (submatrices) los cuales ya no pueden ser reducidos aún más es la matriz de rotación utilizada para darle un giro a un objeto en torno al eje-z que pase a través del objeto:
Como puede verse, la matriz Rk puede ser reducida a dos sub-bloques matriciales: la submatriz I que contiene un solo elemento (el número 1) y la submatriz M que representa las rotaciones llevadas a cabo sobre un cuerpo rígido con la giración efectuada a lo largo y ancho del plano x-y. Y aunque parezca tentador obtener los autovalores propios eigen del sub-bloque matricial M a fin de diagonalizar dicha matriz reduciendo con ello a la matriz de rotación Rk a una matriz diagonal, al hacer tal cosa se le destruye por completo a la matriz original Rk su naturaleza propia como matriz de rotación dejándola completamente inútil, ya que se necesitan los cuatro elementos tal y como están dados en el sub-bloque matricial M para que la matriz pueda llevar a cabo sus labores propias de rotación.
De este modo, al buscar la reducibilidad de las cosas no tenemos por qué estar limitados a que los objetos matemáticos que están siendo manipulados sean exclusivamente números primos (A,B,P,Q,etc.) o figuras geométricas que puedan ser giradas en torno a cierto eje, ya que los objetos pueden ser también otro tipo de cosas como matrices. Más aún, como en el caso del número 35 que puede ser descompuesto en el producto de los números primos 5 y 7 y que también puede ser también descompuesto en una suma única de números primos, podemos sospechar que inclusive hasta las figuras geométricas simétricas en dos dimensiones (como el triángulo equilátero y el pentágono) o inclusive en tres dimensiones (como la pirámide y el paralelepípedo) puedan ser clasificadas bajo cierto patrón estructural de orden en el que obedezcan ciertas relaciones bajo cierto tipo de simetrías como ocurre en el caso de los cristales perfectos, sospechando también que haya relaciones de simetría que incluso tal vez puedan ser transferidas a relaciones válidas dentro de la física de las partículas atómicas y sub-atómicas y que puedan ser interpretadas de alguna manera como en el caso de la siguiente relación en la cual se utiliza notación de la Teoría de Grupos (no se debe intentar darle una interpretación rigurosa a esta relación que a estas alturas se proporciona como algo de naturaleza meramente ilustrativa):
Habiendo visto en entradas previas que la cuestión de la simetría está estrechamente ligada con la Teoría de Grupos, antes de entrar en mayores detalles acerca del asunto de las representaciones irreducibles haremos un nuevo repaso de dicha teoría introduciendo conceptos nuevos.
Para el caso de los grupos finitos discretos, las operaciones matemáticas que definen a cierto grupo pueden ser detalladas mediante lo que se conoce comúnmente como una “tabla de multiplicar”, aunque ello no implique que necesariamente estemos hablando del producto de los números propios de la aritmética. En efecto, la naturaleza conceptual de un grupo es algo tan general (abstracto) que los elementos asociados con las operaciones permisibles para el grupo pueden ser cualquier cosa, ya sea números enteros, números complejos, y hasta operaciones de simetría sobre una figura tal como pentágono. Considérese, por ejemplo, el siguiente grupo de orden tres (consta de tres elementos) en el cual al elemento identidad se le simbolizará con la letra e que significa Einheit, nombre que se acostumbra darle en la literatura técnica de la Teoría de Grupos al elemento identidad en su forma más general:
El lector puede verificar fácilmente por cuenta propia que el siguiente conjunto de elementos, que consta del número 1 y de dos números complejos, satisface las operaciones indicadas en la “tabla de multiplicar” del grupo:
Aquí es el momento justo de repasar algo que había quedado pendiente de ser ampliado y de lo cual solo se habían hecho referencias algo vagas en las entradas anteriores; el hecho de que dada la “tabla de multiplicar” de un grupo G es posible darle a dicho grupo una representación matricial. Aunque a primera vista la Teoría de Grupos y las matrices parecen ser cosas totalmente diferentes, es posible establecer una conexión profunda entre ambos conceptos, la cual adquiere una enorme importancia a raíz del descubrimiento que hemos estado llevando a cabo del hecho de que detrás de muchos fenómenos físicos propios de la Mecánica Cuántica subyacen relaciones de simetría que son las que dictan al final de cuentas lo que es posible y lo que no es posible.
¿A qué nos referimos exactamente con la idea de que es posible darle a un grupo una representación matricial?
Nada ilustra mejor una idea que un ejemplo, y con esto en mente tomaremos como ejemplo un grupo que consiste de cuatro elementos y cuya “tabla de multiplicar” es la siguiente:
Como ya se dijo, el conjunto de elementos de los que consta un grupo, en este caso el grupo G.=.{e,a,b,c}, puede representar cualquier cosa, y de hecho los elementos del grupo pueden ser también matrices, siempre y cuando el producto de cada par posible de matrices reconstruya la “tabla de multiplicar” para el grupo. Haremos un ligero cambio de notación renombrando al conjunto de elementos como G.=.{E,A,B,C} para enfatizar este hecho, en donde las letras resaltadas como mayúsculas en color azul son matrices (aunque en entradas previas hemos estado representando a la matriz identidad como I, aquí la representaremos como E para ir acostumbrando al lector a la simbolización propia de la Teoría de Grupos):
Para que esto sea válido, debemos encontrar cuatro matrices tales que todos los productos posibles entre cualquier par de dichas matrices reproduzca la tabla anterior. El lector puede verificar fácilmente por cuenta propia que el siguiente conjunto de matrices, que consta de la matriz identidad E y de las tres matrices 2×2 indicadas, satisface las operaciones indicadas en la “tabla de multiplicar” del grupo:
A esto es precisamente a lo que nos referimos con la idea de darle a un grupo una representación matricial, el poder definir una cantidad de matrices que sea igual al orden del grupo, matrices tales que estas dupliquen fielmente las características de la “tabla de multiplicación” matricial del grupo; o en pocas palabras, el poder redefinir a cada elemento del grupo como una matriz.
Es muy importante no perder de vista el hecho de que el tamaño de un grupo (fijado por el orden del grupo, el número de sus elementos) no determina de manera unívoca una “tabla de multiplicación” para el grupo. En efecto, puede haber dos grupos del mismo tamaño cuyas “tablas de multiplicación” sean diferentes, lo cual hace que los dos grupos sean diferentes. En el caso del grupo G.=.{e,a,b,c} dado arriba, se puede construír otra tabla de multiplicación válida que define a otro grupo distinto que es el siguiente:
El lector puede verificar por cuenta propia que este conjunto de elementos {e,a,b,c} también satisface las operaciones binarias (en este caso, multiplicativas) especificadas por la tabla. Una conclusión que se obtiene de todo esto es que dos grupos con el mismo número de elementos pueden ser de hecho dos grupos diferentes. Y por su parte, un mismo grupo puede tener varias representaciones posibles, dependiendo del significado específico que se le dé a cada uno de sus elementos, lo cual nos conduce a una tema propio de la Teoría de Grupos conocido como la teoría de las representaciones.
Un caso especial que debe llamar mucho nuestro interés es el caso en el cual un grupo al cual se le pueda dar una representación matricial represente también alguna operación de simetría que pueda ser conceptualizada geométricamente mediante operaciones elementales de rotación. En una situación así, estaríamos unificando el concepto de la representación matricial de un grupo con el concepto de las simetrías de rotación. ¿Y cómo habremos de lograr ésto? De nueva cuenta, nada mejor que un ejemplo específico, y el ejemplo que tomaremos será el grupo que especifica todas las rotaciones posibles de un triángulo equilátero, mejor conocido como el grupo de simetría D3. En el sentido más general (abstracto), la “tabla de multiplicar” de este grupo es la siguiente (usaremos aquí la letra I para denotar al elemento identidad, con el fin de no perder la costumbre):
Esta “tabla de multiplicar” no arroja mucha luz sobre cómo podamos asociar al grupo con un conjunto de matrices, mucho menos cómo asociar al grupo con un conjunto de matrices de rotación. Para demostrar la factibilidad de poder lograr este propósito, escribiremos la misma tabla con lo que a primera vista parecerá un simple cambio de notación:
en donde simplemente se ha hecho:
I ↔ E , p ↔ R1 , q ↔ R2 , r ↔ R3 , s ↔ R4 , t ↔ R5
La nueva “tabla de multiplicar”, hablando en el sentido matemático más general (abstracto), en realidad es la misma tabla que la tabla anterior, sólo se efectuó un cambio notacional. Ambas tablas representan a dos grupos que son isomorfos (tienen la misma forma matemática aunque su apariencia superficial sea diferente). Pero el cambio notacional aparentemente inocuo nos llevará muy lejos hacia el objetivo final que tenemos en mente, si consideramos a los elementos grupales Rk como rotaciones llevadas a cabo sobre un triángulo equilátero, siempre y cuando las rotaciones sean tales que, a menos de que el triángulo equilátero tenga sus bordes etiquetados con los números que corresponden a cada esquina, será imposible para un observador externo darse cuenta que el triángulo equilátero fue desplazado (girado) con respecto a su posición original.
De este modo, si queremos construír una representación matricial del grupo D3, para ello podemos considerar las transformaciones de un triángulo equilátero como rotaciones en el espacio tridimensional Euclideano usando como herramienta un conjunto apropiado de coordenadas. Si seleccionamos como ejes unitarios de base a los vectores unitarios usuales propios de los ejes rectangulares Cartesianos {ex,ey,ez,}como se muestran en la siguiente figura:
entonces estamos hablando de dos operaciones, R1 y R2, las cuales le dan un giro al triángulo equilátero en el sentido contrario al sentido en el que corren las manecillas de un reloj mecánico, en ángulos de 2π/3 (120°) y 4π/3 (240°):
respectivamente; y estamos hablando también tres operaciones, R3, R4, y R5, las cuales le dan un giro completo de 180° al triángulo en torno a los ejes de simetría marcados en la figura también como R3, R4, y R5:
Es fácil comprobar la validez de todas las operaciones dadas en la “tabla de multiplicación”. Por ejemplo, para demostrar que la operación binaria R4oR1 es igual a R3, lo podemos hacer de la siguiente manera:
Las operaciones inversas de rotación se definen del mismo modo en base a las operaciones elementales de simetría llevadas a cabo sobre el triángulo equilátero.
Puesto que en la “tabla de multiplicación” de un grupo la operación binaria gpogq no es necesariamente conmutativa, pudiendo dar la operación gqogp un resultado diferente, es importante verificar de antemano en la lectura de cualquier libro de texto el orden en el cual se llevan a cabo las operaciones de cada tabla grupal. Para ubicar el elemento que corresponde a la operación gpogq dentro de una tabla, es común que gp sea un elemento puesto en la columna extrema izquierda de la misma, mientras que gq es un elemento puesto en el renglón superior de la tabla, de modo tal que el elemento que resulta de la operación gpogq es el que está ubicado en la intersección del renglón a cuya derecha aparece gp en el extremo izquierdo y la columna en cuyo extremo superior aparece gq. Sin embargo, tratándose de operaciones de simetría actuando sobre un objeto geométrico ¶ como ocurre con la operación R4oR1 actuando sobre el objeto (como lo acabamos de ver arriba), el primer elemento en actuar sobre el objeto geométrico no es gp sino gq, o sea que gpogq actúa sobre ¶ en el mismo orden en que lo hacen los operadores mecánico-cuánticos, de derecha a izquierda, o sea gpogq(¶) = gpo(gq¶):
PROBLEMA: Demuéstrese para el grupo D3 mediante las operaciones de simetría apropiadas la validez de la siguiente relación:
Recurriendo a la figura del triángulo equilátero, resulta evidente que una operación de rotación inversa R3-1 produce el mismo efecto que una operación de rotación R3 por tratarse en ambos casos de una rotación completa de 180° en torno al eje R3. Por lo tanto:
La conexión matricial que estamos buscando para las rotaciones R1 y R2 de 120° y 240° respectivamente del triángulo equilátero que se llevan a cabo en torno al eje-z que pasa perpendicularmente por su centro de simetría se obtienen fácilmente recurriendo a la matriz de rotación general a ser usada en este caso que es:
esto dá como consecuencia relaciones como las siguientes para el elemento grupal R1 (considerado como una rotación de 2π/3 en torno al eje-z):
a lo cual es posible darle de inmediato la siguiente representación matricial:
Procediendo de la misma manera, podemos obtener las siguientes cinco matrices (obsérvese que, en el caso de las rotaciones R3, R4 y R5, se debe poner como elemento en la esquina inferior izquierda de cada matriz a -1 en lugar de 1; obsérvese también que se le ha asignado al elemento identidad como símbolo la letra E para mantener la concordancia con el símbolo Einheit utilizado en muchos textos de Teoría de Grupos para denotar al elemento identidad ):
De este modo, tenemos ya seis matrices. Y resulta fácil verificar que estas seis matrices obedecen las mismas reglas de “multiplicación” que los elementos puestos en la tabla que corresponde al grupo original. En pocas palabras, el conjunto de elementos:
tiene las mismas características grupales (la misma “tabla de multiplicación”) que el conjunto de elementos:
PROBLEMA: Demuéstrese para el grupo D3 mediante las multiplicaciones matriciales requeridas la validez de la siguiente relación:
En virtud de que cada uno de los elementos de la representación matricial del grupo D3 comparte las mismas propiedades y características con los elementos del grupo D3 original, se debe tener que:
De este modo, llevando a cabo las multiplicaciones matriciales indicadas en el lado derecho de la igualdad del enunciado proporcionado, se tiene:
Obsérvese que este es esencialmente el mismo tipo de problema que el que se resolvió con anterioridad recurriendo previamente no a multiplicaciones matriciales sino a operaciones de simetría. Así, se ha comprobado de dos maneras distintas la validez de una de las operaciones binarias del grupo D3 puesta en la “tabla de multiplicación”.
De este modo, hemos logrado el objetivo que buscábamos desde un principio, darle una representación matricial a un grupo, en este caso el grupo D3, asociando dicho grupo con las operaciones de simetría que corresponden a las rotaciones de un triángulo equilátero. De nueva cuenta, obsérvese que a esto es precisamente a lo que nos referimos cuando hablamos de darle a un grupo una representación matricial; encontrar un conjunto de matrices cuyos elementos sean isomorfos a los elementos del grupo original, dando ambos grupos en esencia la misma “tabla de multiplicación”, lo cual podemos enunciar formalmente de la siguiente manera:
Cuando un grupo G1 es isomorfo a otro grupo G2 cuyos elementos sean matrices, se dice que G2 es la representación matricial del grupo G1.Se ha demostrado, por medio de lo que en matemáticas se conoce como una demostración constructiva, cómo es posible obtener una representación matricial para cierto grupo discreto finito. Pero no se ha demostrado que esto sea válido para cualquier grupo, lo cual representa un reto mayor, y nos lleva hacia el verdadero “jugo” de lo que es la Teoría de Grupos. Demostrar el enunciado general requiere formalizar otras definiciones tales como lo que es una equivalencia de clases, lo que es el carácter de un grupo, etc. Por lo pronto, aceptaremos la veracidad del enunciado general como un teorema pendiente de ser demostrado, pero de cualquier manera empezaremos por ver algunos de estos conceptos.
En un grupo G, no sólo podemos encontrar subgrupos. El grupo G en sí también puede ser subdivido; los elementos que constituyen al conjunto de todos los elementos del grupo pueden ser separados a su vez en subconjuntos disjuntos (que no comparten ningún elemento en común con los otros subconjuntos de elementos), llevándose a cabo lo que en matemáticas se conoce como una partición. Un ejemplo de una partición es aquella en la cual en un salón de clases subdividimos a los alumnos en las filas que ocupan sus respectivos pupitres, de forma tal que se tenga a los alumnos (elementos) que están ubicados en la fila 1 (primer subconjunto de elementos), a los alumnos que están ubicados en la fila 2 (segundo subconjunto de elementos), y así sucesivamente. La suma de los elementos de todos los subconjuntos será igual al número de elementos (alumnos) de los que consta el salón de clases.
Podemos llevar a cabo una partición de varias maneras utilizando criterios distintos, pero una partición particularmente interesante del conjunto de elementos de los que consta un grupo es aquella en la cual los subconjuntos de elementos constituyen lo que se conoce como clases de equivalencia. El criterio para llevar a cabo este tipo de partición descansa sobre un viejo conocido que ya se había visto antes al hablar acerca de los procesos conjugados relacionados con el cubo de Rubik (véase la entrada “Los grupos de rotación III”). Formalmente, decimos que un elemento Ga de un grupo es conjugado a otro elemento Gb de dicho grupo si existe en el grupo un elemento Gn tal que la siguiente relación se pueda cumplir:
Ga = GnGbGn-1
Si los elementos Gb y Gc son ambos conjugados al elemento Ga, esto implica que las siguientes dos relaciones se deben de cumplir:
Ga = GnGbGn-1
Ga = GmGcGm-1
De la primera relación:
Ga = GnGbGn-1
Gn-1Ga = (Gn-1Gn)GbGn-1
Gn-1Ga = GbGn-1
Gn-1GaGn = Gb(Gn-1Gn)
Gn-1GaGn = Gb
Combinando esto último con la segunda relación, se tiene:
Gb = Gn-1GaGn
Gb = Gn-1(GmGcGm-1)Gn
Gb = (Gn-1Gm)Gc(Gm-1Gn)
Gb = (Gn-1Gm)Gc(Gn-1Gm)-1
Esto último demuestra que si Gb y Gc son ambos conjugados al elemento Ga, entonces también los elementos Gb y Gc serán los conjugados el uno del otro, de forma tal que el conjunto de elementos {Ga,Gb,Gc}puede ser considerado como un subconjunto de elementos de un grupo G que son equivalentes de acuerdo a la definición dada arriba del elemento conjugado. Los tres elementos pertenecen, literalmente hablando, a una misma clase de elementos, constituyen una clase de equivalencia. Todos los elementos de un grupo que sean conjugados en pares forman una clase de equivalencia.
PROBLEMA: Determínense las clases de equivalencia que pueda haber en el grupo de simetría D3.
Con la ayuda de algo de intuición y tanteo (o simplemente agotando todas las posibilidades), se encuentra que para el grupo de simetría D3 existen las siguientes tres clases de equivalencia:
ε1 = {E}___ε2 = {R1,R2}___ε3 = {R3,R4,R5}
En este caso, se le puede dar a las clases de equivalencia una interpretación sencilla: ε1 = {E} describe una rotación en un ángulo de cero grados; por su parte, ε2 = {R1,R2} describe una rotación del triángulo equilátero en un ángulo de 2π/3 así como una rotación en un ángulo de 4π/3 que es equivalente a un ángulo de rotación igual a - 2π/3, mientras que los elementos en ε3 representan cada uno de ellos una rotación igual a π radianes. Podemos reconocer al grupo de simetría D3 como un subgrupo del grupo continuo de rotaciones ortogonales O(3), permitiéndose únicamente un número limitado de ejes de rotación. O viéndolo de una manera más amplia, este es un ejemplo de un grupo discreto finito que es a su vez un subgrupo de un grupo continuo. Los grupos discretos finitos ciertamente juegan un papel muy importante en la física de la cristalografía, aunque la mayor parte de los grupos interesantes en la Mecánica Cuántica son grupos continuos. Sin embargo, en el hecho de que el grupo discreto D3 sea un subgrupo del grupo continuo O(3) se tiene una pista sobre las maneras en las que se puede llevar a cabo la transición de las propiedades y los teoremas matemáticos de los grupos discretos finitos hacia los grupos continuos, aunque es necesario ejercer cautela al dar este brinco matemático ya que al hacer la transición de las sumatorias a las integrales éstas pueden resultar divergentes para el caso de grupos continuos no-compactos (como en el caso del grupo de los operadores de traslación cuyos efectos no están acotados).
Veamos ahora la cuestión de la reducibilidad para la representación matricial del grupo de simetría D3. Debe ser posible llevar a cabo alguna reducibilidad, ya que para las rotaciones del triángulo equilátero, como en el caso de las representaciones matriciales de los elementos matriciales de los elementos R1 y R2 del grupo de simetría D3 (los cuales pertenecen a la misma clase de equivalencia ε2) se utilizó la matriz general de rotación que se acostumbra usar para rotaciones en torno al eje-z:
Para el caso específico del elemento matricial asociado con la operación de rotación R1, dicho elemento tiene la siguiente estructura de bloques que son a su vez irreducibles:
Lo mismo se puede observar en las demás matrices. De este modo, una inspección de las seis matrices que se obtuvieron arriba para la representación matricial del grupo D3 revela que todas las seis matrices tienen una estructura de bloques, permitiendo el poder llevar a cabo una descomposición de cada una de ellas mismas en una submatriz (2×2) y en una submatriz (1×1). Las submatrices forman a su vez una representación irreducible porque no pueden ser descompuestas en algo más elemental. Introduciendo un nuevo tipo de notación para la simbolización de las submatrices (empleando super-índices), podemos decir que las submatrices (2×2) constituyen la representación irreducible D(3) y que las submatrices (1×1) constituyen la representación irreducible D(2), habiendo una representación trivial, la representación identidad caracterizada como D(1)(Rk).=.1 para todos los Rk. Se puede hacer un resumen de estos resultados en la siguiente tabla:
En estas representaciones matriciales irreducibles podemos deducir algunas propiedades importantes que serán de utilidad posterior en estudio de la Mecánica Cuántica. La primera de ellas es que en virtud de que el operador de rotación R del grupo es unitario la representación matricial correspondiente también lo debe ser, lo cual significa que:
Obsérvese que el intercambio de sub-índices en el lado derecho de la igualdad indica que tenemos que tomar la transpuesta de la matriz, y el asterisco (así como el color rojo) indican que debemos tomar el conjugado complejo de sus elementos, si es que hay números complejos como elementos. Podemos poner este enunciado a prueba con las representaciones matriciales que corresponden a los operadores R1 y R2. En la “tabla de multiplicación” para el grupo D3, podemos ver que R1 es el inverso de R2 así como R2 es el inverso de R1. Las matrices reducidas D(3) para estos operadores de rotación son las siguientes:
Se tiene entonces, por aplicación directa del enunciado (en virtud de que la transpuesta del conjugado complejo de una matriz es, por definición, su transconjugada, representada mediante una daga puesta como exponente, esto es lo que se ha hecho aquí en el símbolo usado para la representación de la matriz completa que aparece en la tercera línea):
Podemos verificar del mismo modo la validez del enunciado para todos los demás elementos del grupo.
Del mismo modo, por aplicación directa de la definición explícita de cada componente de la matriz C que nos resulta de una multiplicación de dos matrices A y B:
se acepta como válida la siguiente relación:
Aunque la notación usada aquí es de carácter matemático general, se está preparando el terreno para cuando se apliquen posteriormente estos conceptos a la suma mecánico-cuántica de dos momentos angulares.
Ahora consideraremos una pregunta importante: ¿Cómo se pueden describir de una manera sencilla las propiedades invariantes de una representación grupal, como en el caso de la representación matricial de un grupo? Si consideramos un elemento cualquiera de un grupo G y lo simbolizamos como Ga, como lo hemos visto arriba en el caso específico del grupo de simetría D3, una representación D(Ga) no es ambigüa por el simple hecho de que en la “tabla de multiplicación” del grupo no puede aparecer repetido un mismo elemento en un renglón o en una columna. Una manera más elegante y sofisticada de decir lo mismo consiste en notar que tomando un elemento (en representación matricial) A cualquiera que pertenezca al grupo G, la operación de similitud AD(Ga)A-1 producirá una forma equivalente pero no idéntica a D(Ga). Una posibilidad para llevar a cabo la descripción de las propiedades invariantes de un grupo sería a través de los autovalores propios eigen de la representación matricial del grupo, a sabiendas de que los autovalores propios eigen de una matriz no cambian bajo una operación de semejanza (similitud), permanecen iguales. Esto conduce a la construcción de los operadores Casimir, cuyos eigenvalores sirven para clasificar las representaciones matriciales. Desafortunadamente, la construcción de los operadores Casimir (o casimires) es por lo general un difícil problema no-lineal. Afortunadamente, en muchos casos, resulta suficiente recurrir a una invariante matricial más sencilla que también permanece invariante bajo operaciones de semejanza, la traza de la representación matricial, la suma de los elementos puestos a lo largo de la diagonal principal. A la traza de una representación matricial de un grupo se le dá un nombre convencional de carácter grupal de la representación matricial, simbolizado como χ (letra griega “xi”), quedando obviamente definido de la siguiente manera:
siendo d la dimensión de la representación matricial (el tamaño de la matriz). A manera de ejemplo, para el elemento grupal R2 que corresponde al grupo de simetría D3 que vimos arriba, el carácter grupal de su representación matricial será:
En el caso de una matriz reducible que pueda ser sub-dividida en bloques diagonales más pequeños irreducibles, podemos aplicar la misma definición del carácter grupal para caracterizar a los sub-bloques matriciales irreducibles. Recurriendo nuevamente al ejemplo de la representación matricial de R2, se tienen los siguientes tres caracteres grupales (tanto para como para , se trata de matrices 1×1 que constan de un solo elemento, el número 1):
Y como ya se dijo, puesto que la traza de una matriz permanece invariante bajo operaciones de similitud, el carácter grupal de una representación matricial es invariante.
PROBLEMA: Demostrar que el carácter grupal de una representación matricial de un grupo o de un sub-bloque matricial irreducible, permanece invariante bajo una operación de similitud.
Tómese la representación matricial dada a cierto elemento Ga del grupo que está siendo considerado:
Si a esta matriz le aplicamos una operación de similitud (semejanza) usando para ello una matriz A del mismo tamaño, entonces la operación matricial a ser llevada a cabo será:
Este es un triple producto matricial en notación abreviada. Para calculos detallados, tenemos que recurrir a la definición matemática básica del producto matricial; en este caso extendida hacia un triple producto matricial (obsérvese que a la matriz intermedia destacada en color azul se le han agregado los subíndices jk de forma tal que ya no estamos hablando de la matriz en su totalidad sino de un elemento matricial específico):
Reagrupando:
Puesto que aquí estamos hablando de elementos específicos a ser sumados, podemos reacomodar los sumandos de la siguiente manera al haber plena conmutatividad en las operaciones llevadas a cabo:
Lo que tenemos entre paréntesis, aunque sigue siendo objeto de una dobla sumatoria en los subíndices jk, permite prescindir de la sumatoria en el subíndice i, teniéndose entonces:
Obviamente, lo que se tiene entre paréntesis (en color magenta) necesariamente debe producir una matriz identidad, como debe ocurrir en el producto de toda matriz A con su inversa:
Al efectuar cálculos, lo anterior es lo mismo que:
Pero esta es la traza de la matriz original, que ya se había definido como el carácter grupal de la representación matricial del elemento Ga:
Se concluye entonces que el carácter grupal permanece invariante bajo una operación de similitud (semejanza).
Llevando a cabo la evaluación de las trazas de las matrices irreducibles dadas en la tabla anterior, podemos construír la siguiente tabla de caracteres grupales del grupo de simetría D3, en donde por razones de conveniencia se han agrupado los caracteres grupales χ bajo las clases de equivalencia ε1, ε2 y ε3:
Ahora bien, recurriendo a la definición del carácter grupal χ, se puede definir un nuevo tipo de representación, la representación vectorial de los caracteres grupales, la cual consiste en agrupar en una forma ordenada bajo un vector los caracteres grupales de las representaciones matriciales. Cada uno de estos vectores será de una dimensión igual al número de elementos que hay en el grupo original. A manera de ejemplo, el vector χ(3) que contiene como componentes los caracteres grupales que corresponden a las representaciones irreducibles D(3) del grupo de simetría D3 será:
Obsérvese que, por conveniencia, se han agrupado en proximidad inmediata dentro del vector inmediata los caracteres de los elementos que pertenecen a la misma clase de equivalencia, con el único elemento (2) que pertenece a la clase de equivalencia ε1 destacado de color rojo, los dos elementos que pertenecen a la clase de equivalencia ε2 destacados de color azul, y los tres elementos que pertenecen a la clase de equivalencia ε3 destacados de color magenta. Haciendo esto de una manera ordenada, una vez que se tiene este tipo de representación se puede definir formalmente lo que vendría siendo algo así como el “producto punto” de dos vectores χ:
siendo cp el número total de elementos que hay en cada clase de equivalencia, y siendo n el número total que hay de clases de equivalencia dentro de un grupo. Si ponemos los vectores χ(2) y χ(3) el uno a un lado del otro, resalta de inmediato la manera en la cual se puede efectar el cálculo del producto punto entre los dos vectores a través de la suma de los productos parciales formados entre cada par de componentes (componentes con el mismo color) de cada vector:
Un hecho interesante y extraordinario es que para cualquier grupo G el producto escalar definido arriba para cualesquier par de vectores χ obtenidos de las representaciones irreducibles de dicho grupo resulta ser igual ya sea al orden del grupo g o a cero, en lo que se conoce como una relación de ortogonalidad:
De este modo, tanto para el caso en que se trate de los vectores de caracteres grupales de dos representaciones irreducibles diferentes (a.≠.b) o de dos representaciones irreducibles iguales (a.=.b), se tiene:
PROBLEMA: Verifíquense las relaciones de ortogonalidad para los vectores de caracteres grupales que corresponden a las representaciones irreducibles del grupo de simetría D3.
Empezaremos tomando el “producto punto” entre los vectores χ(2) y χ(3):
Esto mismo lo podemos calcular del siguiente modo con la fórmula dada arriba:
Ahora obtendremos el “producto punto” del vector χ(2) consigo mismo:
En lo que toca al “producto punto” del vector χ(3) consigo mismo, se tiene:
Esto mismo, usando la fórmula, procede de la manera siguiente hacia el mismo resultado:
Para el “producto punto” entre los vectores χ(1) y χ(2), se tiene:
Y en lo que toca al “producto punto” entre los vectores χ(1) y χ(3), se tiene, se tiene:
En todos los casos considerados, siempre se verifica la relación de ortogonalidad.
No hay que perder de vista el hecho de que detrás de toda la simbología matemática que en ocasiones puede resultar más una distracción que una ayuda subyacen ideas importantes de enorme utilidad. En el caso de los caracteres grupales, si tomamos la matriz de sub-bloques matriciales A’ dada arriba resulta fácil comprobar para la misma que el carácter grupal χ(A’) de toda la matriz es simplemente igual a la suma de los caracteres grupales los sub-bloques matriciales que la forman, esto es:
y este es un número que permanece invariante para toda la matriz incluso cuando ésta es sometida a operaciones de similitud (semejanza). Al igual que la energía y el momento angular, las cuales son cantidades físicas que se conservan y permenecen invariantes bajo cualquier experimento, el carácter grupal también por ser una invariante (matemática) debe atraer nuestro interés por encima de otras propiedades de las representaciones irreducibles.
Echar mano de las matrices ortogonales de rotación no es la única manera de construír una representación matricial de un grupo. Considérese un grupo formado por tres objetos (1, 2 y 3), cuyos elementos son especificados por todas las operaciones posibles de permutación que se puedan llevar a cabo sobre dichos objetos. Si partimos de la permutación {1,2,3} tomándola como el elemento identidad del grupo, resulta obvio que hay seis maneras distintas de acomodar los objetos, siendo las cinco restantes {2,1,3}, {3,2,1}, {1,3,2}, {2,3,1} y {3,1,2}. Equiparando al elemento {1,2,3} con una matriz identidad (que simbolizaremos aquí como E ) cuyo tamaño sea 3×3, y relacionando al primer objeto (1) con el primer renglón de la matriz identidad, al segundo objeto (2) con el segundo renglón de la matriz identidad, y al tercer objeto (3) con el tercer renglón de la matriz identidad, resulta evidente que las permutaciones de los tres objetos pueden ser asociadas con las permutaciones llevadas a cabo en los renglones de la matriz identidad E. Con esto en mente, estamos en condiciones de poder construír las siguientes matrices para el grupo de permutaciones de tres objetos:
Las matrices así construídas son llamadas matrices de permutación, y tienen la propiedad evidente de que un “1” puesto en la diagonal principal de cada matriz corresponde a un objeto que no cambiado de posición.
Se puede verificar, mediante la construcción de la “tabla de multiplicación” (en donde la operación binaria de “multiplicación” debe ser interpretada como una permutación de objetos) para los elementos del conjunto de permutación de tres objetos, que los elementos forman un grupo que aquí llamaremos P3. Sin embargo, en lo que toca a las matrices que hemos construído, y por la forma tan peculiar en la que han sido construídas (sin hacer referencia de ninguna especie a operación alguna de rotación), surge la duda de que tales matrices realmente puedan constituír un grupo matemático, y aún no se ha definido qué tipo de operación matricial se llevaría a cabo como operación binaria para determinar si se les puede dar una interpretación grupal. La adición de matrices se descarta de inmediato como operación binaria posible para estos efectos, porque con tal operación se generan de inmediato elementos que no forman parte del conjunto original (matrices que tienen más de un “1” en un renglón o en una columna). Sin embargo, la operación de multiplicación matricial se antoja como un medio posible para definir una operación binaria válida sobre las seis matrices de permutación con la que se cumplan las propiedades de un grupo. La duda puede subsistir al considerar esta posibilidad. Después de todo, al construír las matrices de permutación para los tres objetos, el criterio utilizado fue simplemente el intercambio en los renglones de la matriz identidad, nunca lo hicimos teniendo en mente operaciones de multiplicación matricial. La única manera de salir de dudas es construyendo la “tabla de multiplicación” para las matrices de permutación del grupo P3, la cual resulta ser la siguiente:
Inspeccionando la tabla, podemos ver que no aparece ningún elemento repetido en renglón o columna alguna. Más aún, podemos apreciar también que cada elemento tiene su inverso. Yendo en mayor detalle, podemos comprobar que la propiedad asociativa también se cumple en las operaciones llevadas a cabo con los elementos matriciales de la tabla. Estamos entonces frente al hecho sorprendente e inesperado de que la representación matricial del grupo de permutaciones de tres objetos en base a matrices de permutación constituye también un grupo matemático.
¿Fue este resultado un mero accidente, una extraordinaria coincidencia, o se aplica también a otros grupos con una cantidad mayor de elementos? De esto es precisamente de lo que trata la Teoría de Grupos, el dar respuestas a este tipo de incógnitas. Aquí la pregunta planteada adquiere una importancia primordial en virtud de que un hecho fácilmente demostrable en la Teoría de Grupos es que todo grupo G es isomorfo a un subgrupo de un grupo de permutación. El cubo de Rubik que vimos en una entrada previa es un ejemplo de un subgrupo de permutación, el conjunto de elementos que están siendo permutados son los subcubos coloreados del cubo completo, y cada una de las rotaciones de las caras del cubo es una permutación de las posiciones y las orientaciones de los subcubos.
Igualmente interesante resulta el hecho de que si se compara la “tabla de multiplicación” del grupo de rotaciones del triángulo equilátero D3 con la tabla que corresponde al grupo de permutaciones de tres objetos P3, desubriremos que (con un simple cambio en las notaciones de los elementos), ambas tablas son las mismas. Hablando matemáticamente, y aunque se trate de cosas completamente distintas, los grupos D3 y P3 son isomorfos. Esto es algo muy común en la Teoría de Grupos, el que una misma tabla grupal junto con sus propiedades y teoremas y demás parafernalia matemática sea válida para situaciones totalmente distintas. Esta es la razón por la cual en la Teoría de Grupos se opta por la abstracción, la generalización, en vez de estar trabajando sobre casos particulares aunque esto último sea más cómodo y entendible, ya que el cubrir todos los casos particulares posibles requeriría un esfuerzo titánico, mientras que el enfocarse en lo esencial, en lo abstracto, aplicando los resultados en cada situación de nuestro interés particular que vaya surgiendo, ahorra una cantidad enorme de trabajo en el que simplemente estaríamos reinventando la rueda una y otra vez.
Es posible que el lector que ya tiene algunas nociones sobre Teoría de Grupos (tal vez al haber tomado o estar tomando un curso relacionado con esta materia) esté formulándose ya varias preguntas. Partiendo del hecho de que dado un grupo G cualesquiera siempre es posible que dicho grupo contenga algún subrupo (o subgrupos); habiendo también la posibilidad de que el subgrupo (o subgrupos) del grupo G sean lo que en la Teoría de Grupos se define como subgrupos normales (lo más cercano que pueda haber en la Teoría de Grupos a la noción de “factorización”); y que del mismo modo dada una matriz M cualesquiera es posible que dicha matriz sea reducible a sub-bloques matriciales con lo cual podemos considerar a la matriz M como una matriz reducible, entonces aceptando el hecho de que a todo grupo se le puede dar (en principio) una representación matricial, ¿podemos esperar que la “reducibilidad” de un grupo a sus subgrupos normales sea correspondida con la reducibilidad de las matrices que representan a sus elementos bajo una representación matricial? Invirtiendo el razonamiento, ¿podríamos postular como un teorema de carácter general a ser demostrado el que a una matriz invertible M -esto es, que tenga un inverso M-1, que no sea una matriz singular- le corresponderá un grupo G? Esto nos abriría un mundo nuevo de posibilidades dentro de la Mecánica Matricial de Heisenberg, ya que en principio podríamos tomar la matriz que representa un sistema físico y podemos darle una representación grupal a dicho sistema desprovista por completo de toda mención de la cosa matricial. Meditando un poco sobre estas reflexiones sencillas, se podría vislumbrar que aquí podría haber suficiente material de base para que empiecen a saltar las chispas llevándonos hacia una axiomatización aún más formal y rigurosa de la Mecánica Cuántica, lo cual invariablemente puede conducir a nuevas generalizaciones y descubrimientos. Son precisamente este tipo de interrogantes lo que hace avanzar a la Ciencia.
Se había asentado en la entrada titulada “Los grupos de rotación III” el siguiente enunciado de carácter general:
Toda representación matricial de un grupo es equivalente a alguna representación del grupo llevada a cabo con matrices unitarias.Lo que hemos visto previamente en esta entrada nos permite incorporar el enunciado anterior como el primero de un conjunto de lo que llamaremos los cuatro teoremas fundamentales que constituyen el “núcleo central” dentro de la Teoría de Grupos de los grupos finitos discretos:
1) Toda representación matricial de un grupo es equivalente a alguna representación del grupo que sea llevada a cabo con matrices unitarias.
2) Una matriz que conmute con todas las matrices de una representación irreducible sólo puede ser la matriz identidad o un múltiplo de la matriz identidad (este enunciado es conocido como el lema de Schur).
3) Si A y B son las matrices de dos representaciones irreducibles de un grupo, de dimensiones n y m respectivamente, entonces si hay una matriz M con m renglones y n columnas tal que MA.=.BM para todos los miembros del grupo, ésta tiene que ser la matriz nula para m.≠.n, y si m.=.n entonces puede ser una matriz nula o puede ser una matriz cuyo determinante sea diferente de cero. En el último caso, la inversa matricial M-1 existe, y las representaciones A y B son equivalentes.
4) Si A y B son dos representaciones irreducibles de un grupo, no equivalentes, entonces Σ.A*ijBkl.=.0, y para una representación irreducible unitaria sencilla se tiene Σ.A*ijAkl.=.(g/n)δikδjl, en donde g es el orden del grupo (el número de elementos de los que consta el grupo) y n la dimensión de la representación. La sumación es llevada a cabo sobre todos los miembros del grupo. Los δ son deltas de Kronecker, iguales a cero cuando los subíndices son diferentes, e iguales a la unidad cuando los subíndices son iguales. Esta es conocida como la relación fundamental de ortogonalidad para las representaciones irreducibles de un grupo.
Ahora bien, la principal característica de los vectores unitarios de base {ex,ey,ez}en un sistema de coordenadas rectangulares Cartesianas es que constituyen un conjunto ortonormal de vectores:
ei · ej = δij
El mismo concepto de ortonormalidad puede ser extendido matemáticamente hacia un espacio N-dimensional. Pero no es necesario limitarse al sistema de coordenadas rectangulares Cartesianas. En un sistema de coordenadas esféricas, los vectores unitarios de base son {er,eθ,eφ}también satisfacen la misma condición de ortonormalidad, y comparten la misma característica: son irreducibles. Y mientras se satisfaga la condición de ortonormalidad, no es necesario limitarse al uso de vectores unitarios de base, también se pueden emplear funciones de base para simbolizar una representación irreducible. De hecho, cualquier conjunto ortonormal de funciones (vectores) puede ser empleado para la simbolización de representaciones irreducibles. Y en la Mecánica Cuántica, en donde el momento angular está entronizado en un lugar de primerísima importancia, las soluciones a la parte angular de una ecuación de onda en donde haya un potencial de simetría esférica, que son las armónicas esféricas, estas son funciones de base ortonormales e irreducibles. De este modo, la búsqueda de representaciones irreducibles eventualmente nos llevará a considerar la solución general de la ecuación de onda de Schrödinger para el átomo de hidrógeno, la cual ya se ha visto previamente que está dada por una suma infinita de soluciones particulares cada una de las cuales define uno de los estados posibles (orbitales) del átomo de hidrógeno:
Ya hemos visto que cada una de las soluciones particulares puede ser expresada (gracias al método de separación de variables) como el producto de una función de onda radial Rl,m y una función de onda angular:
En realidad, la parte que está íntimamente ligada al momento angular orbital en el átomo de hidrógeno es la parte angular de la funcion de onda, la cual es representada en cualquiera de las siguientes maneras:
Y esto es justo lo que representa el momento angular (orbital) en el átomo de hidrógeno. Esto nos obliga a repasar las funciones de onda del momento angular orbital, las cuales hemos visto ya al tratar el tema del momento angular desde el punto de vista de la Mecánica Ondulatoria que son armónicas esféricas. Y resulta que las armónicas esféricas son representaciones irreducibles, ninguna de ellas puede ser obtenida mediante una combinación linear de cualquiera de las otras, ni pueden ser expresadas como la suma o el producto de algo más elemental. Lo cual nos viene a confirmar, de paso, que la solución general a la ecuación de onda del átomo de hidrógeno al obtenerse en función de armónicas esféricas está expresada en función de cantidades irreducibles; y no es posible expresar dicha solución en términos de algo más elemental.
Las representaciones irreducibles en la Mecánica Cuántica son una consecuencia directa de las relaciones matemáticas que resultan de la Teoría de Grupos. Como ya se ha visto, el operador Hamiltoniano H es una función de las coordenadas y los momentums de un sistema. En la representación de Schrödinger, las soluciones de la eigen-ecuación Hψ.=.Eψ existen sólo para ciertos valores del número E que pueden ser montadas sobre un conjunto ortonormal de funciones de las “coordenadas” {ψ}, o sea las eigenfunciones (o eigenkets). Cuando a más de un estado ψ le corresponde la misma energía, decimos que el nivel de energía es degenerado (no los estados, puesto que no hay nada degenerado acerca de los estados, simplemente tienen la misma energía). Si pre-multiplicamos (por la izquierda) la eigen-ecuación con algún operador mecánico-cuántico Q e insertamos Q-1Q (un operador identidad) entre H y ψ, obtenemos (QHQ-1)Qψ = QEψ = EQψ. Si QHQ-1 = H, o lo que es lo mismo, QH = HQ, entonces HQψ = EQψ, lo cual significa que los estados ψ y Qψ corresponden al mismo valor de la energía, esto es, el nivel es degenerado. Si Q representa algún cambio de las funciones de base (las coordenadas {ψ}), entonces QHQ-1 será el nuevo operador Hamiltoniano H’ en el nuevo marco de referencia. Si Q es una operación de simetría, entonces se debe tener que QHQ-1 = H’, y en tal caso el conjunto de operadores que conmutan con H constituyen un grupo, llamado el grupo de simetría del Hamiltoniano. Cada estado puede ser clasificado mediante la representación irreducible a la cual pertenece. Las clasificaciones espectroscópicas son esencialmente identificaciones de la representación irreducible a la que cada estado pertenece.
Como ya se vió al tratar el tema de las técnicas de aproximación, resulta frecuentemente útil expresar el Hamiltoniano H de un sistema como la suma de H0, un Hamiltoniano aproximado que es sencillo y que corresponde a la mayor parte de la energía, y un Hamiltoniano de perturbación H’ que incluye los detalles más finos. Si el grupo de simetría de H’ es más pequeño que el grupo de simetría de H0, entonces se rompe la simetría de orden mayor a causa de la perturbación. En este caso, niveles previamente degenerados pueden ser separados en niveles distintos (algunos de los cuales pueden seguir siendo degenerados en caso de haber otros números cuánticos distintos a los ya usados que no han sido tomados en cuenta). La Teoría de Grupos proporciona funciones apropiadas para estos cálculos que pueden reducir considerablemente el esfuerzo requerido. Como un ejemplo ya visto en entradas anteriores, los estados de un átomo aislado pueden ser clasificados mediante el momento angular total L (que podemos representar de un modo más general como J), y pertenecen a las representaciones irreducibles del grupo de rotación en tres dimensiones, con dimensión 2J+1. Mientras haya simetría esférica, todos estos estados tendrán exactamente la misma energía. Pero si se aplica un campo magnético, la simetría esférica se rompe, y la única simetría remanente será la que haya en torno a un eje en la dirección del campo magnético. Los 2J+1 niveles adquieren entonces energías diferentes, y los estados no-degenerados pueden ser clasificados con el número cuántico magnético M siendo M = J, J - 1, ..., -J. La Teoría de Grupos permite determinar estos estados de antemano, de modo tal que la separación de los niveles de energía está dada por un elemento matricial diagonal sencillo. Como otro ejemplo un poco más sofisticado, al observarse que los nucleones (el neutrón y el protón) y la partícula Λ no eran muy diferentes en sus masas, en los años sesenta del siglo XX se conjeturó que estas partículas pudieran ser miembros de una representación irreducible de dimensión 3 de un grupo llamado SU3, y que las diferencias observadas en las masas era consecuencia de un desdoblamiento debido a una perturbación relacionada con la propiedad llamada extrañeza (strangeness). Aunque hubo algún éxito en el acomodamiento de las partículas conocidas en representaciones irreducibles de SU3, poco tiempo después una teoría de la estructura interna de las partículas elementales de mayor peso superó dicho modelo. La Teoría de Grupos no sólo sirve para la clasificación de las partículas sub-atómicas elementales conforme se van descubriendo nuevas partículas adjudicándoles nuevos números cuánticos con los cuales pueden ser reagrupadas bajo nuevas clasificaciones. La amplitud de la probabilidad para una transición entre dos estados ψ y φ está dada por alguna integral como ∫ψ*Pφdτ en donde P es un operador característico del mecanismo involucrado en la transición (por ejemplo, dipolo eléctrico) y dτ es el elemento diferencial de volumen. Si ψ, φ y P son clasificadas todas de acuerdo a sus representaciones irreducibles, entonces el producto de estas tres cantidades corresponde a una representación cuyos caracteres grupales (trazas) χ son el producto de los caracteres grupales de cada una de las representaciones involucradas. Esta representación casi siempre es reducible, y las representaciones irreducibles en los componentes pueden ser encontradas mediante el análisis de los caracteres grupales. A menos de que la representación unitaria (con todas las matrices con +1) esté allí, la integral ∫ψ*Pφdτ debe desvanecerse, puesto que de otro modo cambiaría bajo alguna operación de simetría, la cual por definición no puede cambiar a la integral. Esto proporciona las reglas de selección para el no-desvanecimiento de ciertas transiciones o de ciertos elementos matriciales. Un ejemplo tomado de la espectroscopía nos muestra la manera en la que ésto funciona. El momento de dipolo eléctrico es un vector, y corresponde a la representación irreducible J.=.1 del grupo de rotación. Operando en un estado de momento angular J, nos dá las representaciones que corresponden a J+1, J y J-1. El otro estado involucrado en la transición debe tener uno de estos valores de J, o el resultado no contendrá la representación unitaria J.=.0. Esto produce la regla de selección de que J sólo puede cambiar en ±1 ó en 0 en una transición de dipolo eléctrico.
Los grupos finitos son útiles en el estudio de los cristales, espectros moleculares y partículas idénticas, y nos dan ejemplos claros de las aplicaciones de la Teoría de Grupos, pero ya se ha visto que también hay grupos continuos, los cuales desempeñan un papel importante en la Mecánica Cuántica y la física de las partículas elementales; sus representaciones comparten muchas de las propiedades de las representaciones de los grupos finitos, aunque los métodos de análisis involucrados en ambos casos es algo diferente. Aunque no haya sido obvio, el estudio del momento angular dentro de la Mecánica Cuántica es en realidad Teoría de Grupos, aunque no sea presentada como tal en tratados elementales puesto que los detalles pueden ser manejados recurriendo al álgebra de primeros principios. Lo que se encuentra son las representaciones irreducibles del grupo de rotación en tres dimensiones, O3, y las reglas para combinarlas. El grupo de rotación O3 es un ejemplo excelente de un grupo de rotación, aunque es algo elemental para mostrar muchos de los detalles finos. Un grupo continuo es de orden infinito, de modo tal que la suma llevada a cabo sobre elementos finitos grupales termina siendo una integración sobre elementos grupales continuos parametrizados de alguna manera conveniente.
En el estudio del momento angular y las representaciones irreducibles del grupo de rotación O3, resulta ventajoso recurrir a algo que ya se visto previamente al estudiar el momento angular bajo la óptica de la Mecánica Ondulatoria, los operadores escalera. Simbolizando al momento angular como J, y simbolizando a sus componentes en un sistema de coordenadas rectangulares Cartesianas como el vector (Jx,Jy,Jz) los operadores escalera de ascenso y descenso (o bien, de subida y bajada) están definidos como:
Recurriendo a las relaciones de Born para el momento angular, se encuentra que el efecto de ambos operadores escalera es aumentar o disminuír el número cuántico (eigenvalor) m de una eigen-función de onda ψj,m en una unidad, dejando intacto al número cuántico .j. Con el operador escalera de ascenso, podemos ir escribiendo y acomodando las eigen-funciones de onda (eigen-vectores, eigen-kets) con respecto a un m creciente de la siguiente manera:
siendo el número p un entero positivo. Del mismo modo, podemos ir escribiendo y acomodando las eigen-funciones de onda de la siguiente manera con el operador escalera de descenso:
siendo el número q también un entero positivo. En cualquiera de estas dos maneras, y seleccionando el factor de fase que aparece en la parte angular de la solución de la ecuación de onda de Schrödinger como positivo y real con un módulo igual a la unidad (o sea, +1), se obtiene entonces un conjuto de 2.j+1 eigenfunciones ortonormales:
Cada una de estas eigenfunciones ortonormales (ortogonales la una con respecto a la otra) satisface las eigenecuaciones fundamentales del momento angular:
y satisfacen también las eigen-ecuaciones que corresponden a los operadores escalera que se obtienen de dichas relaciones fundamentales del momento angular:
Los dos 2.j+1 eigenvectores son transformados del uno al otro mediante la aplicación de estos operadores. Con estos operadores, bajo el contexto del grupo de rotación UR(φ), siempre obtenemos como resultado estos eigenvectores y sus combinaciones lineales. En lenguaje matemático formal, el espacio vectorial (2.j+1)-dimensional cubierto (abarcado) por las eigen-funciones ψj,m es invariante bajo la aplicación de los operadores del momento angular. Lo llamamos, por lo tanto, un sub-espacio invariante del espacio de Hilbert. No puede ser separado en sub-espacios invariantes más pequeños, y cada uno de los 2.j+1 vectores puede ser transformado en cualquiera de los otros vectores con la aplicación de los operadores escalera. Esto es lo que nos lleva a la expresión de la representación irreducible del grupo de rotación.
Los operadores J no son miembros de un grupo. Más bien, forman una álgebra Lie cerrada bajo la operación mecánico-cuántica de conmutación. Su relación con los miembros grupales de O3 es que son los generadores del grupo en el sentido de que D(α) = (1.+.iαJz) es el operador para una rotación a través de un ángulo infinitesimal α en torno al eje-z. Una rotación finita (no infinitesimal) puede ser expresada como D(α) = exp(iαJz). El álgebra Lie expresa la estructura del grupo de una manera concisa y útil. Para muchas aplicaciones del momento angular, no se requieren sus matrices de rotación en su forma explícita. Un resultado importante en todo esto es que mientras que una simetría continua generalmente está asociada con una ley de conservación (la conservación del momento angular es una consecuencia de la simetría O3), las simetrías finitas no están asociadas con cantidades que se conservan (un buen ejemplo de ello es la simetría de inversión o paridad).