martes, 11 de agosto de 2009

Perturbacion y estados degenerados I

Las técnicas de perturbación para obtener soluciones aproximadas (o inclusive exactas) no solo son aplicables a la solución de ecuaciones diferenciales siempre y cuando se tenga una ecuación diferencial más sencilla cuyas soluciones se conozcan y la cual pueda ser utilizada como punto de partida aplicando perturbaciones pequeñas a la ecuación diferencial original. También son útiles cuando la ecuación usada como punto de partida es una ecuación matricial en lugar de una ecuación diferencial y en donde no vemos por ningún lado operador diferencial alguno. Las relaciones usadas para el cálculo de los términos de perturbación son las mismas, excepto que hay que hacer ligeros cambios en la notación tomando en cuenta que en lugar de funciones un(x) estaremos usando vectores, y que en lugar de operadores notacionales como λx3un(x) estaremos usando matrices como M1 en las relaciones para obtener las perturbaciones de primer orden, de segundo orden, etcétera. Lo importante es darse cuenta de que aunque los procedimientos parezcan diferentes en realidad se trata de dos caras diferentes de una misma moneda, y el estudioso de la Mecánica Cuántica puede sacar mucho provecho sintiéndose cómodo al pasar de la Mecánica Ondulatoria en la que se usa la ecuación diferencial de Schrödinger a la Mecánica Matricial de Heisenberg en donde se utilizan vectores y matrices, y viceversa.

En la Mecánica Matricial, el operador matricial básico es esencialmente lo que identificamos como el operador matricial Hamiltoniano de energía H, y la ecuación eigen que describe a un sistema físico es la siguiente:

= EΨ

Una ecuación matricial algo más elaborada incluirá un término de perturbación H1 agregado a la anterior ecuación matricial, lo cual consideramos como una pequeña perturbación al sistema original, de modo tal que el operador matricial Hamiltoniano H constará ahora del término H0 propio de la ecuación original cuya solución se conoce, y el término H1 que representa la pequeña perturbación al sistema original:

H = H0 + H1

Se ha asentado ya previamente que, en el ámbito de la Mecánica Ondulatoria, los eigenvalores de perturbación obtenidos con la aplicación de un término perturbador O1 están dados por una serie convergente de perturbación como la siguiente:


en donde la corrección de primer orden está dada por el término:


mientras que la corrección de segundo orden está dada por el término:


habiendo otras correcciones de orden mayor cuyas fórmulas entendiblemente se van complicando más y más al ir creciendo el orden.

La diferencia en las relaciones anteriores cuando son usadas en la Mecánica Matricial es que el operador O1 es reemplazado en dichas fórmulas con una matriz H1, y las eigenfunciones un(x) son reemplazadas por vectores Ψ, de modo tal que para el cálculo de la corrección de primer orden en una serie de perturbación la relación requerida tomará el siguiente aspecto:


A fin de cuentas, también se obtiene un número real al final de las evaluaciones después de haberse llevado a cabo todas los cálculos numéricos (el producto de un vector renglón Ψn por un operador matricial M que a su vez actúa sobre un vector columna Ψn termina siendo un simple número, un escalar), lo que cambia es la manera en la cual efectuamos los cálculos. Esto requiere una explicación más detallada que se muestra a continuación:


Obsérvese que estamos usando la convención bra-ket de Dirac para simplificar la notación. El bra es el vector renglón, y el ket es el vector columna. Poniendo atención cuidadosa en lo que tenemos aquí como la definición de una corrección perturbativa de primer orden, vemos que el término de corrección de primer orden es también lo que ya ha sido definido previamente como el promedio estadístico o esperanza matemática del operador H1, con la única diferencia de que ahora el operador en cuestión es una matriz. Esto nos permite escribir lo siguiente recurriendo a la notación usada para describir esperanzas matemáticas:


Escribir la corrección de segundo orden cuando se emplean matrices resulta un poco más elaborado, pero la estructura general de cada fórmula sigue siendo la misma.

Hablando en términos más formales pero igualmente prácticos, las relaciones generales proporcionadas por la Teoría de las Perturbaciones (para obtener correcciones de primer orden, segundo orden, etcétera) expresadas en notación matricial automáticamente incluyen a las mismas expresiones generales que emplean notación no-matricial para su uso en la Mecánica Ondulatoria si se está dispuesto a considerar para ésto último matrices cuadradas de orden uno, o sea matrices 1×1. Una matriz 1×1 es una matriz que contiene un solo elemento que vendrá siendo expresado como una relación algebraica ordinaria tal y como las que se utilizan en la Mecánica Ondulatoria (por ejemplo, el operador Hamiltoniano H para el oscilador armónico simple), y tanto el vector renglón que pre-multiplica a la matriz de perturbación como el vector columna que post-multiplica a la matriz de perturbación son reducidos necesariamente a vectores con un solo elemento puesto que ésta es la única manera en la cual se pueden llevar a cabo operaciones con una matriz 1×1 que terminen produciendo un número ordinario (o sea un valor propio eigen). De este modo, todas las relaciones típicas de la Mecánica Ondulatoria dentro de la Teoría de las Perturbaciones que están expresadas en notación matricial se pueden considerar como un caso especial de las mismas relaciones usadas en la Mecánica Ondulatoria prescindiendo de matrices y vectores. Tómese por ejemplo la corrección perturbativa de primer orden que en muchos textos técnicos aparece en forma matricial de un modo como el siguiente:


Si la matriz H1 es una matriz que contiene un solo elemento, entonces la expresión matricial para la corrección de primer orden se reduce a la expresión ordinaria (no matricial) usada en la Mecánica Ondulatoria sin hacer referencia alguna ni a vectores renglón ni a vectores columna ni a matrices:


Del mismo modo, la corrección perturbativa de segundo orden que en muchos textos técnicos aparece en forma matricial de un modo como el siguiente:


se reduce a la expresión ordinaria (no matricial) usada en la Mecánica Ondulatoria sin hacer referencia alguna ni a vectores renglón ni a vectores columna ni matrices para el caso en el cual H1 es una matriz que contiene un solo elemento:


Ahora bien, tanto en el ámbito de la Mecánica Ondulatoria como en la Mecánica Matricial la evaluación de la corrección perturbativa de segundo orden presenta el problema de una división por cero cuando dentro de la sumatoria se tiene el término en el que los dos números cuánticos m y n que son iguales:


El dilema de la división por cero se resuelve aclarando de antemano para el rango a lo largo del cual se llevará a cabo la sumatoria (o sea lo que se escribe debajo del símbolo Σ) que el caso específico en que m y n son iguales queda fuera de la evaluación, o sea que solo se llevará a cabo la sumatoria sobre valores de m que sean diferentes del número n:


Esta aclaración (agregada debajo del símbolo Σ) en la definición de la corrección de segundo orden resuelve el asunto recordándonos aquello que no debemos tomar considerar, o sea el caso en el que m sea igual a n, para evitar caer en errores fatales. Aparentemente, esto sería el fin del asunto, excepto que puede surgir otra situación completamente diferente en la cual para un sistema no-perturbado haya dos niveles de energía con números cuánticos m y n diferentes pero que tengan exactamente el mismo valor. Esto es lo que en la Mecánica Cuántica se conoce como estados degenerados. Supóngase por ejemplo que se tiene un sistema no-perturbado para el cual:


¿Qué es lo que vamos a hacer entonces cuando tengamos que evaluar el siguiente término como parte de una sumatoria?:


El problema no es poca cosa, y en sus inicios esto llegó a causar serias preocupaciones en los pioneros de la Mecánica Cuántica en sus esfuerzos por extender el método de las perturbaciones a una gran variedad de problemas para los cuales no parecía haber una solución a la ecuación diferencial que se tenía que resolver. Estamos hablando de la necesidad de crear una extensión al método de las perturbaciones, y crear una teoría de la perturbación para estados degenerados. Al agregarle ésta capacidad a la Teoría de las Perturbaciones, es mejor empezar intuitivamente con algún ejemplo que nos sirva de muestra para desarrollar las técnicas matemáticas con las cuales podremos estar en condiciones de lidiar con los estados degenerados que lejos de ser la excepción parecen ser la regla en muchísimos sistemas físicos estudiados en la Mecánica Cuántica.

Un ejemplo sencillo de la aplicación de las técnicas de perturbación a un sistema con estados degenerados que además nos permite trabajar desde un principio con una ecuación matricial para familiarizarnos mejor con la notación propia de la Teoría de las Perturbaciones aplicada a problemas propios de la Mecánica Matricial es el de un ión paramagnético situado en una retícula cristalina. Se trata de un problema poco fácil puesto que el Hamiltoniano H para tal ión usualmente es extremadamente complejo, ya que contiene términos que corresponden a las energías cinéticas de los electrones, las interacciones Coulómbicas entre los electrones y entre ellos y el núcleo iónico, interacciones entre los electrones iónicos y los campos del cristal creados por los átomos en la vecindad, interacciones spin-órbita y además de interacciones de otra índole conocidas como interacciones hiperfinas, interacciones de cuadripolo (o cuadrupolo), etcétera. Prescindiendo de términos en el Hamiltoniano innecesarios para el cálculo aproximado que queremos llevar a cabo (siempre es posible agregar posteriormente el efecto perturbativo producido por los otros términos que estaremos ignorando aquí), estudiaremos un ejemplo tomado de la ciencia de la cristalografía. El advenimiento de la Mecánica Cuántica, aplicada a la cristalografía que anteriormente era una ciencia empírica convirtiéndola en algo sobre lo cual se podían llevar a cabo cálculos numéricos de índole científica, es a lo que debemos semiconductores miniaturizados que hacen posible los monitores LED de estado sólido que volvieron obsoletos a los voluminosos tubos de rayos catódicos empleados en los cientos de miles de televisores de antaño y a los rayos láser de bolsillo, entre muchas otras cosas. Pese a la complejidad del Hamiltoniano en este tipo de situaciones, para muchos problemas de interés, la teoría perturbativa se puede aplicar con éxito a tales sistemas.

El caso a ser considerado es el del grupo más bajo de estados electrónicos asociados con un ión que posee un spin efectivo S.=.1, localizado en un punto de una retícula cristalográfica en donde el potencial efectivo visto por el ión a su alrededor está caracterizado por algo que los expertos en cristalografía conocen como simetría rómbica. Los niveles más bajos de energía se pueden describir en términos de lo que se conoce como un Hamiltoniano de spin (para una mayor abundancia de detalles sobre este concepto el lector puede referirse a trabajos como “Paramagnetic Resonance” elaborado en 1953 por B. Bleaney y K. W. H. Stevens para la publicación Reports on Progress in Physics, y “Paramagnetic Resonance II” de K. D. Bowers y J. Owen elaborado en 1955 para la misma publicación Reports on Progress in Physics) cuyas propiedades están relacionadas directamente con las propiedades iónicas del cristal. En la ausencia de un campo magnético aplicado, el Hamiltoniano de spin del cristal puede ser expresado de la siguiente manera:

H = DSz2 + R(Sx2 - Sy2)

El término dominante DSz2 (la letra “D” destaca la naturaleza “D”ominante) en el Hamiltoniano surge en el operador Hamiltoniano cuando la simetría dominante octaédrica vista por el ión paramagnético en muchos casos es distorsionada a simetría tetragonal (o trigonal), formando la ecuación matricial básica usada como punto de partida. Una distorsión adicional a la simetría rómbica es lo que dá origen al término rómbico

R(Sx2 - Sy2)

que manejamos como una perturbación al sistema original. El Hamiltoniano de spin que se acaba de especificar se aplica a muchos cristales, entre ellos la sal de níquel de Tutton K2Ni(SO4)2·6H2O.

Es razonable considerar al término rómbico como una perturbación del sistema, puesto que el factor R es considerablemente menor que el factor D, y las energías que van asociadas con ambos términos son pequeñas en comparación con los términos mucho mayores que corresponden a la energía cinética y Coulómbica.

Las tres eigenfunciones apropiadas Ψn para el término DSz2 son aquellas para Sz que representamos mediante los siguientes vectores columna:


Un vector columna puede ser escrito también como un vector renglón y sigue siendo exactamente el mismo vector; la única diferencia radica en el tipo de operación vectorial o matricial que habrá de llevarse a cabo. En el caso de las anteriores eigenfunciones, la representación de los vectores como vectores renglón es la siguiente:


Estas funciones son ortonormales, esto es, son ortogonales entre sí y la norma de cada una de las funciones tiene un valor igual a la unidad, concretizado mediante la siguiente relación:


Determinaremos a continuación las energías cuando no hay perturbación alguna suponiendo para ello que el factor R es igual a cero. En el estudio de los operadores matriciales de spin S, se encuentra que las matrices que corresponden a ;Sx, Sy y Sz son los siguientes:

Para una partícula que posee un spin S.=.1, las tres matrices de spin Sx, Sy y Sz requeridas por el Hamiltoniano H0 de la eigenecuación básica y el Hamiltoniano H1 de perturbación son las siguientes:


Nos enfocaremos primero en la eigenecuación básica, para la cual requerimos evaluar primero:


De este modo, el Hamiltoniano básico H0 es:


Esto nos permite obtener con la primera eigenfunción Ψ1 el primer eigenvalor E1(0) en donde el superscripto cero entre paréntesis (0) indica que se trata de algo en lo que no hay aún perturbación alguna:


Del mismo modo, podemos obtener con la segunda eigenfunción Ψ2 el segundo eigenvalor E2(0):


Procediendo de modo similar, obtenemos con la tercera eigenfunción Ψ3 el tercer eigenvalor E3(0). :

H0Ψ3 = E3(0) Ψ3 = 2Ψ1

Así pues, los tres valores de energías para cada una de las eigenfunciones Ψn son:


Obsérvese que la matriz que representa al término DSz2 es una matriz diagonal, como es usual que ocurra en un Hamiltoniano no-perturbado:


Nos enfocaremos ahora sobre lo que tiene que ver con el término perturbador:


R(Sx2 - Sy2)

Esto nos requiere evaluar tanto:


como:


Usando lo anterior, el operador Hamiltoniano matricial de perturbación H1 será entonces:


Obsérvese algo importante: el operador matricial de perturbación no es una matriz diagonal. Esto es lo común en muchos términos perturbativos. Si aplicamos éste elemento perturbador a la primera eigenfunción Ψ1 que corresponde la ecuación matricial básica, se tiene:


Del mismo modo, haciendo lo propio con la segunda eigenfunción Ψ2 que corresponde la ecuación matricial básica, se tiene:


Procediendo de modo similar, obtenemos:

H1Ψ3 = 2Ψ1

Ahora bien, en el cálculo de términos de perturbación de primer orden bajo el ámbito de la Mecánica Ondulatoria en donde manejamos ecuaciones diferenciales (y no ecuaciones matriciales), en la entrada anterior se había especificado una relación como la siguiente:


Sin embargo, si estamos trabajando en el ámbito de la Mecánica Matricial en donde lo que usamos son matrices y vectores, el símil de la relación anterior que se requiere para poder continuar adelante es:


De éste modo, para obtener la eigenenergía que corresponde a un número cuántico k basta con extraer de la matriz H1 el elemento situado en el renglón k y la columna k de la matriz. Obsérvese que se han dado dos representaciones para las dos alternativas notacionales, la primera en la penúltima fórmula utilizando la notación bra-ket de Dirac para “encapsular” a manera de “sandwich” el operador O1 entre las dos eigenfunciones de onda, y la segunda fórmula usando la notación (H1)kk que representa esencialmente lo mismo pero manejando el problema desde la perspectiva de la Mecánica Matricial..

Antes de llevar a cabo los cálculos para obtener las correcciones de primer orden mediante las técnicas de perturbación para el término R(Sx2 - Sy2), aplicaremos sucesivamente el operador matricial de perturbación H1 a cada una de las funciones Ψ1, Ψ2 y Ψ3 obteniendo primero:


y después:


y finalmente:


De este modo, habiendo efectuado lo anterior, podemos calcular que el término de perturbación de primer orden será, para Ψ1:


Por otro lado, el término de perturbación de primer orden será, para Ψ2:


Y por último, el término de perturbación de primer orden será, para Ψ3:


Puesto que todas las correcciones de primer orden se desvanecen a cero, no hay correcciones de primer orden aquí, por lo cual pasamos a la búsqueda de las correcciones perturbativas de segundo orden, lo cual hace que el problema se vuelva interesante.

El problema que se nos ha venido encima para el cálculo de las perturbaciones de segundo orden es que para el operador Hamiltoniano H0 dos de las eigenenergías tienen el mismo valor, o sea que hay dos eigenfunciones distintas cuyos eigenvalores son los mismos como corresponde a dos estados degenerados.

Como ya se resaltó arriba, en contraste con la forma matricial del Hamiltoniano inicial (no-perturbado) que es una matriz diagonal, se tiene que la forma matricial del término general de perturbación no es una matriz diagonal:


Tomando en cuenta que en el cálculo de las correcciones perturbativas de segundo orden para éste problema aparecen términos en los cuales los denominadores son iguales a cero a causa de la presencia de estados degenerados, es necesario remover éste inconveniente que de otra manera impide calcular las correcciones perturbativas de segundo orden para el problema. No es posible obtener aquí las correcciones de segundo orden mediante la aplicación de la sumatoria usada en la evaluación de correcciones de segundo orden en virtud de que los estados no perturbados Ψ1 y Ψ3 son estados degenerados. Sin embargo, podemos resolver el problema efectuando lo que se conoce en el Algebra Linear como un cambio de base, tomando combinaciones lineares de estos estados degenerados de modo tal que no haya “elementos de cruce” o “elementos cruzados” (esto es, elementos situados fuera de la diagonal principal en la matriz) entre las nuevas funciones de estado. En pocas palabras, vamos en pos de la búsqueda de funciones “buenas” que sean capaces de poder diagonalizar la matriz de perturbación H1. Si algún estudiante en un curso introductorio de Algebra Linear alguna vez se preguntó qué tipo de aplicación práctica podría tener un cambio de base, he aquí una aplicación práctica de ello.

Para el cambio de base, obtendremos las nuevas funciones “buenas” como una combinación linear de funciones del subespacio (Ψ1, Ψ3).serán simbolizadas de la manera siguiente:

Ψ+ y Ψ-

El uso del signo positivo y el signo negativo como subíndices de las funciones de onda “buenas” refleja una costumbre que viene del hecho de que frecuentemente ocurren en pares como resultado de la obtención de raíces cuadráticas en donde hace su aparición una raíz positiva y una raíz negativa. El uso de ésta tradición no es mandatorio, pero simplifica la perspectiva de lo que se está viendo y lo que se está manejando.

Para la combinación linear de las funciones de onda “malas” (malas en el sentido que corresponden a un operador matricial no-diagonal), hágase:


en donde a y b son constantes a ser determinadas. Puesto que las nuevas funciones serán utilizadas en la eigenecuación matricial que corresponde al operador Hamiltoniano de perturbación H1, tenemos entonces lo siguiente:


en donde γ.' es una constante a ser determinada dentro de la cual hemos agrupado el factor constante 2 para sacarlo fuera del camino (igual podríamos haber hecho R y ħ iguales a 1, habido el hecho de que en realidad lo que estamos buscando son valores para a y b). Esto último nos conduce a un sistema trivial de ecuaciones lineares que puede ser resuelto fácilmente por substitución directa:


De este modo, las constantes a y b están relacionadas del siguiente modo:


Si le damos arbitrariamente a la constante a un valor igual a la unidad, entonces la constante b de modo automático puede tener dos valores prefijados, b igual a 1 con signo positivo y b igual a 1 con signo negativo. Así pues, las funciones que estamos procurando en la nueva base pueden ser:


Estos vectores no están normalizados, su norma no es igual a la unidad. Normalizando los vectores como ya lo hemos hecho en otros problemas anteriores, las funciones normalizadas serán:


o bien, factorizando en ambos casos:


Podemos usar la siguiente simbolización común para denotar ambas funciones:


No cuesta mucho trabajo verificar que ambas funciones son ortonormales:


Así pues, tenemos la siguiente nueva base de funciones para ser usada con el término general de perturbación H1:


Lo que hemos hecho con todo lo anterior es efectuar un cambio de base del espacio:

(Ψ1, Ψ2, Ψ3).

al espacio:

(Ψ+, Ψ2, Ψ-).


Usando las nuevas funciones podemos empezar a llevar a cabo algunas evaluaciones como la siguiente que vendría siendo la obtención de un “elemento cruzado” que no va situado en la diagonal principal de la matriz de perturbación:


Obtenemos el mismo resultado de cero si intentamos llevar a cabo la misma evaluacion para obtener el valor del elemento obtenido usando Ψ- y Ψ2 en cualquier orden.

A continuación, haremos lo mismo con las funciones Ψ+ y Ψ-:


Si invertimos el orden, obtendremos exactamente el mismo resultado de cero. Posiblemente el lector alcance a vislumbrar ya que con las funciones “buenas” lo que hemos logrado ha sido diagonalizar la matriz de perturbación, que es lo más importante. Pero ésto solo nos será de utilidad si las funciones “buenas” además de nulificar los elementos no-diagonales reduciéndolos a cero nos producen elementos diagonales diferentes de cero (de lo contrario, tendríamos una matriz cero 0 que no nos sirve de nada). ¿Se ha logrado ésto?

Tal parece que sí. Si efectuamos la evaluación usando Ψ+ en ambos lados, el resultado no será igual a cero:


Tampoco será cero el resultado si usamos Ψ- en ambos lados:


Obsérvese bien lo que ha sucedido. Con la base de funciones originales, para el término general de perturbación no era posible obtener una matriz diagonal con los eigenvalores puestos en la diagonal principal, mientras que con la base nueva obtenida mediante una combinación linear de las funciones originales, la matriz correspondiente para el término general de la perturbación sí es una matriz diagonal:


Esto implica que si le sumamos a la matriz que corresponde al Hamiltoniano sin perturbación, la cual es una matriz diagonal, la matriz obtenida con las funciones nuevas, podremos tener el Hamiltoniano total H también como una matriz diagonal:


Un diagrama de niveles de energía para el ejemplo que hemos estado considerando es el siguiente:



En la parte (a) de la figura podemos ver con una separación casi imperceptible los dos niveles de energía 2 que corresponden a los dos estados degenerados, iguales en magnitud pero que han sido ligeramente separados a propósito en la figura con fines meramente didácticos para dejar en claro cómo lo que parece ser un solo nivel de energía 2 se termina desdoblando en dos niveles de energía a causa de la perturbación 2 como se muestra en la parte (b) de la figura.

Obsérvese que en este ejemplo sencillo que se acaba de ver, la diagonalización de la submatriz para el subespacio que corresponde a (Ψ1, Ψ3) diagonaliza el Hamiltoniano entero (el Hamiltoniano perturbado):

H = DSz2 + R(Sx2 - Sy2)

y por lo tanto resuelve el problema eigenvalor-energía en forma exacta en vez de resolverlo únicamente hasta la corrección de segundo orden del término perturbador. Los resultados finales de temas como éste son lo que se estudia en la Teoría del Campo Cristalino, algo de lo cual se proporciona por separado una introducción cualitativa en ésta obra.

En este ejemplo que acabamos de ver se ha deslizado la manera en la cual le podemos dar la vuelta al espinoso caso de los sistemas cuánticos con sistemas degenerados en los que por tal situación se pensaría difícil la aplicación del método de las perturbaciones cuando hay estados degenerados. En vez de desarrollar formalmente un procedimiento riguroso (abstracto, hablando en generalidades sin hacer referencia a ningún ejemplo específico dificultando con ello la visualización de aquello de lo que se está hablando) sobre la manera de manejar los estados degenerados dentro de la Teoría de las Perturbaciones, mostrando posteriormente la aplicación del procedimiento general a unos cuantos ejemplos, se ha proporcionado arriba un ejemplo con el cual podemos hablar en mayor detalle acerca del procedimiento general con la esperanza de que teniendo el ejemplo en mente el lector se dará cuenta de aquello de lo que hablamos en generalidades.

La dificultad esencial en la aplicación del método de las perturbaciones a casos en los cuales hay estados degenerados se encuentra a partir del cálculo de las correcciones de segundo orden:


en donde el denominador de las energías se desvanece cuando el estado n bajo consideración es degenerado con el estado m, y cuando elementos matriciales de H que acoplan estos estados degenerados. La dificultad se resuelve cuando todos los elementos matriciales del término de perturbación H1 que forma parte del Hamiltoniano general H del sistema se desvanecen entre todos los pares de estados degenerados. Esto significa que la matriz Hamiltoniana H formada por la suma de ambas matriz principal H0 y matriz de pertubación H1:


debe ser una matriz diagonal en lo que concierne a cada submatriz que se refiera a un grupo de estados degenerados. Por lo tanto, la dificultad de aplicar la metodología perturbativa a estados degenerados es removida mediante una diagonalización de la submatriz apropiada del Hamiltoniano total. Esto siempre se puede hacer. El problema se reduce a encontrar las combinaciones lineales (ortonormales) apropiadas vm de los estados degenerados un de modo tal que H1 tenga elementos matriciales fuera de su diagonal principal que se desvanecen entre los estados vm:


en donde:


Aquí los uk representan el conjunto original de funciones de onda degeneradas de energía Es. Se supone aquí que cada degeneración se presenta en m-tantos. En pocas palabras, se trata del mismo problema clásico en donde a un estudiante universitario se le presenta una matriz no-diagonal y se le pide diagonalizar dicha matriz, y si la matriz ya es parcialmente diagonal entonces se le pide que diagonalice aquellas submatrices de la matriz que no sean diagonales. El estudiante de Algebra Lineal que ya estudió y comprendió lo que es un proceso de diagonalización de matrices sabe perfectamente de lo que estamos hablando.

Para aclarar un poco más lo anterior, considérese la siguiente matriz 6×6:


No hay que inspeccionar mucho ésta matriz para darse cuenta de que la matriz se puede subdividir de modo tal que salta a la vista que contiene dos submatrices no-diagonales:


siendo la primera submatriz no-diagonal la que corresponde al subespacio (1,2):


y siendo la segunda submatriz no-diagonal una que corresponde al subespacio (4,5,6)


La matriz original 6×6 tiene un valor propio (eigen) claramente visible que es 4 y que podemos considerar colocado en una matriz diagonal 1×1, de modo tal que podemos decir que la matriz original puede ser subdividida en tres submatrices o bloques matriciales. Se supone que la matriz debe tener otros cinco valores propios que no se pueden discernir a simple vista porque están “escondidos” en las dos submatrices no-diagonales que tienen que ser diagonalizadas para que los cinco valores propios restantes de la matriz 6×6 puedan salir a flote. Es obvio que el proceso de diagonalización de la submatriz 2×2 junto con la diagonalización de la submatriz 3×3 diagonaliza la matriz completa 6×6. El proceso de diagonalización de las dos submatrices no-diagonales no cambia los valores propios eigen de la matriz 6×6, siguen siendo los mismos.excepto que tras la diagonalización de las dos submatrices ya no estarán “escondidos”. El proceso de diagonalización de cada submatriz se lleva a cabo por separado. Si las funciones de onda del sistema original no-perturbado son:

(Ψ1 , Ψ2 , Ψ3 , Ψ4 , Ψ5)

entonces para diagonalizar la primera submatriz que corresponde al subespacio (Ψ1,Ψ2) podemos formar una combinación lineal como la siguiente:


con la finalidad de determinar las constantes numéricas a y b con el propósito de obtener la primera diagonalización con los dos eigenvalores (y eigenfunciones) que estamos buscando, mientras que para diagonalizar la segunda submatriz que corresponde al subeespacio (Ψ3,Ψ4,Ψ5) podemos formar una combinación lineal como la siguiente:


con la finalidad de determinar las constantes numéricas c, d y e con el propósito de obtener la segunda diagonalización con los tres eigenvalores (y eigenfunciones) restantes que estamos buscando. De aquí en adelante, todo es una repetición mecánica del procedimiento utilizado en el ejemplo de arriba. Aunque suene prosaico decirlo, en realidad de aquí en adelante todo se trata de una simple “receta de cocina” que no requiere de mucha inteligencia o mucho ingenio.

De aquí en adelante, llamaremos a las funciones de onda que son capaces de poder diagonalizar una matriz de perturbación “funciones de onda buenas”. En realidad, todo el secreto para poder resolver un problema de perturbación en donde hay estados degenerados radica en encontrar las “funciones de onda buenas”.

Otra manera de resaltar lo que sucede cuando se añade un Hamiltoniano de perturbación a un sistema no-perturbado consiste en visualizar el operador Hamiltoniano H en su representación matricial H actuando sobre una función de onda general Ψ para producir otra matriz diagonal, la matriz de los eigenvalores, en la eigenecuación matricial de Schrödinger:


De lo anterior, al extraer cada elemento matricial correspondiente de ambos lados de la ecuación matricial, se genera una serie de eigenecuaciones de Schrödinger independientes del tiempo:


Se supone de inicio que la matriz H que representa al operador Hamiltoniano H no-perturbado aunque no sea una matriz diagonal siempre puede ser diagonalizada, porque en caso contrario tal matriz no nos sirve para darle una representación al sistema físico desde una perspectiva de la Mecánica Cuántica. ¿Pero qué sucede si al Hamiltoniano H del sistema no-perturbado le añadimos una matriz del mismo orden (del mismo tamaño), la matriz de perturbación, que representa una perturbación al sistema? Con la matriz de perturbación, generalmente hablando, ocurre precisamente lo contrario de lo que ocurre con la matriz del Hamiltoniano no-perturbado, en tal caso la matriz que se agrega casi nunca es una matriz diagonal. Y al agregar una matriz no diagonal a una matriz diagonal, el resultado que se obtiene (la matriz del sistema ya perturbado) es una matriz no-diagonal (obviamente). Por ejemplo:


Una matriz H así como la que se acaba de dar arriba no puede ser diagonalizada por ninguna técnica conocida dentro del repertorio del Algebra Linear; es imposible tratar de diagonalizar una matriz así. Pero lo que sí se puede hacer es cambiar las funciones de base, o sea las eigenfunciones originales de onda, haciendo combinaciones de las mismas para obtener así “funciones de onda buenas” φ con las cuales, al aplicarles un Hamiltoniano perturbado, se producirá una matriz diagonal de eigenvalores, lo cual siempre se puede llevar a cabo. De hecho, ésta es la razón por la cual en la materia del Algebra Linear se le dá tanta importancia al cambio de base, aunque dentro de la materia nunca se menciona tal cosa en virtud de la obsesión de los matemáticos por darle una amplia generalidad a sus metodologías sin tratar de hacer conexión alguna entre la teoría abstracta y las aplicaciones de la teoría al mundo real. Puesto que las “funciones de onda buenas” φ son obtenidas de las eigenfunciones originales de base ψ mediante simples combinaciones lineares, matemáticamente hablando las “funciones de onda buenas” φ son tan buenas como las funciones de onda originales ψ en virtud de que la combinación linear de dos soluciones distintas a un sistema de ecuaciones lineares seguirá siendo siempre también una solución al sistema (obsérvese que las soluciones que se buscan, los eigenvalores, no cambian):


Refiriéndonos a nuestra introducción original al tema de las perturbaciones en donde el término perturbador es λH1, parece claro que conforme la perturbación λ se va acercando a cero las funciones de onda del sistema perturbado deben aproximarse más y más a aquellas funciones de onda del sistema no-perturbado H0. Sin embargo, cuando hay degeneración presente, generalmente hablando la función apropiada no será una de las funciones originales uk de la ecuación cuántica para el sistema no-perturbado:


sino que serán una combinación lineal de los mismos uk. El proceso de diagonalización que se ha indicado arriba simplemente asegura que las funciones de onda perturbadas se irán aproximando a las funciones de onda no-perturbadas conforme λ..0.

Lo que acabamos de ver es algo en cierta forma extraordinario. La Teoría de las Perturbaciones nos dice que, cuando se tienen estados degenerados, entonces se podrá dar no un simple desplazamiento en todos los niveles de energía, sino un desdoblamiento.

La Teoría de las Perturbaciones nos predice matemáticamente que el simple hecho de que haya estados degenerados implicará la existencia de un desdoblamiento de niveles de energía que se puede dar en forma espontánea como ocurre en el caso de los cristales, o que puede darse con la aplicación de una condición física externa como un campo eléctrico o un campo magnético. Esto no lo predicen otros métodos como el principio variacional y mucho menos lo pueden manejar cuantitativamente, lo cual convierte al método de las perturbaciones posiblemente en el aliado más confiable y poderoso del físico que se tiene que conformar con aproximaciones ante la inexistencia de soluciones analíticas exactas.

El ejemplo del ión paramagnético en una retícula cristalina que se ha estudiado arriba nos permite entender mejor el efecto de los estados degenerados en los cálculos de términos de corrección evaluados mediante la teoría de las perturbaciones, y es un ejemplo de lo que se conoce como una degeneración de dos pliegues (en inglés, two-fold degeneracy) que ocurre cuando hay dos niveles de energía que en ausencia de perturbación alguna se confunden en un solo nivel. En el ejemplo del cristal, no es necesario aplicar un campo externo para romper la degeneración, ya que las condiciones necesarias para romper la degeneración se dan por sí solas sin que tengamos que hacer nada al respecto, y en una situación así la Mecánica Cuántica es usada más bien para explicar algo que sucede en la Naturaleza. Pero en otros casos, en ausencia de un efecto perturbador interno, es necesario aplicar una perturbación externa mediante algo así como un campo eléctrico o un campo magnético con lo cual se pueda romper la degeneración, y entre mayor sea la intensidad del efecto perturbador cuantificada a través de un parámetro λ (que tomaremos en nuestros cálculos como menor a la unidad) tanto mayor será la ruptura de la degeneración con los dos niveles separándose más y más, como lo muestra la siguiente ilustración:




En ausencia de perturbación alguna, solo será posible detectar un solo nivel de energía que en la figura estamos llamando E0. Es la acción de alguna perturbación lo que puede romper la degeneración haciendo que los niveles energéticos se vayan separando conforme va aumentando la intensidad de la pertubación.

Este es el momento propicio para retomar algo que había quedado pendiente en la discusión llevada a cabo en la entrada titulada El acoplamiento LS puesta en esta obra: el análisis cuantitativo y no meramente cualitativo de los niveles energéticos del átomo de hidrógeno cuando se ha llevado a cabo un desdoblamiento de niveles a causa del acomplamiento spin-órbita del electrón producido por el acoplamiento del momento angular orbital L y el momento angular de spin S del electrón:




En la entrada referida, se obtuvo la siguiente relación para la energía de interacción producida por el acoplamiento citado de momentos angulares:


Esto lo vamos a considerar como una perturbación. De acuerdo al método de las perturbaciones, la corrección perturbativa de primer orden que es mucho más fácil de obtener que la corrección perturbativa de segundo orden constituye en esencia la obtención de la esperanza matemática o el promedio estadístico de la perturbación. En el caso del átomo de hidrógeno se tiene no uno sino tres números cuánticos (n,l,m) con una variedad de combinaciones posibles para cada número cuántico n arriba del número cuántico principal n.=.1. Para obtener las correcciones perturbativas de primer orden se vuelve necesario evaluar cada caso por separado para todas las combinaciones posibles. La expresión general para evaluar la corrección energética de primer orden para cada posibilidad es:


De la relación obtenida para el acoplamiento spin-órbita (ó acomplamiento LS), se aprecia que la energía de interacción es proporcional al producto escalar del momento angular orbital del electrón y su momento angular de spin. Sumando ésta energía de interacción al Hamiltoniano de energía para el electrón de valencia del átomo de hidrógeno nos dá:


El tercer término, que viene siendo la perturbación en los niveles de energía del átomo de hidrógeno, depende del producto escalar L·S. Definiendo el momento angular total J como:

J = L + S

tenemos entonces que en presencia del acoplamiento spin-órbita el operador Hamiltoniano H para el átomo de hidrógeno ya no conmuta con L y con S, de modo tal que el momento angular de spin y el momento angular orbital ya no se conservan separadamente. Y bien los operadores J, L y S no conmutan el uno con el otro, los operadores J2, L2 y S2 sí conmutan el uno con el otro, produciendo cada uno de ellos los siguientes eigenvalores al actuar sobre la función de onda mostrada:


Puesto que el único valor que puede tener el número cuántico de spin s es 1/2, entonces:


y ello justifica prescindir del subíndice s de la función de onda.


La expresión que corresponde a la función de onda completa para el átomo de hidrógeno también conmuta con estos tres operadores J2, L2 y S2. Operacionalmente hablando, lo siguiente es válido y correcto:



Podemos por lo tanto caracterizar el estado del átomo de hidrógeno con los números cuánticos n, j, l y m, en donde el número cuántico principal n está asociado con la parte radial de la función de onda. Y de acuerdo con el resultado obtenido previamente:


los eigenvalores de L·S son por lo tanto:


Así pues, el operador Hamiltoniano H del sistema incorporando la perturbación causada por la energía de interacción spin-órbita se puede reescribir de la siguiente manera:


Puesto que el tercer término de lo anterior, considerado como un operador combinado (por lo que hay dentro de los paréntesis cuadrados), estará operando sobre una eigenfunción que es manipulada por cada uno de los operadores para cada uno de los estados estacionarios del átomo de hidrógeno (J, L y S), el término entre los paréntesis cuadrados terminará siendo un simple número como resultado de la suma de los tres números que corresponden a los operadores J, L, y S. Esto nos resulta en una energía potencial modificada efectiva V.' para un estado en particular dada por:


Se ha considerado que la corrección spin-órbita es pequeña en comparación con el resto de la energía del átomo (ésta es la justificación para haber recurrido a la teoría de las perturbaciones), lo cual es confirmado al meter números en el asunto, y la corrección energética de primer orden para el átomo de hidrógeno en lo que toca a la interacción LS puede ser escrita como:


Esto tiene el efecto de desdoblar la degeneración en los niveles de energía para un mismo estado n con el mismo valor de l pero con distintas orientaciones relativas de los vectores L y S, esto es, con diferente j. En particular, para todos aquellos estados que no sean estados S (para los cuales l.=.0), cada nivel de energía se separa en un doblete, correspondiendo al hecho de que:


De lo que acabamos de obtener, se deduce que la separación energética del doblete está dada por la relación:


La esperanza matemática de índole radial:


depende del modelo empleado para describir el potencial radial V(r). Lo más fácil es suponer un potencial simétricamente esférico, con toda la carga positiva del núcleo concentrada dentro de una esfera de probabilidad tan pequeña que se le puede tomar como una carga punto o carga puntual, en cuyo caso podemos recurrir a la conocida fórmula de la ley de Coulomb que dentro del sistema de unidades SI-MK está dada por la relación:


mientras que en el sistema de unidades CGS-Gaussiano está dada por:


Tomando esta última expresión, vemos que:


Así pues, el desarrollo posterior se reduce a obtener una expresión para la esperanza matemática:


Pero resulta que obtener esta esperanza matemática radial para el átomo de hidrógeno o un átomo hidrogenoide no es un asunto fácil. Se puede obtener recurriendo a otros instrumentos tales como la relación de Kramer y el teorema Hellman-Feynman, pero ésto se cubrirá más a fondo en la entrada titulada Corrección perturbativa relativista que forma parte de esta obra. Adelantándonos a dicho tema, se asentará aquí un resultado que se obtiene en dicha entrada:


siendo a el radio de Bohr. Dicho sea de paso, este resultado nos confirma que estábamos en lo cierto al agregar los subíndices n y l en:


afirmando al hacer tal cosa que ésta esperanza matemática depende únicamente del número cuántico principal n que esté bajo consideración y el número cuántico l asociado al momento angular orbital del electrón, y nada más. Para no embrollar el asunto y confundirnos, mantendremos la representación de ésto último sin hacer substitución alguna

Yendo hacia un ejemplo muy conocido y muy específico, con lo que se ha obtenido arriba vemos que el estado P3/2 (l.=.1, j.=.3/2) difiere energéticamente del nivel P1/2 de la siguiente manera:


Esto es precisamente lo que se usa para explicar una gran variedad de resultados obtenidos experimentalmente en el laboratorio, tales como el desdoblamiento de las líneas características del doblete del sodio con una longitud de onda λ para los fotones que corresponden a una de las líneas de 589 nanometros (5890 Angstroms) y una longitud de onda de 589.6 nanometros (5896 Angstroms) para la otra línea del doblete:




En el potasio también se observa de modo prominente exactamente el mismo doblete que el que se observa en el sodio, con la única diferencia de que para el caso del potasio las longitudes de onda de los fotones observados es de 764.49 nanometros (7644.9 Angstroms) para una de las líneas y de 769.90 nanometros (7699.0 Angstroms) para la otra línea del doblete.

Aunque no haya sido obvio, el cálculo de la energía de interacción spin-órbita involucró la teoría de perturbación para estados degenerados, porque en ausencia del término de interacción , los niveles para:


se vuelven degenerados y se confunden. Fue la selección de eigenfunciones de H, J2, L2 y S2 como funciones de onda lo que permitió una diagonalización total de la matriz de perturbación, de modo tal que la degeneración no salió a flote explícitamente. Lo interesante de este tipo de desdoblamiento es que se dá por sí solo sin necesidad de que haya que aplicarle alguna influencia perturbadora externa al átomo como un campo eléctrico o un campo magnético, y se dá por sí solo a causa de algo que es completamente interior al mismo átomo.

En los dos casos que acabamos de ver arriba, tanto el que corresponde al problema de cristalografía como el que trata de la explicación de los “dobletes” de las líneas-D del sodio y el potasio, las energías de perturbación aparecen espontáneamente y en forma natural sin que nosotros tengamos que hacer algo (o podamos hacer algo) al respecto. El acoplamiento LS es algo que se dá en el átomo por el solo hecho de existir el átomo con un electrón en su derredor que además de poseer su propio momento angular de spin S posee también un momento angular orbital L. Tales efectos de perturbación son parte intrínseca de las características de algunos sistemas físicos. En dichos sistemas las energías de perturbación son valores fijos, inmutables. Sin embargo, en otros casos nosotros somos los que sacamos a flote la perturbación y podemos provocar a voluntad los desdoblamientos aplicando a la muestra de material ya sea un campo eléctrico (como en el caso del efecto Stark del cual veremos algo posteriormente en unas entradas posteriores) o un campo magnético (como en el caso del efecto Zeeman), de modo tal que podemos ir aumentando la intensidad de la perturbación a nuestro antojo simplemente subiendo la intensidad del campo eléctrico o del campo magnético. Lo que hay que tener siempre presente sin embargo es que la teoría de las perturbaciones fue desarrollada para efectos de perturbaciones relativamente pequeñas, y al aumentar la intensidad de la perturbación a niveles elevados es factible anticipar una discordancia entre lo que predice la teoría y lo que se obtiene experimentalmente en el laboratorio.

Cuando hay degeneración de dos pliegues, además de proceder adelante con la diagonalización requerida para poder encontrar las “funciones eigen buenas” que son capaces de diagonalizar una matriz o un sub-bloque matricial, sin emplear alguna fórmula general, podemos recurrir a otro procedimiento que se asentará aquí.

Supóngase que se tiene un sistema no-perturbado para el cual hay dos eigenfunciones de onda:


estando normalizadas ambas funciones de onda ψa(0) y ψb(0):


Lo primero a resaltar es que cualquier combinación lineal de ambas funciones de onda:


seguirá siendo un eigenestado del Hamiltoniano no-perturbado H0 con el mismo eigenvalor E(0). Los estados ψa(0) y ψb(0) son funciones de onda espaciales, independientes del tiempo. El efecto de una perturbación que aquí llamaremos λ:


será “romper” la degeneración. Justo al aplicar la perturbación con un valor λ diferente de cero, el eigenvalor no-perturbado deja de ser simplemente E(0) y hacen su aparición los dos estados degenerados:


Al ir aumentando la intensidad de la perturbación y al irse rompiendo la degeneración, entonces conforme va aumentando la intensidad del efecto perturbador λ de 0 a 1 también irá aumentando la brecha entre los dos niveles de energía que antes estaban confundidos en un solo valor en ausencia de perturbación alguna. Así como podemos ir en un sentido también podemos ir en el sentido contrario, removiendo la perturbación hasta que λ.=.0 y no hay perturbación alguna. Lo que se quiere ahora es resolver la ecuación de Schrödinger independiente del tiempo:


haciendo:


y llevando a cabo la siguientes expansiones en series de potencias:


Substituyendo estas expansiones en la ecuación de Schrödinger independiente del tiempo, y recolectando términos en potencias iguales de λ, se tiene lo siguiente:


Puesto que para el sistema no-perturbado se tiene:


entonces los primeros términos en cada lado de la igualdad se cancelan mutuamente, y a un primer orden en λ se tiene:


Pre-multiplicando por la izquierda ambos miembros de la igualdad anterior por el conjugado complejo de ψa(0), esto con la finalidad de tomar productos internos recurriendo a la notación bra-ket de Dirac para mayor simplicidad, se puede escribir entonces:


El operador H0 es Hermitiano:


y esto permite que el primer término del lado izquierdo de la igualdad pueda cancelar el segundo término del lado derecho de la igualdad:


lo cual nos deja simplemente con:


Insertando en esto último la relación:


y haciendo uso de las condiciones de ortonormalidad, se tiene entonces:


Esto lo podemos expresar de una manera más compacta usando a la siguiente notación:


de modo tal que tenemos ahora lo siguiente en una presentación más compacta y entendible:


Repitiendo los mismos pasos, pero utilizando ahora el conjugado complejo de ψb(0) en lugar del conjugado complejo de ψa(0), llegamos a otra relación similar:


en donde se han hecho en forma parecida a lo anterior las siguientes definiciones:


Obsérvese que hemos definido los elementos necesarios para poder definir lo que podría llamarse una “matriz de trabajo” W:


En realidad, al llegar a esta etapa hemos tocado lo que viene siendo la “clave” del procedimiento de análisis para un problema de perturbación con dos estados degenerados: se construye la “matriz de trabajo” W definiendo los elementos matriciales de dicha matriz como los que se obtienen tomando el Hamiltoniano de perturbación H1 y evaluando los elementos matriciales usando para ello las funciones de onda que corresponden a la expansión original en los eigenestados ψa(0) y ψb(0) que aquí para mayor simplicidad estamos llamando simplemente ψa y ψb en la matriz W que tenemos arriba.

Ahora bien, multiplicando la ecuación:


por Wab y usando la ecuación:


para eliminar βWab, llegamos a lo siguiente después de aplicar un poco de álgebra:


Si α es diferente de cero (ya que de lo contrario podría llevarnos a una división entre cero), esta última relación puede ser desarrollada llevándonos a la siguiente ecuación cuadrática:


Resolviendo la ecuación anterior para E(1) con la fórmula cuadrática, y haciendo uso del hecho de que la matriz W debe ser una matriz Hermitiana para la cual:


de modo tal que se tiene:


llegamos entonces a las dos raíces distintas que nos proporcionan los dos valores eigen de energía que corresponden a los estados otrora degenerados:


Esta técnica nos permite obtener las dos raíces distintas que corresponden a los dos valores degenerados de un sistema en el que estamos seguros por el aspecto de la matriz (o del sub-bloque matricial) de que hay degeneración de dos pliegues.

En la fórmula anterior, un caso especial es aquél que ocurre cuando Wab.=.0:



con lo cual podemos ver que uno de los valores de los estados degenerados de energía es:



mientras que el otro valor es:



Se tiene entonces lo siguiente:



Poniendo mayor atención en esto último, podemos darnos cuenta de que los dos eigenvalores obtenidos corresponden precisamente a las correcciones perturbativas de primer orden del sistema:


También podemos darnos cuenta de otro asunto importante. La matriz W tal y como fue construída fue obtenida bajo la condición especial invocada resultó ser una matriz diagonal. Esto desde luego que es una cuestión de suerte, porque en un caso cualquiera que puede ser diferente al caso especial no tenemos forma alguna de poder saber a priori, de antemano, que las funciones de onda ψa(0) y ψb(0) sean también “funciones de onda buenas” que son precisamente las que se requieren para obtener una matriz diagonal al construír la matriz W que a fin de cuentas es la que corresponde a la matriz del Hamiltoniano de perturbación H1. En una situación que coincida con el caso especial que hemos tratado el desarrollo del problema nos confirmaría que las funciones de onda ψa(0) y ψb(0) del sistema no-perturbado son también “funciones de onda buenas”. Sin embargo, un caso de esta índole vendría siendo una excepción, lo más factible es anticipar que la matriz W no será una matriz diagonal una vez construída. La fórmula obtenida nos permite calcular los eigenvalores de energía que vienen siendo las correcciones de primer orden que hay que agregar a la energía no-perturbada para poder obtener las magnitudes de la energía del sistema perturbado:


pero no nos proporciona las funciones de onda buenas en caso de que estemos interesados en ellas. Así pues, ¿qué del caso en el que la matriz W nos resulte ser una matriz no-diagonal? La fórmula nos sigue proporcionando con sus dos raíces las dos correcciones de primer orden a la energía no-perturbada pero no nos proporciona las funciones de onda con las cuales se pueda llevar a cabo la diagonalización de la matriz que corresponde al Hamiltoniano de perturbación H1. En tal caso, ya hemos visto más arriba al resolver el problema de cristalografía lo que se tiene qué hacer para obtener las funciones de onda diagonalizadoras: hay que obtener a partir de la matriz de trabajo W el determinante con el cual podemos obtener el polinomio característico que nos proporciona lo que necesitamos para poder proceder a la obtención de las funciones de onda buenas. Con la fórmula obtenida nos evitamos el tener que andar diagonalizando matrices o sub-bloques matriciales, habido el hecho de que muchas veces estamos interesados en obtener simplemente los valores de energía de los estados perturbados que son a su vez las correcciones de primer orden que hay que aplicar. Pero para poder obtener el par de “funciones de onda buenas” invariablemente tenemos que recurrir al procedimiento de la diagonalización de la matriz de trabajo W que corresponde en realidad a la matriz del Hamiltoniano H1 del sistema perturbado.

Hay una manera de evitar el tener que recurrir a la fórmula de arriba para obtener las energías degeneradas, y dicha forma consiste en recurrir al truco de buscar un operador Hermitiano M que sea conmutativo con H0 y con H1. Si ψa(0) y ψb(0), las funciones eigen degeneradas de H0 son también funciones del operador M con eigenvalores distintos:


siendo μ..ν, entonces Wab.=.0 y podemos usar directamente a ψa(0) y a ψb(0) como funciones de onda buenas y de este modo usar la teoría de las perturbaciones para estados no-degenerados. Podemos verificar ésta aserción partiendo del hecho de que por hipótesis al ser M un operador Hermitiano que conmuta con el operador H1, entonces:


y podemos efectuar las siguientes operaciones:


Puesto que, por hipótesis, μ..ν, se concluye entonces que Wab.=.0. Esto significa que al enfrentar un problema con dos estados degenerados, basta con tratar de encontrar algún operador Hermitiano M que conmute con H0 y con H1, tomando como estados no-perturbados aquellos que sean simultáneamente eigenfunciones y de H1, y usando entonces las correcciones perturbativas de primer orden. Si no podemos encontrar un operador M tal entonces recurrimos a la fórmula que se ha obtenido arriba.

Puesto que cuando hay dos estados degenerados que parten del mismo punto tales estados son a la vez el resultado matemático de dos raíces, se acostumbra usar la notación de “más-menos” para representar en una sola línea lo que tendría que representarse de dos maneras. De este modo, en lugar de usar:


usamos simplemente la siguiente línea que representa las dos anteriores:


PROBLEMA: Demostrar que las dos raíces Ψ+(0) y Ψ-(0) en la expresión anterior son ortogonales.

Empezamos con la condición de ortogonalidas que se debe de cumplir y desarrollamos:


Usando las condiciones de ortonormalidad entre las funciones no-perturbadas, lo anterior se reduce a:


Usando uno de los resultados obtenidos arriba:


y adaptando la notación al problema actual:


se tiene:


De este modo:


El término entre los corchetes se puede desarrollar quedando de la siguiente manera:


Recurrimos ahora a la fórmula general obtenida arriba:


Puesto que:


entonces, formando el producto:



y desarrollando, se tiene que:


Tenemos ya lo que faltaba para evaluar el término entre corchetes de arriba, y lo que encontramos es que todo se reduce a:


Pero sin ir más a fondo, y viendo lo que tenemos aquí, resulta evidente que se reduce todo a cero, y al reducirse el término entre corchetes a cero entonces la conclusión final es que:


En pocas palabras, Ψ+(0) y Ψ-(0) son ortogonales

PROBLEMA: Usando los resultados anteriores, demuéstrese que:


Procediendo de una manera parecida a como se resolvió el problema anterior, se tiene lo siguiente:


Usando los resultados anteriores para β y simplificando, se tiene:


Del problema anterior sabemos que:


Se concluye entonces que:


PROBLEMA: Usando los resultados anteriores, demuéstrese que:


Procediendo de una manera parecida a como se resolvieron los problemas anteriores, se tiene lo siguiente:


Haremos un cambio en el tercer término usando la relación dada arriba:


para expresar α en función de β y así poder continuar con la simplificación:


Así pues:


Se ha definido en ésta entrada una “matriz de trabajo” W para poder sistematizar de manera formal el manejo de una degeneración de dos pliegues. Pero no solo hay degeneración de dos pliegues en donde un estado de energía degenerado se desdobla en dos niveles de energía bajo la acción de algún efecto perturbador, con la brecha entre ambos niveles de energía aumentando conforme aumenta la intensidad del efecto perturbador. Hay también degeneración de tres pliegues en donde un estado triplemente degenerado se abre revelando la degeneración de tres pliegues, e incluso hay degeneraciones de orden mayor, multipliegues, para las cuales es posible seguir usando el concepto de la “matriz de trabajo” W. Pero tal cosa tendrá que ser postpuesta para las siguientes entradas dada la amplitud del tema.