En las entradas anteriores se cubrió, recurriendo a aproximaciones necesarias para poder hacer manejable el tema, la manera en la cual una partícula cargada interactúa ya sea con un campo eléctrico E o con un campo magnético B intenso, no desde el punto de vista de la mecánica clásica sino desde la perspectiva de la mecánica cuántica.
Existe otro modo de interacción que aún no ha sido cubierto, y tal modo de interacción involucra no un campo eléctrico o un campo magnético separados sino un haz de radiación electromagnética desplazándose a la velocidad de la luz c en donde ambos campos están íntimamente conectados por medio del vector de Poynting (un vector que es perpendicular a los vectores de amplitud que corresponden al campo eléctrico E y al campo magnético B de una onda sinusoidal electromagnética como la que clásicamente describe a un haz de luz monocromática) que siempre apunta la dirección hacia la cual se está desplazando la onda electromagnética. De hecho, en un haz de radiación electromagnética representado matemáticamente mediante una onda senoidal continua, clásicamente bajo el sistema de unidades MKS-SI el inverso de la raíz cuadrada del producto de la permitividad eléctrica del vacío y la permeabilidad magnética del vacío produce un número que coincide a un nivel elevado de precisión con la velocidad de la luz, lo cual llevó al físico escosés James Clerk Maxwell a postular que la luz muy bien podría ser una onda electromagnética, hecho que fue confirmado posteriormente con el desarrollo pleno de la electrodinámica clásica. Sin embargo, la cuantización de la materia y la energía vino a complicar las cosas por el hecho de que no hay radiación electromagnética alguna (trátese de la luz, trátese de las señales portadoras de información hacia los teléfonos celulares, trátese de la señales de televisión transmitidas por los diversos canales, etcétera) que no esté cuantizada, compuesta de corpúsculos llamados fotones, y fue Max Planck quien al proponer un nuevo modelo matemático para poder explicar la radiación del cuerpo negro descubrió que la energía luminosa visible no es producida por ondas electromagnéticas continuas. En efecto, el comportamiento oscilatorio de las ondas de televisión y telefonía celular que los ingenieros electrónicos aprenden a usar desde sus primeros años es una idealización que se derrrumba por completo a nivel submicroscópico; las fórmulas todavía les trabajan bien a nivel macroscópico en los usos prácticos de la vida cotidiana, pero todo ese andamiaje matemático se colapsa en cuanto se trata de explicar con tales fórmulas lo que ocurre a nivel submicroscópico. De cualquier modo, recurriendo a las aproximaciones de rigor sin entrar muy a fondo en el tema de la Electrodinámica Cuántica, lo cual incluye seguir considerando a una radiación electromagnética como formada por una onda oscilatoria continua, es posible obtener algunos resultados que explican varios fenómenos observados en el laboratorio.
A continuación estudiaremos la razón (o rapidez) con la cual un átomo absorbe energía de una onda electromagnética plana que incide sobre dicho átomo, y también la razón a la cual ocurre el fenómeno de emisión estimulada si el átomo se encuentra no en un estado basal sino en un estado excitado cuando incide la onda electromagnética plana sobre él. En la aproximación que se estará utilizando, la emisión espontánea (natural) del átomo será ignorada. Clásicamente, para una onda electromagnética plana viajando en el espacio libre a la velocidad de la luz, la magnitud de la intensidad de su campo magnético es igual a la magnitud de intensidad de su campo eléctrico (en unidades CGS-Gaussianas), y a partir de éste hecho podemos investigar el orden de magnitud de las energías de interacción.
Primero calcularemos la energía de interacción del electrón con un campo eléctrico ℇ en virtud de su carga electrónica. Esta interacción tiene un orden de magnitud dado aproximadamente por ea0ℇ en donde a0 es una medida del radio del átomo (el radio de Bohr). Por otro lado, la energía de interacción con el campo magnético tiene una magnitud del orden:
que representa la energía de interacción entre el momento de dipolo magnético del electrón y el campo magnético. Si a0 representa el radio de Bohr para el átomo de hidrógeno, se sabe que:
en donde α, la constante de estructura fina, está dada por:
Si se comparan las magnitudes de las energías de interacción eléctrica y magnética, se concluye que la energía de interacción magnética tiene una magnitud del orden de 1/137 veces la magnitud de la energía de interacción eléctrica, y puede ser ignorada sin incurrir en un error mayúsculo. Esto nos deja únicamente con el siguiente término que aparece en el Hamiltoniano que fue desarrollado previamente en la entrada “Interacción con un campo electromagnético II” (tomada como una perturbación):
como la única energía de interacción que se necesita tomar en cuenta (recuérdese que el campo magnético se obtiene tomando el rotacional ∇× del potencial vectorial A).
Clásicamente, suponiendo al potencial vectorial A como una onda plana, dicha onda se puede representar matemáticamente de la siguiente manera:
Lo anterior no es más que la extensión hacia un espacio tridimensional de la onda viajando en la dirección-x usando la fórmula de Euler:
siendo k el número de onda (el recíproco de la longitud de onda λ) que a diferencia de λ que es un escalar es un vector usado convencionalmente para apuntar la dirección hacia la cual se está desplazando el frente de onda.
Igualando el potencial eléctrico Φ a cero, en concordancia con lo que se afirmó arriba sobre poder ignorar el efecto del campo eléctrico sin incurrir en un error mayúsculo (aunque no parezca obvio, trabajando también con el gauge de Lorentz el plano de polarización de la onda senoidal de A a será perpendicular a la dirección de propagación, y por lo tanto:
La perpendicularidad que hay entre los vectores A y k se ilustra mejor con la siguiente figura:
Naturalmente, y como podemos comprobarlo viendo la figura de arriba, la divergencia del potencial vectorial A es igual a cero (no muestra divergencia alguna saliendo de alguna fuente de origen creadora de los vectores):
Haremos otra aproximación: supondremos que la onda electromagnética que incide sobre el átomo tiene una longitud de onda λ que es grande en comparación con el tamaño del átomo. Este tipo de simplificación es conocida como la aproximación de dipolo eléctrico.. En tal caso, k·r.«.1 para todos los valores del vector posición r en donde el electrón pueda ser encontrado. Siendo así, el término exp(ik·r) en la expresión:
puede ser reemplazado por la unidad, o simbólicamente hablando:
Suponiendo que el centro geométrico del átomo coincide con el punto r.=.0 del vector posición, la energía de interacción del término de perturbación puede ser entonces aproximada de la siguiente manera:
En ésto último la parte del dipolo eléctrico de la interacción es considerada. La aproximación del dipolo eléctrico es es equivalente a suponer que el campo electromagnético es uniforme sobre una región que es grande en comparación con el tamaño del átomo. El término de perturbación obtenido a estas alturas nos debe resultar familiar a lo que se trató en la serie de entradas que cubren el tema de “Perturbaciones dependientes del tiempo”:
Esto nos encamina directamente a la aplicación de las técnicas que ya se vieron cuando se trató previamente el tema de las perturbaciones dependientes del tiempo.
Tenemos pues un término de perturbación H1, el cual será usado para el cálculo de las transiciones del átomo entre varios niveles de energía causados por la interacción con la onda electromagnética representada por el término de perturbación que se acaba de especificar. El siguiente paso lógico ahora consiste en aplicar la teoría de las perturbaciones dependientes del tiempo que ya vimos en las entradas previas relacionadas con dicho tema, y se hará uso directo de la expresión para los coeficientes de expansión cj desarrollada en dicha teoría. Repasando la expresión ya obtenida en entradas previas relacionadas con las perturbaciones dependientes del tiempo, se tiene lo siguiente:
Para poder efectuar la integración, podemos echar mano de la fórmula de Euler que nos permite interpretar la relación coseno como una mera variación de la función exponencial compleja:
Esta integración ya la hemos efectuado previamente al tratar el tema de las perturbaciones dependientes del tiempo, y no tiene caso repetir aquí lo mismo; basta con asentar el resultado final que se obtiene suponiendo el cumplimiento de la condición de resonancia:
con lo cual, llevando a cabo la expansión en serie de los exponenciales y despreciando los términos relativamente pequeños en magnitud, se obtiene:
Podemos simplificar un poco la notación de ésto último suponiendo que la dirección de la polarización de la onda transversal A con amplitud máxima A0 mostrada en la figura de arriba es la de una onda viajera que se mueve en la dirección-z, lo cual equivale a hacer P.=.Pz, con lo cual:
Obtendremos ahora la norma de cada coeficiente multiplicándolo por su conjugado complejo. Con el propósito de simplificar la anterior notación que obviamente es algo engorrosa, supondremos que la dirección de polarización de la onda transversal electromagnética plana apunta en la dirección-z. Siendo así, obtenemos lo siguiente como la probabilidad de que el átomo se encuentre en un estado-j un tiempo t después:
Lo anterior implica que en un tiempo t.=.0, cuando la radiación electromagnética es aplicada súbitamente (“encendida” por así decirlo), el átomo se encuentra en el estado-0 (precaución: no se debe confundir el estado-0 con el estado basal o fundamental del átomo, el cual repetimos que suponemos que se encuentra no en su estado basal sino en un estado excitado, el estado-0 es el estado inicial en el que se encuentra el átomo, que aquí se dá por hecho es su estado al momento de recibir el impacto de la radiación electromagnética). La probabilidad de que el átomo se encuentre en el estado-j un cierto tiempo después será una función senoidalmente oscilante de t. Sin embargo, en la práctica suele encontrarse algún mecanismo de amortiguamiento que impide que ocurra éste tipo de oscilaciones entre los niveles energéticos del átomo. Un ejemplo de éste tipo de mecanismo es el que se conoce como el amortiguamiento por colisiones, en donde las colisiones del átomo con otros átomos perturban al átomo de tal manera que se producen desplazamientos de fase aleatorios entre los varios coeficientes cj de la expansión utilizada para el desarrollo de la teoría de las perturbaciones dependientes del tiempo:
Después de tales desplazamientos aleatorios en las fases de los coeficientes, el comportamiento del átomo es tal que, en promedio, se encuentra como si estuviese en cualquiera de los varios estados puros de energía, con las probabilidades para cada estado dadas por los cuadrados absolutos de los coeficientes ck correspondientes. Así pues, todo lo que se requiere es calcular la probabilidad promedio de que una transición habrá ocurrido entre el estado-0 y el estado-j al momento de la primera colisión. Un átomo observado en un tiempo t.=.0 eventualmente resentirá una colisión un cierto tiempo t después. La probabilidad por unidad de tiempo, dw/dt, de que la colisión será observada un cierto tiempo t después de la observación inicial, sin que haya ocurrido previamente una colisión en el intervalo entre t.=.0 y t.=.t, está dada por la expresión:
Esta expresión puede ser obtenida dividiendo el intervalo de tiempo de t.=.0 a t.=.t en intervalos infinitesimales dt y multiplicando juntamente con las probabilidades de que el átomo no sufrirá una colisión en cada uno de estos intervalos infinitesimales de tiempo. Si la ecuación anterior representa la probabilidad por unidad de tiempo de que una colisión ocurrirá en un tiempo t, entonces la probabilidad media de transición (estadísticamente hablando) en el intervalo de tiempo desde cero hasta el infinito será:
Dicho sea de paso, si el lector se pregunta por qué para simbolizar a la probabilidad promedio de transición estamos usando la letra W mayúscula (la barrita horizontal puesta encima de la letra significa “en promedio”) en vez de usar la letra P mayúscula cuando para fines de claridad parecería preferible usar la letra P simbolizando con ello la probabilidad, ello se debe a que se ha estado usando de modo intensivo la letra P para representar el operador del momentum, y aquí mismo la seguimos utilizando, y si se usara la misma letra P para representar también la probabilidad entonces ello podría dar lugar a confusiones causadas por similitudes en la notación, especialmente en lugares en donde ambas cosas aparecen juntas.
La relación que se acaba de obtener es la probabilidad promedio de que una transición habrá ocurrido del estado-0 al estado-j en el tiempo transcurrido desde la primera colisión después de t.=.0. Usaremos ahora una integral tomada de las tablas de integrales:
Con éste resultado, se obtiene entonces lo siguiente para la probabilidad de transición por colisión:
Obsérvese que, de acuerdo a ésta relación, la probabilidad de que un átomo que se encuentre inicialmente en el estado-0 será arrojado al estado-j al ser impactado por un haz luminoso (onda electromagnética) será exactamente igual a la probabilidad de que un átomo en el estado-j será arrojado al estado-0 al ser impactado por un haz luminoso, en virtud de que:
es algo que se tiene que cumplir (recuérdese que el operador del momentum es un operador Hermitiano). La ecuación obtenida para W dá la probabilidad de transición, por colisión, de que un átomo será arrojado de un estado a otro. De ésta expresión se puede obtener la probabilidad por segundo de que ocurra una transición de un estado de energía a otro en el átomo. Esto se logra simplemente multiplicando la relación por el número promedio de colisiones por segundo, que es γ. Conociendo la probabilidad por segundo de que ocurra una transición de un estado a otro, podemos escribir directamente la energía absorbida por segundo por un gas que contiene poblaciones n0 y nj de átomos en los estados 0 y j respectivamente. La razón a la cual la energía es absorbida por el gas viene siendo:
Hay veces en las que es deseable expresar en términos de una sección transversal de colisión la razón a la cual un átomo que se encuentra en el estado inicial 0 absorbe energía de la radiación electromagnética incidente. Esto representa el área de sección transversal efectiva que un átomo presenta a los fotones incidentes (hay más sobre éstos conceptos en la entrada titulada “Esparcimiento clásico de partículas” que forma parte de ésta obra). Esto viene siendo igual a la energía promedio por segundo absorbida por el átomo en el estado 0, dividida entre el flujo de energía por segundo por centímetro cuadrado que hay en la onda electromagnética incidente. Esta razón, que tiene las dimensiones de área (después de todo, se trata de un área de sección transversal) puede ser vista como un área de sección transversal efectiva σ del átomo. Para obtener una relación para el área de sección transversal efectiva σ del átomo (o sección eficaz de captura, como se le acostumbra llamar en los países de habla hispana) ofrecida a la onda electromagnética con que se encuentra, recurrimos primero al concepto clásico de la densidad de energía electromagnética de la onda electromagnética plana cuando se usa el sistema de unidades CGS-Gaussiano (usamos la letra “Ɛ” cursiva para evitar confusiones con la letra “E” mayúscula latina usada para representar los niveles de energía discretizados del átomo):
De lo anterior, vemos que la contribución del campo eléctrico a la densidad de energía electromagnética total de la onda electromagnética plana cuando se usa el sistema de unidades CGS-Gaussiano viene siendo:
Por lo tanto, la contribución de campo eléctrico Ɛ al flujo de energía de una onda electromagnética plana (la intensidad de campo eléctrico Ɛ incidente) es, multiplicando lo anterior por la velocidad de la luz con la cual se propaga la onda viajera en el vacío (la letra S que estaremos usando es la misma que la que se utiliza para simbolizar el vector de Poynting que proporciona la dirección hacia la cual se encamina la onda viajera):
Dimensionalmente hablando, la justificación de que, dentro del sistema de unidades CGS-Gaussianas, el multiplicar el promedio de la densidad de energía ue (medida en ergs por centímetro cúbico) por la velocidad de la luz nos produce el flujo promedio de energía electromagnética a través de un área de sección transversal (medido en ergs por centímetro cuadrado por segundo) es la siguiente:
Si estuviésemos trabajando dentro del sistema de unidades MKS-SI (útil para problemas de ingeniería en el mundo macroscópico pero de poco uso en situaciones de dimensiones sumamente pequeñas), la relación que estaríamos empleando para la contribución del campo eléctrico a la densidad electromagnética sería la siguiente:
Pero puesto que estamos trabajando en el sistema de unidades CGS-Gaussianas (que es el más apropiado para dimensiones más afines al mundo submicroscópico de la física cuántica), se requiere reemplazar en lo anterior ε0 por 1/4π (tómese en cuenta que la constante de la permitividad eléctrica del vacío ε0 que recibe un valor bien definido en el sistema de unidades MKS-SI no aparece para nada en el sistema de unidades CGS-Gaussiano, y que al transformar las fórmulas del sistema de unidades MKS-SI al sistema CGS-Gaussiano además de que la magnitud ε0 debe substituírse por 1/4π se debe tener en cuenta que en el sistema CGS-Gaussiano deben usarse todas las demás unidades que corresponden a dicho sistema, o sea el centímetro y el gramo):
y en virtud de que ésto último es una expresión de la energía por unidad de volumen, multiplicando lo anterior por la constante c (la velocidad de la onda electromagnética en el vacío, o sea la velocidad de la luz) se obtiene (dimensionalmente hablando) la fórmula para el flujo de energía por segundo S que tenemos arriba.
Pero como estaremos trabajando no con la contribución del campo eléctrico Ɛ sino con la contribución del campo magnético, la expresión que usaremos será:
Sin embargo, en los Hamiltonianos que hemos desarrollado para cuestiones cuánticas de la interacción con un campo electromagnético, lo que usamos no es el campo magnético B sino el potencial vectorial A que postulamos que produce dicho campo, lo cual nos lleva a tener que redefinir a S en función del potencial vectorial.
PROBLEMA: Demostrar, usando argumentos puramente clásicos, que la contribución del campo magnético de una onda viajera al flujo de energía promedio de la onda está dado por la relación en función de la amplitud máxima del potencial vectorial A (tómese en cuenta que en el sistema CGS Gaussiano absoluto la permeabilidad magnética del vacío μ0 se establece igual a la unidad y por lo tanto no debe aparece en ninguna de nuestras relaciones para una onda electromagnética):
Inspeccionando la figura que tenemos más arriba que nos muestra a una onda transversal que representa las variaciones del potencial vectorial A representado como una oscilación armónica (de carácter senoidal), con las amplitudes instantáneas del potencial oscilante perpendiculares a la dirección hacia la cual se dirige la onda viajera, resulta claro que la solución del problema dependerá del sistema de coordenadas que se utilice (en éste caso, se requieren coordenadas rectangulares Cartesianas) así como el acomodo de los ejes empleados para montar en ellos la amplitud oscilante del potencial vectorial A y de la dirección de propagación de la onda viajera. Si acordamos que el frente de onda de la onda transversal está avanzando en el sentido positivo del eje-z (tal y como lo hicimos arriba), y montamos los vectores de amplitud de A (flechas de color azul) alineados con el eje-y según lo muestra la siguiente figura (no se ponga por lo pronto mucha atención en las flechas de color negro identificadas como B que apuntan en una dirección que podemos intuír que va a lo largo del eje-x):
entonces la expresión correcta de la onda viajera será:
De la especificación que se acaba de dar, lo siguiente debe resultar obvio desde el punto de vista estrictamente matemático (no se ponga mucha atención a la cuestión ilustrativa de las figuras):
Ahora bien, la relación fundamental que une a B y al potencial vectorial A es B.=.∇×A, y es en base a ésta relación que debemos obtener a B en función de A, para lo cual se requiere desarrollar el producto vectorial cruz (con la ayuda del determinante mnemónico que se expande usando menores a lo largo de la primera línea superior) en base a lo que se acaba de definir tomando en cuenta de que no hay componentes Ax ni Az:
Puesto que el vector de campo magnético B solo consta de un componente de A sobre una coordenada, la componente que va a lo largo de la coordenada-x, podemos tomar tal componente como la magnitud del componente magnético B de la onda viajera para el cálculo de B2 (dicho sea de paso, esto justifica el haber montado el campo magnético oscilante de B sobre la coordenada-x en la figura de arriba). Además, puesto que la velocidad de la onda viajera (viaja a la velocidad de la luz) es igual al producto de la frecuencia de la onda senoidal (que a su vez es igual a ω/2π) multiplicada por la longitud de onda λ que a su vez es el recíproco del número de onda, se tiene que:
Para llegar a la solución final reemplazando todo lo anterior en la relación:
tenemos además que usar el promedio de la onda senoidal cuadrática para obtener el promedio de la densidad de energía, tomando en cuenta de que el promedio de la onda senoidal cuadrática es igual a la mitad de su valor máximo (la integral para obtener el promedio estadístico se toma sobre un período completo T de la onda):
Juntándolo todo, el problema está esencialmente resuelto.
Antes de continuar, conviene aclarar aquí que puesto que la densidad de energía electromagnética uem es igual a la suma de la densidad de energía eléctrica ue y la densidad de energía magnética um, y puesto que estas son iguales:
entonces la densidad de energía electromagnética total uem equivale al doble de cada una de ellas. Sin embargo, como vemos arriba, las densidades de energía son funciones oscilantes alrededor de un valor no nulo, de modo tal que recurriendo a la identidad trigonométrica:
deducimos que el promedio de la densidad de energía es igual a la mitad de su valor máximo (la integral para obtener el promedio estadístico se toma sobre un período completo T de la onda):
lo cual en la fórmula que hemos obtenido cancela el factor de 2 ocasionado por dos densidades de energía (una eléctrica y la otra magnética) en lugar de una sola, dándole validez a nuestra fórmula para el valor promedio del flujo S.
Usando lo anterior para continuar con lo que había quedado pendiente, se afirma aquí que el área de sección eficaz de captura σ del átomo individual ofrecida a la radiación electromagnética incidente será por lo tanto:
A llevar a cabo procedimientos de integración para evaluar los elementos matriciales del momentum Pz, la cosa no resulta ser poco amena. Los elementos matriciales de la posición z entre dos niveles distintos de energía resultan ser más fáciles de calcular (por integración directa) que los elementos matriciales del momentum, y podemos relacionar ambos elementos matriciales empezando con un truco: el conmutador del Hamiltoniano H con la posición z es proporcional al momentum Pz.
En su forma más general y más frecuentemente encontrada, el Hamiltoniano genérico que incluye tanto al término de la energía cinética como al término de la energía potencial V(r) en función del vector posición (éste último pudiendo estar formado de la suma de varios términos) es:
El conmutador cuántico de éste Hamiltoniano genérico H con el vector tridimensional de la posición r viene siendo:
Así pues, para la relación que se pretende demostrar, el único operador cuántico del Hamiltoniano H que realmente tenemos que tomar en cuenta para nuestros propósitos es el que corresponde al operador del momentum P.
En lo que llevaremos a cabo, al considerar un solo componente del operador tridimensional (Cartesiano) del momentum P, el que corresponde a la coordenada-z, hacemos P.=.Pz de modo que se tiene:
El siguiente paso consiste en aplicar el conmutador-operador [H,z] a una función de onda “monigote” cualesquiera ψ para poder llevar a cabo el desarrollo que se muestra:
Habiendo cumplido la función de onda “monigote” ψ su papel de coadyuvante, podemos ignorarla por completo para concentrarnos exclusivamente en la relación que hay entre los operadores del lado izquierdo y el lado derecho de la última línea obteniendo así:
Lo que se ha obtenido es completamente válido si el Hamiltoniano a ser usado es el que corresponde a una interacción del átomo excitado con una onda electromagnética que incide sobre dicho átomo. Ya se demostró previamente en una entrada anterior que para éste tipo de Hamiltoniano los operadores del momentum lineal P y el potencial vectorial A conmutan. Por otro lado, el operador A no tiene efecto alguno sobre la variable-z y por lo tanto conmuta con ésta, lo cual significa que al evaluar el conmutador de H con z podemos ignorar la porción que compete a A porque será reducida a cero por acción del conmutador, lo cual nos deja únicamente con la parte del conmutador que concierne únicamente al momentum P.
De éste modo, el elemento matricial que forma parte de la relación para la sección eficaz de captura que tenemos arriba se puede reescribir de la siguiente manera:
Pero nuestro objetivo era relacionar los elementos matriciales del momentum Pz con los elementos matriciales de la posición z. Usando lo anterior como paso intermediario, tal cosa es lo que haremos a continuación
PROBLEMA: Demostrar que:
Expandiendo el conmutador:
Obsérvese que dentro del desarrollo anterior se ha recurrido a la ecuación de Schrödinger independiente del tiempo, tanto para el Hamiltoniano H actuando sobre el bra que está a su izquierda (operación resaltada en color magenta) como el Hamiltoniano H actuando sobre el ket que está a su derecha (operación resaltada en color azul):
De este modo, se tiene:
o más explícitamente:
De este modo, con lo anterior, finalmente llegamos a la siguiente expresión para la sección eficaz de captura σ para la onda electromagnética:
Haremos momentáneamente una pequeña modificación en la última línea metiendo la carga e del electrón dentro del elemento matricial de la posición z para así obtener:
La cantidad ez cuyos elementos matriciales se definen arriba en lo que está resaltado de color azul debe resultar familiar para quienes hayan tomado un curso introductorio de electromagnetismo; es ni más ni menos que la definición del momento dipolar eléctrico, y puesto que la probabilidad de que ocurra una transición entre el estado inicial (el estado-0) y el estado final es proporcional al cuadrado del elemento matricial que corresponde al momento de dipolo eléctrico, ésto justifica plenamente el nombre que se le dá a éste tipo de aproximación, la aproximación del dipolo eléctrico.
La absorción máxima de la onda electromagnética incidente ocurre en el punto de resonancia:
en donde:
A estas alturas, es necesario volver a dejar dos cosas en claro: ω es la frecuencia (angular) de la onda electromagnética incidente que puede tomar cualquier valor continuo (y de hecho en el laboratorio muchas veces se tiene control sobre ésto) mientras que ωj0 es la frecuencia (angular) asociada con la diferencia energética ΔE entre dos estados energéticos discretos del átomo (y sobre lo cual el experimentador no tiene control alguno por ser algo proporcionado por la misma Naturaleza).
La curva de absorción tiene lo que se conoce como un perfil Lorentziano (en referencia al notable físico holandés Hendrik Antoon Lorentz que propuso la hipótesis de la contracción de Lorentz antes del advenimiento de la Teoría Especial de la Relatividad, definió el concepto del espacio-tiempo cuatridimensional plano en los marcos de referencia Lorentzianos, además de ganar el Premio Nobel de Física por sus explicaciones sobre el efecto Zeeman cuando aún no había nacido propiamente la Mecánica Cuántica como hoy la conocemos, entre muchas otras cosas). Una función de perfil Lorentziano usalmente es estandarizada (para fines de espectroscopía) para tener un valor máximo de 1, y además se acotumbra “recalibrar” la escala horizontal dándole a ωj0 un valor igual a cero para tener una curva “centrada” como la que se muestra a continuación:
La línea roja en esta última gráfica nos proporciona el “ancho” de la curva a la mitad de la altura máxima de la curva en el punto máximo de resonancia, una anchura conocida como la Anchura a Media Altura o bien como FWHM por las siglas en Inglés de la palabra “Full Width at Half Maximum”. La función matemática que describe a una función con perfil Lorentziano tiene la siguiente forma genérica:
siendo x una variable subsidiaria definida de la siguiente manera:
en donde p0 es la posición del máximo (correspondiendo al punto de resonancia), p es una posición cualesquiera, y w es la anchura de la curva a la mitad del máximo de intensidad (a la mitad de la altura máxima de la curva), lo cual ocurre en los puntos:
El número p es típicamente un número de onda o una frecuencia, mientras que la variable x carece de dimensiones y recibe un valor igual a cero en el punto de resonancia p.=.p0. Este tipo de función es conocida también como distribución de Cauchy en virtud de que fue el matemático francés Agustín Louis Cauchy quien trató éste tipo de distribuciones en 1853, la cual comparte varias características con otra distribución conocida como la distribución Breit-Wigner. La siguiente gráfica nos permite establecer una comparación entre el perfil Gaussiano (que corresponde a una curva Gaussiana) y el perfil Lorentziano:
Una de las cosas que distingue al físico del matemático puro es que al físico le gusta poner números en cualquier asunto, le gusta trabajar con cosas que se puedan medir de alguna manera aunque muchas veces ésto quede obscurecido por la simbología y la notación empleados, mientras que el matemático no tiene problema en trabajar con conceptos completamente abstractos e idealizados que muchas veces no solo no se pueden medir sino que en principio son imposibles de ser mensurados como el punto ideal Euclideano que carece de dimensiones. Una de las cosas a las cuales nos gustaría ponerle números es precisamente a la sección eficaz de captura σ por un átomo de la onda electromagnética. El problema estriba en que para poder lograrlo, aunque podemos meter de inmediato números en constantes físicas tales como la carga e del electrón de valencia del átomo, la velocidad de la luz c, la frecuencia (angular) aproximada del nivel (o niveles) energético en el cual ocurre la máxima absorción de energía electromagnética (lo cual se puede obtener en las escalas horizontales de los espectrogramas de laboratorio usualmente calibradas en números de onda), e incluso la ancuhra γ que podemos determinar en forma más o menos aproximada revisando la anchura de una línea espectral ensanchada como la del espectrograma simulado de arriba, la fórmula:
nos presenta un factor un poco “incómodo”:
Evaluar ésto último resulta algo incómodo porque requiere determinar primero las eigenfunciones de onda ψj y ψ0, y ésto es algo que se había evitado hasta ahora. Repasando los procedimientos que se tuvieron que llevar a cabo en nuestro estudio de la teoría de las “Pertubaciones y estados degenerados”, recordaremos que incluso en problemas sencillos en los cuales obtener un par o un trío de funciones de onda “buenas” requerían de dedicación y esfuerzo, el obtener algunas de las eigenfunciones de onda ψj por y ψ0 puede constituír un verdadero dolor de cabeza. Para poder lidiar con ésto en términos razonables, se acostumbra recurrir a aproximaciones, de las cuales hay varias en las que se echa mano de varios trucos matemáticos. Una de tales aproximaciones consiste en tomar el anterior “factor incómodo” como lo que realmente es, una matriz, y llevar a cabo las simplificaciones usando reglas de sumación matriciales (las cuales omiten mencionar).
Empecemos por dejar en claro que si bien la cantidad z es una variable usada para medir distancias, y no una matriz, podemos construír con ella una matriz z usando eigenfunciones de onda apropiadas ψα y ψβ que puedan servir como una base. De éste modo, tenemos una definición de cada elemento matricial de la matriz z de la siguiente manera:
En el caso que estamos manejando, no se requieren todos los elementos matriciales posibles para todos los valores posibles de los subíndices α y β. De hecho, el segundo subíndice está anclado a un solo valor representando un solo estado energético del átomo, el estado-0 (siendo necesario repetir aunque parezca una redundancia innecesaria que no es necesariamente el estado basal o fundamental del átomo, y en nuestra situación actual de arriba se ha convenido que representa un estado excitado), el estado inical en el cual se encuentra el átomo (excitado) al momento de ser impactado por la onda electromagnética. Esta observación la podemos resaltar de la siguiente manera:
Si escogemos una representación matricial en la cual al primer subíndice j le asignamos un renglón distinto en la matriz z para cada valor de j, y al segundo subíndice 0 le asignamos una columna en particular dentro de la matriz (¡y una sola columna!), entonces los únicos elementos matriciales en los que estamos interesados los podemos visualizar del modo siguiente:
Aún así, es posible obtener algunas relaciones interesantes y hasta útiles haciendo uso de las reglas básicas para el manejo de matrices.
PROBLEMA: Demostrar la siguiente relación:
Obviamente, lo que se tiene es el promedio estadístico de lo que vendría siendo el cuadrado de z evaluado para el estado-0. Este problema se resuelve fácilmente recurriendo a la definición matemática básica del producto de dos matrices A y B las cuales producen una matriz C cuyos elementos están dados por la definición fundamental de lo que es el producto matricial:
En el caso que estamos manejando, las matrices A y B son dos matrices iguales, la matriz z. Modificando la notación para resaltar el hecho, se tiene:
Usamos ahora la definición básica que se dá a la construcción (obtención) de elementos matriciales usando eigenfunciones de base:
De éste modo, se tiene lo siguiente:
Tomando en cuenta que z no es un operador que le cambie el signo al ket a su derecha (o a su izquierda) sobre el cual vendría actuando, entonces:
Así pues:
Haciendo m.=.n.=.0 y k.=.j, lo anterior toma el siguiente aspecto:
No cuesta mucho trabajo reconocer que lo que tenemos del lado izquierdo es, de acuerdo a lo que se ha estado usando para las esperanzas matemáticas (promedios estadísticos) de variables físicas en la Mecánica Cuántica, la esperanza matemática del cuadrado de z para el estado-0. Prescindiendo de uno de los dos ceros en el lado izquierdo por superfluo, se tiene entonces la relación que se deseaba demostrar:
De la relación que se acaba de demostrar, podemos obtener otra conclusión. Puesto que todos los términos de la sumatoria en el lado derecho son positivos (todas las cantidades están elevadas al cuadrado), y puesto que es innegable que cualquier término de la suma de términos ciertamente tiene que ser menor que la suma de todos los términos (que suponemos positivos), se obtiene entonces la siguiente igualdad-desigualdad:
Pero regresando al factor matricial “incómodo”, una forma en la cual podemos simplificar las cosas es recurrir a aproximaciones que impongan un tope máximo o un mínimo al valor que puedan tomar ciertas cosas como el factor matricial “incómodo”. De esto es precisamente lo que trata lo que veremos a continuación.
PROBLEMA: Evaluando el conmutador de z con el Hamiltoniano H, y formando el conmutador de z con el conmutador así obtenido considerando tal cosa como un operador, obtener la siguiente relación:
Formando primero el conmutador de z con el Hamiltoniano H y tras ello formando un nuevo conmutador con z y con el conmutador así obtenido, se llega a lo siguiente:
Considerando lo anterior como un operador, entonces podemos postular una función de onda “monigote” ψ sobre la que actuará dicho operador. Usando la misma expresión diferencial para el operador Hamiltoniano usada arriba basada en el cuadrado del momentum, se tiene el desarrollo que se muestra a continuación:
Enfocándonos exclusivamente en la parte operacional (deshaciéndonos de la función de onda “monigote” después de que ésta ya cumplió su propósito), queda demostrada la siguiente relación operacional:
PROBLEMA: Usando la relación operacional demostrada en el problema anterior, y tomando el elemento matricial (0,0) de dicha ecuación después de haberla convertido a su equivalente matricial, partiendo del supuesto de que la matriz H es una matriz diagonal demostrar la validez de lo siguiente:
La relación operacional obtenida en el problema anterior, una vez convertida a su símil matricial como se acostumbra hacerlo al pasar de la Mecánica Ondulatoria a la Mecánica Matricial y viceversa, toma el siguiente aspecto (obsérvese que en el lado derecho de la relación matricial se vuelve necesario multiplicar el factor constante por una matriz identidad I para que se le pueda considerar verdaderamente una relación matricial correcta):
En las simplificaciones que serán llevadas a cabo más adelante en éste problema, se usará lo siguiente que no es más que la expresión de la ecuación de onda de Schrödinger independiente del tiempo con el operador Hamiltoniano H actuando sobre funciones de onda en notación de kets produciendo los valores eigen correspondientes:
Como ya se mencionó en la postulación del problema, se supone que por hipótesis el Hamiltoniano H es, en su representación matricial, una matriz diagonal:
A continuación, evaluaremos el elemento matricial (0,0) de la ecuación matricial con la que estaremos trabajando, repitiéndose la observación de que el estado-0 no es necesariamente el estado fundamental o basal, y tal como se indicó arriba no necesariamente estará ubicado en el primer renglón (el renglón superior) y en la primera columna (del extermo izquierdo) de las matrices que se estarán manejando (obsérvese que en el lado derecho de la ecuación matricial el elemento entresacado de la matriz será necesariamente ħ2/m habido el hecho de que cada uno de los elementos en una matriz identidad I es igual a 1):
Obsérvese que en el lado izquierdo de la ecuación matricial cada uno de los términos de los cuales estresacaremos el elemento (0,0) es un producto matricial triple, obtenido del producto de tres matrices. Recurrimos ahora a la manera mediante la cual se define en la Mecánica Ondulatoria el elemento matricial de una función de onda:
El tercer término matricial es evaluado de la siguiente manera (obsérvese que en la penúltima línea se ha injertado el operador identidad resaltado en color magenta cuyo uso fue cubierto en la entrada titulada “La notación bra-ket de Dirac” que forma parte de ésta obra):
Procediendo de modo similar, el segundo término es evaluado a lo siguiente:
Asimismo, el tercer elemento matricial resulta ser (obsérvese que fue posible sacar E0 de las sumatorias de arriba porque se trata de un solo elemento constante, mientras que en la evaluación del tercer elemento matricial ésto no es posible porque se trata de varios elementos Ej sobre los cuales actúa la sumación):
De éste modo, sumando los tres términos matriciales que forman parte del lado izquierdo de la ecuación matricial, se tiene entonces:
Así pues, finalmente (obsérvese que la sumatoria de elementos matriciales se lleva a cabo sobre los elementos de una sola columna, la columna que corresponde al estado-0):
Es el momento apropiado de recurrir a la aproximación de la que estábamos hablando que requirió todo lo anterior. De nueva cuenta, puesto que cualquier término de una suma de términos ciertamente es menor que la suma de todos los términos (que suponemos positivos), entonces lo siguiente debe ser necesariamente cierto:
Pero como lo que se tiene del lado derecho de ésta última desigualdad es igual a ħ/2m, esto permite imponer un tope máximo al valor numérico que puede tomar la sección eficaz de captura en base al valor máximo que puede tomar el “factor incómodo” sin necesidad de tener que encontrar en detalle ninguna de las eigenfunciones de base:
Usando éste “tope máximo”, podemos calcular numéricamente un valor máximo para la sección eficaz de captura σ usando constantes físicas conocidas así como parámetros que podemos estimar con la ayuda del equipo de laboratorio con la ayuda de la siguiente relación:
De la desigualdad que se acaba de obtener, se deduce lo siguiente:
La cantidad:
es conocida como la fuerza de la oscilación de la transición. Puede verse que la amplitud del “pico” de la curva de la sección eficaz de captura σ es proporcional a la fuerza de la oscilación (o fuerza del oscilador, como se le quiera llamar). La relación:
nos afirma que la suma de todas las fuerzas de oscilación de las transiciones hacia un cierto nivel energético es igual a la unidad. Resulta interesante observar que para las dos líneas-D amarillas la fuerza de oscilación es 0.976, o sea casi igual a la unidad, y lo que tomamos como una desigualdad se convierte prácticamente en una igualdad (ésto explica el hecho de que las dos líneas-D del sodio sean tan visibles y tan prominentes incluso en espectrómetros de muy bajo costo como los que se utilizan en las demostraciones llevadas a cabo en las escuelas). Suponiendo que lo que es la desigualdad se puede tomar en ciertos casos como una igualdad, para una fuerza de oscilación unitaria la sección transversal σ en el punto de resonancia vendrá siendo:
Esto último viene siendo ni más ni menos que la sección transversal de absorción de radiación para un oscilador clásico. Éste es el origen del término fuerza del oscilador que estamos utilizando aquí. La fórmula que acabamos de obtener implica que la sección eficaz de captura es infinita cuando el tiempo entre las colisiones es infinito. Bajo éste tipo de situaciones, sin embargo, la aproximación que hemos estado empleando de un campo electromagnético intenso resulta inadecuada, y se vuelve necesario incluír los efectos de la radiación espontánea y el correspondiente amortiguamiento de la radiación. Si se incluyen tales efectos, se encuentra que el valor de σ en el punto de resonancia es únicamente del orden de λ2.
Muchas de las investigaciones que se llevan a cabo en el laboratorio sobre la interacción de átomos y moléculas con campos electro-magnéticos se efectúan sobre muestras de material en estado gasesoso, y en estado gasesoso las partículas submicroscópicas obedecen la repartición de estados energéticos de acuerdo al factor de Boltzmann que asigna una caída exponencial a la probabilidad de encontrar partículas en estados excitados. Basados en el factor de Boltzmann, trataremos de dar aquí una definición para el coeficiente de absorción Γ de una muestra de un gas en el cual la población de átomos (o moléculas) en los estados excitados con una cantidad n0 de partículas (correspondiendo al estado inicial que consideramos aquí como el estado más excitado) y una cantidad nj de partículas en un estado excitado pero de menor energía que el estado-0 en relación al estado basal de menor energía de las partículas nBasal están determinadas por factores de Boltzmann (el factor de Boltzmann se estudia en mayor detalle en la serie de entradas tituladas “Mecánica Estadística Cuántica” que forman parte de ésta obra):
De las dos relaciones anteriores vemos que:
Obviamente, la cantidad de partículas n0 siempre será menor que la cantidad de partículas nj, y la suma de ambas que simbolizaremos como N nos proporciona la población total de partículas de la muestra que es relevante para los efectos que se están investigando.
Hay varias maneras en las cuales se puede definir un coeficiente de absorción de una muestra gaseosa para la absorción de los fotones de energía electromagnética incidente sobre la muestra. Una de ellas es la siguiente:
siendo el número total de átomos (o moléculas):
N = n0 + nj
Lo anterior nos lleva directamente a lo siguiente:
en donde n0 y nj representan el número de átomos (o moléculas) en los estados 0 y j en una columna del gas que ofrezca un centímetro cuadrado de sección transversal para la captura de cuantos de radiación electro-magnética, y Γ representa entonces el coeficiente de absorción, esto es, la fracción de la radiación electromagnética incidente en el gas que es absorbida por el mismo. Como ya se mencionó tras obtener la relación:
la absorción máxima ocurre en el punto de resonancia, cuando la frecuencia de la onda electromagnética incidente es igual a la diferencia de frecuencias (o bien, diferencia de energías) entre los dos estados de energía. Observamos de la relación que entre más pequeño sea γ, tanto más grande será la sección transversal de absorción σ, y consecuentemente, cuando el gas es encontrado bajo una condición de resonancia, tanto menos frecuentes serán las colisiones, y tanto mayor será la absorción de energía electromagnética incidente. Por otro lado, para frecuencias alejadas del punto de resonancia, la absorción será mayor con valores crecientes de γ. La línea de contorno de la absorción graficando la absorción σ en función de la frecuencia ω es lo que nos produce el típico perfil Lorentziano mostrado en las figuras de arriba.
La absorción ha sido calculada aquí únicamente para el límite de campos electromagnéticos intensos. Sin embargo, en la práctica resulta que las expresiones obtenidas son correctas también para campos electromagnéticos débiles, siempre y cuando el tiempo entre las colisiones sea corto en comparación
con el tiempo natural requerido por un átomo para emitir un fotón saltando espontáneamente del estado-j al estado-0. Si el tiempo no es comparativamente más pequeño, es necesario modificar la ecuación anterior agregando a γ2 otro término, el término γ2r que representa el amortiguamiento que resulta del proceso de radiación espontánea.
Solo nos falta cerrar con algo que es central al tema. A estas alturas debe ser evidente que si la cantidad:
es igual a cero, no habrá ningún acoplamiento entre los dos estados energéticos a los que se refieren las dos funciones de onda. Y si los dos estados no están acoplados, no podemos esperar que haya ninguna línea espectral ni de emisión ni de absorción. La cantidad nos mide la fuerza del acoplamiento entre los dos estados, y es lo que nos proporciona la posibilidad de que ocurra una transición energética de un estado a otro como resultado del impacto de una onda electromagnética en el átomo. En pocas palabras, si:
entonces la transición es una transición que no se puede dar, se trata de una transición prohibida, al igual que la línea prohibida que de otro modo se produciría en un espectrograma, mientras que cuando:
entonces la transición es una transición permitida. En síntesis, lo que hemos estudiado es lo que nos proporciona sobre bases teóricas sólidas lo que se conoce como las reglas de selección, y el material que se ha visto aquí complementa el material cubierto en la entrada titulada “Reglas de selección” que forma parte de ésta obra. De este modo, lo que hemos visto aquí nos proporciona no solo una estimación sobre el ensanchamiento que se puede esperar en una línea espectral, a un nivel más fundamental nos proporciona el conocimiento de la posibilidad de que tal línea espectral se pueda producir o no, al menos desde el punto de vista de las transiciones permisibles bajo el criterio de la aproximación del dipolo eléctrico. De hecho, es común que en muchos textos de Mecánica Cuántica el tema de las reglas de selección sea tratado inmediatamente después de haberse cubierto el tema de la interacción de un átomo con una onda electromagnética, o sea con un haz de luz (o rayos X, o cualquier otro tipo de radiación electromagnética). Tal es la importancia de lo que se ha cubierto aquí.
En síntesis, éste es el núcleo más importante de la conclusión a la que hemos llegado aquí:
La probabilidad de que pueda ocurrir una transición de un estado energético a otro estado es proporcional al cuadrado del elemento matricial del término de interacción en el Hamiltoniano que acopla los dos niveles en cuestión. |
Si la interacción entre el spin del electrón y la órbita del electrón (el acoplamiento LS) es incluído como parte del Hamiltoniano no-perturbado y el término de interacción es tratado como un término de perturbación en el Hamiltoniano, los estados estacionarios de energía pueden ser caracterizados por los números cuánticos j, l, mj y n. Siendo así, el elemento matricial que determina la transición de un estado energético a otro es, en la aproximación del dipolo eléctrico (obsérvese que estamos usando la notación abreviada empleada en muchos textos y literatura científica que prescinde del símbolo ψ para la función de onda al sobreentenderse que tanto el bra como el ket están referenciados a una función de onda):
Considérese, por ejemplo, cómo se aplicaría la regla de selección en lo que toca a mj. Por lo que ya se ha visto en entradas previas, se sabe que el operador Jz y el operador Pz conmutan el uno con el otro. De éste modo, los únicos elementos matriciales que no se desvanecen y que pueden ser obtenidos para Pz son con Δmj.=.0. Para demostrarlo formalmente, todo lo que tenemos que hacer es escribir la relación de conmutación entre ambos operadores en forma matricial:
Los elementos de la matriz Jz nos son conocidos, puesto que la representación empleada es aquella para la cual las funciones son eigenfunciones de Jz (el operador Jz actúa únicamente sobre el número cuántico mj de la función de onda):
Calculando los elementos matriciales del conmutador para Jz y Pz se obtiene de la relación de conmutación entre ambos operadores en forma matricial:
Escribiendo explícitamente los productos matriciales que ocurren aquí y haciendo uso de lo anterior, encontramos que:
De ésto último resulta evidente que los elementos matriciales de Jz se desvanecen si mj.≠.m'j. De éste modo, hemos encontrado formalmente la regla de selección Δmj.=.0. Del mismo modo, podemos encontrar todas las demás reglas de selección.
Las transiciones permisibles bajo la aproximación del dipolo eléctrico, conocidas en la literatura científica como transiciones E1, permiten una transición del estado 2p al estado 1s, pero prohiben una transición de un estado 2s a un estado 1s al ser ésta última una transición prohibida. Es importante aclarar que las transiciones prohibidas no están estrictamente prohibidas, Lo que sucede es que de acuerdo a la aproximación del dipolo eléctrico son mucho menos frecuentes que aquellas que están permitidas. Después de las transiciones E1, el siguiente tipo de transición más probable es una transición de dipolo magnético, conocidas en la literatura científica como transiciones M1 y ocasionadas por la interacción entre el spin del electrón y el campo magnético oscilante de la onda electromagnética incidente. Las transiciones de dipolo magnético típicamente son unas 105 menos probables que transiciones de dipolo eléctrico similares. En la expansión del término exponencial usada para llevar a cabo la aproximación del dipolo eléctrico, hay otros términos que fueron ignorados, como el que se resalta a continuación en la expansión en serie usual del exponencial:
Las transiciones del cuadrupolo eléctrico conocidas en la literatura científica como transiciones E2 típicamente son 108 veces más improbables que las transiciones del dipolo eléctrico. Las transiciones del dipolo magnético y del cuadrupolo eléctrico satisfacen reglas de selección diferentes a las reglas de selección impuestas por la aproximación del dipolo eléctrico. Mientras que las reglas de selección para el dipolo eléctrico, simbolizando con el número cuántico l al momento angular orbital total del electrón y con el número cuántico m a la proyección del momento angular orbital sobre el eje-z, son:
las reglas de selección para las transiciones del cuadrupolo eléctrico son:
Así pues, las transiciones que están prohibidas como transiciones del dipolo eléctrico pueden muy bien estar permitidas como transiciones de dipolo magnético o como transiciones de cuadrupolo eléctrico, aunque las probabilidades de poder observarlas en los espectrogramas sean mucho menores. Hay también transiciones de octupolo conocidas como transiciones E3, y podríamos en principio continuar usando más términos de la expansión exponencial para calcular las probabilidades de transición asociadas a cualquier multipolo y las correspondientes reglas de selección, pero es mejor mantenerse enfocado en cosas que pueden ser detectadas con las técnicas experimentales contemporáneas que en cosas cuya existencia tal vez sólo sea posible postular teóricamente con pocas posibilidades de confirmación en el laboratorio.