martes, 11 de agosto de 2009

La Mecánica Cuántica Relativista

Este material presupone que el lector está familiarizado ya con los elementos esenciales de la Teoría Especial de la Relatividad. En caso de que el lector aún no haya sido introducido a dicho tema, se le recomienda consultar la obra “La Teoría de la Relatividad” de este mismo autor para ponerse al corriente con varios de los conceptos que serán tratados a continuación.

Con todo lo que se ha visto con anterioridad en las entradas previas, puede quedar la impresión de que lo que se pueda decir en su aspecto más fundamental acerca de la Mecánica Cuántica se ha dicho ya, siendo poco lo que haya que agregar. Sin embargo, esto dista mucho de ser el caso, porque en la formulación de la Mecánica Cuántica en los años veinte del siglo XX había un enorme hueco que necesitaba ser llenado. Si inspeccionamos de cerca la ecuación de onda de Schrödinger formulada en el espacio-posición:


en donde x es el vector posición en tres dimensiones, encontraremos que en dicha ecuación no aparece en lo absoluto la velocidad de la luz. Esto desde luego contrasta con la ecuación de onda para un fotón luminoso para el cual, si consideramos su campo eléctrico ε suponiéndolo como una onda electromagnética viajera moviéndose a lo largo de la coordenada-x, sí incorpora a la velocidad de la luz como parte integral:


En tres dimensiones recurriendo al uso de coordenadas rectangulares Cartesianas, una ecuación de onda más completa es la siguiente:


Con la ayuda del operador nabla, esta ecuación de onda la podemos escribir en forma operacional de una manera un poco más compacta:


en donde lo que ha sido destacado en color azul es conocido como el operador de onda de la teoría clásica del electromagnetismo. Se podría argumentar, desde luego, que esta ecuación es válida para un fotón luminoso viajando a la velocidad de la luz, y no para las ondas de materia en donde se sabe ya que ningún cuerpo cuya masa en reposo sea diferente de cero puede viajar a la velocidad de la luz. Y este es precisamente el problema. No hay absolutamente nada en la ecuación de Schrödinger que impida que una partícula material pueda viajar a la velocidad de la luz o inclusive a una velocidad mayor que la velocidad de la luz. Desde el punto de vista de la ecuación de onda de Schrödinger, un electrón puede viajar a una velocidad cien veces mayor que la velocidad de la luz, y con ello no se viola absolutamente nada. La ecuación de onda de Schrödinger, como la hemos estado formulando, es totalmente incompatible con la Teoría Especial de la Relatividad.

Para saber a ciencia cierta si una ecuación o un grupo de ecuaciones siguen siendo válidas dentro del marco de la Teoría Especial de la Relatividad, un físico holandés de nombre Hendrik Antoon Lorentz nos dejó una prescripción muy sencilla conocida como las transformaciones de Lorentz:


En su aspecto más esencial, la receta dada por Lorentz nos confirma que si una ecuación que describe un fenómeno físico permanece invariante en forma (con el mismo aspecto matemático, sin más términos o menos términos eliminados o añadidos a la ecuación, y sin modificación alguna en las operaciones matemáticas que se deben llevar a cabo de acuerdo a la ecuación) al serle aplicadas las transformaciones de Lorentz, entonces esa ecuación será plenamente válida dentro del marco de la Teoría Especial de la Relatividad.

El problema es que la ecuación de Schrödinger no es invariante bajo las transformaciones de Lorentz, aunque sí es invariante bajo las transformaciones de Galileo.

La incompatibilidad de la ecuación de onda para las ondas de materia con la Teoría Especial de la Relatividad es algo que llegó a preocupar al mismo Schrödinger, quien sabía mejor que nadie que sin llenar este hueco su trabajo estaba incompleto. Sin embargo, en virtud de que la incorporación de la Teoría Especial de la Relatividad a la ecuación de Schrödinger no es un asunto fácil de llevar a cabo, Schrödinger optó por dejar el asunto pendiente, concretándose a la formulación de su ecuación de onda que ahora sabemos ya que es una ecuación no-relativista. Es posible que Schrödinger, al ser testigo del éxito enorme que tuvo su ecuación de onda para explicar muchas cosas que anteriormente permanecían sin explicación alguna, no tuvo grandes incentivos para emprender una tarea monumental por encima de la que ya había emprendido y que le había hecho merecedor del Premio Nóbel. Además, con toda seguridad Schrödinger habrá tenido en mente el eventual fracaso y abandono de las extensiones relativistas hechas por Arnold Sommerfeld al modelo atómico planetario de Bohr que habían sido incorporadas en el modelo con la finalidad de explicar esas líneas espectrales adicionales en los espectros de absorción y emisión del átomo de hidrógeno que el modelo atómico planetario de Bohr por sí solo no podía explicar. ¿Para qué comprometer algo que ha resultado bastante exitoso con unas modificaciones posteriores de consecuencias desconocidas que en vez de afianzar la solidez del modelo lo pongan en entredicho sacando a flote posibles contradicciones e inconsistencias que habían permanecido ocultas?

Si queremos incorporar la Teoría Especial de la Relatividad dentro de la Mecánica Cuántica, no es necesario empezar de cero. En la formulación de la Mecánica Ondulatoria se tienen ya varias pistas que pueden servir como guía invaluable, entre ellas:

1) La substitución de variables por operadores.- Tanto en la Mecánica Matricial como en la Mecánica Ondulatoria, el verdadero triunfo consistió en darse cuenta de que para poder obtener resultados matemáticos válidos en el mundo sub-microscópico era necesario tomar las variables físicas clásicas identificadas como observables y reemplazarlas por operadores, ya sea operadores matriciales u operadores diferenciales, procediendo tras esto a resolver el sistema matricial o la ecuación diferencial resultante con el fin de obtener los eigenvalores que proporcionan cosas tales como los valores permisibles de energía para un sistema ligado.

2) El uso de la Teoría Especial de la Relatividad como punto de partida.- Así como las relaciones clásicas fueron punto de partida para la formulación de las relaciones esenciales utilizadas dentro de la Mecánica Ondulatoria (por ejemplo, la relación entre la energía E de una partícula y su momentum p, que es E = p²/2m), en la dinámica relativista también hay relaciones de energía que reemplazan a las relaciones clásicas, relaciones relativistas de energía que son plenamente válidas dentro de la Teoría Especial de la Relatividad (invariantes bajo las transformaciones de Lorentz).

Con lo anterior en mente, y repasando algunos de los pasos que fueron llevados a cabo en la “derivación” heurística de la ecuación de Schrödinger no-relativista, recordamos que la energía cinética de la partícula considerada como una observable expresada clásicamente como:


nos llevó a postular al siguiente operador que representa en la Mecánica Ondulatoria a la energía cinética a lo largo de una sola dimensión espacial:


Pero este operador, basado en la física clásica no-relativista, no nos sirve para la formulación de una Mecánica Cuántica Relativista. Para ello, en vez de utilizar la expresión clásica para la energía cinética, debemos empezar por utilizar la expresión relativista para la energía de la partícula, o mejor dicho, la expresión relativista para la energía-momentum (tomando prestado de la Teoría de la Relatividad el concepto de los cuatro vectores que lleva a cabo la unificación de cantidades físicas en vectores de cuatro componentes),  la cual es:


En esta expresión relativista, la masa m0 es la masa en reposo de la partícula, la cual permanece invariante a diferencia de la masa relativista que se suele escribir sin el sub-índice. Sin embargo, en virtud de que muchos textos que tratan sobre el tema prescinden del cero como sub-índice para destacar de cualquier manera a la masa en reposo, aquí haremos lo mismo, máxime que cualquier simplificación notacional a la que podamos recurrir será bienvenida para no atiborrarnos de símbolos. Sin embargo, debe quedar perfectamente claro que al estar escribiendo lo siguiente:

 

la masa que aparece en la ecuación sigue siendo la masa en reposo de la partícula. En pocas palabras, estaremos haciendo m = m0.

Naturalmente, a lo anterior tendríamos que agregar la energía potencial V para poder reproducir (con las modificaciones requeridas) los pasos que se llevaron a cabo para la justificar la “derivación” de la ecuación no-relativista de Schrödinger. Sin embargo, al adentrarnos en estos terrenos desconocidos, es de sabios empezar con las situaciones más sencillas posibles extendiendo posteriormente los resultados obtenidos hacia situaciones de mayor complejidad que empezar directamente con lo más difícil. Antes de aprender a nadar, hay que aprender a mantenerse a flote. Es por ello que el desarrollo que llevaremos a cabo será para una partícula libre, ya sea en reposo o en movimiento, sobre la cual no actúan fuerzas, o sea una partícula que se mueve en una región de potencial constante que por simplicidad tomaremos como V.=.0.

Otra cosa que haremos será restablecer al momentum p como un vector tridimensional con sus tres componentes a lo largo de tres ejes coordenados rectangulares Cartesianos:


Haciendo de manera tentativa las substituciones para los operadores E y p que anteriormente habían dado tan buenos resultados:


de lo cual se obtiene a la vez:


tenemos entonces lo siguiente al hacer la substitución de estos operadores en la expresión relativista para la energía:


 Haciendo actuar esto operacionalmente sobre una función de onda que representa a una onda de materia, obtenemos la siguiente ecuación mecánico-cuántica relativista:


Obsérvese que en el lado izquierdo de esta ecuación tenemos entre los paréntesis lo que es ni más ni menos el operador de onda, el mismo que habíamos resaltado arriba en color azul. En esta ecuación, la función de onda φ es una cantidad escalar que podemos considerar como un número complejo que tendrá el mismo valor numérico en todos los sistemas de referencia precisamente por ser un escalar. Con esto, la ecuación ciertamente debe ser una ecuación relativista. Puesto que la ecuación es de segundo orden en la derivada del tiempo (a diferencia de lo que ocurre con la ecuación de Schrödinger que es de primer orden en la derivada del tiempo), para poder resolverla debemos especificar no sólo algún valor inicial de φ sino también de ∂φ/∂t, lo cual es algo rutinario para las ondas clásicas en donde las condiciones iniciales son la posición y la velocidad. Sin embargo, se supone que en la Mecánica Cuántica la función de onda por sí sola es la descripción completa del sistema, esto es, el conocimiento de la función de onda debe ser suficiente para poder determinar el futuro del sistema.

Pese a las objeciones iniciales, la ecuación que hemos obtenido parece ser un buen principio. Sin embargo, presenta casi de inmediato un aspecto problemático si intentamos aplicarle el criterio de Born según el cual la densidad de probabilidad para encontrar a una partícula en cierta región del espacio está dada por el cuadrado de la función de onda y no por la función de onda en sí, o sea:

 ρ = φ*φ

siendo esta definición una cantidad que siempre será positiva en todo momento (positive definite).Ya vimos anteriormente que la corriente de la densidad de probabilidad está definida mediante la expresión:


y vimos también que la conservación de la densidad de probabilidad tiene la forma:


En el contexto de la Teoría de la Relatividad en donde casi todo es unificado bajo el concepto de los 4-vectores, la forma de la densidad de la probabilidad y la corriente de probabilidad tienen que ser unificadas también formando un 4-vector, lo cual implica reemplazar en la definición de densidad de probabilidad al operador diferencia nabla por el operador de diferenciación parcial con respecto al tiempo, ∂/∂t, el cual se acostumbra representar como .t para simplificar la notación un poco:


Tenemos aquí una definición de densidad de probabilidad relativista, y hasta este punto todo lo que hemos hecho está en plena concordancia con la Teoría Especial de la Relatividad. Pero el problema que tenemos es que la densidad de probabilidad no es definitivamente positiva en todo momento, puede ser negativa, precisamente en virtud de que los valores iniciales de φ y de ∂φ/∂t pueden ser seleccionados libremente sin distingo de signos cuando anteriormente en la definición no-relativista el signo positivo estaba anclado permanentemente a la función de onda sin posibilidad de volverse negativo. Sin embargo, cabe señalar que para movimientos no relativistas (o sea para superposiciones de ondas de frecuencias positivas cuya longitud de onda sea grande en comparación la longitud de onda Compton) la ecuación se puede manejar con las definiciones usuales de densidad de probabilidad y corriente de probabilidad usadas previamente con la ecuación de Schrodinger, mientras que se reduce a una cantidad definitivamente negativa para superposiciones de frecuencias negativas, y mezcla ambos signos positivo y negativo cuando hay fuerzas con la suficiente amplitud para producir movimientos relativistas, en cuyo caso el esparcimiento puede producir pares de partículas y antipartículas.

Por otro lado, aunque la fórmula que hemos obtenido parece ser una ecuación diferencial de segundo orden que no se antoja extremadamente difícil de resolver, aquí las apariencias engañan, y no vamos a llegar muy lejos, no a menos de que recurramos a una buena dosis de intuición e ingenio. Podríamos escribir a la ecuación relativista para la energía de la siguiente manera:


y una vez hecho esto, substituír nuevamente a p por su operador equivalente como lo acabamos de hacer arriba, tras lo cual podríamos intentar llevar a cabo una expansión MacLaurin-Taylor del radical en una serie de potencias que nos conducirían a una serie infinita de operadores diferenciales en orden creciente con la finalidad de montarlo todo como un problema de eigenvalores resolviendo el problema con algún procedimiento iterativo. El consenso actual es que, aún si fuera posible hacer tal cosa, las esperanzas en esta vía de solución se antojan muy remotas.

Meditando sobre el problema, y seguramente inspirado al ver que en la ecuación mecánico-cuántica relativista que hemos obtenido arriba todo está elevado al cuadrado (interpretado operacionalmente en donde se requiera hacer tal interpretación), al físico inglés Paul Adrien Maurice Dirac se le ocurrió trabajar sobre algo en lo que no se había intentado previamente: tomar la raíz cuadrada del operador de onda. Con:


esto equivale a reformular la ecuación de onda de Schrödinger de la siguiente manera:


Tomando en cuenta que los pj son operadores y no meros números, podemos darnos cuenta de que esta no es una ecuación muy satisfactoria, porque no trata por igual el espacio y el tiempo, uno de los principios básicos de la Teoría Especial de la Relatividad especial. Dirac razonó que, mientras la parte derecha de la ecuación contenía una derivada de primer orden respecto al tiempo, la parte de la izquierda debía contener igualmente una primera derivada respecto al espacio (esto es, los operadores del momentum). Una posibilidad para poder obtener esta situación es que la cantidad de la raíz cuadrada sea lo que se conoce en las matemáticas como un cuadrado perfecto, algo así como el trinomio:

x2 + 6x + 9

que resulta ser un cuadrado perfecto y al cual se le puede extraer raíz cuadrada simplificándolo como el producto de dos binomios:

(x + 3)(x + 3)

Si hacemos esto, llegamos entonces simbólicamente a lo que podemos tomar como una “factorización” tentativa del operador de onda, la misma factorización a la que llegó Dirac, que es la siguiente:


Para que la “factorización” pueda funcionar, se requiere desde luego que:

A2 = 1___B2 = 1___C2 = 1___D2 = 1

El problema con la “factorización” que se ha llevado a cabo es que, al llevar a cabo la multiplicación de los dos “factores”, habrá términos tales como ∂yx y ∂zt que no estaban presentes en la expresión original. Si queremos que los “términos cruzados” se desvanezcan, no nos queda otra alternativa más que imponer las condiciones:

AB + BA = 0___AC + CA = 0___AD + DA = 0

BC + CB = 0___ BD + DB = 0___CD + DC = 0

Esto tiene ya cierto parecido con algo que hemos visto anteriormente. Son relaciones de no-conmutatividad.

Afortunadamente, cuando a Dirac se le ocurrió dar este gran paso, ya estaba familiarizado con la Mecánica Matricial de Heisenberg y con la “extraña ecuación” de Max Born, y no tardó mucho tiempo en captar que la única manera posible de que los dos “factores” pudieran funcionar era suponiendo que las cantidades A, B, C y D son matrices. Esto significa que el primer criterio, expresado matricialmente, en realidad es lo siguiente:

A2 = I___B2 = I___C2 = I___D2 = I

Del mismo modo, el segundo criterio, expresado matricialmente, en realidad es lo siguiente:

AB + BA = O___AC + CA = O___AD + DA = O

BC + CB = O___ BD + DB = O___CD + DC = O

Estos son los dos requisitos indispensables que deben cumplir las cuatro matrices. La siguiente pregunta es necesariamente: ¿De qué tamaño deben ser las cuatro matrices? Aunque teniendo en mente la omnipresencia de las matrices de Pauli podríamos suponer que tal vez estas pudieran ser utilizadas también aquí, la posibilidad tiene que ser desechada de inmediato porque las tres matrices de Pauli por sí solas no son suficientes. No hay forma alguna en la cual podamos reconstruír el operador de onda con tres matrices 2x2. Y el siguiente paso consistente en probar matrices 3x3 también  tiene que ser desechado de inmediato en virtud de que necesitamos matrices de orden par, no de orden impar. Eventualmente encontramos que necesitamos, como mínimo, cuatro matrices 4x4 para poder llevar a cabo la reconstrucción del operador de onda a partir de los “factores”. Esta es la parte fácil. Lo elaborado consiste en determinar cuáles deben ser las entradas de las cuatro matrices 4x4 para que se cumplan las condiciones especificadas arriba.

De este modo, podemos escribir la siguiente ecuación de onda:


siendo κ una constante multiplicativa pendiente de ser determinada. Aquí tal vez surja de inmediato una duda. Lo que tenemos en el lado izquierdo de la igualdad es una expresión matricial que involucra matrices 4x4, mientras que lo que tenemos en el lado derecho aparentemente es una cantidad escalar. ¿Cómo puede ser esto posible? Siendo κ una simple constante multiplicativa, un número en lo que a nosotros concierne, la única respuesta posible a este dilema es asumir que la función de onda ψ es un vector. Con la excepción del asunto del spin del electrón, en el cual la función de onda del spin es una función de onda de dos componentes, con uno de los componentes representando la parte de la función de onda del spin que apunta “hacia arriba” y el otro componente representando la parte de la función de onda del spin que apunta “hacia abajo”, anteriormente habíamos considerado a la función de onda Ψ como una entidad indivisible, como algo que en un principio se supuso que representaba el aspecto “ondulatorio” de la materia y a la cual se le atribuía una naturaleza oscilatoria, para terminar conviertiéndose en un mero artificio matemático para poder encontrar cosas tales como los eigenvalores de la energía en los sistemas ligados, un simple símbolo que no representaba nada más que a sí mismo. Pero las implicaciones del resultado que se ha obtenido arriba es que la función de onda es de hecho una función multicomponente, esto es, que consta de componentes múltiples:


Esta conclusión es una consecuencia directa del hecho de haber incorporado la Teoría de la Relatividad dentro de la Mecánica Ondulatoria, y proporcionó por vez primera una explicación teórica a la aparición de las funciones de onda de dos componentes en la teoría fenomenológica de Pauli utilizada para describir adecuadamente el spín del electrón sobre una base meramente fenomenológica, un asunto que previamente había permanecido como un misterio inclusive para el mismo Pauli. Antes de la relativización de la Mecánica Cuántica, la función  de onda para una partícula libre, en este caso el electrón, era simplemente una función de onda que no podía ser subdividida en cuatro partes, y no había razón para ello. De este modo, el comportamiento no-relativista de una partícula libre estaba descrito esencialmente por una sola ecuación diferencial. Pero el descubrimiento de Dirac fue mayúsculo, ya que se encontró que para poder describir plenamente el comportamiento del electrón se requerían cuatro ecuaciones diferenciales; y esto para una sola partícula libre.

Podemos escribir la función de onda de cuatro componentes de una manera más explícita como un vector columna que a su vez puede ser considerado como una matriz 4x1:


Por su gran parecido con las funciones de onda para el spin del electrón que fueron utilizadas por vez primera por Pauli dentro de la Mecánica Ondulatoria no-relativista de Schrödinger, a esta función de onda multicomponente se le conoce en la literatura como espinor. En este caso, la función de onda vendría siendo un espinor de dimensión cuatro. Al escribir al espinor como un vector columna, entonces el dual ψ* de este vector columna que se requiere para poder obtener la densidad de probabilidad bajo el criterio de Born como ψ*ψ como lo hemos venido haciendo con anterioridad debe ser escrito como una vector renglón (el cual a su vez puede ser considerado como una matriz 1x4) cuyos componentes serán los conjugados complejos de los elementos correspondientes tomados del vector columna:


en donde los asteriscos simbolizan el conjugado complejo (la daga puesta como super-índice significa la transpuesta del conjugado complejo, o lo que es lo mismo, el conjugado complejo de la transpuesta). Obsérvese que si antes daba lo mismo escribir la densidad de probabilidad como ψ*ψ o como ψψ*, ahora esto ya no es posible en virtud de la no-conmutatividad del producto matricial. La densidad de probabilidad tiene que ser calculada ahora con un producto matricial en el orden:


Aplicando el operador matricial en ambos lados del resultado que hemos obtenido arriba nos permite recuperar la ecuación de onda para ondas de materia:


Más aún, si hacemos:


encontraremos que con este recurso los cuatro componentes de la función de onda multicomponente satisfacen individualmente la relación relativista para la energía-momentum. Por lo tanto, la ecuación de onda mecánico-cuántica relativista que estamos buscando que sea de primer orden tanto en el espacio como en el tiempo será entonces:


Seguramente después de haber invertido una buena cantidad de tiempo probando varias posibilidades al tanteo, Dirac por fin encontró las matrices requeridas, las cuales resultaron ser las siguientes cuatro matrices conocidas como las matrices de Dirac:





Obsérvese que la primera matriz, la cual es una matriz diagonal, también recibe en la literatura técnica la designación β. El lector podrá comprobar fácilmente por su propia cuenta que multiplicando cualquiera de estas cuatro matrices por sí misma obtendremos como resultado la matriz identidad I,



y que el producto de cualquiera de estas matrices por cualquiera de las otras tres dará el mismo resultado pero con signo contrario si se invierte el orden en el que se toma el producto matricial, o sea que, en pocas palabras, las cuatro matrices son anticonmutativas. Se debe aclarar que este cuádruplo de matrices de Dirac no es único, ya que hay otros cuádruplos que también pueden servir para nuestros propósitos, aunque hay unos cuádruplos que se prestan más al manejo matemático que otros.

Subdividiéndolas en bloques sub-matriciales 2x2, las matrices de Dirac pueden ser expresadas de una manera un poco más compacta poniendo tres de ellas en función de las tres matrices de Pauli:


Esto nos permite definir las siguientes matrices αk cuyos elementos son a su vez matrices 2x2 que resultan ser las matrices de Pauli así como la matriz β:


siendo k.=.1,2,3.

PROBLEMA: Escribir explícitamente las matrices αk y la matriz β definidas arriba.

Para la matriz α1 tenemos lo siguiente:


Para la matriz α2 tenemos lo siguiente:


Por su parte, para la matriz α3 tenemos lo siguiente:


Finalmente, en lo que respecta a la matriz  β tenemos:


Regresando a la ecuación de onda relativista de Dirac, una vez definidas las matrices de Dirac que serán utilizadas en lugar de los coeficientes matriciales A, B, C y D, haciendo:

(A, B, C) = iβαk

D = β

obtenemos la ecuación relativista de Dirac en una de sus representaciones convencionales.

PROBLEMA: Escribir explícitamente los coeficientes matriciales A, B, C y D empleando los componentes de las matrices αk y la matriz β tal y como están definidas arriba.

En el caso del coeficiente matricial A, este resulta ser:


Omitiendo el número imaginario i que multiplica por fuera a la matriz, a la matriz obtenida se le designa como una matriz gamma (γ).

En el caso del coeficiente matricial B, este resulta ser:


Omitiendo el número imaginario i que multiplica por fuera a la matriz, a la matriz obtenida también se le simboliza como otra matriz gamma (γ).

En el caso del coeficiente matricial C, este resulta ser:


Omitiendo el número imaginario i que multiplica por fuera a la matriz, a la matriz obtenida también se le simboliza como otra matriz gamma (γ).

Finalmente, en el caso del coeficiente matricial D este de modo trivial es simplemente igual a la matriz β, o sea:


Teniendo lo anterior en mente, y representando a los operadores usuales del momentum como:


 podemos escribir la ecuación relativista de Dirac de la siguiente manera:


Empleando el símbolo de sumatoria, podemos escribirla de una manera más compacta aún en una de sus versiones mejor conocidas:








Si inspeccionamos la primera matriz de Dirac, podremos darnos cuenta de que dicha matriz puede ser subdividida en cuatro sub-matrices 2x2, esto es, una matriz cuyos componentes son sub-matrices:




Las compactaciones simbólicas que hemos llevado a cabo metiendo a las matrices de Pauli en el panorama nos deben permitir escribir la ecuación relativista de Dirac con un operador de onda actuando no sobre una función de onda ψ que consta de cuatro componentes sino sobre una función de onda φ que conste de sólo dos componentes.


Esta función de onda que consta de dos componentes, utilizada en la versión compacta de la ecuación relativista de Dirac, recibe en la literatura técnica el nombre de espinor de dos componentes.

Antes de continuar, se obtendrán primero unas relaciones que surgen con mucha frecuencia en la literatura de la Mecánica Cuántica Relativista.

PROBLEMA: Demostrar que para cualquier par de las matrices 2x2 de Pauli, se cumple la siguiente relación:


La demostración es fácil de llevar a cabo si recordamos que bajo el producto matricial cualquier par de matrices de Pauli forma un producto anticonmutativo:

lo cual podemos escribir como:


Por otro lado, cualquiera de las matrices de Pauli multiplicada por sí misma nos producirá la matriz identidad I, con lo cual:


Entonces, con la ayuda del delta de Kronecker, podemos resumir ambos resultados en uno solo:


PROBLEMA: Demostrar que para las matrices α1, α2 y α3 dadas arriba, se cumple la siguiente relación:


Obsérvese que los elementos de la matriz mostrada son a su vez matrices 2x2, con lo cual la matriz mostrada en el lado derecho de la igualdad matricial es realmente una matriz 4x4. Obsérvese también la similitud con la relación demostrada en el problema anterior para las matrices de Pauli.

Aplicando la definición dada arriba para las tres matrices αk en función de las tres matrices de Pauli σk y utilizando el resultado obtenido en el problema anterior tenemos entonces:


Podemos simplificar esto un poco más en virtud de que:

 
con lo cual podemos escribir:


Obsérvese la gran semejanza de este resultado con el resultado obtenido en el problema anterior para las matrices de Pauli, sin olvidar que en este caso la matriz identidad I es una matriz 4x4 en vez de una matriz 2x2. Esta simetría es la que nos permite suponer que podemos escribir la ecuación relativista de Dirac actuando sobre un espinor “compactificado” de dimensión 2 en lugar de una ecuación actuando sobre un espinor de dimensión 4.

Definiendo los siguientes vectores (nótese que el primer vector es un vector cuyas componentes son las matrices αk, mientras que el segundo vector es un vector cuyas componentes son los operadores diferenciales del momentum en coordenadas rectangulares Cartesianas):


de modo tal que la formación del producto vectorial punto entre ambos vectores nos dé:


entonces podemos tomar la ecuación relativista de Dirac:


para escribirla de una manera más compacta y elegante:


Esta estructura empieza a resultar algo familiar. Considerando el término entre paréntesis en el lado izquierdo como un operador Hlibre que está actuando sobre el espinor ψ(x,t) y que vendría siendo el operador Hamiltoniano relativista para la partícula libre:


podemos escribir entonces la ecuación relativista de Dirac en una forma que tiene la misma estructura que la ecuación de onda de Schrödinger:


Una cosa es obtener una ecuación de onda mecánico-cuántica relativista, en este caso, la ecuación de Dirac que tenemos arriba, y otra cosa muy diferente es encontrarle alguna solución. Aquí nos ayuda el hecho de que al haber seleccionado un potencial V igual a cero, tenemos una partícula libre para la cual podemos esperar que la solución sea mucho más sencilla que para una partícula que forme parte de un sistema ligado.

Para irnos dando una idea de la naturaleza del procedimiento general empleado para resolver la ecuación de onda relativista de Dirac, podemos empezar por el caso más sencillo de todos, el de una partícula libre en reposo. Al hacer tal cosa, estaremos tomando el límite no-relativista de la ecuación, algo así como la simplificación que se hace en la Teoría Especial de la Relatividad cuando se consideran fenómenos ocurriendo a una velocidad significativamente menor que la velocidad de la luz, con lo cual se obtienen resultados válidos en la mecánica clásica Newtoniana.

Para una partícula en reposo, carente de momentum, la ecuación relativista de Dirac se reduce a lo siguiente:


En la tercera línea se ha reemplazado a  β por su representación matricial explícita como preparativo para el producto matricial que se llevará a cabo con el vector espinor ψ de dimensión 4. Llevando a cabo el producto matricial:


Igualando las componentes respectivas de ambos lados de esta ecuación matricial, obtenemos las siguientes cuatro ecuaciones diferenciales:


que podemos escribir también como:


Cada una de estas ecuaciones diferenciales, manejada por separado, tiene una solución matemática extremadamente sencilla con la cual ya estamos familiarizados. De este modo, podemos escribir las cuatro soluciones que representan cada uno de los cuatro componentes del espinor ψ:


Otra manera de escribir estas soluciones, resaltando por separado cada una de las cuatro componentes del espinor como las componentes de un vector columna, es la siguiente:


Las primeras dos funciones de onda corresponden a valores positivos de energía, mientras que las últimas dos soluciones corresponden a valores negativos de energía, lo cual es extraño. Y esto no es algo de lo que nos podamos deshacer fácilmente. En la mecánica clásica, hay muchos problemas en los cuales al tomar una raíz cuadrada obtenemos dos soluciones, una solución con un radical positivo y una solución con un radical negativo, siendo ambas soluciones igualmente válidas desde el punto de vista matemático, aunque frecuentemente una de las dos soluciones es desechada al no ser físicamente admisible por representar un absurdo como una presión negativa. Sin embargo, en este caso las dos soluciones no surgen simplemente de tomar una raíz cuadrada. Dejaremos pendiente este asunto mientras encausamos nuestra atención a la búsqueda de una solución a la eigenecuación de onda independiente del tiempo utilizando el operador de energía Hamiltoniano descubierto por Dirac:


en donde ψ0(x) es el fragmento independiente del tiempo:


En este caso, consideraremos una partícula libre cuyo momentum no es necesariamente igual a cero. Buscaremos una solución de onda plana, la cual ya sabemos que será una función de onda multicomponentes. Por conveniencia, se toma la z del eje como la dirección en que la partícula se está moviendo. Podemos empezar proponiendo una solución tentativa como la siguiente:


Puesto ψ0 consta de cuatro componentes, y puesto que el exponencial eipx/ħ es un simple número, podemos ver que la “constante” w tendrá que ser un espinor constante de cuatro componentes, siendo por su parte p el momento de la partícula, tal y como podemos verificar aplicando el operador de momento a la función de onda. En la representación de Dirac, la ecuación aplicada a la solución tentativa ψ0 nos produce entonces la siguiente eigenecuación de valores propios con el espinor w escrito como una matriz 4x1:


Para cada valor del momentum p, hay dos espacios propios, ambos de dos dimensiones. Un espacio propio contiene valores propios positivos, y el otro valores propios negativos, de la forma:


El espacio propio positivo está estructurado por los siguientes dos estados propios eigen:


 mientras que el espacio propio negativo está estructurado por los siguientes dos estados propios eigen:


 siendo:


 El primer estado propio eigen de la estructura de cada espacio propio tiene el “spin” apuntando en la dirección positiva del eje-z (“spin hacia arriba”) y el segundo estado propio eigen tiene el spin apuntando en la dirección negativa del eje-z (“spin hacia abajo”).

En la Teoría Especial de la Relatividad, sabemos que a velocidades lo suficientemente bajas en comparación con la velocidad de la luz los resultados relativistas se reducen a los resultados clásicos que se obtienen con la mecánica Newtoniana no-relativista. Tratándose de la Mecánica Cuántica que de clásico no tiene nada, no podemos esperar que con simplificaciones semejantes las soluciones que hemos obtenido arriba se reduzcan a algo “clásico”. Pero sí podemos esperar que se reduzcan a algún resultado que ya habíamos obtenido previamente con la ecuación de onda no-relativista de Schrödinger. Y esto resulta ser el caso, ya que en el límite no relativista, la componente ε del espinor reduce la energía cinética de la partícula, que es insignificante comparada con pc:


En este límite, por lo tanto, podemos interpretar las cuatro componentes de la función de onda como sus amplitudes respectivas del (I) spin hacia arriba con energía positiva, y el (II) spin hacia abajo con energía positiva, (III) spin hacia arriba con energía negativa, y (IV) spin hacia abajo con energía negativa. Si ignoramos el asunto de las energías negativas, entonces tenemos esencialmente la predicción teórica del spin del electrón que ya se había estudidado previamente tanto bajo la óptica de la Mecánica Matricial como la óptica de la Mecánica Ondulatoria sin consideraciones de efectos relativistas.

La ecuación de Dirac, una teoría de una sola partícula libre que permite describir las amplitudes de probabilidad para un electrón solitario, dá una predicción suficientemente buena del spin y del momento magnético del electrón, además de que explica la mayor parte de la estructura fina observada en las líneas espectrales atómicas. Pero esto mismo en cierta forma ya se había logrado con la ecuación no-relativista de Schrödinger. Entonces, ¿qué hemos ganado a cambio de la complejidad en la que nos hemos involucrado aquí? Resulta que la ecuación relativista de Dirac también realiza una muy peculiar predicción de que existe un conjunto infinito de estados cuánticos en que el electrón tiene energía negativa. Este extraño resultado le permitió a Dirac predecir, por medio de las hipótesis contenidas en su llamada teoría de los agujeros, la existencia de electrones cargados positivamente, una predicción que fue confirmada experimentalmente con el descubrimiento del positrón en 1932. De lo que estamos hablando aquí es ni más ni menos que la predicción teórica del descubrimiento de la antimateria.

Las soluciones negativas de E son problemáticas, ya que la energía de una partícula en reposo (p = 0) que es igual a E = mc2 (la ecuación más famosa de Einstein) también vendría siendo E = - mc2, sugiriendo con ello una masa “negativa” (la velocidad de la luz es una constante numérica siempre positiva), siendo que las masas negativas no existen dentro de la Teoría Especial de la Relatividad. De cualquier modo, matemáticamente no parece haber motivo alguno para rechazar las soluciones correspondientes a energía negativa. Para afrontar este problema filosófico, Dirac introdujo una hipótesis conocida como la teoría de los agujeros según la cual el vacío resulta ser el estado más importante en el mundo de los cuantos, en el que todos los estados propios de energía negativa del electrón ya están ocupados. Esta descripción del vacío como un “mar” de electrones es llamada el mar de Dirac en donde el espectro de los eigenvalores de energía en la ecuación de Dirac acomodados en orden creciente de energía (en el sentido vertical positivo) tiene la siguiente apariencia:


Podemos imaginar que los autoestados eigen de energía negativa con E<-mc2están ya ocupados por electrones formando el “mar de Dirac”:


Estos estados representan el estado del vacío, y son por lo tanto inobservables, mientras que los electrones reales, observables, sólo pueden existir en estados de energía positiva.

En virtud de que el principio de exclusión de Pauli prohíbe a los electrones ocupar el mismo estado, cualquier electrón adicional sería forzado a ocupar un estado propio de energía positiva, y los electrones de energía positiva no podrían decaer a estados propios de energía negativa. Dirac razonó que si los estados propios eigen de energía negativa están llenos de forma incompleta, cada estado propio no ocupado —llamado agujero— podría comportarse como una partícula cargada positivamente. El agujero tiene energía positiva, ya que se necesita energía para crear un par partícula-agujero a partir del vacío:


Dirac en un principio pensaba que el agujero era un protón, pero Hermann Weyl le advirtió de que si así fuera entonces sería un protón sumamente raro ya que el agujero se comportaría como si tuviera la misma masa del electrón, siendo que el protón es, aproximadamente, dos mil veces más masivo. El agujero fue finalmente identificado como el positrón, la partícula descubierta por Carl Anderson en 1932.

Por necesidad, la teoría de agujeros asume que los electrones de energía negativa en el mar de Dirac no interaccionan unos con otros, ni con los electrones de energía positiva. Con esta suposición, el mar de Dirac produciría una inmensa (de hecho, infinita) carga eléctrica negativa, la mayor parte de la cual de una forma u otra sería anulada por un mar de carga positiva debido a que el vacío permanece eléctricamente neutro. Sin embargo, es completamente insatisfactorio postular que los electrones de energía positiva pueden ser afectados por el campo electromagnético mientras los electrones de energía negativa no lo pueden ser. Por otro lado, el concepto del mar de Dirac tiene un indeseable sabor a ciencia-ficción que no apeteció ni siquiera al mismo Dirac. Por este motivo los físicos teóricos, incluyendo al mismo Dirac, abandonaron la teoría de agujeros en favor de la teoría de campos de Dirac, que deja de lado el problema de los estados de energía negativa tratando los positrones como verdaderas partículas

Una vez destronada la función de onda Ψ del pedestal en el que estaba colocada como una unidad indivisible desde la formulación original de la hipótesis de De Broglie, la secuela inevitable resultó ser la formulación de la pregunta: ¿por qué no tratar de reformular la Mecánica Cuántica empezando con la descripción clásica de una onda plana, cuantizando sus ecuaciones de movimiento? De este modo, los estados cuantizados de energía de la onda plana corresponderían a las 0, 1, 2, ... partículas que tengan el momentum correspondiente. Esta cuantización de Ψ es algo que se conoce como la segunda cuantización. Y puesto que así como el campo eléctrico ε es a una onda electromagnética clásica como Ψ lo es a una onda de materia, podemos considerar a Ψ más como un campo susceptible de ser cuantizado que como una simple función de onda. De lo que estaríamos hablando entonces es de la cuantización del campo para ondas de materia, estaríamos hablando de una teoría cuántica de campos (en la literatura inglesa, quantum field theory). Siendo posible esta cuantificación para el campo que representa a las ondas de materia, podemos pagarle entonces una deuda de gratitud a la teoría del campo electromagnético de la cual vino la inspiración para la formulación de la ecuación de Schrödinger haciendo lo mismo con dicha teoría, cuantificando al campo electromagnético, y tendremos entonces lo que se conoce como la teoría de la electrodinámica cuántica (en la literatura inglesa, quantum electrodynamics o QED) que podemos agregarle a la teoría cuántica de los campos. Si todo esto se lleva a cabo desde el contexto de la Teoría Especial de la Relatividad, entonces se empieza a zanjar el asunto del continuum que representa clásicamente el campo electromagnético, el cual en una época en la cual la Mecánica Cuántica estaba demostrando que no era posible sub-dividir a la energía y a la materia hasta el infinito sin encontrarlas cuantificadas, se mantenía sub-divisible hasta el infinito. La cuantificación de los campos vendría entonces a demostrar que todo, hasta los mismos campos, están cuantificados. Quizá lo más interesante es que el punto de entrada a la teoría cuántica de los campos resulta ser precisamente la primera ecuación mecánico-cuántica relativista de arriba que habíamos descartado al principio, ecuación hoy conocida como la ecuación Klein-Gordon. Para regresar a dicha ecuación, era necesario destronar a la función de onda Ψ como un ente indivisible, lo cual obtuvo Dirac (sin haberlo anticipado) con el descubrimiento de su ecuación de onda. Una vez hecho esto, y con una reinterpretación del asunto de la densidad de probabilidad negativa, el camino estaba abierto para un nuevo e importante desarrollo de tamaño cuántico. (Para poder interpretar a la ecuación Klein-Gordon como una ecuación que proporciona la amplitud de probabilidad para una partícula en una posición dada, las soluciones de frecuencias negativas deben ser interpretadas como describiendo a una partícula que viaja hacia atrás en el tiempo, propagándose hacia el pasado, lo cual podrá parecer a muchos como otro asunto digno de una novela de ciencia-ficción que no mejora en nada la explicación teórica dada por Dirac con su teoría de los agujeros. Esto nos confirma que, a partir del descubrimiento del principio de incertidumbre de Heisenberg, el cual ha resistido todos los intentos experimentales por desbancarlo, la Mecánica Cuántica tiene su propia lógica de funcionamiento que trabaja de modo muy distinto a la lógica humana).