martes, 11 de agosto de 2009

El principio de incertidumbre I

En la Mecánica Clásica, la ley de la gravitación universal de Newton que resultó tan exitosa en la descripción cuantitativa de las órbitas de los planetas y de los cometas en torno al Sol así como de la Luna en torno a la Tierra dice así: “dos cuerpos se atraen en razón directa del producto de sus masas y en razón inversa del cuadrado de la distancia que los separa”, y enunciada matemáticamente se escribe de la siguiente manera:

F = Gm1m2/r²

La aplicación de la fórmula supone que para la distancia de atracción entre dos cuerpos utilizamos la distancia que hay entre los centros geométricos de ambos cuerpos en donde para fines de cálculo suponemos que está concentrada la masa de los cuerpos que se atraen el uno al otro.

Sin embargo, sabemos muy bien que la masa de un cuerpo no está concentrada en su centro geométrico. Se puede demostrar mediante las herramientas del cálculo infinitesimal que si sub-dividimos una esfera enorme de materia y sumamos vectorialmente las contribuciones gravitatorias de cada uno de los elementos infinitesimales de materia de los que consta la esfera, el resultado que se obtiene es el mismo que el que se obtendría si toda la masa se supone concentrada en el centro de la esfera, dándole una justificación matemática a la simplificación mediante la cual para fines de cálculo la distancia que separa a dos cuerpos se puede tomar como la distancia que separa sus centros geométricos. Pero esta simplificación utilizada para fines de cálculo no deja de ser una falacia. Y pese a ello, nos hemos acostumbrado a aplicar liberalmente esta suposición desde algo tan grande como los planetas y el Sol hasta algo tan pequeño como los cuerpos microscópicos.

Aunque solemos representar exactamente la ubicación de algo en el espacio mediante un sistema de coordenadas tales como las coordenadas rectangulares Cartesianas, por ejemplo:

(x, y, z) = (2.0 centímetros, 5.0 centímetros, 3.0 centímetros)

una ubicación como ésta siempre ha sido una idealización imposible de lograr en la práctica por el simple hecho de que todo cuerpo consta de una extensión finita de eso que llamamos materia ocupando cierta región del espacio. En el caso de un cubo de 5 milímetros de lado, su ubicación estaría dada entonces de la siguiente manera:

(x, y, z) = (2.0 ± 0.5, 5.0 ± 0.5, 3.0 ± 0.5)

Esto es válido incluso para partículas muy pequeñas como el electrón, porque aunque clásicamente se les considera como partículas puntuales en realidad nadie cree que toda la partícula esté confinada a un punto de dimensión cero. De este modo, si nos vamos al mundo sub-microscópico, una partícula esférica de diámetro Δx en realidad no se puede considerar ubicada en cierto punto x exacto. Si la posición de una partícula pudiera fijarse de modo exacto en el espacio, entonces la representación de un cuerpo o de una partícula en movimiento a lo largo de un eje podría representarse de la siguiente manera conforme se desplaza de un lugar a otro:




Sin embargo, si el cuerpo o la partícula no son considerados como algo en lo que toda la masa esté concentrada en un punto de dimensión cero, entonces lo que tenemos en la realidad para la descripción del movimiento es lo siguiente:




¿Y qué decir del momentum p = mv? Si no podemos ubicar exactamente la posición de una partícula, tampoco podremos definir el momentum de modo exacto, y en vez de hablar de un momentum p estaríamos hablando del momentum como:

p ± Δp

Obsérvese que esto no tiene nada que ver con la precisión de los aparatos que utilicemos.

De cualquier modo, la incertidumbre que estaremos tratando, la incertidumbre cuántica, tiene mucho más de fondo que la simple imposibilidad de poder representar cualquier cuerpo físico real como una coordenada en el espacio.

Empezaremos por asentar un hecho importante: El principio de incertidumbre es una consecuencia directa de la ecuación de Born, a grado tal que muchos especialistas en la Mecánica Matricial los toman como sinónimos. La razón por la cual hay incertidumbre en el mundo sub-microscópico es porque la constante de Planck no es igual a cero. Si fuese igual a cero, no sería posible obtener el principio de incertidumbre de la ecuación de Born, y la ecuación de Born no sería más que una manifestación física de la propiedad matemática de conmutatividad aplicada a dos observables compatibles. De cualquier manera, por razones estéticas y de buen gusto filosófico además de las razones de índole matemática, se sigue considerando a la ecuación de Born como más fundamental que el principio de incertidumbre.

En la derivación que será llevada a cabo a continuación del principio de incertidumbre, nos mantendremos estrictamente dentro del marco de la Mecánica Matricial, recurriendo en todo momento a matrices utilizadas como operadores para representar (a través de sus valores característicos eigen) los valores físicos reales observables en el laboratorio que estas matrices representan. Se demostrará primero que para dos cantidades reales K y L que sean a su vez los eigenvalores de dos matrices K y L, las reglas generales implican que para cualquier estado físico representado por este par de matrices la siguiente expresión debe ser válida (recuérdese que la esperanza matemática de una matriz o de alguna combinación de matrices siempre es un número real y no una matriz):

<K²> <L²> ≥ | (1/2) <KL - LK>

Pero antes de llevar a cabo la demostración de esta aserción, se llevará a cabo la demostración de otra relación que estaremos necesitando.

PROBLEMA: Dadas dos matrices K y L cuyas esperanzas matemáticas de sus valores medios cuadráticos son respectivamente <K²> y <L²>, demuéstrese que:


tanto para el caso en el que cualquiera de las esperanzas matemáticas <K²> y <L²> sean iguales a cero como para el caso en el que ambas son iguales a cero.

Para poder probar la aseveración cuya demostración se pide, se demostrará primero que dado un número complejo w cualquiera cuyo conjugado complejo sea w* entonces se debe tener que el eigenvalor del siguiente producto matricial:

(K + wL) (K - w*L)

deberá ser mayor que cero, esto es:

(K + wL) (K - w*L ) ≥ 0

Puesto que, por hipótesis, w es un número complejo, podemos escribirlo como la suma de una parte real y una parte imaginaria:

w = u + iv

siendo u y v números reales. Hágase también, en función de los eigenvalores de las matrices K y L:

A = K + uL

B = vL

Entonces, siendo u y v números reales, los eigenvalores A y B serán también números reales y por lo tanto las matrices A y B también representarán cantidades reales que deben ser observables en el laboratorio y que pueden ser medidas. Hablando matricialmente:

A = K + uL

B = vL

Reemplazando al número complejo w por la suma de su parte real y su parte imaginaria, podemos escribir lo siguiente:

K + wL = K + uL + ivL
= A + iB

Tomando el conjugado complejo de la ecuación anterior sin olvidar que K y L son cantidades reales positivas, tenemos entonces:

K + w*L = K + uL + ivL

= A - iB

De este modo, lo siguiente debe ser cierto:

(K + wL) (K + w*L) = (A + iB) (A - iB)
= A² + B²

Puesto que A² siempre será una cantidad positiva aunque la misma cantidad A sea un número complejo (definida desde luego como A² = A*A) al igual que B², se deduce entonces que:

(K + wL) (K - w*L ) ≥ 0

Esto es lo mismo que decir que todos los eigenvalores de la matriz que obtengamos al formar el siguiente producto matricial:

(K + wL) (K + w*L)

serán valores reales positivos.

Podemos demostrar también que si G es una matriz que representa (a través de cualquiera de sus eigenvalores) una cantidad G que siempre será real y positiva, entonces todos los eigenvalores que obtengamos de la matriz formada a partir del producto matricial:

(K + iL) G (K - iL)

serán también reales y siempre positivos. Para demostrarlo, sea R uno de los eigenvalores de la matriz R que es a su vez una matriz que multiplicada por sí misma nos resulta en la matriz G, esto es:

R² = G

Obviamente, el cuadrado de cada uno de los eigenvalores de la matriz R nos resultarán en cada uno de los eigenvalores de la matriz G:

 R² = G

Fórmense ahora los eigenvalores A y B de las matrices A y B de la manera siguiente:

A = (1/2)(KR + RK) + (1/2) i (LR - RL)

B = (1/2)(LR + RL) + (1/2) i (KR - RK)

Entonces:

(K + iL) G (K - iL) = (K + iL) RR (K - iL)

=  (KR + iLR) (RK - iRL)

= (1/2) {(KR + RK) + i (LR - RL) + (KR - RK) + i (LR + RL)}
 ×(1/2) {(RK + KR) - i (RL - LR) + (RK - KR) - i (RL + LR)}

 = (A + iB) (A - iB)

= A² + B²

Puesto que A² y B² siempre serán cantidades positivas, esto significa que la cantidad:

 (K + iL) G (K - iL)

siempre será una cantidad positiva, y por lo tanto los eigenvalores del producto matricial:

 (K + iL) G (K - iL)

 siempre serán cantidades reales y positivas.

Ahora bien, supóngase que la esperanza matemática <L²> no es igual a cero. Esto nos permite definir entonces una cantidad w de la siguiente manera:


 Con lo que acabamos de definir, entonces la esperanza matemática del producto matricial:

(K + wL) (K + w*L)

viene siendo lo siguiente después de llevarse a cabo los productos:

 K² + w*KL + wLK + w w*L²

y tras aplicar la regla que nos dice que la esperanza matemática de la suma de dos o más cantidades es igual a la suma de las esperanzas matemáticas de cada una de dichas cantidades:


 Usando la definición dada arriba para el número w:


Podemos ver que los dos términos encerrados en recuadros color magenta se eliminan, dejándonos únicamente lo siguiente:


Pero ya habíamos demostrado arriba que para cualquier estado:

(K + wL) (K - w*L ) ≥ 0 

se deduce entonces que:

 

para el caso en el cual <L²> no es igual a cero. En virtud del papel simétrico que desempeñan las matrices K y L en las relaciones anteriores, resulta obvio que la conclusión no cambiará en lo absoluto si las matrices K y L son intercambiadas. Esto nos permite afirmar que la relación que acabamos de demostrar también será válido para el caso en el cual <K²> no es igual a cero.

Falta por demostrar que la desigualdad se mantendrá en pie aún cuando ambas esperanzas matemáticas <L²> y <K²> son iguales a cero. Para demostrarlo, hágase:


Entonces, tomando nuevamente el producto matricial original:

(K + wL) (K + w*L) = K² + w*KL + wLK + w w*L²

y aplicando la definición que le hemos dado al número w tras tomar las esperanzas matemáticas en ambos miembros de la ecuación anterior, puesto que les hemos dado a las esperanzas matemáticas de K² y L² un valor de cero tendremos lo siguiente:


De la definición que le hemos dado al número w, si tomamos el conjugado complejo del mismo podemos decir que:


Por lo tanto:


Antes de proseguir adelante, demostraremos aquí otra relación que queremos utilizar para simplificar lo que tenemos arriba:


Siendo la esperanza matemática de cualquier matriz un número, el cual puede ser real o complejo, podemos escribir entonces lo siguiente:


Si la suma de ambas esperanzas matemáticas:


ha de ser un número real, esto implicará que:

x + iy + u + iv

deberá ser a su vez un número real, y para que esto sea cierto, se requiere que:

v = - y

con el fin de que las partes imaginarias se cancelen mutuamente dejándonos un número real. Por la misma razón, la diferencia de ambas esperanzas matemáticas:


cancelará las partes reales dejando únicamente las partes imaginarias, o puesto de otra manera:

x + iy - (u + iv)

deberá ser un número imaginario, lo cual requiere que:

u = x

Entonces:

u + iv = x - iy

u + iv = (x + iy)*

con lo cual:


Con esto podemos escribir:


y la relación que teníamos arriba se convierte en:


en donde se ha definido la magnitud absoluta como la cantidad multiplicada por el conjugado complejo de la misma cantidad:

Así, puesto que:


se concluye que:


Puesto que en lado izquierdo de la desigualdad tenemos una cantidad negativa (-2) que multiplica a una cantidad que es definitivamente positiva, la única manera en la que este resultado pueda ser cierto es haciendo la magnitud de la esperanza matemática igual a cero. Se concluye que la desigualdad se mantendrá en pie aún cuando ambas esperanzas matemáticas <L²> y <K²> sean iguales a cero. Queda demostrada pues con esto la validez general de la relación:

 

A continuación, podemos ir asentando lo siguiente:


Tras esto, la siguiente reagrupación es una operación perfectamente válida:



Tomando la esperanza matemática de ambos lados de esta ecuación matricial aplicando a la vez la propiedad de que la esperanza matemática de la suma de dos términos es igual a la suma de las esperanzas matemáticas de los términos:


Obsérvese que hasta este punto tenemos en el lado derecho de la ecuación matricial la suma de dos términos, siendo uno de ellos es la esperanza matemática del anticonmutador:

{K, L} = KL + LK

y siendo el otro de ellos la esperanza matemática del conmutador:

[K, L] = KL - LK

Tenemos ya una expresión para <KL>. Lo que queremos ahora es obtener una expresión para <LK> para así poder formar el producto:


Podemos obtener fácilmente <LK> a partir de <KL> con el simple conocimiento de que:


Entonces:


Usando la expresión matricial que obtuvimos arriba para <KL>, es obvio que:


Puesto que, siendo las esperanzas matemáticas números (¡no matrices!), y tanto el término:


como el término:


representan cantidades reales, positivas, lo que tenemos bajo el módulo es simplemente la magnitud absoluta de la “longitud” de un número complejo del tipo:

a + ib

para el cual, usando la desigualdad de Schwarz de la cual se deriva la desigualdad del triángulo (la cual nos dice que la longitud de cualquier lado de un triángulo es menor o igual que la suma de las longitudes de los otros dos lados, con la igualdad ocurriendo cuando el triángulo degenera en una línea recta), deducimos que dicho módulo o “longitud” del tipo |a+ib|² será mayor que su parte real o su parte imaginaria. Gráficamente, un número complejo se puede representar como un “vector” mediante un diagrama de Argand:


Algebraicamente:

 |a + ib|² = (a + ib)*(a + ib) = (a - ib)(a + ib) = a² + b²


y puesto que:

a² + b² ≥ b²

a² + b² ≥ |ib|²

obviamente:

|a + ib|² ≥ |ib|²

Por lo tanto, se concluye que:


lo cual nos resulta a la vez en lo siguiente:


Usando el resultado que habíamos obtenido anteriormente que refuerza aún más a la desigualdad:


 obtenemos finalmente el resultado que estábamos buscando:


Siendo las esperanzas matemáticas de las medias cuadráticas cantidades que están definidas estadísticamente mediante las relaciones que ya han sido definidas previamente en otras entradas anteriores, podemos hacer:

lo cual nos permite escribir el siguiente resultado matricial:


Esta substitución que acabamos de llevar a cabo se mantiene válida para cualquier estado. Esto lo podemos apreciar mejor llevando a cabo las siguientes operaciones:




Volviendo a la relación:


la cual dicho sea de paso es una relación puramente matemática que no involucra parámetro físico alguno, si hacemos en ella a la matriz A igual a la matriz posición Q, y del mismo modo hacemos a la matriz B igual a la matriz momentum P, tendremos entonces lo siguiente:


Pero en el lado derecho podemos introducir la relación de Born:


llegando así al siguiente resultado:


De este modo, la derivación matricial del principio de incertidumbre que hemos estado llevando a cabo toma la siguiente forma:


Pero en el lado derecho de la desigualdad, puesto que la esperanza matemática de la matriz identidad I es igual al número 1 sin importar el tamaño de la matriz (¡así sea una matriz infinitamente grande!), tenemos entonces que:


lo cual nos permite escribir lo siguiente:


Tomando raíces cuadradas en ambos lados de la desigualdad es así como llegamos a la forma en la cual el principio de incertidumbre es mejor conocido en la actualidad. Aunque la derivación del principio de incertidumbre tal y como fue descubierto por Heisenberg es en esencia un resultado que involucra matrices en su obtención, en su forma final ya no involucra matriz alguna sino cantidades reales a las cuales se les pueden asignar números, cantidades que podemos medir en el laboratorio con algún aparato adecuado. Es costumbre aceptada en nuestros días denotar a la incertidumbre en la posición como Δx y a la incertidumbre en el momentum como Δp, haciendo en efecto las siguientes asignaciones:


Y es así como llegamos a la famosa relación con la cual es conocido el principio de incertidumbre en nuestros días, sin dar pista alguna sobre su origen matricial:


Supóngase que la matriz A representa una cantidad real a través de cualquiera de sus eigenvalores. Entonces:


será una cantidad real (al tomarse la esperanza matemática) y será también una cantidad positiva. Y en virtud de la relación:


esto implica necesariamente que:


Si <A²> tiene un valor definido igual a cero, entonces esta última relación implicaría que <A>² tendría un valor negativo. Pero el cuadrado de la esperanza matemática de cualquier cantidad no puede ser negativo, tiene que ser necesariamente positivo. Entonces se concluye que si <A²> es igual a cero entonces <A> también tiene que ser igual a cero, y siendo así entonces la cantidad:


también tiene que tener un valor igual a cero, lo cual significa que la cantidad representada por la matriz A tiene que tener un valor definitivo de cero, sin incertidumbre alguna.

Por otro lado, supóngase que las matrices A, B y C representan cantidades reales. Supóngase además que, como ocurre en la “extraña ecuación” de Born:

AB - BA = iC

Entonces las desigualdades del principio de incertidumbre implican que <C> será igual a cero para cualquier estado en donde la cantidad representada ya sea por la matriz A o por la matriz B tenga un valor bien definido (un número) sin incertidumbre alguna. Esto lo podemos apreciar mejor viendo que:


y puesto que <C>* = <C> en virtud de que <C> es un número real (y no un número complejo) lo anterior se nos reduce a (1/4)<C>². Entonces, usando la relación matricial obtenida previamente, lo que teníamos para este caso:


se nos reduce (en el lado derecho de la desigualdad) a:


De este modo, si la cantidad real representada por la matriz A tiene un valor bien definido (un número), la incertidumbre en dicha cantidad será igual a cero, con lo cual tenemos entonces:


y ésto último sólo puede ser cierto teniendo <C> un valor igual a cero. Se ha demostrado entonces que si las matrices A, B y C representan cantidades reales que están relacionadas de la siguiente manera:

AB - BA = iC

entonces las desigualdades del principio de incertidumbre implican que <C> tendrá un valor igual a cero para cualquier estado en el que la cantidad representada por la matriz A o la matriz B tenga un valor bien definido.

PROBLEMA: (1) Suponiendo que la componente en la coordenada-x de la velocidad con que se desplaza una masa de 0.5 gramos se puede medir con una exactitud de ±10-4 metros/seg, determínese el límite de exactitud con la cual se pueda localizar la partícula a lo largo del eje-x. (2) Repítase el cálculo cuando el cuerpo en movimiento es un electrón.

(1) Si la componente en la coordenada-x de la velocidad se puede medir con una exactitud de ±10-4 metros/seg, entonces la incertidumbre Δvx está situada entre +10-4 metros/seg y -10-4 metros/seg, dándonos un rango igual a:

Δvx = +10-4 metros/seg - (-10-4 metros/seg) = 2×10-4 metros/seg

Del principio de incertidumbre tenemos lo siguiente:


Metiendo números manteniéndonos dentro del sistema de unidades MKS-SI:

Δx ≥ (6.63×10-34 joule·seg)/(4π · 5×10-4 Kg · 2×10-4 metro/seg)

Δx ≥ 5.28×10-28 metro

La incertidumbre mínima en la posición es de 5.28×10-28 metro, un valor que es claramente imposible de medir por ser inferior en varios órdenes de magnitud inclusive a la dimensión de un átomo.

(2) Usaremos la misma fórmula obtenida en la primera parte de este problema, excepto que utilizaremos como masa a la masa del electrón que es igual en el sistema MKS-SI a 9.11×10-31 Kg.

Δx ≥ (6.63×10-34 joule·seg)/(4π · 9.11×10-31 Kg · 2×10-4 metro/seg)

Δx ≥ 0.29 metro

PROBLEMA: Calcúlese la incertidumbre en la medición de la posición de un fotón con una longitud de onda de 2500 Angstroms si dicha longitud de onda se conoce con una precisión de una parte en un millón.

Para un fotón, su momentum está relacionado con su longitud de onda mediante la relación λ = h/p, de la cual tenemos:

p = h/λ

p = hc/λc = (12.40×103 eV·Å)/(2.5×103 Å) c = 4.96 eV/c

Tomando diferenciales:


Tomando el valor absoluto y metiendo números:

Δp = p (Δλ/λ) = (4.96 eV/c)(10-6 ) = 4.96×10-6 eV/c

Entonces la incertidumbre Δx en la posición será:

ΔxΔp ≥ ħ/2

Δx ≥ ħ/2Δp = h/(4πΔp) = hc/(4πcΔp)

Δx ≥ (12.40×103 eV·Å)/[4πc(4.96×10-6 eV/c)]

Δx ≥ 198.9×106 Angstroms

Esta es la incertidumbre teóricamente mínima posible para nuestro conocimiento sobre la posición, a la cual habrá que agregarle las incertidumbres introducidas por los aparatos de laboratorio utilizados en la medición de este parámetro físico. Esta incertidumbre en la medición de la posición del fotón dependiente de la longitud de onda del fotón fue lo que condujo a Heisenberg a idealizar su famoso “microscopio de Heisenberg”, aunque aplicado para el caso de la determinación de la posición de un electrón haciendo rebotar del mismo el fotón de luz utilizado para ubicarlo.

PROBLEMA: Suponiendo que en cierto experimento se puede medir el momentum de una partícula con una exactitud de una parte en cada mil, encuéntrese la mínima incertidumbre en la posición de la partícula si se trata de un electrón que se está moviendo a una velocidad de 2×108 metros/seg.

Si el momentum de la partícula puede medirse con una exactitud de una parte en cada mil, entonces debemos tener lo siguiente:

Δp/p = 10-3

Δp = 10-3p

Δp = 10-3(mv)

Ahora bien, considerando que la velocidad a la cual se está desplazando el electrón es una velocidad cercana a la velocidad de luz que es de 3×108 metros/seg, para la masa del electrón tenemos que usar su masa relativista, la cual de acuerdo con la Teoría de la Relatividad está dada por la relación:


siendo m0 la masa en reposo de la partícula. Para una masa del electrón igual a:

m0 = 9.11×10-31 Kg

en el sistema de unidades MKS-SI, su masa relativista cuando se está desplazando a una velocidad de 2×108 metros/seg será:

m = m0 / √1 - v²/c² = (9.11×10-31 Kg)/(0.745)

m = 12.23×10-31 Kg

Con estos datos, la incertidumbre mínima en la posición será entonces:

Δx ≥ h/(4πΔp)

Δx ≥ h/(4π · 10-3 mv )

Δx ≥ (6.63×10-34 joule·seg)/(4π · 10-3· 12.23×10-31 Kg · 2×108 metro/seg)

Δx ≥ 2.16×10-10 metro

Δx ≥ 2.16Å

La mínima incertidumbre será de 2.16 Angstroms, una distancia que ya está a la par con las dimensiones atómicas. En experimentos de alta energía como los que se llevan a cabo en los colisionadores atómicos usados en las investigaciones propias de la física de las partículas sub-atómicas, la elevada velocidad a la cual son aceleradas las partículas (muy cercana a la velocidad de la luz) hace que los investigadores tengan en mente de vez en cuando los límites teóricos que impone el principio de incertidumbre en los fenómenos propios del mundo sub-microscópico.