Universidad Andrés Bello Departamento de Ciencias Físicas Apuntes de Mecánica Clásica Andrés Gomberoff Selowsky Primer semestre 2015 Índice general 1. La estructura de la Mecánica 1.1. Las leyes de Newton . . . . . . . . . . . . . . . 1.2. Las ecuaciones de movimiento . . . . . . . . . 1.3. Coordenadas generalizadas . . . . . . . . . . . 1.4. Integración de las ecuaciones de movimiento . . . . . . . . . . . . 2. Mecánica Lagrangiana 2.1. Trayectorias de luz . . . . . . . . . . . . . . . . . . . 2.2. Cálculo de variaciones . . . . . . . . . . . . . . . . . 2.3. Espejismos . . . . . . . . . . . . . . . . . . . . . . . . 2.4. El lagrangiano . . . . . . . . . . . . . . . . . . . . . . 2.5. Lagrangiano para sistemas de muchas partículas 2.6. Lagrangiano y coordenadas generalizadas . . . . 2.7. Lagrangiano y vínculos . . . . . . . . . . . . . . . . 2.8. Momentum y energía . . . . . . . . . . . . . . . . . . 2.9. Principio de Maupertuis . . . . . . . . . . . . . . . . 3. Transformaciones de coordenadas y teoría grupos 3.1. Revisitando el Álgebra lineal y los tensores . 3.1.1. Espacio Vectorial . . . . . . . . . . . . . 3.1.2. Espacios duales . . . . . . . . . . . . . . 3.1.3. Cambios de base . . . . . . . . . . . . . 3.1.4. Tensores . . . . . . . . . . . . . . . . . . . 3.2. Métricas . . . . . . . . . . . . . . . . . . . . . . . 3.3. Espacios Euclídeos . . . . . . . . . . . . . . . . . 3.4. Grupo ortogonal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 6 10 11 . . . . . . . . . 13 13 15 18 20 23 24 25 26 29 . . . . . . . . 32 32 32 33 33 35 37 38 41 4. Pequeñas oscilaciones 45 4.1. Espacio tangente . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.2. Lagrangianos cuadráticos . . . . . . . . . . . . . . . . . . . . . . . 45 1 5. El grupo de rotaciones y el sólido rígido 5.1. Rotaciones infinitesimales de SO(2) 5.2. Rotaciones en 3D: El grupo SO(3) . 5.2.1. Fórmula de Rodrigues . . . . 5.2.2. Ángulos de Euler . . . . . . . 5.3. Sistemas de coordenadas rotantes . 5.4. El sólido rígido . . . . . . . . . . . . . 5.5. Propiedades del tensor de inercia . . 5.6. Ecuaciones de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 50 52 55 56 57 59 63 64 6. El teorema de Noether y las simetrías del espaciotiempo 67 6.1. El teorema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 6.2. El grupo de Galileo . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 7. La relatividad especial y el grupo de Lorentz 7.1. La transformación de Lorenz . . . . . . . . 7.1.1. La dilatación del tiempo . . . . . . 7.1.2. La contracción de Lorentz . . . . . 7.1.3. Relatividad de la simultaneidad . 7.2. El grupo de Lorentz . . . . . . . . . . . . . 7.3. La partícula libre relativista . . . . . . . . 8. Mecánica Hamiltoniana 8.1. Variables auxiliares . . . . . . . . . . . 8.2. Transformación de Legendre . . . . . 8.3. Termodinámica y Mecánica . . . . . . 8.4. Bordes y la incerteza de Heisenberg 8.5. Transformaciones canónicas . . . . . 8.6. Ejemplo: el oscilador armónico . . . . 8.7. Paréntesis de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . clásica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9. Estructura Simpléctica 9.1. El grupo simpléctico . . . . . . . . . . . . . . . . . 9.2. Integración de una transformación infinitesimal 9.3. Teorema de Liouville . . . . . . . . . . . . . . . . . 9.4. Generadores infinitesimales y sus álgebras . . . 9.5. Simetrías y cantidades conservadas . . . . . . . 9.6. La teoría de Hamilton-Jacobi . . . . . . . . . . . . 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 75 78 78 79 79 81 . . . . . . . 83 83 84 87 88 90 93 94 . . . . . . 96 97 101 102 103 106 107 Capítulo 1 La estructura de la Mecánica 1.1. Las leyes de Newton Las ecuaciones de Newton son quizás la cima de la historia intelectual de nuestra especie. Un conjunto de ideas que desde su creación han cambiado el curso de nuestra civilización e inspirado casi todo el trabajo científico posterior. Se trata de un cuerpo de ideas que definen lo que hoy llamamos "mecánica clásica", y que de una u otra manera dominaron la física hasta el advenimiento de la mecánica cuántica durante la tercera década del siglo XX. Este curso asume que el estudiante tiene familiaridad con las leyes de Newton y con su aplicación en contextos diversos. También asume dominio del cálculo diferencial e integral en varias variables y del álgebra lineal. El objetivo es reformular la mecánica clásica desde una perspectiva más general y sintética, lo que nos permitirá, por una parte, el uso de poderosas técnicas matemáticas y por otro, nos dejará listos para el estudio de sus contrapartes cuánticas. Comenzaremos recordando la formulación Newtoniana de la mecánica. Esta se basa en las tres leyes de Newton: 1. Primera ley o ley de inercia. Si un cuerpo está tan alejado de otros cuerpos que la influencia de estos es despreciable, entonces su velocidad es constante, esto es, x~¨(t) = 0. (1.1) Lo que esta ley nos dice es que existen sistemas de referencia muy especiales, que llamamos sistemas inerciales. Las leyes de la mecánica en su formulación original, son válidas solo en éstos sistemas de referencia. Si hacemos nuestras observaciones desde un laboratorio 3 que acelera respecto del sistema inercial, es evidente que la primera ley no será respetada. Tampoco lo será si medimos el tiempo con un reloj cuyas manijas no avanzan a ritmo constante, o si nuestras reglas cambiaran de tamaño al cambiarlas de posición espacial (todo esto en relación al sistema inercial). De hecho, la ecuación (1.1) solo es válida para coordenadas espaciales cartesianas. En coordenadas esféricas, por ejemplo, tendrá una forma bien distinta. Para ser más precisos digamos que en coordenadas oblicuas, es decir, aquellas en que los ejes de coordenadas no se intersectan ortogonalmente, la primera ley también se satisface. Sin embargo, es fácil pasar de éstas a coordenadas cartesianas, cuyas propiedades las hacen más útiles. 2. Segunda ley. Quizás la expresión matemáticas más popular de la física, mx~¨(t) = F~ (~ x , x~˙, t). (1.2) La segunda ley de Newton nos dice cómo se moverá un cuerpo, al observarlo desde un sistema inercial, en presencia de otros que puedan influir en su movimiento. Esta influencia es representa por medio de una fuerza F~ , que puede depender de la posición, del tiempo, y de la velocidad del cuerpo. La masa m es una propiedad intrínseca de éste, y representa la resistencia que impone a ser acelerado. Tal como está escrita en (1.2), esta expresión asume que m es constante. Podemos generalizar esta expresión para el caso en que m varía en el tiempo definiendo el momentum ~ = mx~˙, p de modo que (1.2) se reescribe, ~˙ (t) = F~ (~ p x , x~˙, t), (1.3) que es la forma más general de la segunda ley de Newton. 3. Tercera Ley. Acción y reacción. Esta ley nos dice que cuando un cuerpo ejerce una fuerza sobre otro, no quedará inmune. El mismo experimentará una fuerza de igual magnitud pero en dirección opuesta. Matemáticamente, si tenemos un conjunto de N partículas que interactúan entre sí, y si la fuerza que ejerce la i-ésima sobre la j-ésima es F~ij , entonces, F~ij = −F~ji . (1.4) Definiendo el momentum de la i-ésima partícula, ~ i = mi x~˙i , p 4 (1.5) la tercera ley nos dice que el momentum total, ~= P N X ~i p (1.6) i=1 es una cantidad conservada. En efecto, N N X X ~˙ = ~˙ i = P p F~i . i=1 (1.7) i=1 Pero la fuerza F~i que experimenta la i-ésima partícula es la suma de las fuerzas que ejercen sobre ella todas las demás, F~i = N X F~ji . (1.8) j=1 en que la suma contiene los términos Fii = 0. Así, N X N X X ~˙ = F~ji + F~ij = 0. P F~ji = (1.9) i>j i=1 j=1 Note que la ley de acción y reacción tiene dos requerimientos básicos. Primero, la ausencia de fuerzas externas. Es decir, significa que el sistema es cerrado, que las fuerzas que actúan sobre cada partícula son ejercidas por otras dentro del mismo. En ocasiones es útil invocar fuerzas externas, como cuando estudiamos el movimiento de partículas en el campo gravitacional terrestre, sin considerar a la tierra como parte del sistema. En este caso, por supuesto, el momentum de las partículas no se conserva. Segundo, requerimos que el concepto de "simultaneidad"sea universal, ya que las dos fuerzas involucradas actúan simultáneamente. Más adelante, cuando estudiemos las relatividad especial, veremos como esto deja de tener sentido. La nueva formulación de la mecánica que estudiaremos en lo que sigue nos permitirá generalizar la tercera ley y así permitir la definición de un momentum conservado en sistemas cerrados. 5 Ejercicio 1.1 Escriba la primera ley de Newton en dos dimensiones espaciales en coordenadas polares, y note que, efectivamente no tiene la forma (1.1). Muestre que incluso en coordenadas cartesianas, si usamos un reloj cuyo tiempo t 0 difiere del original t de acuerdo a una función no lineal, t = f (t 0 ), entonces la forma (1.1) para la ley de inercia no se satisface. Finalmente corrobore que la primera ley se satisface en coordenadas oblicuas. 1.2. Las ecuaciones de movimiento Suponga ahora que pasamos a un sistema de coordenadas no inercial1 Uno de los objetivos de este curso es, precisamente, tener una visión más general de la mecánica, independiente de sistemas de coordenadas o del estado de movimiento del laboratorio. Supongamos entonces que tenemos un número N de partículas que se mueven en el espacio tridimensional bajo la acción de ciertas fuerzas. En un sistema inercial, las ecuaciones tendrán la forma, ¨ a (t) = f a (q, q ˙ , t). q (1.10) Aquí los ínidices a = 1 . . . 3N, etiquetan a las coordenadas qa de las partículas, qa = (x1 , y1 , z1 , x2 , y2 , z2 , . . . , xN , yN , zN ) mientras que f a (x, x˙, t) son las fuerzas sobre cada una de ellas, divididas por las masas respectivas. Cuando omitimos el índice a en expresiones como ésta nos referimos al conjunto completo de coordenadas. Una transformación general de coordenadas, puede no solo mezclar las coordenadas de cada partícula, como ocurre la pasar de coordenadas cartesianas a polares, sino que también mezclar las coordenadas de partículas distintas, tal como ocurre 1 En este curso hablaremos de sistemas inerciales como aquellos definidos arriba, que incluyen un set de coordenadas cartesianas, y un reloj üniversal". El pasar a un sistema en que cambiamos las coordenadas que describen el espacio a unas no cartesianas, nos sacará del sistema inercial. Esta definición, inspirada en la mecánica relativista que veremos más adelante, puede no ser la usual en los primeros textos sobre mecánica de Newton, para los que salir del sistema inercial implica un movimiento no uniforme respecto del éste. 6 al pasar a modos normales cuando trabajamos con vibraciones (ver ejercicio). En cualquier caso, la transformación será de la forma, qa = qa (Q, t), (1.11) en que Q a son las nuevas coordenadas. La relación entre los dos sistemas debe ser invertible, esto es, debemos poder despejar Q a en (1.11) y escribir la relación inversa Q a = Q a (q, t). Esto implica que det ∂Q a 6= 0. ∂qb (1.12) Supongamos por simplicidad que la relación (1.11) no depende explícitamente del tiempo, de modo que qa = qa (Q). Entonces, ˙a = q 3N X ∂qa ˙ b Q . ∂Q b (1.13) b=1 Note que el índice b sobre el que está hecha la suma aparece repetido. Esto es típico en cálculos "tensoriales", de los que hablaremos más adelante en más detalle. Por ahora solo aprovecharemos esto para utilizar la llamada P "notación de Einstein", en la que eliminaremos el símbolo en las sumas. A menos que digamos explícitamente lo contrario, las expresiones con índices repetidos se asumirá se trata de sumas sobre estos. Así, ¨a = q ∂2 qa ˙ c ˙ b ∂qa ¨ b ˙ t), Q Q + Q = f a (Q, Q, c b b ∂Q ∂Q ∂Q (1.14) en donde hemos hecho uso de la invertibilidad de la transformación para ˙ t) = f a (q(Q), q ˙ (Q), t). Ahora, escribir la función f en términos de Q, f a (Q, Q, dado (3.28), podemos definir la matriz inversa, de modo que ∂qa ∂Q c = δba c b ∂Q ∂q (1.15) ¨ a de la ecuación (1.14), obteniendo De este modo, podemos despejar Q a 2 b ∂Q ∂ q a b c d ¨ = ˙ t) − ˙ Q ˙ Q f (Q, Q, Q . (1.16) ∂qb ∂Q c ∂Q d Las ecuaciones de movimiento en estas coordenadas tienen exactamente la misma forma que la ecuación (1.10), ¨ a (t) = ga (Q, Q, ˙ t), Q 7 (1.17) ˙ t) es igual al lado derecho de la ecuación (1.16). en que la función ga (Q, Q, Vemos entonces que en general, un sistema de N partículas en 3 dimensiones espaciales, no importa en que sistema de coordenadas lo estudiemos, dará lugar a 3N ecuaciones de la forma (1.17). Observamos de inmediato de estas expresiones, que si f = 0, g no necesariamente se anula. Esto solo ocurre cuando q es una función lineal de Q. Estas funciones lineales son precisamente las relaciones entre coordenadas cartesianas (en general oblicuas). Ejercicio 1.2 Muestre que la ecuación (1.15) es válida. Encuentre explícitamente las matrices para la transformación entre coordenadas cartesianas y polares en tres dimensiones. Calcule las ecuaciones para la partícula libre en coordenadas polares. Ejercicio 1.3 Considere una transformación general en que la relación entre los dos conjuntos de coordenadas depende explícitamente del tiempo, qa = qa (Q, t). Encuentre cómo se generaliza la expresión (1.16) y verifique que también es de la forma (1.17). Veamos ahora un ejemplo en el cual las coordenadas de dos partículas se combinan en nuevas coordenadas. Considere dos masas, m1 , m2 conectadas por un resorte de constante k en una dimensión espacial, como se ilustra en la figura 1.1. Las ecuaciones de Newton en un sistema inercial son, k (x2 − x1 ), m1 k = − (x2 − x1 ), m2 x¨1 = (1.18) x¨2 (1.19) en que x1 , x2 es el desplazamiento de la masa m1 y m2 respectivamente respecto de la posición inicial de equilibrio. Definamos nuevas coordenadas, q1 = m1 x1 + m2 x2 , q2 = (x2 − x1 ). 8 (1.20) (1.21) Figura 1.1: En éstas, las ecuaciones de movimiento toman la forma, ¨ 1 = 0, q ¨ 2 = −k q (1.22) 1 1 + m1 m2 q2 . (1.23) Estas últimas son mucho más sencillas, ya que se trata de dos ecuaciones desacopladas. La primera nos dice que la coordenada q1 se mueve con velocidad constante, cosa que era de esperar pues esta coordenada no es otra cosa que el centro de masas. La segunda describe la oscilación del resorte en el centro de masas. Intencionalmente no nos hemos preocupado de que las coordenadas tengan unidades de distancia. No es importante para nuestros propósitos. De hecho, ya en ejemplos anteriores en los que usamos coordenadas polares renunciamos al requerimiento de que las coordenadas espaciales tengan unidades de distancia: los ángulos no tienen unidades. El punto esencial es que encontramos un sistema de ecuaciones sencillas. Las unidades o el concepto de masa para cada coordenada, si bien en este caso podríamos establecerlos2 no son lo central. Lo importante es que tenemos un sistema descrito con coordenadas q convenientes, que podemos resolver, y que es de la forma (1.17). 2 Claro, la coordenada q1 m1 + m2 es el centro de masas, cuya posición se conserva por conservación de momentum. La masa asociada al centro de masas es la masa total m1 + m2 . La coordenada q2 , por otra parte, tiene asociada una “masa reducida", M, tal que, 1 1 1 = + . M m1 m2 Si bien en ese caso sencillo hay formas de interpretar físicamente las coordenadas, en casos más generales esto dejar de ser cierto. 9 1.3. Coordenadas generalizadas Cualquier conjunto de coordenadas qa que describan completamente el sistema, de modo que sus ecuaciones dinámicas tengan la forma (1.17) se denominan coordenadas generalizadas. El espacio etiquetado por éstas se denomina espacio de configuración. Si se trata, digamos, de N partículas que se pueden mover libremente en D dimensiones, el espacio de configuración tendrá ND dimensiones. En muchos casos, las partículas estarán restringidas por vínculos. Por ejemplo, en el caso de un péndulo que se mueve en un plano, la partícula esta restringida a moverse en una trayectoria que mantenga su distancia al origen de largo constante l. En coordenadas cartesianas como las de la figura , esto significa que x e y no se mueven independientemente, sino que deben satisfacer el vínculo x 2 + y2 − l2 = 0. (1.24) Aunque este vínculo es mediado por una fuerza, en este caso la tensión de la Figura 1.2: cuerda, es mucho más sencillo describir el sistema en coordenadas polares, e ignorar la coordenada r, que dado el vínculo (1.24) está obligada a ser siempre r = l. El sistema por lo tanto, a pesar de contener una partícula en dos dimensiones espaciales, puede describirse con solo una coordenada generalizada, el ángulo φ respecto del eje negativo de la coordenada y (y que medimos, digamos, en sentido opuesto a las manecillas del reloj). De este modo, la ecuación dinámica es, ¨ = − g sin φ, φ l 10 que es de la forma de (1.17). En términos generales por lo tanto, un sistema dinámico está compuesto por un conjunto de coordenadas generalizadas qa que lo definen unívocamente en todo instante, y un sistema de ecuaciones diferenciales ordinarias de segundo orden de la forma (1.17). Más adelante estudiaremos un modo sistemático de tratar los vínculos. En términos generales, considere un sistema de N partículas en D dimensiones, en presencia de M vínculos independientes de la forma ΦA (qa , t) = 0, (1.25) en que a = 1 . . . ND son las coordenadas de las partículas y A = 1 . . . M etiqueta los vínculos. Este sistema puede describirse utilizando ND − M coordenadas generalizadas. En el ejemplo anterior N = 1, D = 2 y M = 1. Así, basta con 1 × 2 − 1 = 1 coordenada, en este caso el ángulo φ. Los vínculos de la forma (1.25), que solo dependen de las coordenadas (y no de las velocidades) se llaman holonómicos. 1.4. Integración de las ecuaciones de movimiento Para terminar este capítulo recapitulemos. Desde la perspectiva matemática, un sistema clásico es descrito por un conjunto qa de N coordenadas generalizadas (en adelante solo ‘coordenadas"), que definen el espacio de configuración C. En caso que los −∞ < qa < ∞ estuviesen definidos sobre todo el eje real, C = RN . Esto no es siempre así, como podemos verlo en el caso del péndulo, en el que el espacio de configuración es un círculo (o medio círculo si hay un techo que no permite al péndulo dar una vuelta completa). En cada instante de tiempo, el sistema está en un punto del espacio de configuración. La sucesión de instantes define una trayectoria. Esta es una función de R en C, que a cada t ∈ R le asocia un q ∈ C, como se representa en la figura 2.1. En mecánica, las trayectorias están dadas por un conjunto de N ecuaciones diferenciales ordinarias de segundo orden, las ecuaciones dinámicas, ¨ a (t) = f a (q, q ˙ , t). q (1.26) En general, resolver este conjunto de ecuaciones puede ser tremendamente difícil, y salvo para sistemas muy sencillos, se suelen resolver numéricamente con la ayuda de un computador. Para integrarlas, hará falta de 2N constantes de integración. En sistemas de partículas éstas se suelen definir imponiendo condiciones iniciales, esto es, la posición inicial y la velocidad ˙ (t0 ) en cierto instante t0 . Las ecuaciones dinámicas nos perinicial q(t0 ), q miten de este modo asociar las condiciones iniciales en cierto instante t0 11 Figura 1.3: Una trayectoria en el espacio de configuración C, para el intervalo t ∈ [t1 , t2 ] con las trayectorias posibles del sistema (al menos para cierto intervalo al rededor de t0 ). 12 Capítulo 2 Mecánica Lagrangiana 2.1. Trayectorias de luz La dinámica de un sistema mecánico se describe usualmente a través de ecuaciones de movimiento dinámicas y las correspondientes condiciones iniciales, tal como vimos en el capítulo anterior. Existe, sin embargo, otro modo de describir trayectorias, y es el que usualmente utilizamos al describir rayos de luz, que satisfacen el principio de Fermat. Este dice que la luz siempre escoge, entre todos los caminos posibles entre dos puntos, aquel que minimiza el tiempo que demorará en recorrerlo. Es claro entonces que, en el vacío, la luz se moverá siempre en líneas rectas (por definición, la más corta entre dos puntos). Pero veamos dos ejemplos más. Primero, considere un espejo y dos puntos a la misma distancia d de éste, A y B, como en la figura 2.1. El espejo esta sobre el eje x, y los puntos A y B tienen coordenadas B A d q1 0 x q2 L 1 Figura 2.1: (0, d) y (L, d) respectivamente (la acción ocurre en el plano (x, y), por lo que ignoramos la tercera coordenada). Evidentemente, la línea recta que une a los dos puntos es la más corta, pero no es del todo claro cuál será la 13 trayectoria minimal si exigimos que el rayo rebote en el espejo. Si el rayo rebota en un punto del espejo de coordenada (x, 0) entonces el largo de la trayectoria I será, p √ I(x) = x 2 + d2 + (L − x)2 + d2 . (2.1) Encontrar el punto de rebote que minimiza I implica encontrar x tal que ∂I = 0. ∂x Esto es, (2.2) x (L − x) −√ +p = 0, x 2 + d2 (L − x)2 + d2 o bien, lo que es lo mismo, cos θ1 = cos θ2 Esto significa que el camino más corto es tal que θ1 = θ2 , o x = L/2. Precisamente la ley de reflexión que conocemos. Note que en este caso, a diferencia de lo que ocurre en mecánica, el problema que estamos analizando no tiene una solución única. Tiene dos, razón por la cual si A es nuestro ojo, y B una ampolleta, veremos dos ampolletas, una mirando directamente y la otra en x = L/2 en el espejo. A pesar de que la naturaleza del problema es distinto, la forma en que está planteado resulta físicamente bastante más natural. Fijamos dos puntos en el espacio y nos preguntamos cual es la trayectoria que minimiza el tiempo en que la luz la recorre. Es una forma más intuitiva e independiente de coordenadas, y una, como veremos, muy útil. Por esto intentaremos replicarla para las trayectorias en el espacio de configuración de la mecánica clásica. Con esto en mente, analicemos un caso más general en torno al principio de Fermat. Considere nuevamente dos puntos A, B en el plano, y suponga que éste está lleno de cierto material dieléctrico con índice de refracción n(x, y). La velocidad de la luz en el punto (x, y) será por lo tanto c/n(x, y),en donde c es la velocidad de la luz en el vacío. Considere ahora una trayectoria arbitraria y(x) tal que sus extremos están fijos en A y B, esto es, y(xA ) = y(xB ) = 0. (2.3) En la figura 2.2 mostramos tres de estas posibles curvas. El tiempo T que demora la luz en recorrer la curva es Z p 1 xB dx n(x, y(x)) y0 (x)2 + 1. (2.4) T [y(x)] = c xA 14 y B A Figura 2.2: Vale la pena detenerse un momento en el objeto T [y(x)]. Ésta no es una función del tipo que usualmente nos encontramos. De allí el uso de paréntesis cuadrados. Esta clase de funciones son llamadas funcionales, ya que no depende de un número finito de variables, sino que de una función, y(x) en este caso. Los funcionales son funciones cuyo dominio es un espacio de funciones, en este caso F : H −→ R en donde H es el espacio de funciones continuas y(x) con x ∈ [xA , xB ] y los extremos fijos según (2.3). El espacio H es de dimensión infinita. Un modo intuitivo y útil de verlo es comparando el funcional F [y(x)] con una función de varias variables f (x a ). En este caso, la función de pende de un conjunto de coordenadas x a , en que a = 1 . . . N es un índice discreto. EL funcional generaliza este índice, haciéndolo continuo. Podemos pensar en la función y(x) como un conjunto de coordenadas etiquetadas por un índice continuo, x. Para calcular el mínimo de una función varias variable simplemente buscamos puntos en donde sus derivadas parciales respecto de todas las variables se anulan. Cuando tenemos un conjunto continuo de variables, minimizar un funcional como (2.4) es una tarea un poco más compleja. Es lo que estudiaremos en la próxima sección. 2.2. Cálculo de variaciones Cuando tenemos una función de una variable I(x), como en el caso del ejemplo anterior, sabemos que si tiene un mínimo (o un máximo), en ese punto se satisface (2.2). Otra forma de decirlo, es que si estamos en un extremo de 15 I, digamos x0 , entonces cualquier pequeño desplazamiento desde ese punto, dx, implicará variaciones en I nulas a primer órden, ∂I dI = I(x0 + dx) − I(x0 ) = dx + O(dx 2 ). (2.5) ∂x x0 En el límite cuando dx → 0 el primero los términos O(dx 2 ) se pueden despreciar y obtenemos la definición de derivada (2.2). En física es muchas veces útil trabajar con ïnfinitesimalesçomo dx o dI, y será el modo en que introduciremos la derivada funcional más abajo. Existen muchos textos sobre cálculo de variaciones en donde los interesados podrán encontrar derivaciones matemáticamente formales. Veamos ahora una función de varias variables f (x a ). Si variamos infinitesimalmente cada coordenada, x a → x a + dx a , la función variará (siempre a primer órden en las variaciones), df = ∂f dx a . a ∂x (2.6) En un punto extremo, x0 , mínimo o máximo, esta variación se anula, df = 0. Pero esto debe ser cierto para variaciones infinitesimales arbitrarias dx a , por lo tanto ∂f = 0. (2.7) ∂x a x0 Es decir, todas las derivadas parciales en x0 se anulan si este punto es extremo. Estudiemos ahora, de manera análoga, el funcional T [y(x)] definido en (2.4). Supongamos que hacemos una variación infinitesimal δy(x) de la función y(x). La convención universal es utilizar el símbolo δ cuando consideramos variaciones de funciones. Procederemos igual que cuando variamos coordenadas finitas dx a , salvo porque ahora el índice a se transformo en el índice continuo x. Y al igual como dx a = x¯a − x a cuando x¯ se acerca arbitrariamente a x, ¯ (x) − y(x), δy(x) = y (2.8) ¯ (x) se acerca arbitrariamente a y(x). De igual modo, tracuando la función y taremos δy(x) como una cantidad infinitesimal, despreciando sus potencias 16 cuadráticas y mayores. La expresión análoga a (2.6) es una suma sobre un índice continuo, es decir una integral, Z δT δT [y] = dx δy(x). (2.9) δy(x) El objeto δT /δy(x) que aparece en esta expresión, es la generalización a índices continuos de la derivada parcial. Se llama derivada funcional, y por supuesto, deberá anularse en los extremos del funcional T . En el presente caso el funcional T en (2.4) es de la forma, Z xB dx L y(x), y0 (x), x . (2.10) T = xA Obviamente, no todo funcional puede escribirse de esta manera. En primer término, la función L podría depender de derivadas de orden mayor. También podría incluir varias integrales. La forma (2.10) será, sin embargo, suficientemente general para nuestros propósitos. Hagamos una variación infinitesimal de ella, Z xB ∂L 0 ∂L δy + δy . (2.11) δT = dx ∂y0 ∂y xA Note ahora que, usando (2.8) ¯ 0 (x) − y0 (x) = (δy)0 , δy0 = δy(x) = y es decir la derivada d/dx la variación δ conmutan, de modo que, Z xB d d ∂L ∂L ∂L δT = dx δy − δy . δy + dx ∂y0 dx ∂y0 ∂y xA (2.12) Por lo tanto, x Z xB ∂L B d ∂L ∂L δT = δy + dx − δy. + ∂y0 xA dx ∂y0 ∂y xA (2.13) Finalmente, note que el primer término es cero, ya que estamos demandando que las variaciones en los extremos se anulen, δy(xA ) = δy(xB ) = 0, luego, Z xB d ∂L ∂L δT = + dx − δy. (2.14) dx ∂y0 ∂y xA Comparando con (2.9), tenemos que la derivada funcional δT d ∂L ∂L =− + . 0 δy(x) dx ∂y ∂y 17 (2.15) En el caso discreto, las variaciones dx a eran independientes, por lo que la única forma de asegurar (2.6) era que la derivada parcial respecto de cada coordenada x a se anulara. Del mismo modo, en esta caso, las variaciones δy(x) son independientes en cada punto x, por lo que la única forma en que δT se puede anular para variaciones arbitrarias es que la expresión (2.15) se anule. En un extremo, por lo tanto, ∂L ∂L d + =0. (2.16) − 0 dx ∂y ∂y Estas ecuaciones se llaman de Euler-Lagrange. 2.3. Espejismos Calculemos las ecuaciones de Euler-Lagrange para el funcional T (y) en (2.4). ∂L 1 p 02 ∂n = y +1 ∂y c ∂y 0 ∂L n y p . = 0 ∂y c y02 + 1 Las ecuación de la trayectoria de la luz es, por lo tanto, ! p d y0 ∂n 02 np − y +1 = 0. dx ∂y y02 + 1 (2.17) Evidentemente, si n es una constante, la solución es fácil. Simplemente y0 =constante. Esto implica que para índice de refracción homogéneo la luz seguir’a l’ineas rectas. En el caso de la figura 2.2, en la que utilizamos las condiciones (2.3) en los extremos, tendremos simplemente y(x) = 0. Supongamos ahora que n varía solo con la altura y, n = n(y). En ese caso, la ecuación (2.17) se simplifica bastante, y00 = 1 ∂n 1 + y02 . n ∂y (2.18) Note que cuando el índice de refracción aumenta con la altura, entonces el lado derecho de (2.18) es siempre positivo, y la función y(x) es convexa, y00 (x) > 0. 18 Esto explica los espejismos que vemos en el pavimento en calurosos días de verano. El sol calienta el cemento, provocando un gradiente de temperatura en el aire cercano al suelo, mientras más cercano, más caliente. La densidad del aire disminuye con la temperatura, y de este modo, el índice de refracción. De este modo, en una región cercana al suelo, n(y) diminuye aumenta con la altura, por lo que los rayos de luz seguirán curvas convexas en esa región. La figura muestra cómo este hecho nos hace ver los reflejos que vemos en el suelo, y que nos dan la impresión que hubiese agua allí derramada. Figura 2.3: Los rayos de luz se curvan de modo convexo en un sistema cuyo índice de refracción aumenta con la altura y. Por lo tanto, los rayos que llegan a los ojos del personaje de la figura desde el automóvil deben seguir un camino cuya forma es cualitativamente como la mostrada. El hombre, verá, por lo tanto, la imagen del automóvil especularmente reflejada como se muestra. Ejercicio 2.1 Suponga que el índice de refracción viene dado por n = eλy . Calcule las trayectorias de los rays de luz. Dibuje la curva entre ciertos puntos A y B en (−d, l) y (d, l) respectivamente. Ejercicio 2.2 Diseñe un funcional que mida el tiempo de viaje de un haz de luz en tres dimensiones. Suponga que pedimos que estas curvas conecten dos puntos 19 A y B fijos. Encuentre las ecuaciones que se obtienen al extremisar este funcional. 2.4. El lagrangiano El principio de Fermat es un modo particularmente sintético y elegante para enunciar las leyes dinámicas en el caso de la luz. Además, es inherentemente independiente de coordenadas espaciales (aunque sigue requiriendo que tengamos un acuerdo respecto de un tiempo universal Newtoniano). La pregunta es evidente. ¿Es posible formular la dinámica de Newton en términos de un principio análogo? Lo primera distinción que observamos, es que cuando minimizamos la duración de una trayectoria de luz, usualmente fijamos la posición de sus extremos. En mecánica, sin embargo, es más usual fijar parámetros (posición y velocidad en este caso) solo en uno de sus extremos. Esto hace más complejo imaginar la analogía. Sin embargo este obstáculo es fácil de sortear. Un sistema de N ecuaciones diferenciales ordinarias de segundo orden, para N coordenadas en el espacio de configuración, se pueden integrar también si en lugar de fijar posiciones y velocidades en un extremo, fijamos la posición en ambos. Después de todo, lo único que requieren las ecuaciones es de 2N constantes de integración1 . Seamos ahora más precisos. Consideremos una partícula de masa m que se mueve en una dimensión espacial y que describimos con una coordenada x(t). Suponga que se ejerce una fuerza sobre la partícula proveniente de un potencial V (x), de modo que dV . (2.19) dx Supongamos que requerimos que la partícula esté en x1 en t1 , y en x2 en t2 . En este caso, efectivamente, es posible definir un funcional cuya minimización dé origen a al trayectoria, Z t2 I[x(t)] = dtL(x, x˙, t). (2.20) m¨ x=− t1 1 En realidad el fijar coordenadas en ambos extremos podría dar lugar a casos en que la solución no exista, a diferencia del caso estándar, en donde siempre existe una solución, al menos en una vecindad del instante inicial. ¿Puede imaginar algún caso en que la solución no exista al fijar la posición en los extremos? 20 En que 1 2 L(x, x˙, t) = m˙ x − V (x) . (2.21) 2 El funcional I se denomina la acción del sistema, y el integrando L el Lagrangiano. Antes de hacer la variación de la acción para mostrar que, efectivamente, dan origen a las ecuaciones de Newton (2.19), algunas observaciones: El funcional (2.20) tiene la misma forma de (2.10), salvo por cambios en los nombres de las cantidades. Si en uno la variable de integración era x, ahora es t. Si la trayectoria era parametrizada por y(x), la altura en cada posición espacial, ahora es por x(t), la posición en cada tiempo. Matemáticamente es exactamente lo mismo, por lo que al variar la acción, obtendremos las mismas ecuaciones de Euler Lagrange (2.16), con las sustituciones apropiadas: ∂L d ∂L =0. (2.22) + − dt ∂˙ x ∂x El Lagrangiano (2.23) es precisamente la diferencia entre la energía cinética y la energía potencial de la partícula. Es evidente que al sustituir este lagrangiano en las ecuaciones (2.22) obtendremos las ecuaciones de Newton (2.19). La generalización de esto a dimensiones mayores es directo. En 3D, el lagrangiano de una partícula en un potencial es 1 x) . L(~ x , x~˙, t) = mx~˙2 − V (~ 2 (2.23) En efecto, consideremos todas las trayectorias que comienzan en t1 en x~1 y terminan en t2 en x~2 . Z t2 ∂L i ∂L i dt δ x˙ + i δx . δI = (2.24) ∂˙ xi ∂x t1 Así, t Z t2 ∂L i 2 d ∂L ∂L i i δx + dt − δx + i δx . δI = ∂˙ xi dt ∂˙ xi ∂x t1 t1 (2.25) Las variaciones son nulas en los extremos, y por lo tanto, para que esto se anule para variaciones arbitrarias δx i , d ∂L ∂L + i = 0, (2.26) − i dt ∂˙ x ∂x 21 en este caso, ~ . mx~¨ = −∇V (2.27) Hay dos arbitrariedades inmediatas que observamos al construir nuestro principios de acción. La primera es que podemos sumar al lagrangiano una la derivada temporal de una función arbitraria de las coordenadas y el tiempo, h(x, t), d (2.28) L −→ L + h. dt Este termino al ser integrado da origen a términos que solo son funciones de x i (t1 ) y x i (t2 ). Pero estas cantidades se mantienen fijas en la variación de la acción por lo que no contribuyen. La segunda es la multiplicación del lagrangiano por una constante arbitraria. Terminemos esta sección con una pregunta.¿Cómo sabemos que el extremo que calculamos es un mínimo y no es un máximo?. Bueno, en realidad no necesariamente será un mínimo. En ocasiones será un punto de ensilladura. De lo que sí podemos estar seguros, es que no puede ser un máximo, ya que, si la masa es positiva, (2.23) entre dos puntos fijos puede ser tán grande como queramos. Basta buscar una trayectoria que oscile muy rápido, pero con una amplitud pequeña respecto de otra dada. Las oscilaciones harán que la energía cinética sea tan grande como queramos, mientras el término con el potencial no varíe mucho por lo pequeñas de las amplitudes. Ejercicio 2.3 Muestre que la acción tiene unidades de momentum angular. Ejercicio 2.4 Considere una acción cuyo lagrangiano depende de las segundas derivadas de x, L ≡ L(x, x˙, x¨, t). Encuentre las ecuaciones de movimiento provenientes de extremizarla. ¿Qué cantidades debe mantener fijas en los extremos para que el mínimo de la acción exista? ¿de qué orden son las ecuaciones de movimiento que obtuvo? ¿En qué caso serán de segundo orden? Ejercicio 2.5 22 Muestre explícitamente que la transformación (2.28) lleva a un lagrangiano que da origen a las mismas ecuaciones de movimiento. Note que si la función h dependiera también de las primeras derivadas, h ≡ h(x, x˙, t), entonces las ecuaciones de movimiento también serán las mismas. En este caso, sin embargo, la variación impondrá condiciones distintas a las discutidas en el texto en los extremos. Considere ahora el lagrangiano de la partícula libre, y sumándole una derivada total, construya aquel apropiado para fijar las velocidades en los extremos. 2.5. Lagrangiano para sistemas de muchas partículas Considere dos partículas, x~1 , x~2 que se mueven en los potenciales externos V1 y V2 respectivamente. Si ambas están muy lejos una de la otra, entonces es fácil comprobar que el lagrangiano L(~ x1 , x~˙1 , x~2 , x~˙2 ) = L1 (~ x1 , x~˙1 ) + L2 (~ x2 , x~˙2 ) (2.29) con L1 y L2 dados por (2.23), da cuenta de la física del sistema. Tal como discutimos en el capítulo anterior, podemos multiplicar cada uno de los dos lagrangianos en la suma por constantes y las ecuaciones seguirán siendo correctas. Sin embargo, esto deja de ser cierto cuando agregamos un acoplamiento, esto es, cuando aproximamos las partículas de modo que exista una fuerza que ellas mutuamente se ejerzan Lac (~ x1 , x~˙1 , x~2 , x~˙2 ) = L1 (~ x1 , x~˙1 ) + L2 (~ x2 , x~˙2 ) − Vac (~ x1 , x~2 ). (2.30) En este caso es evidente que la multiplicación de uno de los lagrangianos por una constante modificará las ecuaciones. Es por esto que mantendremos siempre la normalización del lagrangiano de una partícula tal como en la ecuación (2.23). Para un sistema de partículas, L = K − U, en que K es la energía cinética total, X1 mi x~˙i K = 2 23 (2.31) y U la energía potencial total. Este último tiene contribuciones de fuerzas externas, y que por lo tanto dependen de las coordenadas de cada partícula, y contribuciones de fuerzas internas, fuerzas que ejercen una sobre las otras. En un sistema cerrado, esto es, en ausencia de fuerzas externas, U= 1X Vij (~ xi − x~j ), 2 i,j (2.32) en que Vij = Vji y Vii = 0. Un ejemplo de esto es la gravedad, en que grav Vij =− mi mj G |~ xi − x~j | Note que en estos casos se satisface la ley de acción y reacción de Newton, ya que ~ i Vij = −∇ ~ j Vij ∇ (2.33) 2.6. Lagrangiano y coordenadas generalizadas Una de las virtudes de la formulación lagrangiana es que el cambio de coordenadas en el lagrangiano es mucho más sencillo que directamente en las ecuaciones. Veamos un ejemplo. Considere un péndulo esférico, esto es, una partícula de masa m que se mueve en una esfera de radio r bajo la influencia de la gravedad. El cuadrado de la velocidad en coordenadas esféricas es ˙ 2, v~˙2 = l2 θ˙ 2 + l2 sin2 θ φ en que l es el largo del péndulo. El potencial, V = −mgl cos θ. Así el lagrangiano es, L= m 2 ˙2 ˙ 2 + mgl cos θ. l θ + l2 sin2 θ φ 2 (2.34) Las ecuaciones de Euler-Lagrange para las coordenadas generalizada θ y φ son, respectivamente, ˙ 2 + mgl sin θ = 0 ml2 θ¨ − ml2 sin θ cos θ φ d ˙ = 0. ml2 (sin2 θ φ) dt 24 (2.35) (2.36) El uso de coordenadas generalizadas nos sugiere romper amarras, y considerar sistemas dinámicos cuyo lagrangiano ˙ a , t), L ≡ L(qa , q a = 1 . . . N, (2.37) dependa de N coordenadas generalizadas que incluso no tengan la forma K − U de los sistemas de partículas de mecánica Newtoniana. Más adelante veremos ejemplos como el de la mecánica relativista, en que en efecto, esto deja de ser cierto. La esencia de la mecánica lagrangiana está en la existencia de un espacio de configuración descrito por coordenadas qa y un funcional de acción definido como la integral en el tiempo, entre t1 y t2 del lagrangiano (2.37), Z I= t2 t1 ˙ a , t). dtL(qa , q (2.38) El extremo de éste, cuando consideramos trayectorias cuyos extremos están fijos, qa (t1 ) = qa1 , qa (t2 ) = qa2 se obtiene exigiendo que sea estacionario, Z t2 ∂L ∂L d + a δqa (t). (2.39) 0 = δI = dt − a dt ∂˙ q ∂q t1 Para variaciones arbitrarias δqa esto implica que la curva satisface las ecuaciones de Euler-Lagrange, d ∂L ∂L − = 0. (2.40) + dt ∂˙ qa ∂qa 2.7. Lagrangiano y vínculos En ocasiones, la eliminación de vínculos para la identificación de coordenadas generalizadas puede no ser tan directa. En esos casos podemos utilizar el método de los multiplicadores de Lagrange para trabajar con vínculos holonómicos como los de la ecuación (1.25). En presencia de vínculos, las variaciones δqa (t) no son arbitrarias, ya que están restringidos por los M vínculos, ΦA (qa , t) = 0. (2.41) Una forma de salir del paso, es extender el espacio de configuración añadiendo M nuevas coordenadas, λA , y definiendo un nuevo lagrangiano, ˙ a , t) + λA ΦA (qa , t). ˙ a , λA , t) = L(qa , q L0 (qa , q (2.42) Este nuevo principio de acción no tiene vínculos, pero debemos variar la acción respecto de las N + M coordenadas. Al variar respecto de los λa no 25 surgen términos de borde, ya quel lagrangiano no depende de λ˙A , y por lo tanto no nos exige fijar estas coordenadas en los extremos. Es directo comprobar que las ecuaciones de Euler-Lagrnage en este caso son precisamente los vínculos (2.41). Al variar con respecto a las coordenadas qa obtenemos, en términos del antiguo lagrangiano L, ∂L ∂L ∂ΦA d + a + λA a = 0. (2.43) − a dt ∂˙ q ∂q ∂q EL término extra que aquí aparece corresponde a la tensión, esto es, la fuerza extra requerida para mantener los vínculos. Veamos el mismo ejemplo de la sección anterior, el péndulo esférico, pero utilizando las tres coordenadas espaciales más un vínculo, Φ(r) = r − l = 0. El lagrnagiano es, m 2 ˙ 2 + mgr cos θ + λ(r − l) ˙r + r 2 θ˙ 2 + r 2 sin2 θ φ L= 2 (2.44) Las ecuaciones correspondientes a las coordenadas θ y φ son idénticas luego de utilizar el vínculo para reemplazar r por l. Ahora, sin embargo, tenemos una ecuación extra, aquella que se obtiene variando respecto de la coordenada r, ˙ 2 + λ, m¨r = mr θ˙ 2 + r sin2 θ φ (2.45) la que, al reemplazar r = l nos permite encontrar λ, ˙ 2. λ = mlθ˙ 2 + l sin2 θ φ Esta ecuación nos muestra que lambda es, efectivamente, la fuerza normal que la esfera debe aplicar sobre la partícula. 2.8. Momentum y energía Definimos el momentum pa asociado a la coordenada qa , como pa = ∂L . ∂˙ qa (2.46) En términos del momentum, las ecuaciones de Euler-Lagrange (2.40) toman la forma, ∂L ˙a = . (2.47) p ∂qa 26 ~ = m~˙x, Es evidente que en el caso del lagrangiano de una partícula (2.23), p como es de esperar. En ese caso, el término de la derecha de la ecuación ~ , por lo que obtenemos las ecuaciones de New(2.47) es precisamente −∇V ton para una fuerza conservativa. La definición en este caso, sin embargo, es para coordenadas generalizadas y para cualquier tipo de lagrangiano. Para el péndulo esférico de (2.44), por ejemplo, ˙ pφ = mr 2 sin2 θ φ. (2.48) Ejercicio 2.6 Verifique que el momentum pφ asociado a la coordenada φ de las coordenadas esféricas es precisamente el componente z del momentum angular de la partícula. El hecho que el lagrangiano del péndulo esférico no depende explícitamente de la coordenada φ, implica, de acuerdo a (2.47) que el componente z del momentum angular de la partícula, pφ se conserva. Esto es una resultado general. Si el lagrangiano no depende explícitamente de una coordenada, el momentum asociado se conserva. Veamos otro ejemplo. Considere un conjunto de N partículas que interactúan entre ellas, sin fuerzas externas involucradas, a través de un potencial de la forma (2.32) en coordenadas cartesianas. Definamos el centro de masas, 1 X ~C M = mi x~i , (2.49) q M i en que M es la masa total, M= X mi . (2.50) i Hagamos un cambio de coordenadas a un nuevo conjunto ~ i = x~i − q ~C M , q (2.51) que define las coordenadas (cartesianas) respecto del origen en el centro de masas. Note que las nuevas coordenadas no son independientes, ya que X X X ~i = ~C M ) = ~ C M = 0. mi q mi (~ xi − q mi x~i − M q (2.52) i i i 27 ~ i no constituyen, por lo tanto, un conjunto de coordenaLas coordenadas q das generalizadas de nuestro espacio de configuración. Para un descripción ~ C M }, suplementado completa, por lo tanto, podemos utilizar el conjunto {~ qi , q con el vínculo X ~ i = 0. mi q (2.53) i El lagrangiano del sistema es, por lo tanto L = X 1 X ˙ 2 1 ˙2 ~C M + q ~˙ C M · ~˙ i + ~i + M q mi q mi q 2 i 2 i X X ~· ~j ) + λ ~ i. − Vij (~ qi − q mi q i>j (2.54) i Al variar respecto de λ obtenemos el vínculo (2.53). AL variar respecto de las coordenadas del centro de masa obtenemos X ~˙ i = 0. ~¨ C M − −M q mi q i El segundo término de esta se anula al usar el vínculo, lo que nos muestra que el centro de masa se mueve a velocidad constante. Otro modo de ver lo ~C M , mismo es notar que nuestro lagrangiano no depende de la coordenada q ~ por lo que el momentum asociado, pC M , debe ser conservado. En este caso, luego de utilizar el vínculo, ~C M = M q ~˙ . p (2.55) ~ i obtenemos, teniendo en cuenta Al variar respecto de una coordenada q (2.53), X ~ = 0. ~ i Vij + mi λ ~¨ i − ∇ (2.56) −mi q j Esta ecuación puede parecer extraña por el tercer término que incluye el multiplicador de Lagrange. Sin embargo, podemos comprobar rápidamente que λ = 0. Basta sumar la ecuación sobre el índice i. La primera suma se anula en virtud de (2.53), la segunda en virtud de la tercera ley de Newton ~ = 0, lo que demuestra nuestra afirmación. (2.33). Nos queda que M λ Otra cantidad muchas veces conservada, y central en los sistemas dinámicos es la energía. En la formulación lagrangiana la energía viene dada por ∂L a ˙) = ˙ − L = pa q ˙ a − L. E(q, q q (2.57) ∂˙ qa 28 Si el lagrangiano no depende explícitamente del tiempo, entonces la energía será una cantidad conservada en las trayectorias clásicas, esto es, en aquellas que satisfacen las ecuaciones de Euler-Lagrange. En efecto, dE d ∂L ∂L ∂L a ∂L a ∂L ˙a + a q ¨ − aq ¨ − . = − a q a dt dt ∂˙ q ∂q ∂˙ q ∂˙ q ∂t Las ecuaciones de Euler-Lagrange implican que el primer término es nulo. El tercero y cuarto se cancelan trivialmente. El último es cero porque dijimos que el lagrangiano no dependía explícitamente del tiempo. Por lo tanto, dE = 0. dt (2.58) Ejercicio 2.7 Muestre que para un sistema de partículas la energía viene dada por E = K + U. 2.9. Principio de Maupertuis Un ingrediente básico, que debemos siempre tener en cuenta cuando extremizamos un funcional, es la condición que imponemos en los extremos. En nuestro caso, las variaciones se hacen con los extremos de las trayectorias fijos, δqa (t1 ) = δqa (t2 ) = 0. En ocasiones, sien embargo, podemos diseñar funcionales apropiados para otras condiciones en los extremos, tal como vimos en el ejercicio . Allí vimos como la acción adecuada para fijar qa en los ˙a extremos difería por un término de borde de aquella apropiada para fijar q en los extremos. Aquí veremos un tercer principio variacional, el principio de Maupertuis que en ocaciones es útil. Es menos general que el principio de mínima acción, ya que solo es aplicable a sistemas que conservan energía, esto es, cuando L no depende explícitamente del tiempo. Históricamente, es el principio de Maupertuis el que realmente se denomina "de mínima acción", y el que vimos antes se llama "principio de Hamilton". Seguiremos usando 29 el término mínima acción para ambos, ya que es una costumbre generalizada. Note hasta ahora, los tiempos inicial y final, t1 y t2 siempre se han mantenido fijos en las variaciones de la acción. El principio de Maupertuis propone un funcional que no fija esos tiempo. En su lugar, solo fija los puntos ˙ ) en todo punto de la trayectoria. final e inicial qa1 y qa2 , y la energía E(q, q Evidentemente, esto significa que la trayectoria que seleccionaremos tendrá ˙ ) constante, cosa que solo es consistente si esta se conserva. energía E(q, q Consideremos un principio de acción proveniente de una lagrangiano a ˙ a ), y hagamos variaciones sin suponer que nada está fijo. Obviamente L(q , q si nada está fijo, difícilmente el funcional tenga un extremo. Más adelante veremos como fijamos la energía y las posiciones tal como lo anunciamos. t2 Z t2 ∂L a (EEL)a δqa , (2.59) δI = Lδt + a δq + ∂˙ q t1 t1 en que (EEL)a es el lado izquierdo de las ecuaciones de Euler-Lagrange (2.40). Debemos ser cuidadosos aquí con el significado de las variaciones. Si ¯ a (t) es la trayectoria que obtenemos al variar infinitesimalmente qa (t), q ¯ a (t) − qa (t). δqa = q Note que la diferencia en la posición de la posición inicial entre ambas curvas no es δq(t1 ), sino que ¯ a (t1 + δt1 ) − qa (t1 ) = q ˙ a (t1 )δt1 + δqa (t1 ), δ ∗ q1 = q y una expresión análoga para la diferencia en la posición final δ ∗ q2 . Reemplazando en (2.59), t Z t2 ∂L ∗ a 2 (EEL)a δqa , (2.60) δI = −Eδt + a δ q + ∂˙ q t1 t1 en donde E es la energía (2.57). Es claro que si mantenemos fija la energía las variaciones de I no podrán tener un mínimo cuando se satisfacen las ecuaciones de movimiento. Podemos sin embargo definir Im = I + E(t2 − t1 ). (2.61) Si variamos Im manteniendo fijo E y δ ∗ qa , entonces la variación del término extra se cancela con el primer término de (2.62), y Z t2 δIm = (EEL)a δqa , (2.62) t1 30 que es cero, cuando se satisfacen las ecuaciones de Euler-Lagrange, tal como queríamos. La variación se ha hecho ahora sobre trayectorias que tienen fija la energía y la posición de sus extremos, pero no los tiempos en que comienzan y terminan. Terminemos esta sección mirando con un poco más de detalle la forma de Im . Ya que el principio esta construido para trayectorias con energía constante, Z t2 Z t2 ˙ a dt Im = I + E(t2 − t1 ) = dt(L + E) = pa q (2.63) t1 t1 En que para la última igualdad se usó la relación (2.57). Esto se puede escribir como una integral de línea espacial, Z q2 Im = pa dqa . (2.64) q1 Esta es la forma final de la acción que queremos minimizar, con qa1 , qa2 y E fijos. 31 Capítulo 3 Transformaciones de coordenadas y teoría grupos 3.1. Revisitando el Álgebra lineal y los tensores Las próximas secciones asumen que el lector ya conoce el álgebra lineal, y es solo una revisión de algunos de sus aspectos fundamentales y una forma de definir la notación que utilizamos en el texto. 3.1.1. Espacio Vectorial Un espacio vectorial V es tal que si v1 , v2 ∈ V y α ∈ R, entonces v1 + αv2 también está en V . Aquí solo consideramos espacios vectoriales sobre los reales, que es lo que necesitaremos. Decimos que un conjunto de vectores ui es linealmente independiente si no existen parámetros reales λi tales que λi ui = 0 , Un espacio vectorial de dimensión finita tiene una base, esto significa, un conjunto ei , i = 1 . . . N de vectores linealmente independientes tales que cualquier otro v ∈ V se escribe, en forma única v = v i ei , (3.1) en que los coeficientes v i son reales. Los llamamos las componentes de v en la base ei . Note 32 3.1.2. Espacios duales Dado un espacio vectorial V definimos el espacio dual V ∗ como el espacio de funciones lineales entre V y los números reales. Esto es, la función w ∈ V ∗ , es tal que w(v) ∈ R para todo v ∈ V . Además, si v1 , v2 ∈ V y α ∈ R, w(v1 + αv2 ) = w(v1 ) + αw(v2 ). El espacio dual V ∗ es un espacio vectorial que tiene la misma dimensión que el espacio vectorial V . Para mostrar esto basta construir la base dual ei asociada a la base ei de V definiendo su acción, ei (ej ) = δji . (3.2) Para ver que es una base tome un elemento cualquiera w en V ∗ y defina wi = w(ei ). Es ahora evidente que podemos escribir w como w = wi ei , lo que muestra que los ei son una base de V ∗ 3.1.3. Cambios de base Si Mji es una matriz invertible, y ei es una base de V entonces e ¯j = M i j ei (3.3) también lo es. Un vector v se puede escribir respecto de cualquiera de estas bases, j v = v i ei = v¯i e ¯i = v¯i M i ej . De aquí vemos que los componentes v i en la base ei , se relacionan con los componentes v¯i en la base ei según, j v¯i M i = v j , o, lo que es lo mismo, v¯i = (M −1 )i j v j , (3.4) Un cambio de base en el espacio vectorial V induce otro en V ∗ . La base dual de e ¯i es e ¯i = (M −1 )i j ej . (3.5) 33 En efecto, e ¯i (¯ ej ) = (M −1 )i k ek (M l j el ) = (M −1 )i k M l j ek (el ) = = (M −1 )i k M l j δlk = (M −1 )i k M kj = δji . De (3.5), obtenemos que las componentes wi de un elemento w = wi ei del espacio V ∗ transforman de acuerdo a j ¯ i = M i wj w (3.6) En la definición de un espacio vectorial hemos usado subíndices para etiquetar la base del espacio vectorial, y supraíndices para la base de su espacio dual. A su vez, los componentes de un vector tienen un supraíndice y los de un elemento del espacio dual subíndices. Así, en las sumas sobre índices repetidos (notación de Einstein) siempre uno de ellos esta “arriba” y otro “abajo". Así, por ejemplo, el número real que obtenemos al aplicar w ∈ V ∗ sobre v ∈ V es w(v) = wi ei (v j ej ) = wi v j ei (ej ) = wi v j ei (ej ) = wi v j δji = wi v i . (3.7) Evidentemente, este número es invariante bajo cambio de base, ya que es independiente de bases. Pero para ejercitarnos con la mecánica de índices lo mostrarmos explícitamente, j j ¯ i v¯i = M i wj (M −1 )i k v k = δk wj v k = wj v j . w En física, muchas veces hablaremos de un vector v i . Esto es estrictamente incorrecto, ya que los v i son las componentes del vector. Es, sin embargo, un abuso de notación que nos ahorrara algo de tinta. Cuando hablemos de vector v i , estamos realmente refiriéndonos al vector v i ei . De igual modo hablaremos de un elemento del espacio dual wi . La posición del índice nos revela si se trata de un elemento de V o de V ∗ . Así por ejemplo, vi es un elemento de V ∗ . Ya que V ∗ es también un espacio vectorial, en ocasiones sus elementos se llaman vectores covariantes. Más aún, llamamos a cualquier subíndice un índice covariante. En ocasiones también, los elementos de V ∗ son llamados 1−formas. A su vez, los vectores en V son llamados vectores contravariantes, y los correspondientes supraíndices, índices contravariantes. La característica principal que distingue a un vector contravariante de uno covariante es el modo en que (sus componentes) transforman ante cambios de base, como queda de manifiesto en las ecuaciones (3.4) y (3.6). Llamamos escalares a las cantidades que son invariantes bajo cambios de base, tales como wi v i . 34 3.1.4. Tensores Observe que el espacio V es el espacio dual de V ∗ . En efecto, es el espacio de funciones lineales entre V ∗ y R. Dado un elemento w de V ∗ y un v de V , v : V ∗ −→ R w 7−→ w(v) Es decir, v(w) = w(v). Es inmediato comprobar que las funciones así definidas son lineales. De este modo, hemos mostrado que V ∗∗ = V . Desde el punto de vista de componentes, la cosa es aún más evidente. El vector covariante wi , como toda función, es un objeto que está la espera de otro. En este caso, el otro debe tener un índice arriba, digamos v i . Juntos formarán el escalar wi v i . Pero esta expresión escalar es simétrica, en el sentido que también podemos interpretar que el vector v i es un objeto a la espera de otro con el índice abajo para formar un escalar. Cuando un vector covariante y otro contravariante producen un escalar sumando sobre sus índices, hablamos de una contracción de índices. Pensemos ahora en un caso un poco más general. Una función bilineal, que tome un vector w de V ∗ y otro v de V y produzca un real, T : V ∗ × V −→ R (w, v) 7−→ T (w, v). Que sea bilineal significa que es lineal en cada entrada, T(λw1 + w2 , v1 ) = λT(w1 , v1 ) + T(w2 , v1 ), T(w1 , λv1 + v2 ) = λT(w1 , v1 ) + T(w1 , v2 ), para v1 , v2 ∈ V , w1 , w2 ∈ V ∗ y λ ∈ R. Por linearidad, basta conocer la acción de T sobre una base de V y V ∗ para conocer su acción para cualquier par (w, v) en V ∗ × V . Definamos, T (ei , ej ) = T ij Entonces para vectores arbitrarios w = wi ei y v = v i ei , tenemos que T (w, v) = T ij wi v j La función bilinear T es un (1, 1)-tensor, ya que sus componentes T ij tienen un índice contravariante y otro covariante. Es un objeto que tiene dos posiciones disponibles para producir un real, una a la espera de las componentes 35 de un vector covariante y la otra de uno contravariante. Note que T tambien puede verse como una función lineal entre V y V , ya que si solo llenamos la segunda entrada, T(·, v~) nos queda una función a la espera de un elemento de V ∗ para formar un real. Es decir, un elemento de V . Dicho en componentes, T ij v j es un vector contravariante. Por esta razón un (1, 1)-tensor es una matriz. El espacio de (1, 1)-tensores es también un espacio vectorial, ya que podemos sumar estas funciones o multiplicarlas por reales. Como todo espacio vectorial debe tener una base. La base {ei } de V induce naturalmente una base para este espacio. Estas son las funciones, ei ⊗ ej , definidas a través de su acción sobre las bases de V ∗ y V , j ei ⊗ ej (ek , el ) = ei (ek ) ej (el ) = δik δl . (3.8) Podemos comprobar rápidamente que T = T ij ei ⊗ ej . El producto ⊗ se llama producto tensorial. Es un producto ordenado, definido por (3.8), y que podemos extender linealmente cualquier par (w, v), w ⊗ v = wi ei ⊗ v j ej = wi v j ei ⊗ ej . (3.9) Si ahora cambiamos de base, j j T = T ij ei ⊗ ej = T ij (M −1 )ki e ¯l = T ij (M −1 )ki M l e ¯k ⊗ M l e ¯k ⊗ e ¯l (3.10) de donde vemos que la ley de transformación para un (1, 1)-tensor es, j T¯ kl = (M −1 )ki M l T ij . (3.11) Esta construcción podemos generalizarla para cualquier (n, m)-tensor, T = T i1 ...in j1 ...jm ei1 ⊗ · · · ⊗ ein ⊗ ej1 ⊗ · · · ⊗ ejm , Sus componentes transformarán, bajo cambio de base j j T¯ k1 ...kn = (M −1 )k1 i · · · (M −1 )kn i M 1 · · · M m T i1 ...in l1 ...lm n 1 l1 ln j1 ...jm (3.12) Ejercicio 3.1 δji La delta de Kronecker, es una matriz, es decir, un (1,1)-tensor. Muestre que es un tensor invariante, es decir, sus componentes son las mismas en cualquier base. 36 3.2. Métricas Una métrica es un (0, 2)-tensor simétrico. O, lo que es lo mismo, una función bilineal y simétrica, g : V × V −→ R (v1 , v2 ) 7−→ g(v1 , v2 ) = g(v1 , v2 ). Además, la métrica debe ser tal que no exista ningún vector v1 para el cual g(v1 , v2 ) = 0 para todo v2 . En otras palabras, los componentes de la métrica, gij = g(ei , ej ) deben tener determinante no nulo. Note que gij = gji . En estos componentes podemos escribir, g = gij ei ⊗ ej . La métrica actuando sobre un par de vectores define el producto escalar, o producto punto entre vectores, ~ = g(v, u) = gij v i uj . v~ · u (3.13) La medida o norma al cuadrado de un vector se define como el producto escalar consigo mismo, |v|2 = gij v i v j . (3.14) De la sección anterior se desprende que bajo el cambio de base (3.3) las nuevos componentes de la métrica son, j ¯ kl = M i k M l gij . g (3.15) Cuando trabajamos con objetos de dos índices, es útil en ocasiones utilizar notación matricial. Esto nos permite operar con los arreglos de N ×N usando el álgebra de matrices. Para esto, utilizamos algunas reglas estándar. Un tensor de dos índices es una matriz, en el que el primer índice denota la fila y el segundo la columna, sin importar si es covariante o contravariante. En esta notación perderemos la información de cómo transforma este objeto, pero eso no importa para estos efectos. La multiplicación de matrices corresponde a la contracción de un índice de fila con otro de columna. La contracción de dos índices de fila implica que en estamos multiplicando una matriz por la traspuesta de la otra. Así por ejemplo, la ecuación (3.15) se puede reescribir como, g ¯ = MT gM. (3.16) 37 Este tipo de expresiones son útiles para operar, pero nos hacen perder el carácter tensorial de la expresión. Otra cosa importante que deducimos fácilmente de esta forma de escribir la ecuación, es cómo transforma la inversa de la métrica. Invirtiendo (3.16) vemos que transforma como un (2,0)-tensor.Es costumbre denotarlo con la misma letra, pero con los índices arriba, esto es, gij , de modo que, gij gjk = δki . (3.17) La métrica y su inversa nos permiten construir objetos covariantes a partir de objetos contravariantes y viceversa. Por ejemplo, si v j es un vector contravariante, v j gjk es un vector contravariante. Al revés, si uj es covariante, uj gji es contravariante. La costumbre es utilizar el mismo símbolo para un tensor cuando uno de sus índices es “subido” o “bajado"por la acción de la métrica o de su inversa. Así por ejemplo, Ti 3.3. j k = gjl Tilk Ti j k = glk Ti jl . (3.18) Espacios Euclídeos Consideremos el espacio en 3D. Como sabemos, en coordenadas cartesianas, la medida de los vectores posición x i se introduce a través del producto punto, j x~1 · x~2 = δij x1i x2 , en donde δij es la métrica Euclídea, que tiene los mismos valores de la delta de Kronecker en estas coordenadas, esto es 0 si i 6= j y 1 si i = j. Note que no es la delta de Kronecker ya que es un (0,2)-tensor, y al hacer una transformación de coordenadas, los componentes de δij , a difernecia de aquella, cambian. Es posible mostrar que si tenemos una métrica positiva definida, esto es, una tal que g(v, v) ≥ 0, (3.19) entonces existe una base en la que toma la forma δij . La restricción (3.19) es bastante utilizada en las definiciones de producto escalar en matemáticas. Llamaremos espacio vectorial Euclídeo a aquel que la satisface, pero no la exigiremos, ya que en relatividad especial, más adelante, veremos, la utilidad de relajarla. Ahora demostraremos esto, y de paso recordaremos como construir el cambio de base requerido. Escribamos primero la ecuación de autovalores de gij , j j gij v(k) = λ(k) δij v(k) . (3.20) 38 Aquí no hay suma sobre el índice repetido k, que además hemos escrito entre paréntesis para recalcar que no es un índice tensorial. Los autovalores λ(k) se obtienen de la ecuación det gij − λδij = 0, (3.21) la cual podemos encontrar usando (3.20). Un teorema clásico de álgebra lineal nos dice que una métrica real simétrica, positiva definida, de N × N tiene N autovalores λ(k) , no necesariamente todos distintos, de modo que los N autovectores asociados vki forman una base ortonormal, esto es j i gij v(k) v(l) = δ(k)(l) (3.22) Reproducimos parte de la demostración en el apéndice por completitud, en la que además generalizamos para el caso en que no todos los autovalores son positivos. Esta ecuación nos muestra cuál es la transformación que buscamos. Considere la matriz de transformación M i k cuyas columnas son precisasamente cada uno de los vectores v ik , i M i k = v(k) , entonces, de (3.22), j M i k M l gij = δkl (3.23) Comparando con (3.15) vemos que la transfrmación definida por esta matriz M i k era exactamente lo que buscábamos. Ejercicio 3.2 Considere el espacio vectorial R3 en la base, 1 0 0 0 1 0 e1 = e2 = e3 = 0 0 1 con la métrica, √ 7 −3 √2 gij = −3 7 − 2 √ √ 2 − 2 10 Encuentre una nueva base en la cual la métrica sea la de Euclides. 39 Ejercicio 3.3 Defina el (3, 0)-tensor de Levi-Civita, ε ijk en un espacio vectorial euclideo tridimensional, i = 1, 2, 3 de acuerdo a, 1 si (i, j, k) = (1, 2, 3) o (2, 3, 1) o (3, 1, 2) −1 si (i, j, k) = (1, 2, 3) o (2, 3, 1) o (3, 1, 2) ε ijk = (3.24) 0 otros casos. Defina el (0, 3)-tensor de Levi-Civita εijk con los mismos valores en sus entradas que su contraparte contravariante. Muestre que, 1. εijk ε ilm = δjl δkm − δkl δjm 2. εijk ε ijm = 2δkm ~ ~ y b, 3. Muestre que para dos vectores arbitrarios en tres dimensiones, a ~ i = εijk aj bk . (~ a × b) Utilice esto para demostrar algunas de las identidades clásicas del producto de vectores, ~ · (~ ~ = v~ · (w ~ ×u ~ ). u v × w) ~ × (~ ~ = (~ ~ v − (~ ~ u v × w) u · w)~ u · v~)w. ~ × z~) = (~ ~ v · z~) − (~ ~ (~ u × v~) × (w u · w)(~ u · z~)(~ v · w) 4. Podemos utilizar esta técnica para encontrar identidades entre operadores diferenciales. Note que, ~ i = ∂i Φ (∇Φ) ~ = ∂i E i ~ ·E ∇ ~ i = ε ijk ∂j Bk , ~ × B) (∇ en donde ∂i es una abreviación para ∂/∂x i . Utilice esto para mostrar algunas identidades: ~ = Φ∇ ~ + ∇Φ ~ ~ · (ΦE) ~ ·E ~ ·E ∇ ~ × B) ~ =B ~ · (∇ ~ −E ~ · (∇ ~ ~ · (E ~ × E) ~ × B) ∇ ~ = Φ∇ ~ + ∇Φ ~ ~ × (ΦE) ~ ×E ~ ×E ∇ ~ =0 ~ · (∇ ~ × E) ∇ ~ × (∇Φ) ~ ∇ =0 ~ −∇ ~ =∇ ~ ~ ∇ ~ · E) ~ × (∇ ~ × E) ~ 2E ∇( 40 3.4. Grupo ortogonal La métrica de Euclides tiene una característica importante. Existe un conjunto de bases del espacio vectorial en el que la métrica tiene la mismas componentes δij . Una transformación entre dos bases con esta propiedad se llama transformación ortogonal, y debe satisfacer, j δkl = M i k M l δij . (3.25) Tal como vimos en la sección anterior, en ocasiones es útil pasar a notación matricial, y escribir esto como, o, lo que es lo mismo, 1 = MT M (3.26) M−1 = MT . (3.27) Las matrices que satisfacen esta relación forman el llamado grupo ortogonal de dimensión N, y se denotan como O(N). El conjunto tiene las propiedades algebraicas de lo que matemáticas se denomina un grupo. Estas son: Una regla de composición o multiplicación asociativa. En este caso, el hacer dos transformaciones sucesivas, M1 ∈ O(N) y luego M2 ∈ O(N) da origen a una tercera transformación, M = M2 M1 que también está en O(N). La asociatividad se hereda de la multiplicación matricial. La existencia del elemento identidad. En este caso δji ∈ O(N). La existencia del inverso. Si M ∈ O(N) entonces M−1 ∈ O(N). De la ecuación (3.25) resulta que det M = ±1. (3.28) Los elementos con determinante positivo forman un subgrupo de O(N) llamado grupo ortogonal simple, que se denota SO(N). Veamos el ejemplo no trivial más simple. Supongamos que N = 2. Entonces, a b M= (3.29) c d La matriz inversa y la traspuesta son, 1 d −b −1 M = ad − bc −c a 41 T M = a c b d . (3.30) Así, (3.27) requiere, a = ±d b = ∓c ad − bc = ±1, con que el signo de arriba para det M = 1 y el de abajo para det M = −1. Estas ecuaciones implican que a2 + b2 = 1, por lo que podemos parametrizar la solución con a = cos φ, b = sin φ y 0 ≤ φ < 2π. Del resto de las ecuaciones obtenemos, cos φ sin φ 1 0 M= = R(φ) (3.31) ∓ sin φ ± cos φ 0 ±1 en que, R(φ) = cos φ sin φ − sin φ cos φ , (3.32) son las matrices de rotación en un ángulo φ, que tienen determinante +1, y corresponden a los elementos de SO(2). El grupo O(2) contiene además a los elementos de (3.31) que toman el signo de abajo, y corresponden a hacer una rotación seguida de un cambio de paridad. Este es realizado por la matriz 1 0 P= , 0 −1 que cambia la dirección del eje y. Es equivalente a realizar una reflección especular de nuestro plano. Ejercicio 3.4 1. Argumente por qué los elementos de O(N) de determinante −1 no forman un grupo. 2. Muestre gráficamente la acción de R(π/4) y de P sobre los vectores 0 1 1 , , . 1 0 2 42 3. Muestre que R(φ1 )R(φ2 ) = R(φ1 + φ2 ). En particular, R(φ)−1 = R(−φ). 4. Observe que el grupo O(N) se definió como un conjunto de transformaciones que dejan un objeto invariante, en este caso la métrica euclídea. Argumente por qué, en general, cualquier conjunto de transformaciones que se defina a través de un objeto que dejan invariante será un grupo. Supongamos ahora un espacio euclídeo de dimensión N con métrica δij , y un segundo (0,2)-tensor simétrico, Tij . Mostraremos que es posible encontrar una base en que los componentes de la métrica siguen siendo δij , pero T¯ij es diagonal. Dicho de otro modo, existe una transformación en O(N) que diagonaliza Tij . Antes de mostrar cómo hacerlo, es importante aclarar un punto que lleva muchas veces a confusión. Es sabido que dos matrices hermíticas no se pueden diagonalizar simultáneamente a menos que conmuten. Aquí de la impresión que pretendemos hacer lo mismo, esto es, diagonalizar dos matrices simétricas, gij y Tij , simultáneamente, sin preocuparnos de si conmutan o no. El error en este argumento es que no estamos diagonalizando matrices, (1,1)-tensores. Estamos diagonalizando (0,2)-tensores. No tiene porqué ser lo mismo. Y no lo es, como veremos a continuación. Considere el problema de valores propios del tensor Tij , j j Tij u(k) = µ(k) δij u(k) . (3.33) Usando el mismo argumento que nos llevó de (3.20) a (3.22), sabemos que deben existir una base ortonormal de N autovectores ui(k) , j δij ui(k) u(l) = δ(k)(l) . (3.34) Multiplicando (3.33) por ui(l) y usando (3.33) obtenemos, j ui(l) Tij u(k) = µ(k) δ(k)(l) . (3.35) Las últimas dos ecuaciones nos dicen que la transformación cuyos componentes son M i j = ui(j) , está en O(N) y lleva al tensor Tij a una forma diagonal, en la que los elementos de la diagonal son los autovalores µ(k) . 43 Ejercicio 3.5 Haga nuevamente el ejercicio 3.2. Ahora encuentre una transformación que lleve la métrica a la de Euclides y el tensor, 2 0 1 Tij = 0 3 0 1 0 1 a su forma diagonal. 44 Capítulo 4 Pequeñas oscilaciones 4.1. Espacio tangente El espacio de configuración de un sistema mecánico está parametrizado por las coordenadas generalizadas qa . Estas coordenadas, en general, no definen un espacio vectorial. Esto debido a que bajo una transformación de coordenadas-el tipo de transformación relevante para nosotros - no transforman como los componentes de un vector, ¯ a = f a (q, t). q (4.1) En cada punto del espacio de configuración se define el “espacio tangente.a q, Tq , que corresponde al conjunto de desplazamientos infinitesimales, dqa . Estos sí transforman como vectores bajo cambio de coordenadas, a d¯ qa = (M −1 ) b dqb , (4.2) en que la matriz de transformación viene dada por a b (M −1 ) = ∂f a . ∂qb (4.3) ˙ a son elementos de Tq . En particular, las velocidades q 4.2. Lagrangianos cuadráticos ˙, Considere ahora un lagrangiano cuadrático en q y q 1 1 ˙ aq ˙ b − Vab qa qb , L = Tab q 2 2 45 (4.4) en que Tab y Vab son constantes. El lagrangiano es un escalar ante cambio ˙ a transforma como vector, entonces Tab debe de coordenadas, por lo que si q ser un (0,2)-tensor. Si nos restringimos a transformaciones de coordenadas lineales, a ¯ a = (M −1 ) b qb , q (4.5) entonces las coordenadas qa también transformarán como vectores y Vab como un (0,2)-tensor. Note que esto no es general, y solo funciona para este conjunto preciso de transformaciones y para lagrangianos cuadráticos. Este lagrangiano es de particular interés en mecánica, ya que describe pequeñas perturbaciones sobre posiciones de equilibrio en sistemas linealmente estables. Expliquemos esto con el caso más sencillo posible: el del oscilador armónico en una dimensión, L= m 2 k 2 ˙ − q. q 2 2 (4.6) Las ecuaciones provenientes de este lagrangiano son, m¨ q = −kq, que tiene una solución estática, o de equilibrio, q(t) = 0. Esta solución es estable si m y k son positivos, ya que al perturbarla, obtenemos oscilaciones en torno a ella, q(t) = Re(Aeiωt ) , ω2 = k , m (4.7) en que A es una constante compleja. Note que si k es negativo, la solución es una exponencial no oscilante, por lo que la nueva solución se alejará rápidamente de la posición de equilibrio, y por lo tanto éste no será estable. En el caso estable, la posición de equilibrio esta en el fondo de un potencial parabólico convexo, en el otro,en la cima de uno cóncavo. Este ejemplo se puede generalizar al lagrangiano (4.4). Para esto, utilizamos las técnicas matemáticas discutidas en las secciones anteriores. Primero asumimos que Tab es positivo definido. De no ser así el sistema mecánico estaría mal definido, ya que no podría tener un mínimo: habrían trayectorias con acciones arbitrariamente negativas. Esto ya que si Tab no es positivo definido, existen vectores v a tales que Tab v a v b < 0. De ser así, podemos construir trayectorias que zigzagueen con velocidades v a y −v a , dando origen a acciones de valor arbitrariamente negativo. 46 Así, podemos pensar en Tab como una métrica y llevarla a la forma diagonal de Euclides. En segundo lugar, diagonalizamos Vab , utilizando transformaciones en SO(N), de modo de no cambiar la forma de la métrica. En las nuevas coordenadas, el lagrangiano (4.4) tiene la forma, 1 1 ˙ aq ˙ b − Ωab qa qb , L = δab q 2 2 en que Ωab = ω12 0 .. . 0 ... 0 0 .. . 0 ωN2 ω22 .. . 0 0 ... (4.8) (4.9) es diagonal. Algunos de los autovalores ωa podrían ser imaginarios. Las ecuaciones provenientes de este lagrangiano son desacopladas, ¨ a = −ωa2 qa q (sin suma sobre a aquí) (4.10) Si ωa es real, entonces la solución es un oscilador armónico igual al de (4.7). Cada una de estas coordenadas oscilatorias reciben el nombre de modos normales, esto, debido q que podemos apagar el movimiento en todas las coordenadas, dejando solo una frecuencia pura encendida. Un modo normal. Si alguno de los ω es imaginario la solución es exponencial. Veamos un clásico ejemplo simple. Considere dos péndulos de igual masa m conectados por un resorte de constante k como en la Fig. 4.2. l l f2 f1 m k m Figura 4.1: Dos péndulos acoplados a través de un resorte. Cuando los dos péndulos están en reposo.el resorte se encuentra en equilibrio. El lagrangiano del sistema es, L= m 2 ˙2 ˙2 k l (φ1 + φ1 ) + lgm cos φ1 + lgm cos φ2 − (D(φ1 , φ2 ) − d)2 , 2 2 47 (4.11) en que, D 2 (φ1 , φ2 ) = (d + l sin φ2 − l sin φ1 )2 + (l cos φ2 − l cos φ2 )2 (4.12) es la distancia entre las dos masas. Si consideramos pequeñas oscilaciones, podemos expandir en serie de Taylor los ángulos, y quedarnos solo con los términos cuadráticos. El lagrangiano, en esta aproximación, toma la forma, L= kl2 lgm 2 m 2 ˙2 ˙2 l (φ1 + φ1 ) − (φ1 + φ22 ) − (φ2 − φ1 )2 . 2 2 2 (4.13) El tensor Tab ya es proporcional a δab , por lo que no haremos nada con él. El tensor Vab sin embargo no lo es, gm + kl −kl Vab = l (4.14) −kl gm + kl Para diagonalizarlo, buscamos primero los valores propios, (gml + kl2 − λ)2 − k 2 l2 = 0, de donde obtenemos los autovalores, λ1 = gml, λ2 = gml + 2kl2 . Los autovectores, normalizados, asociados a estos autovalores se obtienen directamente, ! ! v1 = √1 2 √1 2 , √1 2 − √12 v2 = . La matriz de transformación unitaria que diagonaliza Vab es, por lo tanto, ! M ab = √1 2 √1 2 √1 2 − √12 . Podemos usarla ahora para encontrar los modos normales, 1 q1 = √ (φ1 + φ2 ) = Re(A1 eiω1 t ), 2 1 q2 = √ (φ1 − φ2 ) = Re(A2 eiω2 t ), 2 en que ω12 = g , l ω22 = 48 g 2k + . l m Si hacemos A2 = 0 vemos que el primer modo normal corresponde a ambos péndulos oscilando paralelos, con frecuencia igual al que tendría cada uno sin la existencia del resorte. Si hacemos A2 = 0, los péndulos se mueven en direcciones contrarias, y la frecuencia aumenta en 2k/m, que es precisamente lo que esperamos en el límite en que g = 0. En este ejemplo utilizamos una técnica que se puede generalizar a problemas mucho más complejos: expandimos el lagrangiano en series de Taylor hasta orden cuadrático en torno a una solución estática. En este caso, aquella en que ambos péndulos cuelgan verticales, en reposo. La aproximación de pequeñas oscilaciones es válida siempre que pequeñas perturbaciones en torno a esta se mantengan pequeñas durante la evolución del sistema. Esto será cierto siempre que los autovalores de Vab sean positivos. En este caso las soluciones oscilaran con una amplitud tan pequeña como la perturbación inicial. Si, en cambio, hay algún autovalor negativo, entonces habrá soluciones exponenciales que crecerán haciendo que la hipótesis que permitió la aproximación resulte incorrecta. 49 Capítulo 5 El grupo de rotaciones y el sólido rígido La mecánica clásica Newtoniana tiene un grupo de simetrías que conocemos como el grupo de Galileo, que incluye las rotaciones, las traslaciones y los “boosts", o cambios a otro sistema inercial de referencia. Para entenderlo bien, debemos introducir un poco más de matemáticas. Comenzaremos revisitando el grupo de rotaciones en el plano, SO(2), desde una perspectiva más sistemática. Como primer ejemplo utilizaremos estas herramientas para estudiar sistemas de coordenadas que rotan respecto de uno inercial, y luego el sólido rígido. 5.1. Rotaciones infinitesimales de SO(2) El grupo SO(2) contiene todas aquellas transformaciones del plano, conectadas a la identidad, que dejan invariante la métrica δij . Por conectadas a la identidad queremos decir que podemos ir, continuamente, desde cualquier rotación a la identidad. Esto es evidente en este caso, ya que las rotaciones R(φ) contienen un parámetro, φ, que podemos llevar continuamente a φ = 0, que corresponde a la identidad. Esta es otra forma de reducir el grupo de rotaciones O(N) al su subgrupo SO(N), ya que los elementos del primero que tienen determinante negativo, claramente no pueden llevarse continuamente a la identidad (no existe ninguna acción que suavemente pueda llevar un −1 en un 1 sin pasar por todos los números intermedios). Considere una transformación infinitesimal de SO(2), x i = (δji + εJ i j )¯ xj , (5.1) en que ε << 1 es el parámetro infinitesimal y Jji es una matriz. La condición 50 para que esta transformación esté en SO(2) es, (δ i j + εJ i j )(δ kl + εJ kl )δik = δjl . Despreciando términos cuadráticos en ε esto es igual a J i j δil + J kl δjk = 0. Usando la notación que nos permite “subir” o “bajar” índices usando la métrica, (3.18), esto se puede reescribir como Jlj = −Jjl . (5.2) Esto nos dice que Jij es un (0,2)-tensor antisimétrico. En este caso, por lo tanto, 0 1 Jij = . (5.3) −1 0 Ciertamente cualquier Jij porporcional a ésta hace el trabajo, pero esta elección no es importante ya que la constante de proporcionalidad se podrá reabsorber en el parámetro ε en (5.1). La matriz J i j se llama generador infinitesimal del grupo. En este caso hay uno solo, ya que el grupo tiene un solo parámetro, el ángulo φ. Considere cierto grupo que actúa linealmente sobre el plano, x i = L(φ)i j x¯j y que se describe por un solo parámetro φ, tal como el grupo de rotaciones. Si parametrizamos de modo que la identidad esté en φ = 0, entonces una transformación infinitesimal, es d i i i L(ε) j = δj + ε L , dφ j φ=0 de donde vemos que el generador infinitesimal es d i i Jj= L . dφ j φ=0 A la inversa, podemos encontrar una transformación finita iterando la acción de una infinitesimal. En notación matricial, N φ L(φ) = l´ım 1 + J = eφJ . N→∞ N 51 En el caso del grupo SO(2), la matriz J viene dada por (5.3), para exponenciarla, la técnica usual es la de primero diagonalizarla, escribiéndola en la forma, J = A−1 JD A, (5.4) en que JijD = i 0 0 −i (5.5) es la forma diagonal de J, y contiene en su diagonal los valores propios de esta matriz, i, −i. Ejercicio 5.1 Diagonalize J y muestre que la matriz A que la lleva a la forma diagonal en (5.4) es, ! − √i2 √i2 A= . √1 √1 2 2 Ahora, D eφJ = A−1 eφJ A ! ! i 1 iφ √ √ − √i2 √i2 e 0 2 2 = −iφ √1 √1 √i √1 0 e − 2 2 2 2 ! e−iφ eiφ ie−iφ ieiφ + − cos φ sin φ 2 2 2 2 = = , −iφ iφ e−iφ eiφ − sin φ cos φ − ie2 + ie2 + 2 2 que es precisamente la matriz R(φ), de (3.32), tal como esperábamos. 5.2. Rotaciones en 3D: El grupo SO(3) Repitamos ahora el análisis anterior para el grupo de rotaciones en el espacio tridimensional. Trabajaremos en coordenadas cartesianas con la métrica δij , en que ahora i, j = 1, 2, 3. Los argumentos entre las ecuaciones (5.1) y (5.2) son exactamente los mismos, x i = (δji + εJ i j )¯ xj , 52 (5.6) o, lo que es lo mismo, δx i = x i − x¯i = εJ i j x¯j (5.7) Solo que ahora Jij es un (0,2)-tensor antisimétrico de 3 × 3. La forma más general de una matríz antisimétrca en 3D es, Jij = Jijk θk , (5.8) en donde θa son parámetros reales, y 0 0 0 0 0 −1 0 1 0 Jij1 = 0 0 1 , Jij2 = 0 0 0 , Jij3 = −1 0 0 . 0 −1 0 1 0 0 0 0 0 Es útil en ocasiones escribir esto en forma abreviada como, (J i )jk = ε ijk , (5.9) en que los índices se suben y bajan aquí con la métrica euclidea δij . Cada rotación queda definida por los tres parámetros θi . Imitando el análisis anterior, i R(θa ) = eθi J . Considere una rotación R(θi ) y un vector v cuyos componentes son proporcionales a los componentes de θi , esto es v 1 = θ1 , . . .. Entonces, 0 θ3 −θ2 θ1 θ1 θ2 = 0. Jv = (θa Ja )v = −θ3 0 θ2 −θ1 0 θ3 Esto significa que una transformación infinitesimal definida por (1 + εJ) , deja invariante cualquier vector paralelo a v. Podemos iterar esta transformación infinitesimal para construir una finita, y el vector v seguirá invariante. Así, N λ = eλJ . R(θa , λ) = l´ım 1 + J N→∞ N deja invariante a v para cualquier λ, y en particular para λ = 1, cuando coincide con R(θa ). El recíproco también es cierto, ya que como podemos ver directamente, la matriz J siempre tiene uno y solo un valor propio nulo. Este resultado se conoce como el teorema de Euler: Todo elemento de SO(3) es 53 una rotación en torno a algún eje. Para el eje x, por ejemplo, tomamos la transformación infinitesimal en que solo θ1 6= 0 obtenemos, 1 0 0 R1 (θ1 ) = eθ1 J1 = 0 cos θ1 sin θ1 . (5.10) 0 − sin θ1 cos θ1 Esta es claramente una rotación en torno al eje x, ya que deja invariante al vector e1 = xˆ. Es importante, antes de continuar, definir bien las convenciones. Asumimos que las coordenadas cartesianas (x, y, z), están orientadas de modo que la base ortonormal construida a lo largo de sus direcciones ˆ , zˆ) es “derecha", esto es, xˆ × y ˆ = zˆ. La rotación (5.10) rota nuestro sis(ˆ x, y tema de coordenadas en dirección de las manecillas del reloj en un ángulo θ1 . Si miramos la rotación en su forma “activa", esto es equivalente de decir que rota todo los vectores en contra de las manecillas del reloj en el mismo ángulo. Análogamente, si exponenciamos transformaciones con solo θ2 6= 0 y θ3 6= 0, obtenemos las rotaciones R2 (θ2 ) en torno al eje y, R2 (θ3 ) en torno al eje z, en donde los tres parámetros son ángulos entre 0 y 2π. La dirección en que se mueven los sistemas de coordenadas siempre sigue la ley de la mano derecha para el movimiento de los vectores (o de la mano izquierda para las bases). Evidentemente, cos θ2 0 − sin θ2 , 1 0 R2 (θ2 ) = 0 (5.11) sin θ2 0 cos θ2 cos θ3 sin θ3 0 R3 (θ3 ) = − sin θ3 cos θ3 0 (5.12) 0 0 1 Ejercicio 5.2 Muestre que los generadores infinitesimales de SO(3), J i satisfacen [J i , J j ] = J i J j − J j J i = −ε ijk Jk . Esta es el álgebra so(3). 54 (5.13) 5.2.1. Fórmula de Rodrigues Existen diversas maneras de parametrizar un elemento general del grupo de rotaciones SO(3). Una particularmente útil es la dada por la fórmula de rotaciones de Rodrigues. Para encontrarla, primero notemos que usando (5.9) el cuadrado del generador infinitesimal, (J2 )i j = θk (J k )i m θl (J l )mj = θk θ l ε kim εlmj = θk θ l (δjk δli − δlk δji ) = θ i θj − θ 2 δji , en que δ 2 = θ i θi . El cubo, (J3 )i j = θk (J k )i m (θ m θj − θ 2 δjm ) = −θ 2 (J)i j . Iterando nos damos cuenta que, para potencias impares, J2n+1 = (−θ 2 )n J. Para potencias pares, (J2n )i j = (−θ 2 )n−1 (θ i θj − θ 2 δji ), (5.14) J2n = (−θ 2 )n−1 J2 . (5.15) o bien, De este modo, e ∞ l X J J = l=0 = 1+ ∞ ∞ X X J2n J2n+1 =1+ + l! (2n)! n=0 (2n + 1)! n=1 ∞ X (−θ)2n+1 (ni Ji ) ∞ X ( − θ 2 )n−1 J2 + (2n)! n=1 Ahora escribamos θ i = ni θ, en que ni es un vector unitario, ni ni = 1, y θ = J e = 1+ ∞ X ( − θ)2n (ni Ji )2 √ θ 2 .Así, ∞ X (−θ)2n+1 ni Ji + n=1 (2n)! (2n + 1)! = 1 − (ni Ji )2 (cos θ − 1) − (2n + 1)! n=0 n=0 ni Ji sin θ −n22 − n23 (1 − cos θ) + 1 n1 n2 (1 − cos θ) − n3 sin θ n n (1 − cos θ) + n3 sin θ 1 2 −n21 − n23 (1 − cos θ) + 1 n1 n3 (1 − cos θ) + n2 sin θ n2 n3 (1 − cos θ) − n1 sin θ Esta es la fórmula de Rodrigues. 55 = n1 n3 (1 − cos θ) − n2 sin θ n n (1 − cos θ) + n1 sin θ 2 3 −n21 − n22 (1 − cos θ) + 1 ! (5.16) Lo que nos dice esta expresión, es que una rotación con parámetros θi es equivalente a una rotación en un ángulo θ en torno al eje en la dirección ni . Para ver esto, reescribamos de otra forma la fórmula. Usando (5.15), Jk θk R(θk ) = e i j = δji − (ni nj − δji )(cos θ − 1) − nk ε kij sin θ = δji cos θ + ni nj (1 − cos θ) − nk ε kij sin θ. Si aplicamos una de estas rotaciones sobre cierto vector r, R(θk )r = r cos θ + n(r · n)(1 − cos θ) + (r × n) sin θ. (5.17) Aquí reconocemos la a veces llamada simplemente fórmula de rotación y que pueden encontrar en diversos textos de mecánica. Es interesante notar que θ debe estar en [0, 2π], lo que significa que θ12 + θ12 + θ12 < 2π, Note, sin embargo, que una rotación (θ, n) es la misma que una (−θ, −n). Por lo tanto, para parametrizar SO(3) basta considerar a θ a dentro de una esfera radio π, en la cual identificamos las antípodas, ya que (π, n) representa la misma rotación que (−π, −n). 5.2.2. Ángulos de Euler Otra forma muy utilizada para parametrizar una rotación arbitraria es a través de los llamados ángulos de Euler. Estos consisten en tres rotaciones sucesivas, todas en dirección contraria a las manecillas del reloj. Primero una rotación en torno al eje z en un ángulo φ. Luego una en un ángulo χ en torno al nuevo eje x (la primera rotación llevó al vector e1 en un nuevo e ¯1 ). Finalmente hacemos una rotación en torno al nuevo eje z en un ángulo ψ. La matriz de rotación, que hace esto es RE (φ, θ, ψ) = R3 (ψ)R1 (χ)R3 (φ) = cos φ cos ψ − cos χ sin φ sin ψ cos ψ sin φ + cos φ cos χ sin ψ ψ sin φ − cos φ sin ψ cos φ cos χ cos ψ − sin φ sin ψ = − cos χ cossin φ sin χ − cos φ sin χ sin χ sin ψ cos ψ sin χ cos χ . (5.18) Los 3 ángulos de Euler están en [0, 2π]. Podemos igualar los elementos de (5.16) y (5.18) y encontrar la relación entre los parámetros entre las dos parametrizaciones. Encontraríamos varias soluciones para los ángulos de Euler, ya que estos no representan unívocamente cada rotación. 56 5.3. Sistemas de coordenadas rotantes Asuma que tenemos dos sistemas de referencia, S y s. El primero está provisto de un sistema cartesiano de coordenadas (X , Y , Z ). El segundo rota respecto del primero y tiene fijo un sistema cartesiano (x, y, z), de modo que el origen de ambos sistemas coinciden. Debe existir, por lo tanto, una matriz ~ y x~ de de rotación R(t) en cada instante t, de modo que las coordenadas X un vector en los sistemas S y s respectivamente se relacionan por ~ (t) = R(t)~ X x (t). (5.19) Si consideramos cierto punto fijo, x~0 , en el sistema rotante, entonces ~˙ = R(t)~ ˙ x0 , X O bien, T ~˙ = R(t)R ~. ˙ X (t)X (5.20) T ˙ La matriz R(t)R (t) es antisimétrica, ya que RRT = 1, por lo tanto, derivando, T T T ˙ ˙ ˙ R(t)R (t) + R(t)R˙T (t) = R(t)R (t) + (R(t)R (t))T = 0, y luego, T ˙ R(t)R (t) = −Ωi Ji . (5.21) De este modo, (5.20) se puede reescribir X˙ i = −ε ijk xj Ωk , o, vectorialmente, ~˙ = Ω ~. ~ ×X X (5.22) De la ecuación de Rodrigues es evidente que en el instante en que ambos ˙ Note que aquí Ω ~ =n ~ es la velocidad angular ~ θ. sistemas de ejes coinciden, Ω respecto del sistema cartesiano S. Este vector puede también escribirse en ~ . Por supuesto, las coordenadas del sistema s, como ω ~ = Rω ~. Ω ~ en s se pueden determinar directamente calculando (5.22) Las coordenadas ω en ese sistema. Para esto observe que a pesar de que la velocidad x˙0 de un ~˙ en punto en reposo en s es obviamente nula, podemos escribir el vector X este sistema. Llamaremos v~ a sus componentes. De este modo ~˙ = RT R~ ˙ x0 = ω ~ × x~0 , v~ = RT X 57 en que ˙ = −ωi Ji . RT R (5.23) Ejercicio 5.3 1. Utilice la fórmula de Rodrigues para mostrar que, en general ˙ + cos θ(1 − cos θ)(˙ ω = θn n × n) + sin θ˙ n 2. Observe las ecuaciones (5.21) y (5.23). Ambas definen una velocidad angular, pero cada una lo hace en un sistema de ccordenadas distinto. Muestre explícitamente que ambas se relacionan de acuerdo ~ = Rω, Ω como es de esperar para cantidades vectoriales. Supongamos ahora que x es un vector que se mueve en s. Entonces, ~˙ = R~ ˙ x + Rx~˙ X de donde, ~˙ = RR ~ + Rx~˙ ˙ TX X o bien, ~˙ = Ω ~ + Rx~˙. ~ ×X X (5.24) Esta expresión relaciona las velocidades en ambos sistemas. Podemos diferenciar nuevamente para obtener la aceleración. La expresión resultante se simplifica en el caso en que la velocidad angular es constante. Allí, ~¨ = Ω ~˙ + R ~ ×X ˙ x~˙ + Rx~¨. X Utilizando (5.24), ~¨ = Ω ~˙ + RR ~˙ − Ω ~ ) + Rx~¨ ~ ×X ˙ T (X ~ ×X X ~˙ − Ω ~ ) + Rx~¨ ~ ×X ~ × (Ω ~ ×X = 2Ω 58 Observamos aquí que inlcluso en ausencia de fuerzas externas, el sistema rotante experimenta fuerzas ficticias, F = −2m~ ω × x~˙ + m~ ω × (~ ω × x~), si m es la masa de la partícula en s cuya posición describimos con x~. El primer término corresponde a la fuerza centrífuga, el segundo a la Fuerza de Coriolis. Ejercicio 5.4 Estudie el movimiento de un péndulo de largo L que realiza pequeñas oscilaciones en una latitud θ dada sobre la tierra. 5.4. El sólido rígido Un sólido rígido es un objeto tal que la distancia entre dos puntos sobre él es simpre la misma. Es más o menos claro que que su posición en cualquier instante podrá ser descrita por seis cantidades. Para verlo con claridad, primero definamos 3 sistemas de referencia cartesianos que utilizaremos en el análisis, que podemos ver en la Fig. 5.4. El primero, s, es un sistema de ¯ de ejes (x, y, z) adosado al cuerpo rígido. El segundo, un sistema inercial, S, coordenadas (X¯ , Y¯ , Z¯ ), y tercero, un sistema S, cuyo origen O coincide con el de s, pero que se mantiene paralelo al sistema inercial, sin rotar. Un punto del sólido, P puede ser descrito en el sistema s, con coordenadas x~. En este sistema las coordenadas de P se mantienen constantes. ~ . En cada instante t También podemos describirlo en S con coordenadas X estas dos cantidades están relacionadas por una rotación R(t), según (5.19), ~ (t) = R(t)~ X x. ¯ el punto P tiene coordenadas, Así, en el sistema inercial S ~r(t) = R(t)~ x + ~r0 (t). (5.25) En cualquier instante, el sólido queda descrito por R y ~r0 , las seis cantidades antes anunciadas. La velocidad, ˙ x + ~˙r0 = RR ˙ T (~r − ~r0 ) + ~˙r0 . ~˙r = R~ 59 (5.26) Y Y O X P r0 r X O Figura 5.1: Para describir el sólido rígido le adosamos un sistema cartesiano de coordenadas (x, y, z), s. Este rota respecto de un segundo sistema cartesiano, S, de coordenadas (X , Y , Z ), que se mantiene siempre paralelo a cierto ¯ de coordenadas (X¯ , Y¯ , Z¯ ). El vector OP ~ se puede describir sistema inercial S, ~ o x~ respecto de los sistemas S, s respectivamente. con coordenadas X ~ . Luego, Pero en el sistema inercial (~r − ~r0 ) es precisamente X ~ + ~˙r0 . ˙ TX ~˙r = RR Usando (5.21) esto se escribe, ~ + ~˙r0 = Ω ~ + ~˙r0 , ~ ×X ~˙r = −Ωi Ji X (5.27) en que Ωi es la velocidad angular medida en el sistema S. La energía cinética del solido viene dada por la suma de las energías de todas las partículas rA que lo conforman, X mA X mA ~A + ~˙r0 )2 , ~ ×X ~˙rA2 = (Ω T = 2 2 A A en que la suma se reemplaza por una integral en el caso continuo. Esto podemos escribirlo como, T = M ˙ 2 X mA 2 ~r0 + XA δij − XAi XAj Ωi Ωj + 2εijk Ωj ˙r0i XAk , 2 2 A 60 (5.28) P en que M = mA es la masa total. El último término es nulo en las dos situaciones de interés para nosotros. Primero, cuando el sólido gira en torno a un punto fijo. En ese caso ˙r0i = 0. Segundo, cuando el origen P en el sistema rotante O lo ponemos en el centro de masa. En ese caso mA XA = 0. En ambos casos, X1 M Iij Ωi Ωj , (5.29) T = ~˙r02 + 2 2 A en que el tensor de inercia del sólido rígido se define, X Iij = mA XA2 δij − XAi XAj . (5.30) A Note que la energía está separada en dos componentes. El primero es la energía traslacional, del cuerpo moviéndose sin girar. El segundo es la energía del giro intrínseco del cuerpo, que es distinta de cero aunque su centro de masa esté en reposo. Note también que, como T , el segundo término es un escalar, por lo que podemos calcularlo también en el sistema rotatorio adosado al cuerpo, de modo que la energía rotacional será TR = X1 A Iij ωi ωj , 2 en donde ωi es la velocidad angular medida en s, y Iij el tensor de inercia en este sistema de coordenadas, que se calcula igual que en (5.30), pero reemplazando las coordenadas Xi en S por xi en s. Esto tiene la ventaja de que Iij es constante a lo largo del movimiento. Veamos algunos ejemplos. Considere primero una barra infinitamente delgada de densidad lineal ρ y largo l. Calculemos su tensor de inercia respecto del centro de la barra. Asumamos que la barra esta dispuesta entre −l/2 y l/2 del eje z, en x = y = 0. Entonces Z Ixx = Izz = ρ l/2 −l/2 dzz 2 = ρl2 M ρl3 ρ = , 12 12 en que M = ρl es la masa total. Es claro que todos los componentes del tensor de inercia se anulan. Considere ahora una argolla infinitamente delgada de radio R y masa total M. Calculemos su tensor de inercia relativo al centro de la argolla. Disponemos la argolla en el plano (x, y) con su centro en el origen x = y = 0, Z Z Z M M M MR 2 2 2 2 Ixx = (R −x )Rdφ = y Rdφ = R 2 sin2 φRdφ = . 2πR 2πR 2πR 2 61 Por simetría, Ixx = Iyy , y Izz = MR 2 . Los términos Ixz ,Iyz son claramente nulos, y Z M Ixy = − R 3 sin φ cos φdφ = 0. 2πR Vemos que si deseamos hacer rotar una argolla en torno a su centro con velocidad angular ω, lo más caro energéticamente es hacerlo en torno a su eje de simetría, allí su energía cinética será, 1 K = MR 2 ω2 . 2 Mientras mayor sea el radio, más energía es requerida. Finalmente calculemos el tensor de inercia de un disco de radio R y masa M respecto de su origen. Nuevamente los disponemos en el plano (x, y) con centro en el origen. Z Z Z 2 2 2 Ixx = σ (r − x )dxdy = σ y dxdy = σ r 2 sin2 φrdrdφ, en que σ = M/πR 2 es la densidad del disco. Así, Z σ πR 4 MR 2 2 2 Ixx = σ r sin φrdrdφ = = . 4 4 Nuevamente por simetría, Ixx = Iyy , y Z Z MR 2 2 Izz = σ r dxdy = σ r 3 drdφ = . 2 Los términos cruzados se anulan todos de igual forma que en el ejemplo anterior. El momento angular del sólido rígido viene dado por la suma de cada trozo infinitesimal. En el sistema inercial, X X ~A + ~r0 ) × (Ω ~A + ~˙r0 ). ~ ×X ~rA × p ~A = L~ = mA (X A A Nuevamente asumiremos que estamos en uno de los dos casos de interés: o ~r0 = 0, o está en el centro de masas del sólido. En esos casos, X ~A × (Ω ~A ), ~ ×X L~ = M~r0 × ~˙r0 + mA X A 62 en que M es la masa total. El primer término es el momentum angular orbital. Es decir, el del cuerpo moviéndose en torno al origen de coordenadas ¯ (en caso que este origen no esté fijo). El segundo es el momeninerciales S tum intrínseco del sólido rígido, y que podemos escribir, luego de algo de gimnasia tensorial como Ji = Iij Ωj . (5.31) 5.5. Propiedades del tensor de inercia Veamos ahora alguna propiedades importantes del tensor de inercia. Antes que todo, vemos de (5.30) que es un (0, 2)-tensor simétrico, Iij = Iji . Además, es definido positivo. En efecto, suponga que ni es un vector unitario, entonces, X Iij ni nj = mA xA2 − (xAi ni )(xAj nj ) . A Cada término de la suma es claramente positivo, ya que la norma al cuadrado de un vector es siempre más grande que el cuadrado de su proyección en cualquier dirección. Solo es igual a cero cuando ~r apunta en la misma ~ . Esto significa, que podemos llevar Iij a una forma diagonal, dirección que n en que sus tres entradas son mayores o iguales a cero. Podemos hacer esto utilizando solo el grupo ortogonal, es decir, rotando nuestro sistema de coordenadas en forma apropiada. Otra propiedad útil es el llamado teorema del eje paralelo, que nos permite calcular el tensor de inercia respecto de un punto si lo conocemos respecto de su centro de masa. Suponga que Iij es el tensor de inercia respecto de un sistema de coordenadas cartesiano con origen en el centro de ~ El masas. Suponga que desplazamos el origen a lo largo de cierto vector B. nuevo tensor de inercia es, X IijB = mA (rAk + Bk )(rAk + B k )δij − (rAi + Bi )(rAj + Bj ) . A Ya que el origen está en el centro de masas, varios términos de esta expresión se anulan, sobreviviendo solo IijB = Iij + M(B 2 δij − Bi Bj ). 63 (5.32) Ejercicio 5.5 1. Muestre que ningún momento de inercia puede superar la suma de los otros dos. 2. Muestre que si un cuerpo tiene simetría de reflexión, entonces dos de sus ejes principales deben estar en el plano de reflexión. 3. Muestre que cualquier tensor de inercia puede conseguirse disponiendo cuatro partículas de igual masa en posiciones apropiadas. 5.6. Ecuaciones de Euler En ausencia de fuerzas externas, el momento angular del sólido rígido se conserva. Dado que no hay fuerzas externas el centro de masas se mueve con velocidad constante, por lo que podemos elegir un sistema inercial en que está en reposo con origen en O. Así, el sistema S coincide con el sistema inercial, y ˙ ˙ L~ = ~J = 0. De (5.31) esto es, d ~ (IΩ) = 0. dt Esta ecuación podemos escribirla en términos de las cantidades medidas ~ es el en el sistema rotante s. Para eso debemos tener en cuenta que, IΩ ij vector contravariante de componentes I Ωj . Así la conservación de momentum puede escribirse d ˙ ω ~ ) = RI ω ~˙ , +RI ~ 0 = (RI ω dt o bien, multiplicando esta expresión por la izquierda por RT , ~˙ + ω ~ × Iω ~. 0 = Iω Estas son las ecuaciones de Euler del trompo libre. Si hacemos coincidir los ejes cartesianos de s con los ejes principales del cuerpo, de modo que Iij 64 sea diagonal, estas ecuaciones toman la forma, ˙ 1 + (I3 − I2 )ω2 ω3 = 0 I1 ω ˙ 2 + (I1 − I3 )ω1 ω3 = 0 I2 ω ˙ 3 + (I2 − I1 )ω2 ω1 = 0. I3 ω (5.33) (5.34) (5.35) Vemos que podemos hacer girar el sólido en torno a cualquier eje principal a velocidad angular constante. Podemos obtener las ecuaciones de Euler a partir de un Lagrangiano. Para esto debemos escribir las velocidades angulares en función de un sistema de coordenadas generalizadas, digamos, los ángulos de Euler. En el sistema de coordenadas s, usando (5.23) 1 ˙ jk . ωi = − ε ijk (RT R) 2 Introduciendo la matriz R de (5.18), obtenemos ˙ ω1 = cos φ χ˙ + sin φ sin χ ψ ˙ ω2 = sin φ χ˙ − cos φ sin χ ψ ˙ ˙ + cos χ ψ. ω3 = φ (5.36) (5.37) (5.38) El lagrangiano de un sólido libre será por lo tanto, ˙ χ˙ , ψ) ˙ = 1 Iij ωi ωj . L(φ, χ, ψ, φ, 2 Note que el lagrangiano no depende de ψ, por lo que el momentum asociado a esta coordenada se debe conservar. Analizaremos esto con mayor detalle en el próximo capítulo. Finalmente, podemos agregar a este lagrangiano un potencial V (φ, χ, ψ). Como ejemplo, veamos el caso de un sólido rígido que se mueve en un campo gravitacional: un trompo en la tierra. En los ángulos de Euler, es la segunda rotación, en χ, la que cambia la posición del centro de masas cuando el punto O está fijo fuera de éste (la otras son en torno al eje z). El potencial resultante es V = mgl cos χ, en donde l es la distancia desde O al centro de masas. Ejercicio 5.6 65 1. Escriba un programa (usando Mathematica, Maple, Maxima u otro programa o lenguaje de programación) en el que pueda visualizar la acción de un elemento de SO(3) sobre un conjunto de puntos en 3D. Utilice ˆ , φ de la fórmula de Rodrigues. como entrada los ángulos de Euler y n 2. Verifique (5.36), (5.37), (5.38). Puede utilizar un programa de lenguaje simbólico. 3. Un libro con Ix < Iy < Iz rota libremente en el espacio. Muestre que el movimiento de rotación es estable solo a lo largo de los ejes x o z. 66 Capítulo 6 El teorema de Noether y las simetrías del espaciotiempo El teorema de Noether (Emmy Noether, 1915), es uno de los más bellos resultados de la física-matemática del siglo XX. Se trata de un profundo resultado que relaciona las simetrías de un sistema físico descrito a través de un principio de acción con sus cantidades conservadas. 6.1. El teorema Comenzaremos con una versión menos general, pero más simple del teorema. Considere un sistema gobernado por la acción I[qa (t)]. Suponga que ésta es invariante bajo la transformación infinitesimal, ˙ , t), δqa = εf a (q, q (6.1) en que ε es el parámetro infinitesimal. Es decir, I[qa (t)] = I[qa (t) + δqa ]. (6.2) Decimos que δqa es una simetría de la acción cuando esto se satisface. Entonces, despreciando términos O(ε 2 ), Z t2 ∂L ∂L a a ˙ δq + a δ q δI = 0 = dt ∂qa ∂˙ q t1 t2 Z t2 ∂L ∂L d ∂L a = δq + dt − δqa . (6.3) a a ∂˙ qa ∂q dt ∂˙ q t1 t1 Note que no hemos utilizado las ecuaciones de movimiento. La acción es invariante para cualquier trayectoria qa (t), sea o no una trayectoria extrema. La transformación (6.1) actúa no trivialmente en cualquier punto de la 67 trayectoria, incluidos los extremos. Esto significa que el primer término en (6.3) no tiene porqué anularse. En el caso en que la trayectoria qa (t) es une extremo, las ecuaciones de Euler-Lagrange se satisfacen, por lo que el segundo término de (6.3) se anula. Por lo tanto en ese caso, obtenemos, usando (6.1), ∂L a ∂L a f = f . ∂˙ qa t1 ∂˙ qa t2 Dado que esto es cierto para cualquier t1 o t2 , esto nos dice que la cantidad Q= ∂L a f , ∂˙ qa (6.4) se conserva sobre las trayectorias que satisfacen las ecuaciones de movimiento. Es una cantidad conservada. El ejemplo más sencillo es el de las coordenadas cíclicas, es decir, aquellas que no aparecen en el lagrangiano. Suponga que la primera coordenada, q1 , es cíclica, ∂L = 0, ∂q1 entonces es evidente que la traslación 0 si a 6= 1 a δq = ε si a = 1 es una simetría de la acción. De (6.4) tenemos que la cantidad conservada asociada a esta simetría es ∂L . Q= ∂˙ q1 Este es el momentum asociado a la coordenada cíclica q1 , cuya conservación ya habíamos discutido en la sección 2.8. Ahora generalizaremos de dos modos distintos el teorema. Primero, en cuanto a la definición de simetría, y luego en cuanto a la clase de transformaciones que consideramos. Ya sabemos que cuando dos Lagrangianos difieren por una derivada temporal, entonces los principios de acción dan origen a las mismas ecuaciones de movimiento. Podemos intuir, por lo tanto, que una transformación infinitesimal tal que ˙ )|tt21 δI = ε Λ(q, q (6.5) 68 también podría ser de interés. En efecto, ampliaremos nuestra noción de simetría para incluir toda transformación infinitesimal que satisface (6.5). Ahora, t2 Z t2 ∂L ∂L d ∂L t2 a ˙ )|t1 = δI = ε Λ(q, q δqa . (6.6) δq + dt − a a ∂˙ qa ∂q dt ∂˙ q t1 t1 Cuando qa (t) es un extremo de la acción tenemos que Q= ∂L a f −Λ ∂˙ qa (6.7) es una cantidad conservada. Veamos un ejemplo en la que esta generalización es útil. Considere una partícula libre en una dimensión espacial, Z 1 2 m˙ x dt , I= 2 y la transformación δx = εt. Esta transformación representa un “boost"de velocidad ε, y al aplicarla sobre la acción resulta, Z Z δI = m x˙δ x˙ = m x˙ε = ε Λ|tt21 , en donde Λ = mx. De este modo, δx es una simetría, y de (6.7) obtenemos la cantidad conservada, Q = m(˙ x t − x). Podemos comprobar directamente que esto es cierto derivando Q y usando ˙ = 0. las ecuaciones de movimiento para mostrar que Q Ahora, generalizaremos en cuanto a permitir que la transformación infinitesimal actúe también sobre el tiempo t, ˙ , t), δqa = εf a (q, q ˙ , t). δt = εh(q, q (6.8) (6.9) Es en ocasiones confuso el significado de la traslación temporal δt. Por esta razón, seremos más precisos en cuanto a la forma de implementar (6.8),(6.9). 69 La translación temporal debe realizarse en los extremos de la integral que define la acción (el tiempo dentro de la integral es solo una variable de integración). Esto, sin embargo, resulta incómodo para comparar luego distintos términos. Es por esto que haremos un cambio de variable de modo de dejar los extremos de integración iguales para las integrales antes y despées de la transformación. ¯ = q + δq, entonces la variación es, Si q Z δI = t2 +δt2 t1 +δt1 Z ˙ ¯ (t − δt), q ¯ (t − δt), t − dtL q t2 t1 ˙ (t), t). dtL(q(t), q (6.10) ¯ , luego hemos trasladado Aquí primero hemos hecho la variación de q → q ¯ (t) curva en δt. Para hacer la sustracción temporalmente la misma cueva q es mejor tener a las dos integrales entre los mismos límites de integración. Para eso hacemos un cambio de variable en la primera integral, t 0 = t − δt. Luego del cambio de variable todas las referencias al tiempo corresponden a la nueva variable. En particular, dq dt 0 dq dq ˙ = 0 = 0 (1 − δt), dt dt dt dt en donde la derivada temporal de δt no importa si es respecto de t o t 0 ya que la diferencia entre las dos es cuadrática en ε. Lo mismo ocurre para la medida de integración. Así, Z t2 Z t2 0 ˙ 0 0 ˙ ˙ ¯ (t ), q ¯ (t )(1 − δt), t + δt − ˙ (t), t) δI = dt(1 + δt)L q dtL(q(t), q t1 t1 Z t2 Z t2 ˙ ˙ t + δt − ˙ + δq ˙−q ˙ δt, ˙ , t) = dt(1 + δt)L q + δq, q dtL(q, q t1 t1 Z t2 ∂L ∂L ∂L a ˙ ∂L a a ˙ ˙ − aq ˙ δt + δt = dt δtL + a δq + a δ q ∂q ∂˙ q ∂˙ q ∂t t1 Z t2 ∂L ∂L ∂L ∂L ∂L a a a a a ˙ + Lδt ˙ − ˙ + ˙ − aq ˙ δt ˙ δt − a q ¨ δt = dt δtL δq + a δ q q ∂qa ∂˙ q ∂˙ q ∂qa ∂˙ q t1 Ahora asumimos que q(t) es un extremo de la acción, es decir, satisface las ecuaciones de Euler-Lagrange, Z t2 d ∂L ∂L a a ˙ δt . δI = dt Lδt + a δq − a q (6.11) dt ∂˙ q ∂˙ q t1 70 Por otro lado, si esta es una simetría, de (6.5), t ∂L a ∂L a 2 t2 ˙ )|t1 = ε Lh + a f − a q ˙ h δI = ε Λ(q, q ∂˙ q ∂˙ q t1 Por lo tanto, si (6.8), (6.9) es una simetría, entonces la siquiente es una cantidad conservada, ∂L a ∂L a ˙ −Λ f + h L − q (6.12) Q= ∂˙ qa ∂˙ qa es una cantidad conservada. El ejemplo más importante en que necesitamos esta forma general del teorema es el análisis de la simetría de traslación temporal para lagrangianos que no dependen explícitamente del tiempo. δqa = 0 δt = −ε. Si el lagrangiano no depende explícitamente del tiempo es evidente que esta es una simetría, por lo que la cantidad, E= ∂L a ˙ −L q ∂˙ qa (6.13) se conserva. Esta es precisamente la energía conservada que discutimos en (2.57). Ejercicio 6.1 1. Considere una partícula que se mueve en una dimensión en un potencial α V (x) = 2 , x en que α es una constante. Este sistema es invariante bajo traslaciones temporales, pero tiene otra simetría menos evidente. Si multiplicamos el tiempo por una constante λ y x por una potencia distinta de la misma constante, digamos λn , podemos dejar la acción invariante eligiendo n en forma adecuada. Encuentre esta simetría y sus cantidad conservada asociada. Use las dos cantidades conservadas que tiene en su poder para integrar completamente las ecuaciones de movimiento. 71 6.2. El grupo de Galileo Considere un sistema cerrado de N partículas, de masas mI , I01 . . . N, interactuando a través de un potencial, como en la ecuación (2.31). Suponga además que el potencial depende solo de las distancias, VIJ ≡ VIJ (|~ xI − x~J |). Este sistema es cláramente invariante ante traslaciones espaciales en las tres direcciones, ante traslación temporal, ante boosts y ante rotaciones. Si no le parece tan claro, veamos. Primero las traslaciones espaciales, ~, δ~ xI = ε a ~ es cualquier vector constante. Aquí trasladamos todas las partículas en que a ~ . Por esta razón, el potencial es en la misma distancia a lo largo del vector a invariante. La energía cinética también lo es, ya que el vector constante no contribuye a la velocidad. Así δI = 0. La cantidad conservada asociada es el ~, momentum lineal total en la dirección del vector a Pa~ = X X ∂L a ~ ·a ~=P ~ . f = mI x~˙I · a ∂˙ qa I Para traslaciones en el tiempo, como ya vimos en (6.13), será la energía total. Para las rotaciones usamos la transformación infinitesimal (5.7), en ˆ. que elegimos una rotación en torno a cierto eje paralelo al vector unitario n Jij = ni εijk . Cada uno de los términos cinéticos es invariante ante esta transformación, m I 2 δ x˙I = mI x˙Ii δ x˙Ii = εmI x˙Ii nk ε kij x˙Ij = 0. 2 Lo mismo ocurre para cada término del potencial, que depende del cuadrado del vector x~IJ = x~I − x~J . Al hacer una rotación, x~IJ2 permanece invariante. Podemos, calcular entonces la cantidad conservada usando (6.4), Jn = X ∂L X a f = mI x˙Ii ε kij nk x j . a ∂˙ q I Vemos que esto no es otra cosa que la componente del momentum angular total ~J, X ~J = mI x~ × x~˙I I 72 al lo largo de −ˆ n, Jn = −ˆ n · ~J. Las tres rotaciones independientes, las tres traslaciones, los tres boost y la traslaci’on temporal forman un grupo de 10 dimensiones (se puede parametrizar con 10 parámentros). Se llama el Grupo de Galileo. 73 Capítulo 7 La relatividad especial y el grupo de Lorentz Con la publicación, en 1965 de “Una teoría dinámica del campo electromagnético", el escocés James Clerk Maxwell cierra un largo capítulo en la historia de la física. Una teoría completa y consistente que unificaba la electricidad, el magnetismo y la luz, dando cuenta de todos los fenómenos electromagnéticos conocidos hasta en entonces. Sin embargo, estas ecuaciones de Maxwell también eran el origen de un profundo misterio: predecían la velocidad de propagción de las ondas de luz. ¿Cómo era esto posible? Ya desde tiempos de Galileo parecía evidente que cualquier sistema inercial era igualmente bueno para describir la naturaleza, pero también, que la velocidad de un cuerpo depende del sistema que elegimos para medirla. El hecho que las ecuaciones de Maxwell predijeran una velocidad, hacía pensar que debía existir un sistema preferencial, en el que la teoría era válida. Quizás el electromagnetismo no era fundamental después de todo, sino más bien una teoría emergente de un sistema mucho más complejo. El sonido, por ejemplo, es un fenómeno colectivo que emerge de un conjunto muy grande de moléculas. Su velocidad se mide respecto del sistema en que la velocidad promedio de las moléculas es cero. De igual modo, se pensaba que existía el eter, un fluido responsable de los fenómenos electromagnéticos, y que la teoría de Maxwell era correcta en el sistema en que estaba en reposo. Einstein vino a cambiar esta forma de pensar, mostrando que el eter no era necesario. Lo que se necesitaba era un cambio profundo sobre nuestra concepción del espacio y del tiempo. 74 7.1. La transformación de Lorenz La idea de Einstein era que las ecuaciones de Maxwell en el vacío eran correctas en cualquier sistema de referencia inercial, y que por lo tanto en cualquiera de ellos la velocidad de la luz era la misma, c = 299,792,458m/s. También insistía en que los sistemas inerciales eran todos equivalentes, por lo que tanto las ecuaciones de Maxwell como cualquier otra teoría fundamental de la naturaleza, debía ser idéntica en cualquiera de éstos. Supongamos que estamos en una dimensión espacial parametrizada a través de un sistema inercial Sde coordenada X y tiempo t. Supongamos que tenemos un segundo sistema inercial, s de coordenada x, que se mueve a velocidad v, hacia la derecha, respecto del primero. Si procedemos de acuerdo al grupo de Galileo, la relación entre los dos sistemas es, X = x + vt. (7.1) Si X (t) describe a una partícula moviéndose a velocidad c hacia la izquierda en el sistema S, entonces la velocidad en el sistema s es, v = c + V. Esta es la ley de suma de velocidades que se desprende del grupo de galileo, y que es muy acorde con nuestro sentido común. Einstein llega a la conclusión que (7.1) no es la forma correcta de conectar los dos sistemas inerciales antes descritos. La forma correcta debe ser tal que la velocidad de la luz sea invariante, y que para velocidades pequeñas respecto de c, es decir, para aquellas con que normalmente convivimos, (7.1) sea una buena aproximación. Supongamos entonces que lanzamos un flash de luz en t = 0 de acuerdo al reloj de S, instante en que ambos sistemas de referencia coiniciden. En S, X − cT = 0, (7.2) en que ahora hemos usado la letra T para denotar el tiempo del reloj en S. Esto, porque tal como veremos más abajo, la nueva forma de conectar dos sistemas inerciales requerirá que la coordenada temporal también sea modificada en la transformación. En (7.2) hemos asumido que el flash es apuntado hacia la derecha. Si invertimos la linterna, el signo cambiara a positivo. Ambos flashes pueden describirse con X 2 − c 2 T 2 = 0. 75 Ahora, si la velocidad de la luz es la misma en s, entonces, x 2 − c 2 t 2 = 0, (7.3) en donde t es el tiempo que mide el reloj del sistema s. Ahora podemos proceder por analogía. Note que lo que queremos es pasar de un sistema de coordenadas a otro manteniendo invariante una forma cuadrática. Esto es muy similar al grupo de rotaciones, en donde δij x i x j = δij X i X j para una rotación entre dos sistemas x i , X i con el origen común. La diferencia está en el signo negativo y la constante c que multiplican a la coordenada temporal. Podemos sin embargo hacer un truco definiendo u = itc, de modo que (7.3) tomo la forma x 2 + u2 = 0. En este caso, sabemos que si (x, u) transforma con la matriz (3.32), entonces, x 2 + u2 = X 2 + U 2 , tal como necesitamos. Ahora, icT cos φ sin φ ict ict cos φ + x sin φ = = (7.4) X − sin φ cos φ x −ict sin φ + x cos φ Note que para que el truco sea consistente, X debe ser real y T imaginario. Esto será así siempre que φ = iβ sea imaginario, de modo que podemos reescribir esta relación como, cT cosh β sinh β ct = (7.5) X sinh β cosh β x Esta es la transformación que necesitamos. Note que también es una matriz de determinante uno, y que al igual que en el caso de las matrices de SO(2), satisface A(β1 )A(β2 ) = A(β1 + β2 ). Estas matrices forman el grupo de Lorentz SO(1, 1). Antes de detenernos en sus propiedades matemáticas, veamos sus consecuencias físicas. Primero si 76 miramos el origen x = 0 del sistema s desde el sistema S, sus coordenadas son cT = ct cosh β X = ct sinh β. Esto significa que de acuerdo al sistema S el sistema s se mueve con una velocidad sinh β v =c = c tanh β. cosh β Se define, 1 γ(v) = cosh β = q , v2 1 − c2 de donde la transformación de Lorentz se puede escribir xv T = γ t+ 2 c X = γ (x + vt) . (7.6) (7.7) Estas ecuaciones nos muestran que si v << c, entonces γ ∼ 1, T ∼ y X ∼ x +vt, reduciéndose en este límite a la ecuación (7.1). La transformación de Lorentz mezcla el espacio y el tiempo de modo que ya no podemos hablar de tiempo y espacio como entes independientes de distinta naturaleza. Tal como decía Minkowski, El espacio como tal, y el tiempo como tal están destinados a desvanecerse en meras sombras. Sólo cierta unión de ambos puede representar una realidad independiente. Esa cierta comunicación de ambos la analizaremos al final de esta sección. Veamos ahora cómo funciona la adición de velocidades en este contexto. Suponga que en el sistema s un objeto se mueve con velocidad constante u, x = ut. En el sistema S, de (7.7) y (7.6), X = γ(u + v)t uv T = γ 1 + 2 t. c De modo que en S la velocidad del objeto es V = (u + v) 1 + uv c2 77 Si u, v < c, entonces V < c. En efecto, dada una velocidad v < c, la función V (u) es monótonamente creciente entre u = 0 (en donde V = v)y u = c (en que V = c), v(u + v) ∂V 1 1 − v 2 /c 2 − = = 2 >0 2 1 + uv 2 ∂u 1 + uv c 2 1 + uv c c2 c2 c2 Las transformaciones de Lorentz dan origen a ciertos fenómenos físicos aparentemente paradojales, los que desafían nuestro sentido común: la dilatación del tiempo, la contracción de Lorentz y la relatividad de la simultaneidad. 7.1.1. La dilatación del tiempo Suponga que una persona está en el origen del sistema s, con un reloj. En t = 0 produce un flash de luz, luego espera un tiempo ∆t y produce un segundo flash. Usted está en el sistema S, y ve el primer flash en t = 0, x = 0, cuando los sistemas coinciden. El segundo flash lo observa en un tiempo ∆T = γ∆t. Note que 1 ≤ γ < ∞, por lo que el lapso de tiempo entre los dos flash puede ser arbitrariamente grande. El sistema S, en movimiento respecto del sistema en que ocurrieron dos eventos en un mismo punto, percibió una dilatación del tiempo, la que ne el límite cuando v → c tiende a infinito. 7.1.2. La contracción de Lorentz Suponga que el sistema s va montado sobre un tren de longitud L, que se extiende entre x = 0 y x = L. Una persona en el sistema S mide el largo del tren en T = 0. Un extremo del tren está en ese instante en X = 0. Para calcular el otro extremo, veamos primero a que valor de t corresponde el instante T = 0 cuando x = L. De (7.6) 0 = γ(t + Lv ), c2 de donde t = −Lv/c 2 . Así, el otro extremo del tren, de (7.7), está en L X = γ L − Lv 2 /c 2 = . γ 78 Vemos entonces que desde el sistema S el tren en movimiento tiene una longitud menor, L LS = . γ Esta es la contracción de Lorentz. 7.1.3. Relatividad de la simultaneidad Suponga dos eventos simultáneos en s. Digamos que ambos ocurren en t = 0, pero uno en x = 0 y el otro en x = a. En el sistema S, usando(7.6) y (7.7) el primer evento tambien ocurre en T = 0. El segundo, sin embargo, ocurre en γav T2 = 2 , c es decir, un poco después del primero. Este fen’omeno es extraordinariamente extraño, ya que aparentemente destruiría la causalidad. Es decir, alguien en el sistema S podría viajar desde un evento hasta otro, conectando causalmente dos cosas que no lo estaban en s. Afortunadamente esto no es así. En S, un objeto que desee partir en (T = 0, X = 0) para llegar a (T2 , X2 ) debe moverse a una velocidad c2 X2 = . T2 v Evidentemente, esta velocidad es mayor que c. Esto nos muestra que siempre que las velocidades de los objetos se mantengan subluminales, la causalidad está protegida. Ya sabemos que a través de boosts no podemos superar la velocidad de la luz. Veremos además, que una partícula con masa requeriría energía infinita para llegar a ella. La naturaleza, por lo demás parece confirmarlo: Nunca se ha observado una partícula cuya velocidad supere la de la luz. 7.2. El grupo de Lorentz En tres dimensiones espaciales es fácil generalizar la transformación de Lorentz. Para que la velocidad de un rayo de luz que parte en el origen en t = 0 sea la misma en otro sistema que coincide en el origen, debe dejar invariante la forma cuadrática −c 2 t 2 + x 2 + y2 + z 2 . 79 Definimos el espacio de Minkowski como el espacio de eventos etiquetados con las coordenadas (x 0 , x 1 , x 3 , x 4 ) = (ct, x, y, z), y la Métrica de Minkowski como el (0,2)-tensor simétrico, −1 0 0 0 0 1 0 0 ηµν = (7.8) 0 0 1 0 , 0 0 0 1 en que los índices griegos µ, ν toman los valores 0, 1, 2, 3. Así, una transformación de Lorentz es análogo a una rotación, salvo que ahora el espacio es de cuatro dimesniones en lugar de tres, y que en lugar de dejar invariante la métrica Euclídea, debe dejar invariante la de Minkowski. Si M µν es una matriz de transformación que deja invariante esta métrica, ηµν = M αν M βµ ηαβ . (7.9) En adelante utilizaremos unidades tales que c = 1. Esto significa que el tiempo lo mediremos en las mismas unidades que la distancia. Cuando queramos recuperar las unidades usuales, basta con insertar las potencias de c necesarias apropiadas. La métrica de Minkowski no es positiva definida, ya que tiene un valor propio negativo. Esto significa que hay vectores cuyo norma es negativa. Por ejemplo, 2 1 0 = −1 0 0 Un vector de norma negativa representa el desplazamiento desde el origen que podría experimentar una partícula que se mueve a una velocidad v < c. Decimos que es tipo tiempo. Análogamente, definimos los vectores tipo luz x µ xµ = 0 y tipo espacio, x µ xµ > 0. El espacio vectorial de eventos etiquetados con el sistema de coordenadas inercial x µ y provisto de la métrica (7.8) se denomina Espacio de Minkowski. Debido a que dejan invariante una métrica con tres autovalores positivos y uno negativo, llamamos a este grupo O(3, 1). Al igual que para el grupo de rotaciones, aquellas transformaciones conectadas a la identidad, de determinante +1, componen el grupo propio de Lorentz SO(3, 1). En adelante cuando nos refiramos al grupo de Lorentz nos referiremos a éste. 80 Las transformaciones infinitesimales de SO(3, 1) las podemos obtener insertando M µν = δ µν + ∆µν en (7.9), en que ∆µν es una matriz de entradas infinitesimales. Al igual que para las rotaciones, obtenemos ∆µν = −∆νµ , en que los índices se bajan con la métrica ηµν y se suben con su inversa, el (2,0)-tensor ηµν , cuyos componentes son idénticos a los de ηµν . A diferencia del caso Euclídeo, en donde el valor de las componentes de un vector no cambiaban al subirlo o bajarlo, el espacio de Minkowski requiere que tengamos cuidado con la altura de nuestros índices, ya que v 0 = −v0 . Las transformaciones infinitesimales, una vez bajado sus índices, son matrices antisimétricas. Existen seis matrices antisimétricas en cuatro dimensiones, (J αβ )µν = δµα δνβ − δνα δµβ Estas seis matrices corresponden a los generadores de las tres rotaciones y los tres boosts. Las matriz J ij , con i, j = 1, 2, 3 genera una rotación en el plano (x i , x j ), mientras que J 0i genera un boost en la dirección de x i . Nuevamente, exponenciando estos generadores infinitesimales podemos obtener las transformaciones finitas. 7.3. La partícula libre relativista Intentemos ahora encontrar un principio de acción para una partícula libre relativista. Nuestro espacio de configuración es ahora el espacio de Minkowski, y las trayectorias en éste deben describirse con algún parametro λ, x µ ≡ x µ (λ). El parámetro λ tendrá en la acción la misma función que tenía el tiempo en el caso no relativista. Si embargo no se trata del tiempo físico, ya que éste corresponde a la coordenada x 0 . El parámetro λ no tiene un significado físico, y solo nos es de utilidad para etiquetar puntos sobre la trayectoria. Evidentemente, hay muchos modos de parametrizar una curva, y dado que 81 la física no debe depender de esta arbitrariedad, esperamos que el principio de acción sea invariante bajo la elección de un nuevo parámetro, λ −→ λ0 ≡ λ0 (λ). (7.10) Por otra parte, el lagrangiano debe depender de las velocidades solamente, al igual que en el caso no relativista, para así asegurar la invarianza bajo traslaciones, x µ −→ x µ + aµ . Esto implicará la conservación de momentum. Para garantizar, además, la invarianza de Lorentz, la acción debe ser de la forma, Z µ I[x (λ)] = F (˙ x µ x˙µ )dλ, en que “·"= d/dλ. La única posibilidad para la función F de modo que la integral sea invariante bajo (7.10), es Z p µ −˙ x µ x˙µ dλ, (7.11) I[x (λ)] = −m en que hemos además incluido una constante, m, que veremos es la masa de la partícula. 82 Capítulo 8 Mecánica Hamiltoniana Ahora procederemos a estudiar un nuevo principio de acción que da origen a las ecuaciones de movimiento mecánicas. A diferencia de la acción lagrangiana que estudiamos en capítulos anteriores, la acción hamiltoniana dará origen a ecuaciones de primer órden, y al doble de variables independientes (coordenadas y momenta). La existencia de esta formulación la podemos intuir, ya que las ecuaciones de Euler-Lagrange nos dan de inmediato una pista con respecto a ellas. En término del momentum, pa = ∂L , ∂˙ qa (8.1) ˙a = p ∂L . ∂qa (8.2) las ecuaciones son En caso que podamos invertir (8.1) en función de las velocidades, ˙ a = Q a (˙ q q, p), (8.3) entonces el conjunto (qa , pa ) son 2N variables que satisfacen (8.2), (8.3), 2N ecuaciones de movimiento de primer órden. La acción hamiltoniana no es otra cosa que un principio de acción que da origen a estas ecuaciones. Una vez que lo construyamos nos permitirá, además, construir una estructura algebraica, los paréntesis de Poisson, que serán de gran utilidad, particularmente en el paso a la Mecánica cuántica. 8.1. Variables auxiliares ˙ , z), que depende de una colección q Considere un Lagrangiano L(q, q ˙ a y de otro conjunto de de coordenadas qa , de sus derivadas temporales q 83 coordenadas z A , (pero no de z˙A ). Las ecuaciones de movimiento resultantes de variar la acción respecto de las z A son ∂L =0 . ∂z A (8.4) ˙, Si estas ecuaciones nos permiten encontrar z A como funciones de q y q ˙ ), z A = Z A (q, q entonces decimos que las z A son variables auxiliares. Estas variables pueden ser eliminadas utilizando esta relación, de modo que podemos construir el lagrangiano ˙ , ) = L(q, q ˙ , z(q, q ˙ )). L0 (q, q Las trayectorias que extremizan L0 eson las mismas que extremizan L cuando ˙ ). Para demostrarlo, variamos la acción, z A = Z A (q, q Z Z 0 ˙ ) = δ dtL(q, q ˙ , Z (q, q ˙ )) δ dtL (q, q Z d ∂L ∂Z ∂L ∂Z ∂L a a a ˙ − δq + a δ q δq + , = dt ∂qa dt ∂˙ qa ∂Z ∂qa ∂˙ q ˙ ) satisface (8.4), y el primer término El segundo término se anula ya que Z (q, q se anula precisamente en el extremo de la acción basada en L. De este modo vemos que los lagrangianos L y L0 son equivalentes. Ambos tienen las mismas trayectorias extremales qa (t). 8.2. Transformación de Legendre La estrategia para encontrar el principio de acción hamiltoniano, es decir, aquel que nos proporcionará directamente las ecuaciones (8.2), (8.3), es pensar en los momenta como variables auxiliares. La acción más general que da origen a ecuaciones de primer órden, en donde los momento son variables auxiliares es Z I = dt [la (q, p)˙ qa − H(q, p)] . Ahora bien, si queremos que al variar la acción con respecto a qi obtengamos ecuaciones de la forma (8.2), necesitamos que li = pi . Probaremos por lo tanto un principio de acción, Z ˙ a − H(q, p)] . I = dt [pa q (8.5) 84 Al variar respecto de pi obtenemos ˙a = q ∂H , ∂pi (8.6) ecuaciones que asumiremos que podemos invertir, de modo de encontrar ˙ ), ya que los p son variables auxiliares. Las ecuaciones (8.6) deben p = p(q, q reproducir (8.3). Al variar ahora respecto de q obtenemos ˙a = − p ∂H , ∂qa (8.7) que son las ecuaciones dinámicas (8.2). El problema ahora es, dado L encontrar la función H de modo que (8.6), (8.7) sean equivalentes a (8.3), (8.2). Pero esto es precisamente lo que vimos en la seccion anterior. Solo requerimos ˙ ), que al insertar la variable auxiliar p ≡ p(q, q ˙ ) = pa (q, q ˙ )˙ ˙ )). L(q, q qa − H(q, p(q, q (8.8) De esta forma, dado H encontramos L. El inverso es igualmente sencillo, ya ˙ es invertible, que la relación entre p y q ˙ a (q, p) − L(q, q ˙ a (q, p)). H(q, p) = pa q (8.9) Esta función se denomina el hamiltoniano del sistema. Vemos que es precisamente la energía que definimos en (2.57). La única precisión que debemos hacer es que el hamiltoniano es siempre una función de (q, p), de igual forma ˙ ). como el lagrangiano es siempre una función de (q, q La transición de la función L a H, (8.9), se denomina transformación de Legendre, y será posible siempre que pa = ∂L ∂˙ qa sea invertible. Esto también de puede expresar como det ∂2 L 6= 0. ∂˙ qa ∂˙ qb La transición de H a L, (8.8), es exactamente de la misma forma. Ahora debemos pedir que (8.6) sea inverible, o bien, det ∂2 H 6= 0. ∂pa ∂pb 85 Las ecuaciones (8.6) y (8.7) se llaman ecuaciones de Hamilton y son la formulación de primer orden de las de Euler-Lagrange. Veamos un ejemplo. Considere un sistema partículas newtonianas en un potencial, en donde el lagrangiano suele ser de la forma 1 ˙ aq ˙ a − V (q), L = T (q)ab q 2 en que Tij es una matriz simétrica que solo depende de las coordenadas (es lo que ocurre en la mayoría de las coordenadas usuales). El momentum es ˙ b. pa = Tab q Podremos encontrar una formulación hamiltoniana siempre que la matriz Tij sea invertible, ya que en ese caso, ˙ a = (T −1 )ab pb , q (8.10) y el hamiltoniano es ˙a − L H(qa , pb ) = pa q 1 ˙ aq ˙ a + V (q) = (T −1 )ab pb pa − T (q)ab q 2 1 −1 ab (T ) pb pa + V (q). = 2 Las ecuaciones de Hamilton son, primero ˙a = q ∂H = (T −1 )ab pb , ∂pa que es precisamente la expresión (8.10), y segundo, ˙a = − p ∂H 1 ∂ ∂V =− (T −1 )bc pb pc − a . a a ∂q 2 ∂q ∂q (8.11) Estas son precisamente las ecuaciones de Euler-Lagrange. Cuando usamos coordenadas cartesianas, Tab no depende de q, y el lado derecho de (8.11) es simplemente el negativo del gradiente del potencial. Ejercicio 8.1 Encuentre los hamiltonianos y verifique las ecuaciones de Hamilton para los siguientes lagrangianos, 86 1. Una partícula no relativista acoplada a un campo electromagnético, L= m ˙2 ~ · x~˙ − qφ. x~ + qA 2 2. Una partícula relativista truncada en una dimensión, L= m ˙2 m ˙4 x~ + x~ . 2 8 3. Una partícula libre en coordenadas esféricas, 2 2 m 2 2 ˙2 ˙ ˙r + r (θ + sin θφ ) . L= 2 4. Un péndulo de largo l y masa m cuyo punto de suspensión se puede mover sobre la parábola z = ax 2 . 5. Un sistema cuyo lagrangiano es ˙ 21 + L=q 8.3. ˙ 22 q ˙ 21 q ˙ 22 . + k1 q21 + k2 q a + bq21 Termodinámica y Mecánica La transformación de Legendere es una técnica matemática que también tiene mucha utilidad en termodinámica. Esto se debe a que tanto la mecánica como al termodinámica se basan en un principio extremal. En esta última se trata del principio de maximización de la entropía, o lo que es equivalente, la minimización de la energía. Un sistema termodinámico consistente, digamos, de N moléculas de cierto gas de energía total U, volumen V puede describirse por una función entropía S(U, V , N). Si el sistema está dividido en varios subsistemas a través de barreras físicas (pistones, paredes diatérmicas, etc.), entonces los subsistemas se repartirán la energía, el volumen y el número de partículas de modo de maximizar S. Equivalentemente, podemos invertir la relación en favor de la energía U(S, V , N) y formular las termodinámica en términos de ésta. Ahora los subsistemas se reparten S, V , N de modo de minimizar la energía. 87 Esto es muy similar al problema de la mecánica, que se describe con un funcional I[q]. Dado q(t1 ) y q(t2 ), los puntos intermedios q(t), t ∈ (t1 , t2 ) toman los valores que extremizan I[q]. En el caso termodinámico la función U(S, V , N) contiene toda la información del sistema, por lo que recibe el nombre de relación fundamental. La temperaura se define como, ∂U T = . ∂S En ocasiones preferimos trabajar con T como variable independiente, ya que esta es más fácil de medir y controlar que la energía. Así, es de interés encontrar un principio extremal aplicable a una función de (T , V , N). Para esto necesitamos hacer una transición desde U(S, V , N) a otra función F (T , V , N) que contenga la misma cantidad de información (esto es, que sea invertible). Esta transición es precisamente la que nos provee la transformación de Lagrange, ∂U − U. −F (T , V , N) = S ∂S Por convención la energía libre de Helmholtz, F (T ) se define como el negativo de la transformada de Lagrange. Así, F = U − T S, S=− ∂F . ∂T Esto será posible en la medida que T (U) sea invertible. La termodinámica se puede formular en términos de F . Se puede demostrar que el encontrar el estado que minimiza la energía con S, V y N fijos es equivalente a minimizar F con T , V y N fijos. 8.4. Bordes y la incerteza de Heisenberg clásica Al hacer la variación de la acción hamiltoniana (8.12) no reparamos el tratamiento de los términos de borde que aparecen. Note que debido a la integral por partes que hicimos en la variación, Z 0 = δI = dt(Ecuaciones de Hamilton) + pa δqa |tt21 . Para que las ecuaciones de Hamilton den cuenta del extremo de I debemos pedir que qa (t1 ) y qa (t2 ) estén fijos en la variación. Esto es igual que en la variación lagrangiana. En ese caso, sin embargo, el tratamiento es simétrico para las N coordenadas generalizadas qa . En este caso, tenemos 2N coordenadas del espacio de fase, y solo debemos fijar la mitad de ellas. Esto está 88 bien desde el punto de vista dinámico, ya que ahora las ecuaciones son de primer orden, pero no nos permite tratar de igual modo a las coordenadas del espacio de fase. Es el precio que debemos pagar si deseamos trabajar en esta formulación. Podemos, sin embargo, diseñar principios hamiltonianos que nos permitan escoger de distintas maneras las coordenadas que fijaremos. Para hacer esto, basta agregar términos de borde a la acción. Estos no cambiarán las ecuaciones de movimiento, pero sí modificarán nuestras exigencias en los bordes. Por ejemplo, consideremos la acción I 0 = I − pa qa |tt21 . Variando, δI 0 Z dt(Ecuaciones de Hamilton) − δpa qa |tt21 − pa δqa |tt21 + pa δqa |tt21 Z dt(Ecuaciones de Hamilton) − δpa qa |tt21 . = = En este caso, por lo tanto, tenemos que exigir que los pa esten fijos en t1 y t2 si deseamos que las ecuaciones de Hamilton se satisfagan en el extremo de la acción. Note que podemos escribir Z 0 ˙ a − H(q, p)] . I = dt [−qa p (8.12) Podemos también construir un principio de acción mixto, que requiera fijar qa en t1 y pa en t2 . Para esto basta definir I 00 = I + pa (t2 )qa (t2 ), de modo que la variación arroja los términos de borde, − pa δqa |tt21 + δpa (t2 )qa (t2 ) + pa (t2 )δqa (t2 ) = pa (t1 )δqa (t1 ) + δpa (t2 )qa (t2 ). Vemos entonces que I 00 requiere que fijemos qa en t1 y pa en t2 . Podemos diseñar finalmente un principio de acción apropiado para fijar qa en t2 y pa en t2 , I 000 = I − pa (t1 )qa (t1 ). Tenemos así cuatro principios de acción, apropiados para fijar en cada extremo de la trayectoria o bien las coordenadas generalizadas, o bien los momentos. Es fácil construir principios de acción apropiados para otras combinaciones, digamos, un principio de acción para un espacio de fase de cuatro dimensiones, (q1 , q2 , p1 , p2 ), en que fijamos (q1 , p2 ) en t1 y q2 , p1 en t2 . 89 Ejercicio 8.2 Constrúyalo. No podemos, sin embargo, fijar todas las coordenadas del espacio de fase en uno de los extremos. Más aún, no podemos fijar una coordenada y su momentum asociado simultáneamente, ya que p(t1 )δq(t1 ) no es la variación total de ninguna función f (q, p), lo que implica que no hay nada que podamos sumar a I de modo que la variación anule totalmente los términos de borde en un extremo. No podemos fijar simultáneamente el momentum y la posición. Esto se parece mucho al principio de incertidumbre de Heisenberg, que dicta que en mecánica cuántica no es posible medir simultáneamente la posición y el momentum. De hecho, es más que una analogía, es la versi’on clásica de ese principio, y se puede trasladar a su versión cuántica rápidamente utilizando la formulación de integrales de camino de Feynman. Pero esto es materia de otro curso. 8.5. Transformaciones canónicas Una de las ventajas de la formulación lagrangiana era su independencia ˙ a ) se puede escribir en otro sistema de coordenadas. El lagrangiano L(qa , q a de coordenadas generalizadas Q , Z Z Z a a a b a b ˙b ˙ a ), ˙ ) = dtL(q (Q ), q ˙ (Q , Q )) = dtL0 (Q a , Q dtL(q , q ˙ a ) son totalmente equiva˙ a ) y L0 (Q a , Q de modo que los lagrangianos L(qa , q lentes en la descripción del sistema físico en cuestión. Más aún, dado que las coordenadas están fijas en los bordes, podemos sumar términos de bordes a la acción (o, lo que es lo mismo, derivadas totales del tiempo al lagrangiano) y el lagrangiano resultante será igualmente bueno. La formulación hamiltoniana rompe con esta covarianza ya que no podemos aceptar formas arbitrarias de la acción. Si definimos nuevas variables en el espacio de fase, Q a ≡ Q a (qb , pb ) P a ≡ P a (qb , pb ), 90 (8.13) entonces, para que las ecuaciones de Hamilton sean de la forma (8.6), (8.7), la transformación debe ser tal que Z Z a ˙ a − H 0 (Q, P) + términos de borde. ˙ − H(q, p) = dt Pa Q dt pa q (8.14) Esto restringe el conjunto de transformaciones de coordenadas del espacio de fase de forma ostensible. Aquellas que satisfacen (8.14) se llaman transformaciones canónicas. En las nuevas coordenadas, las ecuaciones de Hamilton mantienen su forma, 0 0 ˙ a = ∂H Q ∂Pa ˙ a = − ∂H . P ∂Q a (8.15) Los términos de borde que aparecen en (8.14) solo pueden ser derivadas totales del tiempo, o bien ˙ a − H 0 (Q, P) + d F , ˙ a − H(q, p) = Pa Q pa q dt (8.16) dF = pa dqa − Pa dQ a + (H 0 − H)dt. (8.17) Note ahora que si queremos que el nuevo principio variacional sea consistente con la fijación de las coordenadas Q a en t1 y t2 , entonces más vale que la función F solo dependa de las coordenadas y del tiempo, F ≡ F q(P, Q), Q, t . (8.18) Comparando (8.22) y (8.18) obtenemos, ∂F = pa ∂qa ∂F = −Pa ∂Q a ∂F + H = H0 ∂t (8.19) De este modo hemos obtenido un resultado importante. Dado un principio variacional hamiltoniano, (8.12), apropiado para fijar qa en los extremos de la trayectoria, y dada una función arbitraria de qa , de Q a , y del tiempo t, podemos generar una transformación canónica a una nueva acción hamiltoniana equivalente, con coordenadas (Q a , Pa ) y hamiltoniano H 0 (Q, P) implícitamente definidos por (8.19). La función F (Q, q) se llama la función generadora de la transformación canónica. Es importante subrayar que no cualquier transformación canónica entre principios de acción apropiados para fijar q se puede generar de esta forma. Como ejemplo considere el cambio de escala, qa = αQ a pa = 91 1 a P . α (8.20) Es evidente que el término p˙ q es invariante bajo esta transformación. De hecho, satisface (8.14) sin ningún término de borde. Así, F = 0 en este caso, y no podemos obtener la ecuación (8.22). Es claro además que no existe una función F (q, Q) que pueda dar lugar a (8.20) a través de (8.19). Terminamos esta sección notando que podemos generalizar la construcción de transformaciones canónicas usando funciónes generadoras para los casos en que los principios de acción están diseñados para otro tipo de condiciones de borde. Por ejemplo, supongamos que queremos que en las nuevas coordenadas (Q a , Pa ) sea Pa lo que fijemos en los bordes. En ese caso, reemplazamos (8.16) por ˙ a Q a − H 0 (Q, P) + d G, ˙ a − H(q, p) = −P pa q dt (8.21) en que ahora G debe ser una función de q y de P. Luego, dG = pa dqa + Q a dPa + (H 0 − H)dt. (8.22) Ahora entonces, ∂G = pa ∂qa ∂G = Qa ∂Pa ∂G + H = H 0. ∂t (8.23) En esta familia podemos incluir un cambio de escala (8.20), definiendo G= 1 a q Pa . α Para α = 1, esta transformación corresponde a la identidad, que es evidentemente canónica. Podemos también proceder análogamente para encontrar funciones generadoras que lleven de un principio de acción diseñado para fijar pa a otros para fijar Q a o Pa . Ejercicio 8.3 Encuéntrelas 92 8.6. Ejemplo: el oscilador armónico Hasta ahora todo lo que hemos hecho ha sido bastante formal, por lo que en esta sección analizaremos un ejemplo bien familiar, como es el oscilador harmónico, desde una perspectiva hamiltoniana. Consideremos el lagrangiano m 2 k 2 ˙ − q. L= q 2 2 El hamiltoniano es, H(q, p) = p˙ q−L= p2 k + q2 , 2m 2 de donde obtenemos las ecuaciones de hamilton, ˙= q p ∂H = ∂p m ˙=− p ∂H = −kx. ∂q 2 Es √ útil hacer ahora una transformación canónica de escala, (8.20), con α = km, de modo que obtenemos un nuevo hamiltoniano, r 1 k 2 ¯) = ¯ 2 ), H 0 (¯ q, p (¯ q +p 2 m en que hemos rebautizado a las coordenadas luego de la transformación ¯ yp ¯ entran de igual modo en el hamiltoniano. Las En estas coordenadas q trayectorias son las círculos H =constante, como podemos ver en la figura ˙¯ , p ˙¯ ). En la formuxx. También hemos dibujado algunos vectores velocidad, (q ¯ 0 ), que lación hamiltoniana podemos establecer condiciones iniciales, (¯ q0 , p representan un punto en el espacio de fase. La dinámica de este punto estará dada por las ecuaciones de hamilton, o, como a veces se lo llama, el flujo hamiltoniano, que se representa con el campo de vectores velocidad que vemos en la figura. Considere ahora una transformación canónica generada por la función F (¯ q, Q) = De (8.19) tenemos, de donde cos Q ¯=q ¯ p sin Q ¯= p ¯ 2 cos Q q . 2 sin Q ¯2 1 q P= , 2 sin2 Q √ 2P cos Q ¯= q 93 √ 2P sin Q. Las nuevas coordenadas son una suerte de coordenadas polares en el espacio de fase. El nuevo hamiltoniano, H, es r k H= P. m Aunque sabemos que la transfrmación es canónica por lo que debe dejar ˙¯ , veamos ¯q invariante, salvo por una derivado total del tiempo, el término p explícitamente que esto es cierto, √ √ ˙¯ = ( 2P cos Q) d ( 2P sin Q) = ( 2P cos Q) ¯q p dt √ ˙ √ P ˙ √ sin Q + 2P cos Q Q 2P ˙ ˙ + 2P cos2 Q Q ˙ = d (P cos Q sin Q) + P Q. = cos Q sin Q P dt En este sistema, las ecuaciones de Hamilton son r ˙ = k ˙ =0, Q P m por lo que la solución es inmediata, r k P = P 0 Q = Q0 + t. m Ejercicio 8.4 Encuentre una transformación canónica que lleve el hamiltoniano λ 1 2 2 H= +p q 2 q2 al del oscilador armónico. 8.7. Paréntesis de Poisson Se define el paréntesis o corchete de Poisson entre dos funciones del espacio de fase y del tiempo, f (q, p, t), g(q, p, t) como, {f , g} = ∂f ∂g ∂g ∂h − a . a ∂q ∂pa ∂q ∂pa 94 (8.24) ! Las siguientes propiedades del paréntesis de Poisson hacen que su operación sobre el espacio de fase defina lo que se conoce como un Algebra de Lie. Dadas funciones f , g, h y un real λ, Anticonmutación: Linealidad: {f , g} = −{g, f } {f , g + λh} = {f , g} + λ{f , h}. Regla de Leibniz {f , gh} = g{f , h} + h{f , g}. Identidad de Jacobi, {f , {g, h}} + {g, {h, f }} + {h, {f , g}} = 0. Ejercicio 8.5 1. Demuestre estas propiedades. 2. Demuestre que el conmutador en el espacio de matrices cuadradas de dimensión dada, [A, B] = AB − BA, también satisface estas propiedades. En un sistema Hamiltoniano cuyo espacio de fase se describe con coordenadas (qa , pa ), los corchetes de Poisson de éstas son, {qa , pb } = −{pb , qa } = δba , {qa , qb } = {pa , pb } = 0. (8.25) Las ecuaciones de Hamilton, (8.6), (8.7) se pueden escribir de modo muy conveniente como, ˙ a = {qa , H}, q ˙ a = {pa , H} = 0. p (8.26) Notemos que esta forma de las ecuaciones tienen la propiedad de devolver la simetría entre las coordenadas q y p. Por supuesto, esto es solo aparente, ya que en la misma definición del corchete de Poisson se esconde la distinción entre coordenadas y momenta. 95 Capítulo 9 Estructura Simpléctica La simetría en que qA y pA entran en las ecuaciones de Hamilton una vez definido el corchete de Poisson nos invita a considerar el espacio de fase como una estructura unificada, de 2N coordenadas, en un espíritu similar al que usamos para unificar el tiempo y el espacio para construir el espacio de Minkowski. Así, definimos coordenadas del espacio de fase z A , con A = 1 . . . 2N, y A q Si A = 1 . . . N A z = pA−N Si A = N + 1 . . . 2N De este modo podemos reescribir (8.26) como y (8.25) como z˙A = {z A , H}, (9.1) {z A , z B } = J AB , (9.2) en que la matriz J AB viene dada 1 AB −1 J = 0 por, Si A ≤ N, B = A + N Si A > N, B = A − N Otros casos. (9.3) Para dos funciones cualquiera del espacio de fase, (8.24) toma la forma, {g, h} = J AB ∂g ∂h . ∂z A ∂z B (9.4) La dinámica del espacio de fase viene dada por las ecuaciones (9.1), (9.2), (9.3). Las cooordenadas z A aparecen de manera simétrica en estas ecuaciones. La falta de simetría está ahora escondida en la forma de la matriz J AB , 96 conocida como la matriz simpléctica. Cualquier función del espacio de fase A(q, p, t) evoluciona en el tiempo de acuerdo a ∂f A ∂f ∂f A ∂f ˙ = z + {z , H} + ∂z A ∂t ∂z A ∂t ∂f AB ∂H ∂f J + , = A A ∂z ∂z ∂t ˙f = o bien, 9.1. ˙f = {f , H} + ∂f . ∂t (9.5) El grupo simpléctico Acabamos de ver como el paréntesis de Poisson permite escribir la evolución de cualquier cantidad en el espacio de fase de manera sencilla. La ecuación maestra es (9.5), en que el paréntesis {·, ·} viene dado por (9.4), y J AB es la matriz simpléctica (9.3). Las ecuaciones de Hamilton (9.1) pueden escribirse, ∂H (9.6) z˙A = J AB B . ∂z Si ahora hacemos una transformación general de coordenadas del espacio de fase, z A ≡ z A (ηB , t), las ecuaciones transforman, C ∂z A A ∂z A AB ∂η ∂H ˙ + η =J . ∂ηB ∂t ∂z B ∂ηC (9.7) La transformación es canónica si estas ecuaciones tienen la misma forma que las ecuaciones de Hamilton, es decir, si se puede reescribir como (9.8), ˙ A = J AB η ∂K , ∂ηB (9.8) en que K es el hamiltoniano en las nuevas coordenadas. Comenzaremos analizando esto en el caso en que la transformación no tiene dependencia explícita del tiempo, z ≡ z(η). Este caso, además de ser más simple de analizar, será el más importante y útil en lo que sigue. Por completitud, al final de esta sección analizaremos brevemente el caso general. 97 Dado que z(η) es invertible, (9.7) es en este caso, ˙A = JC D η ∂ηA ∂ηB ∂H . ∂z C ∂z D ∂ηB Por lo tanto, vemos que para que la transformación sea canónica en este caso basta exigir que JCD ∂ηA ∂ηB = J AB ∂z C ∂z D K (η) = H(z(η)). (9.9) (9.10) La primera ecuación nos dice que la matriz simpléctica debe ser invariante ante la transformación. Esto es análogo a lo que ocurría para en la definición de los grupos de rotaciones (3.25), y el de Lorentz (7.9). Las transformaciones canónicas deben dejar invariante la matriz J AB , y por lo tanto también el corchete de Poisson. Éste es el mismo no importa cual sea el set de coordenadas que elijamos, en la medida que estén conectadas por una transformación canńica, A B ∂f ∂g ∂f ∂g C D ∂η ∂η = J A B C D ∂η ∂η ∂z ∂z ∂ηA ∂ηB ∂f ∂g = J AB A B = {f , g}z . ∂z ∂z {f , g}η = J AB Este resultado, ya veremos, también es válido para el caso en que la transformación depende explícitamente del tiempo. La segunda ecuación, (9.10), nos dice que el hamiltoniano transforma como un escalar. Esto no será cierto en el caso en que la transformación depende del tiempo, cosa que podemos preveer de, digamos, las ecuaciones (8.19) cuando la función generadora F depende explícitamente del tiempo. El set de matrices de transformación de 2N × 2N, ∂ηA = M AB ∂z B (9.11) que satisfacen (9.9) forman el llamado grupo simplećtico en 2N dimensiones, Sp(2N). Análogamente a lo que hicimos para otros grupos, ahora estudiaremos transformaciones infinitesimales, ηA = z A + εhA , 98 (9.12) en que ε es un parámetro infinitesimal. Al reemplazar en (9.9) y conservar solo los términos lineales en ε, B A C D A ∂h C D B ∂h ε J δC D + J δD C = 0. (9.13) ∂z ∂z Podemos resolver esta ecuación notando que J AB es una matriz invertible, por lo que, hA = J AB hB , (9.14) para cierto hA . De este modo, (9.13) es ∂hD J AC J BD C ∂z + ∂hD J C B J AD C ∂z =J AC BD J ∂hD ∂hC − D ∂z C ∂z = 0. (9.15) Dado que J AB es invertible, el término entre paréntesis debe anularse. Esto implica, que al menos localmente, existe una función h tal que hA = ∂h . ∂z A (9.16) Reemplazando esto en (9.12), obtenemos que dada una función arbitraria h(z) del espacio de fase, δz A = ηA − z A = εJ AB ∂h , ∂z B es una transformación canónica. En general, por lo tanto, una transformación canónica infinitesimal es generada, localmente, por una función h del espacio de fase a través de δz A = ε{z A , h} (9.17) El grupo simpléctico es de dimensión infinita si lo consideramos actuando en todo el espacio de fase, ya que existen infinitas funciones distintas h. Sin embargo, en cada punto del espacio de fase la matriz de transformación (9.11) es, en el caso infinitesimal, M AB = δBA + εJ AC ∂2 h . ∂z A ∂z B La segunda derivada de h es una matriz simétrica arbitraria de 2N × 2N, por lo que tiene N(2N + 1) parámetros. Decimos que el grupo simpléctico es de dimensión N(2N + 1). Las ecuaciones (9.17) tiene una forma bastante sugerente, ya que es muy similar a las ecuaciones de Hamilton. De hecho, estas últimas las podemos escribir, dz A = dt{z A , H}. 99 Aquí dt es el parámetro infinitesimal. Esta ecuación nos dice que la evolución temporal es una transformación canónica. Algo esperable, ya que las ecuaciones de Hamilton y el paréntesis de Poisson son idénticos para todo tiempo. Terminaremos esta sección mostrando qué sucede cuando la transformación canónica depende explícitamente del tiempo. Para esto, consideremos nuevamente la ecuación (9.7), en la forma ˙A = JC D η ∂ηA ∂z B ∂ηA ∂ηB ∂H . − ∂z C ∂z D ∂ηB ∂z B ∂t (9.18) Reemplacemos la transformación infinitesimal (9.12) en que hA ≡ hA (z, t) depende del tiempo. Para esto es importante notar que a orden ε, la inversa es z A (η, t) = ηA − εhA (η, t), de modo que los términos lineales en ε dan origen a la ecuación ∂hA ∂hD ∂hC ∂H ∂κ A C D BD ˙ =J J η − + = J AB B , C D B ∂z ∂z ∂η ∂t ∂η (9.19) en que hemos definido hA como en (9.14) y K = H + εκ. Note que las transformaciones canónicas se definen independientes de la dinámica. Esto es, si (hA , κ) definen un transformación canónica infinitesimal de un sistema con hamiltoniano H, también lo hacen para cualquier otro. De no ser así, por ejemplo, cualquier transformación independiente del tiempo sería canónica para H = 0. Aunque este no es un ejemplo muy útil, pone de manifiesto la esencia de una transformación canónica: Es una propiedad del espacio de fase, no de la dinámica de un Hamiltoniano particular. De este modo, el término entre paréntesis de la ecuación (9.19) debe anularse independientemente. Esto implica lo que ya anunciamos, que la relación (9.10) se satisface incluso para transformaciones tiempo dependientes. También implica que hA tiene la forma (9.16). De este modo, nos queda que ∂2 h ∂κ ∂hA = J AB B , = J AB B ∂t ∂t∂z ∂η por lo que, κ= ∂h + O(ε). ∂t 100 El hamiltoniano, como ya vimos, no transforma como un escalar ante transformaciones canónicas dependientes del tiempo, sino que de acuerdo a, δH = ε ∂h . ∂t Esta ecuación, junto con (9.17) representan la transformación canónica infinitesimal más general posible. 9.2. Integración de una transformación infinitesimal Al igual como lo hicimos para transformaciones infinitesimales del grupo de rotaciones, podemos integrar, al menos formalmente, la transformación infinitesimal para encontrar una transformación finita. Suponga para esto que h es el generador infinitesimal para cierta transformación canónica. Repitiendo (9.17) podemos encontrar la transformación finita, de manera análoga a lo que hicimos en el Cap. 5 para encontrar los elementos del grupo de rotaciones a partir de las transformaciones infinitesimales. Considere una familia de transformaciones canónicas ηA = ηA (z, ξ), parametrizadas por cierto parámetro ξ, z A (ξ), de modo que ξ = 0 corresponda a la identidad, ηA (z, 0) = z A Cuando ξ es suficientemente pequeño podemos expandir en serie de Taylor, 1 ∂2 η 2 ∂ηA A A ξ+ ξ ξ2 + · · · . (9.20) η (z, ξ) = z + 2 ∂ξ ξ=0 2 ∂ξ ξ=0 Cada una de las derivadas que aquí parecen podemos calcularlas usando (9.17), ya que ∂ηA = {ηA , h(z)}, ∂ξ de modo que ∂2 ηA = {{ηA , h}, h}, 2 ∂ξ y así sucesivamente. De este modo, la expansión (9.20) se escribe 1 ηA (z, ξ) = z A + {ηA , h(z)}0 ξ + {{ηA , h}, h}0 ξ 2 + · · · . 2 101 (9.21) Note que esta expansión es muy similar a la que encontramos en la secci’on 5, el mapa exponencial de los generadores infinitesimales del grupo de rotaciones. De hecho, podemos también escribir la ecuación formalmente, η(ξ) = eξ{·,h} η(0) En que la exponencial queda definida por la expansión (9.21). Note que esto no es solo una notación austera. Al igual que la matriz de 3 × 3, que es una función lineal sobre R3 , el objeto {·, h} es un operador lineal que actúa sobre el conjunto de funciones del espacio de fase. En general, considere la ecuación, dx = Ox, dα en que x(α) es una trayectoria en cierto espacio, y O un operador lineal sobre este. Ésta tiene como solución, x(α) = R(α)x(0), R(α) = eαO . En la expansión en serie entendemos O n como la sucesiva aplicación, n veces, del operador O. 9.3. Teorema de Liouville Supongamos que tomamos un subconjunto del espacio de fase, una región D como en la figura. Cada punto en esta región, en cierto momento t, representa la información completa del sistema y evolucionará desde allí de acuerdo a las ecuaciones de Hamilton. La evolución de cada punto define una evolución de la región, como en la figura xxx. El teorema de Liouville nos dice que el volumen de esta región en el espacio de fase, Z Z dq1 . . . dqN dp1 . . . dpN = d2N z D D es invariante. Para demostrarlo recuerde que la evolución hamiltoniana es una transformación canónica, por lo que, si z A parametriza la región D1 en t1 y ηA la región D2 en t2 , y si ηA (z, t) es la transformación que lleva una región en la otra, A Z Z ∂η 2N A 2N d η= det ∂z B d z . D2 D1 102 Sin embargo, de (9.9) tenemos que A ∂η C D ∂ηB = det J AB . det J ∂z C ∂z D El determinante de la matriz simpléctica es 1, por lo que esto implica que A det ∂η = 1, ∂z B de donde obtenemos el resultado enunciado, Z Z 2N d z= d2N η D1 D2 Por supuesto, este resultado es válido para cualquier transformación canónica, no solo para la evolución hamiltoniana. 9.4. Generadores infinitesimales y sus álgebras Considere el espacio de fase 2N-dimensional (qa , pa ), y el generador G(p, q) = p1 . Este tiene corchetes de Poisson no nulos solo con q1 , y por lo tanto, genera la transformación canónica, δq1 = ε{q1 , G} = ε, δqa6=1 = 0, δpa = 0. Es decir, pa genera una traslación infinitesimal de su coordenada conjugada, qa . Podemos diseñar así generadores de traslaciones de cualquier función Q del espacio de fase. Basta que encontremos una transformación canónica en la que Q sea una de las coordenadas. Su momentum conjugado P será el generador que buscamos. Así por ejemplo, −q1 genera traslaciones infinitesimales de su momentum conjugado p1 . Veamos un ejemplo. Consideremos una partícula no relativista en 3D. Supongamos que queremos buscar un generador de rotaciones entorno al eje z. Si φ es el ángulo de la partícula en el plano (x, y), sabemos que su conjugado es el momentum angular, Jz = py x − px y. 103 Comparando con la discusión en la sección 5.2, notamos que, efectivamente, éste es el generador infinitesimal de rotaciones en torno a z, δx δy δz δpx δpy δpz = = = = = = ε{x, Jz } = ε{x, −px y} = −εy ε{y, Jz } = ε{y, py x} = εx ε{z, Jz } = 0 ε{px , Jz } = ε{px , py x} = −εpy ε{py , Jz } = ε{py , −px y} = εpx ε{pz , Jz } = 0. Podemos generar rotaciones en torno a los ejes x, e y utilizando Jx = pz y − py z, Jy = px z − pz x, respectivamente. Ahora calculemos los corchetes de Poisson entre estos generadores, {Jx , Jy } = {pz y − py z, px z − pz x} = {pz y, px z} + {py z, pz y} = px y − py x = Jz Si ahora hacemos los otros dos corchetes, llegaremos a que {Ji , Jj } = εijk J k (9.22) Ejercicio 9.1 Demuestrelo. Una cosa interesante de la expresión (9.22) es que nos muestra que los generadores J i forman un subálgebra de Lie del álgebra funciones del espacio de fase. Note además, que la expresión (9.22) es idéntica a (5.13) (Hay un signo menos de diferencia ya que aquí escogimos la orientación inversa, J → −J ). A pesar de que en un caso se trata de conmutadores de matrices y en otro de corchetes de Poisson de generadores en el espacio de fase, el isomorfismo entre las dos expresiones no es casual. En ambos casos J i 104 representa un generador infinitesimal del grupo de rotaciones SO(3). En un caso, sin embargo, el generador es una matriz que actúa sobre un vector del espacio euclídeo, δ~ x = εJi x~, en el otro es una función actuando sobre las coordenadas del espacio de fase a través del corchete de Poisson, δz A = ε{z A , J i }. Ambos generadores deben satisfacer el mismo álgebra ya que la información que ésta contiene sobre el grupo de rotaciones es más fundamental que el espacio en que sus elementos actúen. Para entenderlo, suponga que hacemos cuatro rotaciones infinitesimales. Primero una generada por J i con parámetro ε1 y luego una generada por J j , y parámetro ε2 . Luego haremos las operaciones inversas, esto es, una rotación generada por J i con parámetro −ε1 y posteriormente una generada por J j , -ε2 . Independiente de si estas rotaciones son hechas sobre el espacio de configuración o sobre el espacio de fase, podemos escribirlas como una sucesión de cuatro operadores lineales, x 0 = R4 R3 R2 R1 x, utilizando la notación del final de la sección 9.2. Ahora expandimos hasta segundo órden en los parámetros infinitesimales ε1 , ε2 , cosa necesaria pues será el orden más bajo que no se anula, 1 2 2 1 2 2 0 x = 1 − ε2 Oj + ε2 Oj 1 − ε1 Oi + ε1 Oi 2 2 1 2 2 1 2 2 1 + ε2 Oj + ε2 Oj 1 + ε1 Oi + ε1 Oi x 2 2 = x − ε1 ε2 Oi Oj − Oj Oi x. Por lo tanto, el efecto total de esta secuencia de transformaciones es al orden más pequeño, δx = −ε1 ε2 Oi , Oj . (9.23) En el caso en que actuamos sobre el espacio de configuración, Oi son las matrices Ji , y el lado derecho de (9.23) corresponde a un conmutador de matrices. En el caso en que actuamos en el espacio de fase Oi = {·, Ji }, por lo que, δz A = −ε1 ε2 {{z a , J i }, J j } − {{z a , J j }, J i } = −ε1 ε2 {z A , {J i , J j }}, 105 en donde en el último paso usamos la identidad de Jacobi. Vemos entonces que si en el espacio de configuración la combinación de las cuatro rotaciones en consideración es generada por [Ji , Jj ], entonces en el espacio de fase lo será por {J i , J j }. Note que en ningún momento hemos utilizado las propiedades particulares del grupo de rotaciones. Podemos afirmar por lo tanto que, en general, cualquier álgebra de generadores infinitesimales que construyamos en el espacio de configuración tendrá una representación isomorfa en el espacio de fase. 9.5. Simetrías y cantidades conservadas Considere una cantidad conservada en el espacio de fase Q(z), que no depende explícitamente del tiempo, dQ = {Q, H} = 0. dt Vemos que la característica de una cantidad conservada de este tipo es que tiene corchetes de Poisson nulos con el Hamiltoniano. Otra forma de decir lo mismo, es que bajo la transformación canónica infinitesimal que genera el Hamiltoniano, esto es, el flujo Hamiltoniano, la cantidad Q es invariante, dQ = ε{Q, H} = 0. (9.24) Esta expresión se puede también leer a la inversa, en el sentido que bajo la tranformación canónica generada por Q, el Hamiltoniano es invariante, dH = ε{H, Q} = 0. (9.25) Estas dos ecuciones representan el teorema de Noether en su versión Hamiltoniana. En efecto, recordemos la forma del principio de acción en forma Hamiltoniana, Z ˙ a − H) . dt (pa q Toda transformaci’on canónica deja invariante el primer término, salvo por posibles términos de borde. Si además el generador de la transformación tiene corchetes de Poisson nulos con el Hamiltoniano, el segundo tambi’en es invariante de acuerdo con (9.25). La acción es invariante salvo términos de borde, por lo que la transformación generada por Q es una simetría. La expresión {Q, H} = 0 nos dice, por lo tanto, que Q es un generador de simetría, y, simultáneamente, que Q es una cantidad conservada. 106 9.6. La teoría de Hamilton-Jacobi Hemos visto que los sistemas mecánicos con N grados de libertad satisfacen N ecuaciones diferenciales ordinarias de segundo orden (ecuaciones Lagrangianas), pero que podemos también escribirlas en términos de 2N variables que satisfacen 2N ecuaciones de primer orden (ecuaciones Hamiltonianas). Una tercera manera, matemáticamente, equivalente de formular el problema, es a través de una única ecuación diferencial, en N + 1 derivadas parciales: la ecuación de Hamilton-Jacobi. Para encontrarla, recuerde que la evolución es una transformación canónica, por lo que debe existir una que lleve cualquier punto del espacio de fase en cualquier tiempo t, z A (t), a sus valores iniciales en t = 0, Z0A (t) = z A (0). Evidentemente, estas nuevas variables satisfacen Z˙0A = 0. Por lo tanto, el hamiltoniano transformado debe anularse. Considere una función generadora S que depende de (qa , Pa ), como la descrita en (8.23). En este caso las coordenadas Z0A = (Q a , Pa ) representan los valores iniciales en t = 0, y H 0 = 0, de donde, ∂S = pa , ∂qa ∂S = Qa, ∂Pa ∂S + H = 0. ∂t (9.26) Encontrar S(q, P, t) que satisfaga la tercera ecuación es equivalente a encontrar la solución general a las ecuaciones de movimiento. Esto eimplica resolver, ∂S ∂S + H q, a = 0. (9.27) ∂t ∂q Ésta es la ecuación de Hamilton-Jacobi. Podríamos también haber elegido una función generadora S 0 (q, Q, t), que dependa de las coordenadas qa en t y de las condiciones iniciales en t = 0, Q a , como la descrita en (8.19). La ecuación de Hamilton-Jacobi resultante será la misma, salvo porque en ese caso ∂S 0 = −Pa . ∂Q a Pero en realidad ambas funciones generadoras darán origen a una descripción equivalente. Al resolver (9.27) , una ecuación de primer orden en N + 1 variables, encontraremos N + 1 constantes de integración. Una de estas es trivial, ya que en la ecuación solo aparecen derivadas de S, por lo que siempre podemos sumar una constante aditiva. Así, podemos identificar las N 107 constantes no triviales con los N momentum en t = 0, Pa . Del mismo modo, podemos identificarlas con los Q a , que también son constantes. Una vez que tenemos S(q, P, t), podemos encontrar la solución general de las ecuaciones, resolviendo las dos primeras relaciones en (9.26) en favor de qa y pa . Veamos el ejemplo más sencillo: la partícula libre no relativista en una dimensión, 1 2 p. H= 2m La ecuación de Hamilton-Jacobi es 2 ∂S 1 ∂S + = 0. (9.28) ∂t 2m ∂q Probando con S = αt + βq, obtenemos α=− β2 , 2m y β2 t + βq. 2m Ahora identificamos P con β. Esta no es la única posibilidad, pero es la que adoptaremos, P2 S(q, P) = − t + Pq, 2m de donde S=− ∂S =P ∂q ∂S P Q = = − t + q, ∂P m p = de donde obtenemos la solución general, q=Q+ P t, m 108 p = P. Ejercicio 9.2 Resuelva el oscilador armónico en una dimensión, H= α 2 q + p2 , 2 en el formalismo de Hamilton-Jacobi. 109
© Copyright 2025