Logo Studenta

clase 10 y 11

¡Este material tiene más páginas!

Vista previa del material en texto

10. Principio de Hamilton
Clase 10: jueves 16 de abril
Clase 11: martes 21 de abril
Todo camino puede andar, todo
puede andar
Spinetta
A lo largo de las clases pasadas hemos estudiado el formalismo de Lagran-
ge de la dinámica clásica. Las ventajas respecto al de Newton son muchas:
i) en Lagrange nos olvidamos de las fuerzas de v́ınculo; ii) escribimos las
ecuaciones de movimiento en función de coordenadas generalizadas que re-
presentan fielmente los grados de libertad; iii) es una teoŕıa en la cual una
única función escalar –la lagrangeana– encierra toda la información del sis-
tema; iv) la relación entre simetŕıas y principios de conservación es directa.
Sin embargo, los principios que dieron origen a las ecuaciones de Lagran-
ge –principios de los trabajos virtuales y de D’Alembert- comparten con
la segunda ley de Newton el hecho de ser principios diferenciales. Esto es,
principios cuyos enunciados dicen algo aśı “nos concentramos en un dado
instante de tiempo, en dicho instante conocemos dónde están y qué veloci-
dades tienen las part́ıculas de nuestro sistema, el principio diferencial nos
permite conocer que ocurrirá en un instante posterior utilizando desplaza-
mientos infinitesimales respecto a la configuración inicial (desplazamientos
reales en Newton, virtuales en Lagrange)”. Cualquier algoritmo numérico
que usemos para resolver las ecuaciones de movimiento ilustra muy bien
este punto: partiendo de unas dadas condiciones iniciales, arbitrarias, y sa-
biendo cuales son las fuerzas o la lagrangeana que gobiernan la dinámica,
instante a instante vamos calculando las posiciones de las part́ıculas del sis-
tema. En esta clase veremos que hay otro tipo de principios, los llamados
principios integrales. Estos son enunciados sobre propiedades globales de la
trayectoria del sistema, en general se requiere que la trayectoria minimice
determinada cantidad. Debido a esta caracteŕıstica, los principios integra-
les también son llamados principios variacionales. Por lo tanto, mientras los
principios diferenciales son locales en el tiempo –sólo importa un instante–,
los principios integrales son globales –importa todo un intervalo de tiempo.
Podemos encontrar ejemplos muy cotidianos de principios integrales, por
ejemplo, la ley de “mı́nimo esfuerzo”, que nos dicta que para alcanzar un
determinado objetivo, antes debemos tener una mirada global del problema
para luego minimizar el esfuerzo. Los principios integrales en la f́ısica tienen
una larga historia, una historia que arranca much́ısimo antes que la de los
87
principios diferenciales. Hace más de dos mil años Herón de Alejandŕıa en-
cuentra la ley de reflexión de la luz a partir proponer que la luz, para ir de
un punto a otro reflejándose en un espejo, sigue el camino que le demande
menos tiempo. Fermat en 1657 utiliza este mismo principio de menor tiempo
para encontrar la ley de Snell. A fines del siglo XVIII se desarrolla el cálculo
variacional necesario para este tipo de principios. En 1788 Lagrange aplica
un principio integral para deducir, de manera alternativa al PTV, sus ecua-
ciones de movimiento. Originalmente llamado principio de mı́nima acción,
hoy en d́ıa lo conocemos con el nombre de principio de Hamilton y será el
tema de la clase de hoy.
10.1. Cálculo variacional
Dećıamos que los principios integrales enuncian propiedades globales de
las trayectorias, por ejemplo, el camino que sigue la luz para ir desde 1
hasta 2 es aquél que minimiza el tiempo necesario para unir ambos puntos.
Existen infinitos caminos posibles que puede seguir un rayo para unir esos
dos puntos, la naturaleza ’elige’ aquel que minimiza el tiempo de viaje.
10.1.1. Funcionales
Habiendo enunciado un principio variacional de este tipo ¿cómo se puede
calcular la trayectoria que efectivamente sigue el rayo? La matemática in-
volucrada para este tipo de problemas es el cálculo variacional, desarrollado
principalmente por Euler (1766). El tiempo de recorrido desde 1 hasta 2 de-
pende evidentemente de la trayectoria Γ1→2 seguida por el rayo, y podemos
escribirlo como un funcional 24
tiempo1→2 = t[Γ1→2], (10.1)
funcional llamaremos a toda transformación que se aplica sobre una función
y cuyo resultado es un número, en este caso un número real positivo. Su-
pongamos que la luz se está propagando en un medio no homogéneo, en el
cual la velocidad de la luz depende punto a punto,
v(r) =
dr
dt
.
Teniendo en cuenta que |dr| es igual al diferencial de longitud ds a lo largo
de la trayectoria del rayo, tenemos (v(x, y) es el módulo de la velocidad)
dt =
ds
v(x, y)
. (10.2)
24Al argumento de un funcional (argumento que es una función) lo encerraremos entre
corchetes [· · · ], para diferenciarlo del caso de las funciones, en las cuales el argumento (en
este caso, un número) se encierra entre paréntesis (· · · ).
88
El tiempo de recorrido se puede escribir entonces como una integral de ĺınea
t[Γ1→2] ≡
∫ t2
t1
dt =
∫ 2
1
ds
v(x, y)
=
∫ 2
1
√
dx2 + dy2
v(x, y)
. (10.3)
Pasamos de la integral de ĺınea a una integral en x sacando dx como factor
común
t[Γ1→2] =
∫ x2
x1
√
1 +
(
dy
dx
)2
v(x, y)
dx. (10.4)
La aplicación del principio de mı́nimo tiempo de recorrido implica la mini-
mización del funcional tiempo t[Γ1→2], es decir, debemos encontrar, entre las
infinitas trayectorias posibles que existen, la trayectoria Γ1→2 ’f́ısica’, la que
minimiza al funcional tiempo. En el caso de funciones, f : R → R, sabemos
como proceder a la hora de buscar puntos extremos: calculamos la derivada
de la función df/dx y buscamos los valores reales para los cuales se anula
esta derivada. Veamos como proceder en el caso de los funcionales.
De manera general definimos el funcional I
I : F → R (10.5)
y → I[y]
siendo F un dado espacio de funciones. Por ejemplo, el funcional delta de
Dirac es δ[y] = y(0): dada una función como argumento la salida es el valor
de la función en el origen.
Vamos a considerar especialmente un funcional definido mediante una
integral de la forma
I[y] =
∫ x2
x1
F (y′, y, x)dx, (10.6)
donde y = y(x) es una función de la variable independiente x, y′ = dy/dx es
su derivada y F es una función de tres variables, a la que llamaremos núcleo
de la integral. Este tipo de funcionales es el que aparece en el principio de
Hamilton. En el ejemplo del rayo de luz, el funcional tiempo de recorrido es
de la forma anterior, con la función núcleo
F (y′, y, x) =
√
1 + y′2
v(x, y)
. (10.7)
10.1.2. Variaciones
Variaciones de una función
Consideremos una función y(x) definida en el intervalo [x1, x2]. Para
cada x desplazamos la función y(x) en una cantidad infinitesimal arbitraria
δy(x), con la condición que en los extremos x1 y x2 el desplazamiento es
89
nulo, es decir, δy(x1) = δy(x2) = 0. δy(x) recibe el nombre de variación de la
función y(x). Podemos pensarla como un simple desplazamiento “virtual” de
la función y(x) (lo llamaremos virtual por analoǵıa con los desplazamientos
virtuales de las coordenadas generalizadas, aunque la variable independiente
x no necesariamente es el tiempo). Luego del desplazamiento δy(x) tenemos
una nueva función
ỹ(x) ≡ y(x) + δy(x),
que llamaremos ’función variada’ y cumple la condición de ’extremos fijos’:
ỹ(x1) = y(x1), ỹ(x2) = y(x2). En la figura 10.1 vemos un esquema de estas
funciones.
Variaciones de la derivada
Notemos que cuando variamos la función y(x) → ỹ(x), también cambia
su derivada
y′(x) → ỹ′(x) ≡ dỹ(x)
dx
= y′(x) +
d
dx
δy(x). (10.8)
Se suele notar la última derivada de esta forma
δy′(x) ≡ d
dx
δy(x), (10.9)
a partir de considerar que los infinitesimales δ y d corresponden a corrimien-
tos en distintas direcciones (uno corresponde a desplazamientos reales en la
dirección x, el otro virtuales a x fijo) y es posible, por lo tanto, conmutarlos:
d
dt
δ = δ
d
dt
. (10.10)
Otro argumento a favor de este intercambio es que la definición más natural
de variación de la derivada, δy′(x), es la diferencia
δy′(x) ≡ỹ′(x)− y′(x) = d
dx
δy(x). (10.11)
Sin embargo es necesario tener cierta cautela para evitar confusiones. Aśı
como δy(x) representa correr arbitrariamente la función y(x) a valor de
x fijo, la notación δy′(x) pareciera corresponder también a una variación
virtual arbitraria de la derivada de y. Sin embargo, de la ecuación (10.9)
resulta claro que ello no es aśı: δy′ tiene que ver con cómo cambian los
desplazamientos δy(x) de un punto x a otro, y no con un desplazamiento
virtual arbitrario de la derivada y′.
Variación de una función de funciones
Podemos definir también la variación de funciones que dependen a su vez
de la función y(x) y de su derivada y′(x). Por ejemplo, tomemos la función
F de (10.6), su variación de manera natural se define como
δF (y′, y, x) ≡ F (y′ + δy′, y + δy, x)− F (y′, y, x). (10.12)
90
~ y(x)
y(x)δ
21
1
y(x)
y(x )
y(x )2
x x
x
Figura 10.1: Variaciones de la función y(x) en el intervalo [x1, x2].
Variación de un funcional
Dada la variación δy de la función y, definimos la variación del funcional
I[y] como
δI[y] ≡ I[y + δy]− I[y]. (10.13)
En el caso del funcional (10.6) la variación es
δI[y] =
∫ x2
x1
F (y′ + δy′, y + δy, x)dx−
∫ x2
x1
F (y′, y, x)dx = (10.14)
=
∫ x2
x1
[
F (y′ + δy′, y + δy, x)− F (y′, y, x)
]
dx =
∫ x2
x1
δF (y′, y, x)dx.
Encontramos aqúı que las operaciones variación e integración se pueden
intercambiar:
δ
∫
=
∫
δ. (10.15)
10.1.3. Valores estacionarios de un funcional
Volvamos a nuestro objetivo: queremos encontrar funciones que extre-
mizan un dado funcional, la estrategia para ello consistirá en tomar una
función y(x) en particular, evaluar el funcional I en y(x), I[y]; luego des-
plazar virtualmente la función y → ỹ = y + δy, evaluar el funcional en la
función variada I[ỹ] y calcular la variación del funcional δI[y]. Si y es una
función extremal del funcional I la variación δI[y] debe ser nula a primer
orden en el desplazamiento infinitesimal arbitrario δy. Ésta última propie-
dad la tomamos prestada de lo que ocurre con los puntos estacionarios de
91
una función cualquiera: si x0 es un punto extremal de f(x) entonces vale
f ′(x0) = 0 o, lo que es lo mismo, f(x) = f(x0) +O((x− x0)2) para x cerca
de x0 en virtud de que el término lineal del desarrollo de Taylor alrededor
de x0 se anula.
Para aplicar estas ideas, sin recurrir a conceptos más sofisticados del
cálculo variacional, hacemos la siguiente parametrización de la variación de
la función y(x)
δy(x) = εη(x), (10.16)
donde ε es un infinitésimo y η(x) es una función del mismo orden que y(x).
La condición de extremos fijos se traduce en η(x1) = η(x2) = 0 y La variación
de la derivada es δy′(x) = εη′(x).
Consideremos el funcional (10.6) con su variación (10.14), como ε es un
infinitésimo podemos desarrollar Taylor la función F en sus dos primeras
variables:
δF (y′, y, x) ≡ F
(
y′ + εη′, y + εη, x
)
− F (y′, y, x) = (10.17)
= ε
[
∂F
∂y′
∣∣∣∣
ε=0
η′ +
∂F
∂y
∣∣∣∣
ε=0
η
]
+O(ε2).
Por lo tanto, la variación del funcional I es 25
δI[y] = ε
∫ x2
x1
[
∂F
∂y′
η′ +
∂F
∂y
η
]
dx+O(ε2). (10.18)
Integramos por parte la primera integral,∫ x2
x1
∂F
∂y′
η′dx =
∂F
∂y′
η
∣∣∣∣2
1
−
∫ x2
x1
d
dx
(
∂F
∂y′
)
η dx. (10.19)
Los términos de los extremos se anulan por la condición de extremos fijos.
Queda entonces
δI[y] = ε
∫ x2
x1
[
− d
dx
∂F
∂y′
+
∂F
∂y
]
η(x) dx+O(ε2) (10.20)
Por analoǵıa con el desarrollo de Taylor de una función f alrededor de x0,
∆f(x0) ≡ f(x0 + ε)− f(x0) = εf ′(x0) +O(ε2),
definimos una derivada funcional
∂I[y]
∂ε
≡ ĺım
ε→0
δI[y]
ε
=
∫ x2
x1
[
− d
dx
∂F
∂y′
+
∂F
∂y
]
η(x) dx. (10.21)
25Por simplicidad, a partir de ahora dejamos de explicitar que las derivadas parciales
están evaluadas para ε = 0.
92
Como dijimos antes, x0 es un valor extremal de una función f si la diferencia
∆f(x0) es nula a primer orden en la desviación ε respecto a x0. De manera
análoga, diremos que la función y(x) es un punto extremal del funcional I,
o que el funcional tiene un valor estacionario para dicha función, si vale
∂I[y]
∂ε
∣∣∣∣
y=y(x)
= ĺım
ε→0
δI[y]
ε
= 0. (10.22)
Para el caso de nuestro funcional la condición de punto extremal es entonces
δI[y]
ε
=
∫ x2
x1
[
− d
dx
∂F
∂y′
+
∂F
∂y
]
η(x) dx = 0 (10.23)
Como η(x) es una función arbitraria, la integral será nula solamente si la
función y(x) satisface la denominada ecuación de Euler (1766)
d
dx
∂F
∂y′
− ∂F
∂y
= 0. (10.24)
Obtenemos aśı la solución buscada, la función y = y(x) que satisfaga la ecua-
ción de Euler será aquella para la cual el funcional toma un valor estaciona-
rio. Por supuesto, si queremos saber si el valor estacionario es un mı́nimo,
máximo o punto de ensilladura, debeŕıamos poder calcular el equivalente a
una derivada segunda. Afortunadamente, en el principio de Hamilton úni-
camente interesa la condición de valor estacionario, sin importar qué caso
en particular es.
La ecuación de Euler se generaliza de manera directa para el caso de
funcionales que dependen de más de una función, por ejemplo,
I[y1, · · · , yn] =
∫ xb
xa
F (y′1, · · · , y′n, y1, · · · , yn, x)dx. (10.25)
Procediendo de manera idéntica a como ya lo hicimos, si las n funciones
yi son linealmente independientes, es decir, no existen v́ınculos entre ellas,
llegamos a que el funcional toma un valor estacionario cuando las n funciones
yi satisfacen el sistema de n ecuaciones de Euler
d
dx
∂F
∂y′i
− ∂F
∂yi
= 0 y = 1, · · · , n. (10.26)
Veamos algunos ejemplos de cálculo variacional
Ejemplo 10.1 (Propagación de los rayos de luz)
Retomando el caso del principio de propagación de la luz, el cual establece
que el tiempo que tarda un rayo para ir desde 1 a 2 es el menor posible, la
función núcleo de la integral es (10.7) y la ecuación de Euler resulta
d
dx
(
y′√
1 + y′2v(x, y)
)
− ∂
∂y
(√
1 + y′2
v(x, y)
)
= 0. (10.27)
93
La dificultad para resolver esta ecuación estará dada por las propiedades del
medio de propagación, esencialmente la dependencia de la velocidad de la
luz con la posición r. Por ejemplo, si el medio es homogéneo, v(x, y) = cte,
entonces la ecuación de Euler se resuelve fácilmente: y′ = cte. El rayo de luz
que pasa por los puntos 1 y 2, de coordenadas (x1, y1) y (x2, y2), se propaga
en ĺınea recta, y su ecuación es
y(x) =
x2 − x1
y2 − y1
(x− x1) + y1.
Ejemplo 10.2 (Geodésicas sobre la superficie de un cilindro)
Queremos encontrar la curva de menor longitud sobre la superficie de un
cilindro de radio R que une los puntos 1 y 2. Naturalmente, usaremos coor-
denadas ciĺındricas ρ, ϕ, z. La ecuación de la superficie del cilindro es ρ = R,
y las coordenadas de los puntos extremos 1 y 2 son (R, z1, ϕ1) y (R, z2, ϕ2),
respectivamente. El diferencial de longitud sobre esta superficie es
ds =
√
R2d2ϕ+ d2z. (10.28)
Busquemos la ecuación de la geodésica como una función z(ϕ). Entonces la
funcional longitud es
L[z(ϕ)] =
∫ 2
1
ds =
∫ 2
1
√
R2d2ϕ+ d2z =
∫ ϕ2
ϕ1
√
R2 +
(
dz
dϕ
)2
dϕ. (10.29)
La función F resulta
F (z′, z, ϕ) =
√
R2 + z′2, (10.30)
y la ecuación de Euler
∂F
∂z
− d
dϕ
∂F
∂z′
= 0 ⇒ ∂F
∂z′
=
z′√
R2 + z′2
= cte ⇒ z′ = cte. (10.31)
Por lo tanto, la geodésica que pasa por los puntos 1 y 2 es una hélice de
ecuación
z =
z2 − z1
ϕ2 − ϕ1
(ϕ− ϕ1) + z1. (10.32)
Ejemplo 10.3 (Braquistócrona: el tobogán más rápido)
Uno de los Bernoulli, Juan, allá por junio de 1696 desafió a sus colegas a
resolver este problema: Dados los puntos 1 y 2 en un plano vertical, ¿cúal
es la curva que los une por la cual una part́ıcula desciende en el menor
tiempo posible bajo la acción de la gravedad terrestre? Esa curva se llama
braquistócrona (’curva del descenso más rápido’) y el problema planteado
por Bernoulli dió origen al cálculo de variaciones. En unos pocos meses,
respondieron al desaf́ıo: Tschimhaus, L’Hopital, Jacobo Bernoulli, Leibniz y
un tal Isaac Newton. Algo fuera de tiempo, aceptamos el desaf́ıo y veremosqué curva es la braquistócrona.
94
Por simplicidad asumimos que el punto 1 coincide con el origen de coor-
denadas y que la part́ıcula inicialmente está en reposo, luego se la suelta y
comienza a caer hacia el punto 2. Al igual que en el caso de la propagación
del rayo de luz, relacionamos tiempo y distancia mediante
dt =
ds
v(r)
, (10.33)
donde v(r) es el módulo de la velocidad de la part́ıcula. El tiempo es un
funcional de la curva y(x) que sigue la part́ıcula para ir desde el origen al
punto 2;
t[y] =
∫ 2
1
ds
v(r)
(10.34)
Necesitamos conocer como depende la velocidad con r, para ello recurrimos
a la conservación de la enerǵıa
E =
1
2
mv(r)2 −mgy ⇒ v(r) =
√
2gy, (10.35)
donde hicimos uso de las condiciones iniciales (E = 0). Buscamos una
solución y = y(x), el funcional tiempo se escribe entonces como
t[y] =
∫ x2
0
√
1 + y′2
2gy
dx. (10.36)
La función núcleo del funcional es en este caso
F (y′, y, x) =
√
1 + y′2
2gy
. (10.37)
Notemos que esta función no depende de la variable independiente x, de
manera completamente análoga a como se demostró la conservación de la
hamiltoniana cuando la lagrangeana no depend́ıa del tiempo, acá podemos
demostrar (les queda como ejercicio) que se conservará la función
G =
∂F
∂y′
y′ − F = cte. (10.38)
Por lo tanto, tenemos la ecuación
y′2√
2gy(1 + y′2)
−
√
1 + y′2
2gy
= cte, (10.39)
trabajándola se llega a
y
2
(
1 + y′2
)
= R, (10.40)
95
donde R es una constante positiva que contiene a g 26. Esta ecuación se
resuelve de más de una manera, la más simple es hacerlo paramétricamente.
Proponemos
y′ = cot
Θ
2
, (10.41)
usando trigonometŕıa llegamos a
y = R (1− cosΘ) . (10.42)
Nos falta encontrar x en función de Θ. Para ello derivamos la expresión
anterior respecto a x y usamos (10.41)
dy
dx
= R sinΘ
dΘ
dx
= cot
Θ
2
, (10.43)
de donde resulta
dx = R (1− cosΘ) dΘ, (10.44)
relación que integrándola nos da
x = R (Θ− sinΘ) . (10.45)
x
1
y
2
x
x
x
Figura 10.2: La braquistócrona es la curva de descenso más rápido desde 1
hasta 2. Coincide con la curva generada por el punto x en el borde del disco
punteado, a medida que el disco rueda perfectamente sobre el eje horizontal.
Llegamos entonces a la expresión paramétrica de la curva braquistócrana
x = R (Θ− sinΘ) , y = R (1− cosΘ) . (10.46)
¿Qué curva es ésta? Se reconoce en esta expresión a la curva cicloide, que se
muestra en la figura (10.2). La cicloide es la curva que describe un punto del
borde de un disco de radio R que rueda sin deslizar a lo largo del eje x. El
radio R está determinado por la condición de que el punto 2, de coordenadas
(x2, y2) pertenezca a la curva, condición que debe resolverse numéricamente.
Si x2/y2 > π/2 se da el resultado llamativo que el punto 2 esté por arriba
del mı́nimo de la curva.
26¡La elección de esta constante es porque conocemos la respuesta de antemano!
96
10.2. Principio de Hamilton y ecuaciones de Lagrange
When I was in high school, my physics teacher -whose name was Mr. Bader-
called me down one day after physics class and said, ’You look bored; I want to tell
you something interesting.’ Then he told me something which I found absolutely
fascinating, and have, since then, always found fascinating. Every time the subject
comes up, I work on it. In fact, when I began to prepare this lecture I found myself
making more analyses on the thing. Instead of worrying about the lecture, I got
involved in a new problem. The subject is this -the principle of least action.
Feynman, Lectures Vol 2, Cap. 19
Veamos ahora cómo las ecuaciones de Lagrange pueden obtenerse a par-
tir de un principio integral. Definimos la acción S como el funcional de la
trayectoria en el espacio de configuraciones, q(t)27, dado por la integral de
la lagrangeana:
S[q(t)] =
∫ t2
t1
L(q̇(t), q(t), t)dt. (10.47)
El principio de Hamilton (1834) enuncia que la acción S toma un valor
estacionario para la trayectoria real del sistema:
Principio de Hamilton δS = δ
∫
Ldt = 0. (10.48)
El principio sólo pide valor estacionario de la acción, no necesariamente
un mı́nimo, aun aśı el principio de Hamilton suele llamarse comunmente
como el principio de mı́nima acción. Si el sistema mecánico es holónomo, es
decir, las n coordenadas generalizadas son linealmente independientes, las
ecuaciones de Euler (10.24) del problema variacional de la acción no son más
que las ecuaciones de Lagrange. Simplemente debemos identificar:
x → t, yi(x) → qi(t), y′i(x) → q̇i(t), F (y′, y, z) → L(q̇, q, t),
y las ecuaciones de movimiento que resulta son:
d
dt
∂L
∂q̇j
− ∂L
∂q
= 0 j = 1, · · · , n (10.49)
A causa de esta deducción alternativa de las ecuaciones de Lagrange, usando
las ecuaciones de Euler del cálculo variacional, a las ecuaciones de movimien-
to se las suele llamar también como ’ecuaciones de Euler-Lagrange’.
El hecho de que la trayectoria real extremice S da relevancia f́ısica a la
acción, y en consecuencia a la función lagrangeana. Al decir de Feynman el
27Como siempre, q(t) simboliza el conjunto de coordenadas generalizadas {qj(t)}nj=1.
97
sistema ’testea’ el valor de la acción en los infinitos caminos f́ısicamente posi-
bles y elige aquel para el cual S es mı́nima 28 L deja de ser una mera función
auxiliar –aunque muy importante ya que contiene todos los ingredientes del
sistema– para pasar a ser la esencia de la acción.
Notemos que el principio de Hamilton se basa en la integral de la lagran-
geana, por lo tanto, si queremos aplicar este principio a un sistema necesi-
tamos que las fuerzas involucradas deriven de un potencial (si es común o
generalizado no importa), que sean ’monogénicas’ al decir de Lanczos. De
esta manera todas las interacciones están contenidas en la función lagran-
geana. Esto impide que sistemas con fuerzas disipativas puedan ser tratados
con el principio de Hamilton tal como lo presentamos, aunque en la lite-
ratura se sigue discutiendo generalizaciones del principio de Hamilton para
sistemas disipativos.
Ejemplo 10.4 (¿Mı́nima acción?)
Morin 6.2 p.225
Al principio de Hamilton suele llamárselo principio de mı́nima acción y
se dice entonces que la trayectoria f́ısica del sistema minimiza la acción. De
manera bastante general, para intervalos de tiempo [t1, t2] suficientemente
cortos la acción presenta efectivamente un mı́nimo para la trayectoria f́ısica,
mientras que para intervalos mayores puede tener un punto de ensilladura.
Veremos un ejemplo de ello en lo que sigue.
Consideremos la lagrangeana de un oscilador armónico
L =
1
2
mẋ2 − 1
2
kx2. (10.50)
La trayectoria f́ısica, x0(t), da un valor estacionario de la acción, y satisface
entonces la ecuación de Lagrange
d
dt
∂L
∂ẋ
− ∂L
∂x
= 0
∣∣∣∣
x(t)=x0(t)
⇒ mẍ0 + kx0 = 0. (10.51)
Hagamos ahora un desplazamiento virtual de la trayectoria
x̃(t) = x0(t) + ξ(t), ξ(t1) = ξ(t2) = 0, (10.52)
y calculemos la acción para este nuevo camino
S[x̃] =
∫ t2
t1
[
1
2
m
(
ẋ0 + ξ̇
)2
− 1
2
k (x0 + ξ)
2
]
dt =
∫ t2
t1
[
1
2
mẋ20 −
1
2
kx20
]
dt+
28En su tesis doctoral Feynman extendió esta idea a la mecánica cuántica mediante el
desarrollo de su “integral de camino”. En su teoŕıa se puede interpretar que la part́ıcula
cuánticamente sigue todos los caminos posibles, aunque con distintas probabilidades, la
probabilidad de un camino Γ es proporcional a e−S[Γ], donde S[Γ] es la acción clásica de
dicho camino.
98
+
∫ t2
t1
[
mẋ0ξ̇ − kx0ξ
]
dt+
∫ t2
t1
[
1
2
mξ̇2 − 1
2
kξ2
]
dt. (10.53)
La primera integral es la acción evaluada en la trayectoria f́ısica S[x0]; la
segunda se anula como se demuestra integrando por parte, considerando que
en los extremos ξ se anula y usando la ecuación de movimiento del oscilador
(10.51):∫ t2
t1
mẋ0ξ̇dt−
∫ t2
t1
kx0ξdt = mẋ0ξ|t2t1 −
∫ t2
t1
[mẍ0 + kx0] ξdt = 0. (10.54)
Por lo tanto, la diferencia entre las acciones es
∆S ≡ S[x̃]− S[x0] =
∫ t2
t1
[
1
2
mξ̇2 − 1
2
kξ2
]
dt. (10.55)
Fácilmente se encuentran funciones ξ para lascuales ∆S > 0, es suficien-
te elegir ξ pequeña pero muy oscilante, de forma tal que su derivada ξ̇ sea
grande. Por lo tanto, x0 nunca dará un valor máximo de la acción, siempre
se podrá elegir una variación de la misma que aumenta la acción. Este razo-
namiento es válido (se los invita a demostrarlo) para cualquier lagrangeana
con un potencial que depende de las coordenadas únicamente, V = V (q).
Por otro lado, podŕıamos tomar ξ grande con derivada ξ̇ pequeña, en-
tonces ∆S puede ser negativa, y x0 resultaŕıa un punto de ensilladura. Sin
embargo no siempre es posible encontrar ξ̇ pequeña con ξ grande debido a
las restricciones ξ(t1) = ξ(t2) = 0. Veamos un caso particular de variación.
Sean t1 = 0, t2 = T y proponemos
ξ(t) =
{
αt/T 0 ≤ t ≤ T/2
α(T − t)/T T/2 ≤ t ≤ T , (10.56)
donde α es una constante. Con esta variación ξ la diferencia entre las dos
acciones (10.55) es
∆S =
mα2
2T
(
1− ω
2
0T
2
8
)
, (10.57)
donde ω0 =
√
k/m es la frecuencia del oscilador armónico. Vemos entonces
que si el tiempo T satisface
T >
2
√
2
ω0
=
√
2
π
2π
ω0
≡
√
2
π
× Periodo, (10.58)
la diferencia ∆S es negativa y entonces la trayectoria f́ısica x0 es un punto
de ensilladura de la acción, en lugar de ser un mı́nimo.
99
10.3. Ventajas del principio de Hamilton
Hemos reobtenido las ecuaciones de movimiento de Lagrange partiendo
desde un lugar completamente diferente a la segunda ley de Newton y el
principio de los trabajos virtuales, principios diferenciales con los que ini-
ciamos el estudio de la dinámica de Lagrange. Mientras aquellos principios
tienen un carácter más ’mundano’, lidiando con fuerzas y desplazamientos
reales o virtuales de las part́ıculas, el principio de Hamilton tiene la belleza
de lo simple y el atractivo de lo mágico 29: entre los infinitos movimientos
posibles la naturaleza ’sabe elegir’ aquel que minimiza una magnitud, la ac-
ción 30. Muchos buscaron en los principios integrales significados más allá
de la f́ısica, pero sin apartarnos tanto podemos listar algunas ventajas del
principio de Hamilton sobre los principios diferenciales.
El principio de Hamilton δS = 0 no hace referencia a una elección
particular de las coordenadas generalizadas. Tenemos una lagrangea-
na que es función de coordenadas y velocidades generalizadas y, en
algunos casos, función expĺıcita del tiempo, L(q̇, q, t). Cuando toma-
mos una trayectoria particular en el espacio de configuraciones, q(t), y
la reemplazamos junto a su velocidad en la lagrangeana, ésta se trans-
forma en una función del tiempo exclusivamente, L(q̇(t), q(t), t). Esta
función es la que se integra para obtener la acción S =
∫
Ldt, que
luego se extremiza. Si hacemos una transformación puntual, pasamos
de q a Q, el valor de la lagrangeana a lo largo de una dada trayectoria
no cambia, en consecuencia tampoco cambia la acción S. Por lo tanto,
la trayectoria f́ısica que extremiza a la acción es independiente mani-
fiestamente de la elección del conjunto de coordenadas generalizadas.
La invariancia frente a transformaciones de gauge es también ma-
nifiesta. Si se hace una transformación de gauge de la lagrangena,
L → L′ = L+ dMdt , la acción cambia a
S → S′ = S +
∫ t2
t1
dM(q, t)
dt
dt = S +M(q(2), t2)−M(q(1), t1).
Al calcular la variación de la nueva acción resulta
δS′ = δS + δM(q(2), t2)− δM(q(1), t1).
Pero las coordenadas generalizadas no vaŕıan en los extremos, por lo
tanto las variaciones de M que aparecen en la expresión de arriba son
nulas, y tenemos δS′ = δS. Entonces, si la trayectoria q(t) extremiza
29Lo mágico se transforma en esotérico cuando algunos autores, como Landau, comien-
zan el estudio de la dinámica de Lagrange directamente con el principio de Hamilton.
30Nos tomamos la licencia de reemplazar ‘extremizar’ por ‘minimizar’, ¡los puntos de
ensilladura parecen no ser tan atractivos como mı́nimos y máximos!
100
la acción S también extremizará a la acción S′. Es decir, el problema
dinámico para ambas acciones tiene la misma solución. Vemos como
la invariancia de gauge se demuestra sin recurrir a la forma particular
de las ecuaciones de Lagrange.
Lejos la ventaja más importante: el principio de Hamilton ha sido ex-
tendido a otras áreas de la f́ısica, como ser electromagnetismo, teoŕıas
de campos clásicos y cuánticos y mecánica cuántica, entre otras. Por
supuesto, los grados de libertad involucrados en cada área son di-
ferentes (campos electromagnéticos, campos ’de materia’ y de gauge,
funciones de onda ...) y la función lagrangeana tendrá diferentes expre-
siones, Pero una vez definida la lagrangeana correspondiente, las leyes
fundamentales de cada área salen del principio de Hamilton: δS = 0.
El principio de Hamilton es entonces uno de los conceptos unificadores
más importante de la f́ısica toda.
En la mecánica clásica, habiendo partido de los principios diferencia-
les, hemos llegado a la expresión L = T −V de la función lagrangeana
y las ecuaciones de Lagrange correspondientes. Podemos decir que el
principio de Hamilton aqúı no juega un rol esencial, es ’otra forma’ de
obtener las ecuaciones de movimiento ya conocidas. En otras áreas, co-
mo en la teoŕıa de campos, el procedimiento va en el sentido contrario:
en primer lugar se proponen lagrangeanas a partir de consideraciones
de simetŕıa y grados de libertad involucrados y luego se usa el principio
de Hamilton para obtener las ecuaciones fundamentales de la teoŕıa.
En este contexto el principio de Hamilton es esencial.
Es un principio simple y elegante, y una vez que nos calzamos los
zapatos de goma, nos permite filosofar un rato (Garćıa dixit).
10.4. Equivalencia de los principios de Hamilton y de
D’Alembert
A partir del principio de D’Alembert podemos obtener el de Hamilton,
simplemente integrándolo en el tiempo. Consideremos que tenemos las
leyes de movimiento de las N part́ıculas de un dado sistema, {ri(t)}Ni=1
en el intervalo [t1, t2]. En cada instante t realizamos ahora un despla-
zamiento virtual del sistema {δri(t)}Ni=1 con la condición de extremos
fijos, ésto es, δri(t1) = δri(t2) = 0, i = 1, · · · , N. Calculamos el trabajo
virtual para un dado instante t
δW (t) =
N∑
i=1
Fi · δri(t) =︸︷︷︸
PTV
N∑
i=1
Fnvi · δri(t). (10.59)
101
Si las fuerzas derivan de un potencial V (r), Fnvi = −∇iV (r), entonces
el trabajo es
δW (t) =
N∑
i=1
Fnvi · δri(t) = −
N∑
i=1
∇iV (r) · δri(t) = −δV (t). (10.60)
Por otro lado, teniendo en cuenta la segunda ley de Newton, el trabajo
virtual se escribe también como
δW (t) =
N∑
i=1
Fi · δri(t) =
N∑
i=1
mir̈i · δri(t) (10.61)
Trabajamos un poco la última expresión
N∑
i=1
mir̈i · δri(t) =
N∑
i=1
mi
dṙi
dt
· δri(t) = (10.62)
=
d
dt
(
N∑
i=1
miṙi · δri(t)
)
−
N∑
i=1
miṙi ·
dδri(t)
dt
.
En el último término podemos intercambiar la derivada respecto al
tiempo con la variación δ,
dδri(t)
dt
= δ
dri(t)
dt
= δṙi(t),
quedando ese término como
N∑
i=1
miṙi ·
dδri(t)
dt
=
N∑
i=1
miṙi · δṙi = δ
(
1
2
N∑
i=1
miṙ
2
i
)
≡ δT. (10.63)
Llegamos entonces a dos expresiones alternativas del trabajo virtual
δW (t) = −δV (t) = d
dt
(
N∑
i=1
miṙi · δri(t)
)
− δT (t), (10.64)
de las cuales deducimos
δL(t) =
d
dt
(
N∑
i=1
miṙi · δri(t)
)
, (10.65)
donde, recapitulando lo que hemos hecho hasta ahora, vemos que δL(t)
tiene el mismo significado de antes, es la variación de la función la-
grangeana por una variación de las posiciones de las part́ıculas:
δL(t) ≡ L (ṙ(t) + δṙ(t), r(t) + δr(t), t)− L(ṙ(t), r(t), t).
102
Integramos δL en el intervalo [t1, t2] y considerando la condición de
extremos fijos, llegamos a
∫ t2
t1
δL(t)dt =
∫ t2
t1
d
dt
(
N∑
i=1
miṙi · δri(t)
)
dt =
N∑
i=1
miṙi · δri(t)
∣∣∣∣∣
t2
t1
= 0.
Podemos ahora intercambiar la variación δ con la integral, para arribar
entonces al principio de Hamilton∫ t2
t1
δL(t)dt = δ
∫ t2
t1
L(t)dt = 0. (10.66)
10.5. Principio de Maupertuis
Antes que Lagrange y Hamilton, Maupertuis (1746) hab́ıa formulado
unprincipio variacional para sistemas que conservan su enerǵıa. Vea-
mos como se deduce partiendo del principio de Hamilton. Supongamos
que tenemos un sistema conservativo, donde E = T (q̇, q)+V (q) = cte,
lo que nos permite escribir la acción como
S =
∫ t2
t1
Ldt =
∫ t2
t1
(2T − E) dt =
∫ t2
t1
2Tdt− E(t2 − t1). (10.67)
Si la enerǵıa cinética es una función cuadrática de las velocidades ge-
neralizadas,
T =
1
2
n∑
i,j=1
aij q̇iq̇j ≡
1
2
n∑
i,j=1
aij
dqi
dt
dqj
dt
, (10.68)
podemos obtener el diferencial de tiempo en término de los diferencia-
les de coordenadas generalizadas:
dt =
√
1
2
∑n
i,j=1 aijdqidqj
T
(10.69)
La acción se escribe entonces como
S =
∫ q2
q1
√
2(E − V (q))
√√√√ n∑
i,j=1
aijdqidqj − E(t2 − t1). (10.70)
Si variamos las trayectorias de forma tal que la enerǵıa se conserve (es
decir, las enerǵıas del camino original y del variado son las mismas),
entonces el último término de la acción no contribuye a su variación, y
103
llegamos entonces al caso particular del principio de Hamilton, llamado
principo de Maupertuis:
δS = δ
∫ q2
q1
√√√√2(E − V (q)) n∑
i,j=1
aijdqidqj = 0. (10.71)
Notemos que en la integral no aparece el tiempo, hemos pasado de una
variación en tiempo a una variación geométrica.
Además de los principios estudiados, de Hamilton y de Maupertuis en
esta última parte, existen otros principios integrales en la dinámica
clásica, por ejemplo, los principio de mı́nima restricción de Gauss y
de la curvatura mı́nima de Hertz. Lanczos discute extensamente sobre
este tipo de principios, no por nada su libro se llama “Los principios
variacionales de la mecánica”.
En esta clase:
• Aprendimos a resolver problemas variacionales simples que
implican extremizar funcionales, entre ellos, los problemas de
geodésicas y la braquistócrona. Consideramos particularmente
un funcional integral, I[y] =
∫
F (y′, y, x)dx, y encontramos las
ecuaciones de Euler que determinan sus funciones extremales.
• Definimos la acción como la integral definida de la lagrangea-
na, S =
∫
Ldt.
• Enunciamos el principio de Hamilton, el cual establece que la
acción tiene un valor estacionario para la trayectoria f́ısica del
sistema, δS = 0.
• Bajo la condición de trayectorias con extremos fijos se deducen
las ecuaciones de Lagrange.
• El principio de Hamilton se aplica en diversas áreas de la
f́ısica, mucho más allá de la mecánica clásica. Es un concepto
unificador importante de la f́ısica.
104

Continuar navegando