19.01.2015 Views

My title - Departamento de Matemática da Universidade do Minho

My title - Departamento de Matemática da Universidade do Minho

My title - Departamento de Matemática da Universidade do Minho

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

1405R1 - Tópicos <strong>de</strong> Sistemas Dinâmicos<br />

Salvatore Cosentino<br />

<strong>Departamento</strong> <strong>de</strong> <strong>Matemática</strong> e Aplicações - Universi<strong>da</strong><strong>de</strong> <strong>do</strong> <strong>Minho</strong><br />

Campus <strong>de</strong> Gualtar - 4710 Braga - PORTUGAL<br />

gab B.4023, tel 253 604086 (atendimento: 4 a -feira 14h-18h)<br />

e-mail scosentino@math.uminho.pt<br />

url http://w3.math.uminho.pt/~scosentino<br />

16 <strong>de</strong> Dezembro <strong>de</strong> 2010<br />

This is a 5th draft.<br />

Resumo<br />

This work is licensed un<strong>de</strong>r a<br />

Creative Commons Attribution-ShareAlike 3.0 Unported License.<br />

1


CONTEÚDO 2<br />

Conteú<strong>do</strong><br />

1 Introdução 4<br />

1.1 Sistemas dinâmicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4<br />

1.2 Exemplos físicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4<br />

1.3 Problemas físicos e pequena história . . . . . . . . . . . . . . . . . . . . . . . . . . 5<br />

1.4 Estratégia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6<br />

2 Iteration/recursion 7<br />

2.1 Exponential growth/<strong>de</strong>cay . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7<br />

2.2 Babylonian-Heron method to “compute” square roots . . . . . . . . . . . . . . . . 8<br />

2.3 Fibonacci numbers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10<br />

2.4 Newton method to find roots of polynomials . . . . . . . . . . . . . . . . . . . . . . 11<br />

2.5 Finite difference equations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13<br />

2.6 Transformações <strong>do</strong> intervalo e cobweb plot . . . . . . . . . . . . . . . . . . . . . . . 14<br />

3 Sistemas dinâmicos topológicos, <strong>de</strong>finições básicas 16<br />

3.1 Transformações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16<br />

3.2 Trajetórias e órbitas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17<br />

3.3 Órbitas periódicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17<br />

3.4 Observáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18<br />

3.5 Conjuntos invariantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19<br />

3.6 Conjugação topológica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19<br />

3.7 Estabili<strong>da</strong><strong>de</strong> estrutural . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20<br />

4 Números e dinâmica 21<br />

4.1 Expansão <strong>de</strong>cimal e multiplicação ×10 . . . . . . . . . . . . . . . . . . . . . . . . . 21<br />

4.2 Deslocamentos <strong>de</strong> Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23<br />

4.3 Rotações <strong>do</strong> círculo/toro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />

4.4 Dyadic adding machine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26<br />

4.5 Frações contínuas e mapa <strong>de</strong> Gauß . . . . . . . . . . . . . . . . . . . . . . . . . . . 26<br />

5 Órbitas regulares e perturbações 31<br />

5.1 Teoremas <strong>de</strong> ponto fixo “topológicos” . . . . . . . . . . . . . . . . . . . . . . . . . 31<br />

5.2 Bacia <strong>de</strong> atração . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31<br />

5.3 Dinâmica <strong>da</strong>s contrações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />

5.4 Or<strong>de</strong>m <strong>da</strong> reta real e trajetórias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34<br />

5.5 Análise local: pontos fixos atrativos e repulsivos . . . . . . . . . . . . . . . . . . . . 35<br />

5.6 Convergência no méto<strong>do</strong> <strong>de</strong> Newton . . . . . . . . . . . . . . . . . . . . . . . . . . 37<br />

6 Flows 39<br />

6.1 Structure of physical mo<strong>de</strong>ls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />

6.2 Integration of one-dimensional systems . . . . . . . . . . . . . . . . . . . . . . . . . 41<br />

6.3 Exponential . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43<br />

6.4 Linear systems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45<br />

6.5 Existence and uniqueness theorems . . . . . . . . . . . . . . . . . . . . . . . . . . . 46<br />

7 Oscillations and cycles 51<br />

7.1 Harmonic oscillator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51<br />

7.2 Mathematical pendulum and Jacobi’s elliptic integrals . . . . . . . . . . . . . . . . 52<br />

7.3 Central forces and planetary motions . . . . . . . . . . . . . . . . . . . . . . . . . . 53<br />

7.4 Cycles in chemistry and biology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55<br />

7.5 Weather report . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57<br />

8 Linearização 59<br />

8.1 Linearização conforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59<br />

8.2 Hiperbolici<strong>da</strong><strong>de</strong> e linearização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59


CONTEÚDO 3<br />

9 Transversali<strong>da</strong><strong>de</strong> e bifurcações 61<br />

9.1 Transversali<strong>da</strong><strong>de</strong> e persistência <strong>do</strong>s pontos fixos . . . . . . . . . . . . . . . . . . . . 61<br />

9.2 Bifurcações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62<br />

9.3 Duplicação <strong>do</strong> perío<strong>do</strong> e cascata <strong>de</strong> Feigenbaum . . . . . . . . . . . . . . . . . . . . 62<br />

10 Statistical <strong>de</strong>scription of orbits 63<br />

10.1 Probability measures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63<br />

10.2 Transformations and invariant measures . . . . . . . . . . . . . . . . . . . . . . . . 65<br />

10.3 Invariant measures and time averages . . . . . . . . . . . . . . . . . . . . . . . . . 68<br />

10.4 Examples of invariant measures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70<br />

11 Recorrências 74<br />

11.1 Comportamento assimptótico <strong>da</strong>s órbitas infinitas: conjuntos ω e α limite . . . . . 74<br />

11.2 Pontos recorrentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74<br />

11.3 Invariant measures and recurrent points: Poincaré theorem . . . . . . . . . . . . . 75<br />

11.4 Conjunto não-errante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76<br />

12 Transitivi<strong>da</strong><strong>de</strong> e órbitas <strong>de</strong>nsas 78<br />

12.1 Transitivi<strong>da</strong><strong>de</strong> . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78<br />

12.2 Minimali<strong>da</strong><strong>de</strong> . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80<br />

12.3 Rotações irracionais <strong>do</strong> círculo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81<br />

13 Homeomorfismos <strong>do</strong> círculo 83<br />

13.1 Número <strong>de</strong> rotação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83<br />

13.2 Teorema <strong>de</strong> classificação <strong>de</strong> Poincaré . . . . . . . . . . . . . . . . . . . . . . . . . . 84<br />

13.3 Difeomorfismos <strong>do</strong> círculo e teorema <strong>de</strong> Denjoy . . . . . . . . . . . . . . . . . . . . 85<br />

14 Per<strong>da</strong> <strong>de</strong> memória e in<strong>de</strong>pendência assimptótica 86<br />

14.1 Órbitas <strong>de</strong>sor<strong>de</strong>na<strong>da</strong>s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86<br />

14.2 Mixing topológico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87<br />

14.3 Dinâmica <strong>do</strong>s <strong>de</strong>slocamentos <strong>de</strong> Bernoulli . . . . . . . . . . . . . . . . . . . . . . . 89<br />

14.4 Conjuntos <strong>de</strong> Cantor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90<br />

14.5 Transformações expansoras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92<br />

14.6 Automorfismos hiperbólicos <strong>do</strong> toro . . . . . . . . . . . . . . . . . . . . . . . . . . . 94<br />

15 Dimensions, fractals and entropy 96<br />

15.1 Dimensions of metric spaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96<br />

15.2 Fractals . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97<br />

15.3 Self-similarity and iterated function systems . . . . . . . . . . . . . . . . . . . . . . 98<br />

15.4 Kleinian groups . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99<br />

15.5 Entropia topológica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99<br />

16 Ergodicity and convergence of time means 102<br />

16.1 Ergodicity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102<br />

16.2 Examples of ergodic maps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103<br />

16.3 Normal numbers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104<br />

16.4 Unique ergodicity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105


1 INTRODUÇÃO 4<br />

1 Introdução<br />

1.1 Sistemas dinâmicos<br />

Uma estrutura típica <strong>de</strong> um mo<strong>de</strong>lo físico é a seguinte. Existe um espaço X, dito “espaço <strong>do</strong>s<br />

esta<strong>do</strong>s”, <strong>do</strong> sistema (uma varie<strong>da</strong><strong>de</strong> simplética em mecânica clássica, um espaço <strong>de</strong> Hilbert em<br />

mecânica quântica, um certo espaço <strong>de</strong> funções em mo<strong>de</strong>los hidrodinâmicos ...). Existe um espaço<br />

T , que chamamos “tempo”, que contém um ponto chama<strong>do</strong> 0 (agora), e junto com t e s também<br />

contém t+s (se é possível esperar uma hora e esperar duas horas, também <strong>de</strong>ve ser possível esperar<br />

três horas). As “leis” <strong>da</strong> física <strong>de</strong>finem uma dinâmica em X: uma família <strong>de</strong> transformações<br />

Φ t : X → X, <strong>de</strong>fini<strong>da</strong>s para t ∈ T , que verificam<br />

Φ 0 = id X e Φ t+s = Φ t ◦ Φ s .<br />

Portanto, as leis <strong>de</strong>finem uma ação Φ : T × X → X <strong>do</strong> semigrupo tempo no espaço <strong>do</strong>s esta<strong>do</strong>s. O<br />

ponto Φ t (x) é o esta<strong>do</strong> no tempo t <strong>de</strong> um sistema que estava no esta<strong>do</strong> x no tempo 0. A função<br />

t ↦→ Φ t (x) é a “trajetória” <strong>do</strong> esta<strong>do</strong> inicial x. As leis po<strong>de</strong>m ser “reversíveis”, ou seja po<strong>de</strong>m<br />

permitir <strong>de</strong>cidir o que aconteceu no passa<strong>do</strong>, e nesse caso o tempo é i<strong>de</strong>aliza<strong>do</strong> como sen<strong>do</strong> o grupo<br />

R ou Z, ou irreversíveis, e neste caso o tempo é pensa<strong>do</strong> como o semigrupo R ≥0 ou N 0 . Se o tempo<br />

é contínuo, o (semi)grupo costuma ser <strong>de</strong>fini<strong>do</strong> por meio <strong>do</strong> seu gera<strong>do</strong>r infinitesimal<br />

v = lim<br />

t↓0<br />

Φ t − id X<br />

t<br />

(o campo <strong>de</strong> vetores <strong>de</strong>fini<strong>do</strong> pela equação <strong>de</strong> Newton F = ma, o grupo <strong>de</strong> opera<strong>do</strong>res unitários<br />

e −itH gera<strong>do</strong> pelo opera<strong>do</strong>r hamiltoniano H, o semigrupo e −t∆ gera<strong>do</strong> pelo opera<strong>do</strong>r <strong>de</strong> Laplace-<br />

Beltrami ∆, . . . ). Se o tempo é discreto, o (semi)grupo é gera<strong>do</strong> pela transformação<br />

Φ 1 : X → X<br />

Numa experiência <strong>da</strong> física, não é necessariamente o esta<strong>do</strong> <strong>do</strong> sistema que se observa. Fazer<br />

experiências quer dizer medir “observáveis”, ou seja ler nos instrumentos <strong>do</strong> laboratório os valores<br />

<strong>de</strong> certas funções ϕ : X → R (a distância entre <strong>do</strong>is planetas, a energia <strong>de</strong> um eletrão, a temperatura<br />

<strong>de</strong> um gás ...). A família <strong>de</strong> funções ϕ t = ϕ ◦ Φ t <strong>de</strong>screve a dinâmica <strong>do</strong> observável ϕ. De fato, o<br />

∫<br />

que se observa po<strong>de</strong>m ser médias temporais <strong>do</strong> genero 1 T<br />

T 0<br />

ϕ tdt, às vezes indiretamente por meio<br />

<strong>do</strong>s espetros <strong>de</strong> Fourier ∫ e ikt ϕ t dt ou <strong>de</strong> Laplace ∫ e st ϕ t dt.<br />

1.2 Exemplos físicos<br />

Só para ter uma i<strong>de</strong>ia...<br />

Mecânica clássica. O espaço <strong>do</strong>s esta<strong>do</strong>s <strong>de</strong> uma partícula (pensa<strong>da</strong> como um ponto material)<br />

é, <strong>de</strong> acor<strong>do</strong> com o princípio <strong>de</strong> relativi<strong>da</strong><strong>de</strong> <strong>de</strong> Galileo, R 3 × R 3 . Um esta<strong>do</strong> é um vetor x = (q, p),<br />

on<strong>de</strong> q ∈ R 3 é a “posição” e p = m ˙q ∈ R 3 o “momento”, ˙ <strong>de</strong>nota a <strong>de</strong>riva<strong>da</strong> em or<strong>de</strong>m ao tempo<br />

e m a massa <strong>da</strong> partícula. A equação <strong>de</strong> Newton “força=massa×aceleração” se traduz no sistema<br />

<strong>de</strong> equações<br />

˙q = p/m ṗ = F<br />

que <strong>de</strong>finem um campo <strong>de</strong> vetores v = (p/m, F ) em R 3 × R 3 . A solução <strong>de</strong> dx (t) /dt = v (x (t))<br />

com condição inicial x (0) = x é a trajetória t ↦→ Φ t (x).<br />

Mecânica quântica. O espaço <strong>do</strong>s esta<strong>do</strong>s <strong>de</strong> uma partícula é um espaço <strong>de</strong> Hilbert, por<br />

exemplo L ( 2 R 3) . Um esta<strong>do</strong> é uma função q ↦→ Ψ (q), que tem a interpretação <strong>de</strong> “<strong>de</strong>nsi<strong>da</strong><strong>de</strong> <strong>de</strong><br />

probabili<strong>da</strong><strong>de</strong>s <strong>de</strong> encontrar a partícula na posição q”. A “energia” é um opera<strong>do</strong>r linear autoajunto<br />

H : L ( 2 R 3) → L ( 2 R 3) , por exemplo <strong>da</strong> forma − ( 2 /2m ) ∆+V (q), on<strong>de</strong> ∆ é o opera<strong>do</strong>r <strong>de</strong><br />

Laplace-Beltrami, é a constante <strong>de</strong> Planck, m é a massa <strong>da</strong> partícula, e V é a “energia potencial”.<br />

A equação <strong>de</strong> Schrödinger<br />

i ∂ ∂t Ψ = − 2<br />

2m ∆Ψ + V · Ψ<br />

gera o grupo unitário <strong>de</strong> opera<strong>do</strong>res e −itH/ : L 2 ( R 3) → L 2 ( R 3) .


1 INTRODUÇÃO 5<br />

Hidrodinâmica. O espaço <strong>do</strong>s esta<strong>do</strong>s é um espaço <strong>de</strong> funções com um certo número <strong>de</strong> <strong>de</strong>riva<strong>da</strong>s<br />

parciais contínuas, por exemplo C ( k R 3 , R ) . Uma configuração, ou “campo”, é uma função<br />

q ↦→ u (q) e representa a “<strong>de</strong>nsi<strong>da</strong><strong>de</strong> macroscópica” <strong>de</strong> certos observáveis microscópicos (número<br />

<strong>de</strong> partículas, energia, pressão, ...). Uma equação diferencial fenomenológica <strong>de</strong>screve a evolução<br />

<strong>do</strong> campo. Por exemplo, a propagação <strong>do</strong> calor é suposta seguir a equação<br />

∂<br />

∂t u = σ∆u<br />

on<strong>de</strong> ∆ é o opera<strong>do</strong>r <strong>de</strong> Laplace-Beltrami e σ é um coeficiente que <strong>de</strong>termina a veloci<strong>da</strong><strong>de</strong> <strong>de</strong><br />

propagação. O opera<strong>do</strong>r diferencial ∆ gera o semigrupo <strong>de</strong> opera<strong>do</strong>res e tσ∆ : C k ( R 3 , R ) →<br />

C k ( R 3 , R ) .<br />

1.3 Problemas físicos e pequena história<br />

O objetivo <strong>do</strong>s físicos é fazer previsões: querem saber o que acontece a um certo ponto x, ou melhor<br />

a um certo observável ϕ, passa<strong>do</strong> um tempo t, e possivelmente dizer o que acontece quan<strong>do</strong> t é<br />

gran<strong>de</strong>. Eis uma lista, não exaustiva, <strong>de</strong> problemas fisicamente relevantes.<br />

Calcular trajetórias. Resolver o “problema <strong>de</strong> Cauchy”: <strong>da</strong><strong>da</strong> uma condição inicial x, o<br />

esta<strong>do</strong> <strong>do</strong> sistema no presente, <strong>de</strong>terminar os esta<strong>do</strong>s futuros Φ t (x) com t ≥ 0. No século XVII<br />

o Newton inventou o seu “methodus fluxionum” (o mo<strong>de</strong>rno cálculo diferencial e integral) para<br />

resolver as próprias equações e assim calcular as trajetórias <strong>do</strong>s planetas, <strong>da</strong>n<strong>do</strong> uma explicação<br />

às leis <strong>de</strong> Kepler ...<br />

Regulari<strong>da</strong><strong>de</strong>s/periodici<strong>da</strong><strong>de</strong>s. Decidir se o sistema tem trajetórias regulares, no senti<strong>do</strong> <strong>de</strong><br />

“previsíveis”. As mais previsíveis são as trajetórias periódicas, que satisfazem Φ T (x) = x para<br />

algum tempo T dito perío<strong>do</strong>, e que portanto regressam a x em ca<strong>da</strong> tempo múltiplo <strong>de</strong> T (a própria<br />

história <strong>do</strong> pensamento científico <strong>do</strong>s homens começou <strong>da</strong> observação <strong>da</strong>s periodici<strong>da</strong><strong>de</strong>s <strong>do</strong>s astros,<br />

<strong>da</strong>n<strong>do</strong> origem a cosmogonias e matemáticas em quase to<strong>da</strong> esquina <strong>do</strong> planeta). Decidir se as<br />

eventuais trajetórias regulares são observáveis, ou seja se uma pequena perturbação <strong>da</strong> condição<br />

inicial x ou <strong>da</strong> lei Φ ain<strong>da</strong> produz uma trajetória próxima <strong>da</strong> trajetória regular, ou se estraga<br />

tu<strong>do</strong>. A procura <strong>de</strong> órbitas periódicas e a teoria <strong>da</strong>s perturbações foi um <strong>do</strong>s temas favoritos <strong>do</strong>s<br />

físicos matemáticos <strong>do</strong> século XIX, particularmente interessa<strong>do</strong>s aos problemas <strong>da</strong> mecânica celeste.<br />

Nos anos cinquenta <strong>do</strong> século XX, Kolmogorov, e <strong>de</strong>pois Arnold e Moser, provaram o resulta<strong>do</strong><br />

espetacular <strong>de</strong> que muitos sistemas hamiltonianos têm muitas órbitas “quase-periódicas”.<br />

Descrição qualitativa. Determinar o comportamento qualitativo <strong>da</strong> “maioria” <strong>da</strong>s trajetórias.<br />

Acontece que, se o sistema não é extremamente simples (como um sistema kepleriano, uma partícula<br />

em um campo magnético constante, ...), é praticamente impossível “calcular” as trajectórias, embora<br />

possa ser possível provar a “existência”. Os físicos <strong>de</strong>vem ficar satisfeitos com uma <strong>de</strong>scrição<br />

“qualitativa” <strong>da</strong>s órbitas possíveis. No final <strong>do</strong> século XIX, Henri Poincaré mostrou que é possível<br />

fazer afirmações interessantes sobre o comportamento qualitativo <strong>da</strong>s trajetórias utilizan<strong>do</strong> informações<br />

fracas sobre a lei <strong>de</strong> evolução. O resulta<strong>do</strong> mais espetacular é o seu famoso “teorema<br />

<strong>de</strong> recorrência”. Outro exemplo é a classificação <strong>do</strong>s homeomorfismos <strong>do</strong> círculo, também <strong>de</strong>vi<strong>da</strong><br />

a Poincaré e <strong>de</strong>pois estu<strong>da</strong><strong>da</strong> por Denjoy.<br />

Problemas numéricos. Embora seja geralmente impossível calcular trajetórias, é possivel obter<br />

trajetórias aproxima<strong>da</strong>s (por exemplo, hoje em dia, utilizan<strong>do</strong> um computa<strong>do</strong>r que ”resolve”<br />

equações diferenciais, mas lembre que os astrónomos calculam “efeméri<strong>de</strong>s” e “calendários” <strong>de</strong>s<strong>de</strong><br />

milénios!). Um esquema muito simplifica<strong>do</strong> <strong>do</strong> cálculo numérico é assim. Da<strong>da</strong> uma condição inicial<br />

x e um “passo” τ, obtemos uma aproximação Φ ′ τ (x) <strong>de</strong> Φ τ (x) com um erro que possivelmente<br />

sabemos estimar, por exemplo limita<strong>do</strong> por ε. A seguir, utilizamos o nosso valor inicial Φ ′ τ (x) para<br />

estimar Φ 2τ (x), assim produzin<strong>do</strong> Φ ′ 2τ (x), supostamente a distância inferior a ε <strong>de</strong> Φ τ (Φ ′ τ (x)),<br />

mas geralmente a distância ain<strong>da</strong> maior <strong>de</strong> Φ 2τ (x)... O problema é <strong>de</strong>cidir se, quan<strong>do</strong> n é gran<strong>de</strong>,<br />

a nossa conjetura Φ ′ nτ (x) ain<strong>da</strong> tem alguma coisa a ver com o ver<strong>da</strong><strong>de</strong>iro Φ nτ (x).


1 INTRODUÇÃO 6<br />

Regulari<strong>da</strong><strong>de</strong>s probabilísticas. Muitos sistemas interessantes têm comportamento <strong>de</strong>sor<strong>de</strong>na<strong>do</strong><br />

(por exemplo, as trajetórias po<strong>de</strong>m ter <strong>de</strong>pendência sensível <strong>da</strong>s condições iniciais), e o esta<strong>do</strong><br />

inicial não po<strong>de</strong> ser <strong>de</strong>termina<strong>do</strong> com precisão (quer por razões “a priori”, quer porque to<strong>do</strong> instrumento<br />

tem a sua sensibili<strong>da</strong><strong>de</strong>). A <strong>de</strong>scrição estatística é neste caso uma necessi<strong>da</strong><strong>de</strong> e até po<strong>de</strong><br />

simplificar a vi<strong>da</strong>. Po<strong>de</strong> acontecer que o comportamento <strong>da</strong> maioria <strong>da</strong>s trajetórias é tão irregular<br />

que acaba por parecer regular num senti<strong>do</strong> probabilístico. Este era o cenário imagina<strong>do</strong> por Ludwig<br />

Boltzmann, na sua teoria cinética <strong>do</strong>s gases, para justificar as lei observa<strong>da</strong>s <strong>da</strong> termodinâmica.<br />

O estu<strong>do</strong> <strong>da</strong>s regulari<strong>da</strong><strong>de</strong>s probabilísticas <strong>do</strong>s sistemas dinâmicos é dito “teoria ergódica”, em<br />

homenagem às intuições <strong>de</strong> Boltzmann, e nasceu nos anos trinta <strong>do</strong> século XX com os resulta<strong>do</strong>s<br />

<strong>de</strong> von Neumann, Birkhoff, Khinchin, Hopf, Kolmogorov... Em tempos mais recentes, matemáticos<br />

e físicos como Bowen, Ruelle, Sinai, <strong>de</strong>scubriram ligações interessantes com a mecânica estatística<br />

<strong>de</strong> Maxwell e Gibbs...<br />

Previsões robustas. Um sistema dinâmico po<strong>de</strong> ser pensa<strong>do</strong> como uma ”máquina” que pega<br />

numa condição inicial x e produz uma trajetória t ↦→ Φ t (x). O problema é <strong>de</strong>cidir se uma pequena<br />

perturbação <strong>de</strong> Φ (uma incerteza nos parâmetro <strong>da</strong> lei física), digamos Φ ′ , produz trajetórias<br />

“comparáveis” com as trajetórias <strong>de</strong> Φ. Uma resposta que é particularmente aprecia<strong>da</strong> pelos<br />

físicos consiste em formular resulta<strong>do</strong>s <strong>de</strong> “estabili<strong>da</strong><strong>de</strong>”, que digam que uma “distância” entre<br />

Φ e Φ ′ suficientemente pequena não altera a estrutura <strong>da</strong>s trajetórias. Isto levanta também a<br />

questão <strong>de</strong> <strong>de</strong>cidir se certos fenómenos são típicos ou não no espaço <strong>da</strong>s possíveis dinâmicas. A<br />

procura <strong>de</strong> sistemas “estruturalmente estáveis” <strong>de</strong>senvolveu-se a partir <strong>da</strong>s i<strong>de</strong>ias <strong>de</strong> Andronov e<br />

Pontryagin, nos anos trinta <strong>do</strong> século XX. A “hiperbolici<strong>da</strong><strong>de</strong>” enquanto chave <strong>da</strong> estabili<strong>da</strong><strong>de</strong><br />

estrutural foi <strong>de</strong>scoberta nos anos sessenta por Anosov, Smale, Sinai ..., ao <strong>de</strong>senvolver i<strong>de</strong>ias<br />

geométricas prece<strong>de</strong>ntes <strong>de</strong> Ha<strong>da</strong>mard, Hopf , Hedlund ...<br />

1.4 Estratégia<br />

Para um matemático, um sistema dinâmico é uma ação G × X → X <strong>de</strong> um (semi)grupo “gran<strong>de</strong>”<br />

(tal que seja possível <strong>da</strong>r um senti<strong>do</strong> à uma expressão <strong>do</strong> género “g → ∞”) G sobre um espaço<br />

X. Estu<strong>da</strong>r um sistema dinâmico quer dizer compren<strong>de</strong>r o espaço <strong>da</strong>s órbitas G\X, ou melhor<br />

a maneira em que as diferentes órbitas Gx estão mergulha<strong>da</strong>s em X. A ênfase é no comportamento<br />

“assimptótico” <strong>da</strong>s trajetórias t ↦→ g t x quan<strong>do</strong> g t → ∞. Resulta que às vezes é possível<br />

fazer previsões interessantes esquecen<strong>do</strong> os “<strong>de</strong>talhes” <strong>da</strong> dinâmica, <strong>de</strong>s<strong>de</strong> que X tenha alguma<br />

estrutura (uma topologia, uma métrica, uma estrutura diferenciável, simetrias, uma medi<strong>da</strong> <strong>de</strong><br />

probabili<strong>da</strong><strong>de</strong>s, ...) que <strong>de</strong> alguma maneira precisa é respeita<strong>da</strong> pela evolução temporal, e que a lei<br />

<strong>de</strong> evolução tenha certas proprie<strong>da</strong><strong>de</strong>s qualitativas. Este é o tema <strong>da</strong> teoria <strong>do</strong>s sistemas dinâmicos.<br />

A estratégia é selecionar mo<strong>de</strong>los simples e tratáveis, possivelmente “<strong>de</strong>scobrir” classes <strong>de</strong> sistemas<br />

com comportamento compreensível, na esperança <strong>de</strong> que sistemas “reais” tenham comportamentos<br />

comparáveis. Até esquecen<strong>do</strong> as motivações físicas, as i<strong>de</strong>ias <strong>da</strong> teoria <strong>do</strong>s sistemas dinâmicos fornecem<br />

outra maneira <strong>de</strong> olhar certas estruturas matemáticas, e produzem resulta<strong>do</strong>s interessantes<br />

em análise, geometria, teoria <strong>de</strong> grupos, teoria <strong>de</strong> números, etc...


2 ITERATION/RECURSION 7<br />

2 Iteration/recursion<br />

2.1 Exponential growth/<strong>de</strong>cay<br />

Geometric progression.<br />

Uma progressão geométrica <strong>de</strong> “razão” λ é uma sequência<br />

x 0 = a x 1 = aλ x 2 = aλ 2 ... x n = aλ n ...<br />

obti<strong>da</strong> <strong>do</strong> termo inicial x 0 = a usan<strong>do</strong> a recursão x n+1 = λx n .<br />

Geometric series. A i<strong>de</strong>nti<strong>da</strong><strong>de</strong> (1 + λ + λ 2 + λ 3 + ... + λ n )(λ − 1) = λ n+1 − 1 mostra que, se<br />

λ ≠ 1, a soma <strong>do</strong>s primeiros n + 1 termos <strong>da</strong> progressão geométrica (com a = 1) é<br />

1 + λ + λ 2 + λ 3 + ... + λ n = λn+1 − 1<br />

λ − 1<br />

Em particular, quan<strong>do</strong> |λ| < 1, a série geométrica ∑ ∞<br />

n=0 λn é convergente, e a sua soma é<br />

1 + λ + λ 2 + λ 3 + ... + λ n + ... = 1<br />

1 − λ .<br />

The dichotomy para<strong>do</strong>x.<br />

Using the above formula, you may convince Zeno that<br />

1/2 + 1/4 + 1/8 + 1/16 + ... = 1 .<br />

Decimal expansions.<br />

Also, you may convince yourself that<br />

and learn how to recognize rational numbers as<br />

from their periodic expansion.<br />

0.99999 · · · = 9<br />

10 + 9<br />

100 + 9<br />

1000 + 9<br />

10000 + · · · = 1<br />

0.33333 . . . or 1.285714285714 . . .<br />

Duplicação <strong>de</strong> células. As experiências mostram que a população <strong>de</strong> uma colónia <strong>de</strong> bactérias,<br />

num perío<strong>do</strong> <strong>de</strong> tempo em que po<strong>de</strong>mos consi<strong>de</strong>rar ilimita<strong>do</strong> o nutrimento e <strong>de</strong>sprezáveis as toxinas<br />

produzi<strong>da</strong>s, duplica-se em ca<strong>da</strong> hora.<br />

• Se a população inicial é <strong>de</strong> 1000 células, <strong>de</strong>termine a população passa<strong>da</strong>s 2, 3, 10 horas.<br />

• Quantas horas <strong>de</strong>vo esperar para ver 1024 bactérias a partir <strong>de</strong> uma única célula inicial<br />

• Escreva uma fórmula para p n , a população <strong>de</strong> bactérias passa<strong>da</strong>s n horas, <strong>da</strong><strong>da</strong> uma população<br />

inicial p 0 .<br />

Invenção <strong>do</strong> xadrez. Dizem que Sissa inventou o jogo <strong>do</strong> xadrez e o ofreceu ao rei <strong>de</strong> Pérsia. Ao<br />

rei, que o convi<strong>do</strong>u a escolher uma recompensa, pediu um grão <strong>de</strong> arroz para o primeiro quadra<strong>do</strong><br />

<strong>do</strong> tabuleiro, o <strong>do</strong>bro, ou seja, <strong>do</strong>is grãos, para o segun<strong>do</strong> quadra<strong>do</strong>, o <strong>do</strong>bro, ou seja, quatro grãos,<br />

pelo terceiro quadra<strong>do</strong>, e assim a seguir até o último <strong>do</strong>s quadra<strong>do</strong>s <strong>do</strong> tabuleiro.<br />

• Quanto grãos <strong>de</strong> arroz o rei teve que pagar<br />

• Se 1 Kg <strong>de</strong> arroz contém à volta <strong>de</strong> 30000 grãos, quantas tonela<strong>da</strong>s <strong>de</strong> arroz foram necessárias<br />

ao rei para pagar o seu jogo


2 ITERATION/RECURSION 8<br />

Tempo <strong>de</strong> meia-vi<strong>da</strong>. O <strong>de</strong>caimento <strong>de</strong> uma substância radioactiva po<strong>de</strong> ser caracteriza<strong>do</strong><br />

pelo “tempo <strong>de</strong> meia-vi<strong>da</strong>” τ, passa<strong>do</strong> o qual aproxima<strong>da</strong>mente meta<strong>de</strong> <strong>do</strong>s núcleos inicialmente<br />

presentes terá <strong>de</strong>cai<strong>do</strong>. Portanto, se q n <strong>de</strong>nota a quanti<strong>da</strong><strong>de</strong> <strong>de</strong> substância radioactiva presente no<br />

instante nτ, com n inteiro, então<br />

q n+1 = 1 2 q n .<br />

• Determine q n em função <strong>da</strong> quanti<strong>da</strong><strong>de</strong> inicial q 0 .<br />

• Determine a quanti<strong>da</strong><strong>de</strong> <strong>de</strong> producto <strong>do</strong> <strong>de</strong>caimento no instante nτ.<br />

• Passa<strong>do</strong> quanto tempo a substância radioactiva fica reduzi<strong>da</strong> a 1 32-ésimo <strong>da</strong> quanti<strong>da</strong><strong>de</strong> inicial<br />

• O tempo <strong>de</strong> meia-vi<strong>da</strong> <strong>do</strong> radiocarbono 14 C é τ ≃ 5730 anos. Mostre como “<strong>da</strong>tar” um fóssil,<br />

saben<strong>do</strong> que a proporção <strong>de</strong> 14 C num ser vivente é fixa e conheci<strong>da</strong>. 1<br />

Crescimento exponencial. O crescimento exponencial <strong>de</strong> uma população num meio ambiente<br />

ilimita<strong>do</strong> é mo<strong>de</strong>la<strong>do</strong> com a equação recursiva<br />

p n+1 = λp n<br />

on<strong>de</strong> p n representa a população no tempo n, <strong>da</strong><strong>da</strong> uma certa população inicial p 0 .<br />

• Interprete o parâmetro λ imaginan<strong>do</strong> que em ca<strong>da</strong> uni<strong>da</strong><strong>de</strong> <strong>de</strong> tempo o incremento p n+1 − p n<br />

<strong>da</strong> população é a soma <strong>de</strong> uma parcela αp n , on<strong>de</strong> α > 0 é um coeficiênte <strong>de</strong> fertili<strong>da</strong><strong>de</strong>, e<br />

uma parcela −βp n , on<strong>de</strong> β > 0 é um coeficiênte <strong>de</strong> mortali<strong>da</strong><strong>de</strong>.<br />

• Discuta o comportamento <strong>da</strong>s soluções <strong>da</strong> equação recursiva ao variar o parâmetro λ.<br />

• A uma população que cresce segun<strong>do</strong> o mo<strong>de</strong>lo exponencial, é adiciona<strong>da</strong> ou retira<strong>da</strong> uma<br />

certa quanti<strong>da</strong><strong>de</strong> β em ca<strong>da</strong> uni<strong>da</strong><strong>de</strong> <strong>de</strong> tempo. O mo<strong>de</strong>lo é portanto<br />

p n+1 = λp n + β<br />

on<strong>de</strong> β é um parâmetro positivo ou negativo. Determine soluções estacionárias, ou seja,<br />

que não <strong>de</strong>pen<strong>de</strong>m <strong>do</strong> tempo n, e a solução com condição inicial p 0 arbitrária (consi<strong>de</strong>re a<br />

substituição x n = p n −p, on<strong>de</strong> p é a solução estacionária). Para quais valores <strong>do</strong>s parâmetros<br />

λ e β as soluções p n convergem para a solução estacionária quan<strong>do</strong> o tempo n → ∞<br />

2.2 Babylonian-Heron method to “compute” square roots<br />

Consi<strong>de</strong>re o problema <strong>de</strong> <strong>de</strong>terminar o la<strong>do</strong> l <strong>de</strong> um quadra<strong>do</strong> <strong>da</strong><strong>da</strong> a sua área a > 0, ou seja, o<br />

número que chamamos l = √ a.<br />

Babylonian-Heron algorithm. Um méto<strong>do</strong>, <strong>de</strong>scrito por Heron 2 , mas utiliza<strong>do</strong> provavelmente<br />

pelos babilónios 3 , consiste em construir recursivamente rectângulos <strong>de</strong> área a com la<strong>do</strong>s ca<strong>da</strong> vez<br />

mais próximos. Se x 1 e y 1 são a base e a altura <strong>do</strong> primeiro rectângulo, e portanto x 1 y 1 = a,<br />

então o segun<strong>do</strong> rectângulo tem como base a média aritmética x 2 = (x 1 + y 1 )/2 <strong>de</strong> base e altura<br />

1 J.R. Arnold and W.F. Libby, Age <strong>de</strong>terminations by Radiocarbon Content: Checks with Samples of Known<br />

Ages, Sciences 110 (1949), 1127-1151.<br />

2 “Since 720 has not its si<strong>de</strong> rational, we can obtain its si<strong>de</strong> within a very small difference as follows. Since the<br />

next succeeding square number is 729, which has 27 for its si<strong>de</strong>, divi<strong>de</strong> 720 by 27. This gives 26 2/3. Add 27 to<br />

this, making 53 2/3, and take half this or 26 5/6. The si<strong>de</strong> of 720 will therefore be very nearly 26 5/6. In fact,<br />

if we multiply 26 5/6 by itself, the product is 720 1/36, so the difference in the square is 1/36. If we <strong>de</strong>sire to<br />

make the difference smaller still than 1/36, we shall take 720 1/36 instead of 729 (or rather we should take 26 5/6<br />

instead of 27), and by proceeding in the same way we shall find the resulting difference much less than 1/36.”<br />

Heron of Alexandria, Metrica, Book I.<br />

3 Carl B. Boyer, A history of mathematics, John Wiley & Sons, 1968. O. Neugebauer, The exact sciences in<br />

antiquity, Dover, 1969.


2 ITERATION/RECURSION 9<br />

<strong>do</strong> primeiro, o terceiro rectângulo tem como base a média aritmética x 3 = (x 2 + y 2 )/2 <strong>da</strong> base e a<br />

altura <strong>do</strong> segun<strong>do</strong>, e assim sucessivamente. A equação recursiva para as bases é<br />

x n+1 = 1 (<br />

x n + a )<br />

.<br />

2 x n<br />

Observe que se a e a conjectura inicial são racionais, então to<strong>do</strong>s os x n são números racionais.<br />

The algorithm converges, and quite fast.<br />

x 1 = 3/2 for √ 2 (since 1 2 < 2 < 2 2 ), and find<br />

We could, as the babylonians, put an initial guess<br />

x 2 = 17<br />

12 ≃ 1.41666666666 x 3 = 577<br />

408 ≃ 1.41421568627 x 4 = 665857<br />

470832 ≃ 1.41421356237<br />

As you see, the sequence stabilizes quite fast.<br />

Error estimate. As a first attempt to explain this miracle, we could start looking at the<br />

recursive equations for the bases and the heights of the rectangles:<br />

x n+1 = x n + y n<br />

2<br />

y n+1 = 1/x n + 1/y n<br />

2<br />

(so, the next height is the “harmonic mean” of the base and height). We see that the x n ’s and the<br />

y n ’s form <strong>de</strong>creasing and increasing sequences, respectively (disregarding the first guess, of course),<br />

namely<br />

y 2 ≤ y 3 ≤ ... ≤ y n ≤ ... ≤ x n ≤ ... ≤ x 3 ≤ x 2 ,<br />

The real root is somewhere between, namely y n ≤ √ a ≤ x n . Hence, we have an explicit control of<br />

the error. A computation shows that the lenghts of those intervals, the differences ε n = x n − y n<br />

satisfy the recursion<br />

ε n+1 < 1 2 · ε n<br />

So, and initial “error” ε 1 ≤ 1 (an easy achievement, since we easily recognize squares of integers)<br />

reduces to at least ε n ≤ 2 −n after n iterations. The true error is actually much smaller. In<strong>de</strong>ed,<br />

in our example we may compute<br />

ε 2 = 17<br />

12 − 212 17 = 1<br />

204 ≃ .005 and ε 3 = 577<br />

408 − 2408 577 = 1<br />

235416 ≃ 0.000004<br />

So that the first improved guess x 2 has already one correct <strong>de</strong>cimals, and the second, x 3 has already<br />

four correct <strong>de</strong>cimals!<br />

Irrationals. What babylonians didn’t suspect is that if you start with a rational guess for √ 2,<br />

you get an infinite sequence of rational approximations, but the process never stops. This is due<br />

to<br />

Pythagoras theorem.<br />

The square root of 2 is not rational.<br />

Exercícios.<br />

• De acor<strong>do</strong> com a fórmula <strong>de</strong> Heron, a área <strong>de</strong> um triângulo <strong>de</strong> la<strong>do</strong>s a, b e c, e semi-perímetro<br />

s = (a + b + c)/2 é<br />

área = √ s(s − a)(s − b)(s − c)<br />

Estime a área <strong>de</strong> um triângulo <strong>de</strong> la<strong>do</strong>s 7, 8 e 9.<br />

• Estime √ 13 com um erro < 0.01 e 0.001.<br />

• Estime quantas iterações é preciso fazer para obter os primeiros n dígitos <strong>de</strong>cimais <strong>de</strong> √ 2<br />

usan<strong>do</strong> o méto<strong>do</strong> <strong>do</strong>s babilónios.


2 ITERATION/RECURSION 10<br />

2.3 Fibonacci numbers<br />

Fibonacci problem. Consi<strong>de</strong>re o seguinte problema, posto por Leonar<strong>do</strong> Pisano (mais conheci<strong>do</strong><br />

como Fibonacci, ou seja, “filius Bonacci”) no seu Liber Abaci, 1202:<br />

Quot paria coniculorum in uno anno ex uno pario germinentur.<br />

Qui<strong>da</strong>m posuit unum par cuniculorum in quo<strong>da</strong>m loco, qui erat undique pariete circun<strong>da</strong>tus,<br />

ut sciret, quot ex eo paria germinarentur in uno anno: cum natura eorum sit<br />

per singulum mensem aliud par germinare; et in secun<strong>do</strong> mense ab eorum natiuitate<br />

germinant. 4<br />

Fibonacci numbers. A resposta <strong>de</strong> Leonar<strong>do</strong> Pisano consiste no seguinte mo<strong>de</strong>lo. Se f n o<br />

número <strong>de</strong> pares <strong>de</strong> coelhos no n-ésimo mês, então<br />

f n+1 = f n + f n−1 .<br />

Esta é uma “lei” que prescreve recursivamente os valores <strong>do</strong>s f n <strong>da</strong><strong>do</strong>s uns valores iniciais f 0 e f 1 .<br />

The sequence grows quite fast, as you can see:<br />

1, 1, 2 , 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377, 610, 987, 1597, 2584 , . . .<br />

and the numbers soon become astronomically large. For example, after 10 years we get<br />

larger than the Avogadro number!<br />

f 120 ≃ 8.67 × 10 24 ,<br />

Quotients and the growth of Fibonacci numbers. How fast <strong>do</strong> Fibonacci numbers grow<br />

Seja q n = f n+1 /f n o quociente entre sucessivos números <strong>de</strong> Fibonacci. Os quocientes satisfazem a<br />

equação recursiva<br />

q n+1 = 1 + 1/q n<br />

We compute:<br />

1 , 2 , 3/2 = 1.5 , 5/3 ≃ 1.66666 , 8/5 = 1.6 , 13/8 = 1.625 , 21/13 ≃ 1.61538 , . . .<br />

A sucessão <strong>do</strong>s q n converge (uma <strong>de</strong>monstração não é difícil, e será <strong>da</strong><strong>da</strong> mais a frente), ou seja,<br />

q n → φ se n → ∞. Ao passar ao limite na equação recursiva temos que φ = 1 + 1/φ, e portanto φ<br />

é uma raiz (positiva) <strong>do</strong> polinómio x 2 − x − 1, ou seja,<br />

φ = 1 + √ 5<br />

2<br />

≃ 1.6180339887498948482 . . .<br />

Hence, for large values of n we may approximate Fibonacci law as<br />

f n+1 ≈ φf n ,<br />

an exponential growth with rate φ. In particular, we expect f n ∼ φ n .<br />

The “ratio”. The limit φ is another famous irrational, the Greeks’ “ratio/proportion”. As<br />

<strong>de</strong>scribed by Euclid: 5<br />

“A straight line is said to have been cut in extreme and mean ratio when, as the whole<br />

line is to the greater segment, so is the greater to the less.”<br />

4 Quantos pares <strong>de</strong> coelhos po<strong>de</strong>m ser gera<strong>do</strong>s por um par em um ano.<br />

Alguém tem um par <strong>de</strong> coelhos, em um lugar inteiramente fecha<strong>do</strong>, para <strong>de</strong>scobrir quantos pares <strong>de</strong> coelhos po<strong>de</strong>m<br />

ser gera<strong>do</strong>s <strong>de</strong>ste par em um ano: por natureza, ca<strong>da</strong> par <strong>de</strong> coelhos gera ca<strong>da</strong> mês outro par, e começa a procrear<br />

a partir <strong>do</strong> segun<strong>do</strong> mês após o nascimento.<br />

5 Euclid, Elements, Book VI, Definition 3.


2 ITERATION/RECURSION 11<br />

If a is the greater part and b the less of a line of lenght a + b, Euclid’s requirement is<br />

a + b<br />

a<br />

There follows that the ratio φ = a/b satisfies 1 + 1/φ = φ. This division of an interval is used in<br />

Book IV of the Elements to construct a regular pentagon.<br />

= a b<br />

Exercícios.<br />

• Show that φ −1 is equal to φ − 1.<br />

Extreme and mean ratio, and regular pentagon.<br />

(from http://en.wikipedia.org/wiki/Gol<strong>de</strong>n_ratio)<br />

• Show that φ is irrational using its geometric <strong>de</strong>finition (see Euclid’s Elements, or [HW59]<br />

4.6.)<br />

2.4 Newton method to find roots of polynomials<br />

Roots of polynomials. Finding √ a means solving the polynomial equation z 2 − a = 0. What<br />

about finding roots of a generic polynomial p(x) ∈ R[x] <br />

Newton-Raphson iterative scheme. O “méto<strong>do</strong> <strong>de</strong> Newton” é um méto<strong>do</strong> proposto por<br />

Joseph Raphson em 1690 para aproximar raízes <strong>de</strong> um polinómio p(x) (o Newton só queria era<br />

resolver x 3 − 2x − 5 = 0). Consiste em “adivinhar” uma aproximação razoável x 0 <strong>de</strong> uma raiz, e<br />

<strong>de</strong>pois melhorar a conjectura usan<strong>do</strong> o zero <strong>da</strong> aproximação linear p(x 0 ) + p ′ (x 0 )(x − x 0 ).<br />

O méto<strong>do</strong>, portanto, consiste na recursão<br />

Search for a root of x 3 − 2x − 5 using Newton iterations.<br />

x n+1 = x n − p(x n)<br />

p ′ (x n ) .<br />

Se a sucessão converge, i.e. x n → x ∞ , e se p ′ (x ∞ ), então o limite x ∞ é uma raiz <strong>de</strong> p.


2 ITERATION/RECURSION 12<br />

Exercícios.<br />

• Use Newton method to solve Newton’s problem, i.e. find the roots of x 3 − 2x − 5.<br />

• Show that Newton method to solve x 2 − a = 0 corresponds to babylonian-Heron iterative<br />

scheme.<br />

• Use o méto<strong>do</strong> <strong>de</strong> Newton para aproximar a “razão”, a raiz positiva <strong>de</strong> x 2 − x − 1. Then,<br />

compare with the babylonian-Heron method (i.e., estimate √ 5, then sum 1 and divi<strong>de</strong> by 2).<br />

• Write and implement Newton method to find n-th roots, i.e. to solve x n − a = 0.<br />

Newton’s fractals. Em 1879 Cayley observou que o méto<strong>do</strong> po<strong>de</strong> ser utiliza<strong>do</strong> também para<br />

aproximar raízes complexas <strong>de</strong> polinómios p(z) ∈ C[z]. A receita consiste em iterar a função<br />

racional<br />

f(z) = z − p(z)<br />

p ′ (z)<br />

O problema é <strong>de</strong>cidir quan<strong>do</strong>, ou seja para quais valores <strong>da</strong> conjetura inicial z 0 , a sucessão (z n ),<br />

com z n+1 = f(z n ), converge para uma raiz <strong>de</strong> p(z). As bacias <strong>de</strong> atração <strong>da</strong>s diferentes raizes<br />

<strong>de</strong>senham padrões surpren<strong>de</strong>ntes no plano complexo<br />

Basins of attraction of the roots of 2z 3 − 2z + 2 in C<br />

(from http://en.wikipedia.org/wiki/Newton_fractal).<br />

Iteração <strong>de</strong> funções racionais na esfera <strong>de</strong> Riemann. É natural consi<strong>de</strong>rar iterações <strong>de</strong><br />

funções racionais f(z) ∈ C(z) arbitrárias (os en<strong>do</strong>morfismos <strong>da</strong> esfera <strong>de</strong> Riemann C = C ∪ {∞}),<br />

e querer <strong>de</strong>screver as trajecórias <strong>de</strong>fini<strong>da</strong>s pela equação recursiva z n+1 = f(z n ).<br />

O exemplo mais estu<strong>da</strong><strong>do</strong> consiste nas iterações <strong>da</strong> família <strong>de</strong> polinómios quadráticos<br />

f(z) = z 2 + c<br />

ao variar o parâmetro c ∈ C. A sua beleza foi intui<strong>da</strong> por Gaston Julia 6 e Pierre Fatou 7 no princípio<br />

<strong>do</strong> século XX, <strong>de</strong>sven<strong>da</strong><strong>da</strong> com o auxílio <strong>do</strong>s computa<strong>do</strong>res mo<strong>de</strong>rnos por Benoît Ma<strong>de</strong>lbrot, e<br />

estu<strong>da</strong><strong>da</strong> por uma multidão <strong>de</strong> excelentes matemáticos (como Adrian Douady, Dennis Sullivan,<br />

John Milnor, Misha Lyubich, Jean-Christophe Yoccoz, Curtis McMullen, . . . ) a partir <strong>do</strong>s anos<br />

‘80 <strong>do</strong> século passa<strong>do</strong>.<br />

6 G. Julia, Mémoire sur l’iteration <strong>de</strong>s fonctions rationnelles, Journal <strong>de</strong> Mathématiques Pures et Appliquées, 8<br />

(1918), 47-245.<br />

7 P. Fatou, Sur les substitutions rationnelles, Comptes Rendus <strong>de</strong> l’Académie <strong>de</strong>s Sciences <strong>de</strong> Paris, 164 (1917)<br />

806-808, and 165 (1917), 992-995.


2 ITERATION/RECURSION 13<br />

Nice pictures. Em baixo, está uma imagem que nos tempos <strong>de</strong> Julia e Fatou apenas era possível<br />

ver com uns olhos matemáticos bem afina<strong>do</strong>s (um applet Java que produz a figura está no meu<br />

bestiario). O laço <strong>de</strong> corações vermelhos à esquer<strong>da</strong>, chama<strong>do</strong> Man<strong>de</strong>lbrot set, consiste nos valores<br />

<strong>do</strong> parâmetro complexo c tais que a órbita <strong>do</strong> ponto crítico z 0 = 0 permanece limita<strong>da</strong>. A região<br />

cinzenta à direita, chama<strong>da</strong> filled-in Julia set, consiste no conjunto <strong>da</strong>s condições iniciais z 0 cuja<br />

órbita é limita<strong>da</strong>. As outras côres (que permitem ver os conjuntos “invisíveis” <strong>de</strong> Cantor) são<br />

escolhi<strong>da</strong>s <strong>de</strong>pen<strong>de</strong>n<strong>do</strong> <strong>da</strong> veloci<strong>da</strong><strong>de</strong> com que as trajectórias z n fogem para o infinito.<br />

Conjunto <strong>de</strong> Man<strong>de</strong>lbrot (esquer<strong>da</strong>) e conjunto <strong>de</strong> Julia <strong>do</strong> polinómio z 2 + c com c ≃ −0.7645 − i · 0.1595 (direita).<br />

(from http://w3.math.uminho.pt/~scosentino/bestiario/julia.html)<br />

2.5 Finite difference equations<br />

Fibonacci mo<strong>de</strong>l is the prototype of<br />

Recursive linear equations. A recursive linear equation (or “finite difference linear equation”)<br />

is a law<br />

a p x n+p + a p−1 x n+p−1 + · · · + a 1 x n+1 + a 0 x n = 0<br />

which <strong>de</strong>fines a sequence (x n ) given a set of “initial conditions” x 0 , x 1 , . . . , x p−1 . Above, a 0 ≠<br />

0, a 1 , . . . , a p−1 , a p ≠ 0 are real or complex parameters. It is a discrete version of a linear ordinary<br />

differential equation of <strong>de</strong>gree p with constant coefficients.<br />

Eigenfunctions. The general recipe is: “linear equations have exponential solutions”. The<br />

conjecture x n = z n solves the recursive equation if z is a root of the characteristic polynomial<br />

P (z) = a p z p + a p−1 z p−1 + · · · + a 1 z + a 0<br />

In particular, if P has p distinct roots (in C), say z 1 , z 2 , . . . , z p , then the general solution of the<br />

recursive equation is a linear combination<br />

x n = c 1 z1 n + c 2 z2 n + · · · + c p zp<br />

n<br />

where the c 1 , c 2 , . . . , c p are constants which <strong>de</strong>pend on the initial conditions x 0 , x 1 , . . . x p−1 .<br />

Exercícios.<br />

• Find an explicit formula for the Fibonacci numbers f n ’s (which is known as Binet’s formula).


2 ITERATION/RECURSION 14<br />

Generating function.<br />

power series<br />

Given a sequence (x n ), <strong>de</strong>fined anyway, we may consi<strong>de</strong>r the (formal)<br />

∑<br />

x n z n<br />

n≥0<br />

If the series has a non-zero radius of convergence r = 1/ lim sup n→∞ x 1/n<br />

n > 0, hence <strong>de</strong>fines an<br />

analytic function g(z) in some neighborhood B r (0) = {z ∈ C s.t. |z| < r} ⊂ C of the origin, then<br />

the original sequence may be recovered computing <strong>de</strong>rivatives, as x n = g (n) (0)/n!.<br />

Theorem A power series ∑ n≥0 x nz n represents a rational function f(z) ∈ C(z) iff the coefficients<br />

x n satisfy a recursive linear equation.<br />

Exercícios.<br />

• If f n <strong>de</strong>notes the n-th Fibonacci number, then the power series ∑ n≥0 f nz n represents the<br />

rational function<br />

1<br />

1 − z − z 2<br />

Observe that it has a pole at 1/φ, and <strong>de</strong>duce that lim sup n→∞ |f n | 1/n = φ (so that f n ∼ φ n ).<br />

2.6 Transformações <strong>do</strong> intervalo e cobweb plot<br />

Análise gráfica. Consi<strong>de</strong>re transformações f : I → R <strong>de</strong>fini<strong>da</strong>s num intervalo I <strong>da</strong> reta real. A<br />

iteração é possível quan<strong>do</strong> f (I) ⊂ I. Um estu<strong>do</strong> ingénuo (mas instrutivo!) <strong>da</strong>s trajetórias po<strong>de</strong>-se<br />

fazer seguin<strong>do</strong> a história <strong>de</strong> um ponto x traçan<strong>do</strong> os segmentos verticais e horizontais<br />

(x, f(x)) ↦→ (f(x), f(x)) ↦→ (f(x), f 2 (x)) ↦→ (f 2 (x), f 2 (x)) ↦→ (f 2 (x), f 3 (x)) ↦→ ...<br />

aju<strong>da</strong>n<strong>do</strong>-se com o gráfico <strong>da</strong> i<strong>de</strong>nti<strong>da</strong><strong>de</strong>.<br />

Cobweb plot of the quadratic map f(x) = λx(1 − x) when λ = 3.56.<br />

É surpren<strong>de</strong>nte observar que, logo que f não é linear, as trajetórias po<strong>de</strong>m ter comportamento<br />

mesmo complica<strong>do</strong>...<br />

Experiência: a família quadrática. Po<strong>de</strong>m começar procuran<strong>do</strong> enten<strong>de</strong>r a dinâmica <strong>da</strong><br />

família quadrática, a família <strong>da</strong>s transformações<br />

f λ : x ↦→ λx (1 − x)<br />

<strong>de</strong>fini<strong>da</strong>s na reta real, ao variar o parâmetro real λ. Esta família contém quase tu<strong>do</strong> o que está<br />

nestas notas... é uma ”palestra” para testar i<strong>de</strong>ias e resulta<strong>do</strong>s, e o seu estu<strong>do</strong> ain<strong>da</strong> levanta hoje<br />

em dia problemas e conjeturas!


2 ITERATION/RECURSION 15<br />

Experiência. Procure enten<strong>de</strong>r a dinâmica <strong>da</strong>s seguintes transformações <strong>de</strong>fini<strong>da</strong>s em intervalos<br />

<strong>de</strong> R convenientes.<br />

x ↦→ ±x 3 x ↦→ x 1/3 x ↦→ x 3 ± x<br />

x ↦→ x 2 + 1/4 x ↦→ 3x(1 − x) x ↦→ 4x(1 − x)<br />

x ↦→ |1 − x| x ↦→ x 2 − 2 x ↦→ sin x e cos x


3 SISTEMAS DINÂMICOS TOPOLÓGICOS, DEFINIÇÕES BÁSICAS 16<br />

3 Sistemas dinâmicos topológicos, <strong>de</strong>finições básicas<br />

3.1 Transformações<br />

Transformações. Nestas notas, um sistema dinâmico topológico será uma ação <strong>de</strong> N 0 ou <strong>de</strong> Z<br />

num espaço topológico (X, τ), gera<strong>da</strong> por uma transformação contínua f : X → X.<br />

As “itera<strong>da</strong>s” <strong>da</strong> transformação f são as transformações f n : X → X, com n ∈ N 0 , <strong>de</strong>fini<strong>da</strong>s<br />

indutivamente por<br />

f 0 = id e f n = f ◦ f n−1 se n ∈ N<br />

(cui<strong>da</strong><strong>do</strong>! nesta notação f 2 (x) não é o quadra<strong>do</strong> <strong>de</strong> f (x), mas f (f (x)) ... ).<br />

Em geral, se n ∈ N e A é um subconjunto <strong>de</strong> X, então f −n (A) <strong>de</strong>nota o conjunto<br />

f −n (A) = {x ∈ X t.q. f n (x) ∈ A} .<br />

Se f é um homeomorfismo, é possível <strong>de</strong>finir as itera<strong>da</strong>s f n : X → X para to<strong>do</strong> n ∈ Z.<br />

A ação Φ : N 0 × X → X, ou Φ : Z × X → X se f for um homeomorfismo, é <strong>de</strong>fini<strong>da</strong> por<br />

Φ n (x) = f n (x).<br />

Espaço <strong>do</strong>s esta<strong>do</strong>s. A seguir, (X, d) será um espaço métrico completo muni<strong>do</strong> <strong>da</strong> topologia<br />

induzi<strong>da</strong> τ, localmente compacto (to<strong>do</strong> ponto admite uma vizinhança compacta) e separável<br />

(admite um subconjunto enumerável <strong>de</strong>nso, e portanto, sen<strong>do</strong> um espaço métrico, uma base enumerável<br />

<strong>da</strong> topologia). Por exemplo, <strong>do</strong>mínios <strong>de</strong> R n , intervalos <strong>da</strong> reta, o círculo R/Z, o toro<br />

R n /Z n , o plano complexo C, a esfera <strong>de</strong> Riemann C, conjuntos <strong>de</strong> Cantor... e produtos cartesianos<br />

<strong>de</strong> espaços finitos. Para evitar triviali<strong>da</strong><strong>de</strong>s e <strong>de</strong>talhes inúteis, assumiremos também que a<br />

cardinali<strong>da</strong><strong>de</strong> <strong>de</strong> X seja infinita.<br />

Translações em espaços homogeneos. A maneira mais simples, <strong>de</strong> fato tautológica, <strong>de</strong> construir<br />

ações é algébrica.<br />

Seja G um grupo topológico, um grupo muni<strong>do</strong> <strong>de</strong> uma topologia <strong>de</strong> Haus<strong>do</strong>rff tal que as<br />

operações (g, g ′ ) ↦→ gg ′ e g ↦→ g −1 sejam contínuas. Da<strong>do</strong> um subgrupo Γ ⊂ G, é possível formar<br />

o espaço homogéneo X = G/Γ = {gΓ com g ∈ G}, muni<strong>do</strong> <strong>da</strong> topologia quociente (a “maior”<br />

topologia em G/Γ tal que a projeção π : G → G/Γ seja contínua).<br />

To<strong>do</strong> subgrupo S ⊂ G age no espaço homogeneo X = G/Γ, a ação S × G/Γ → G/Γ sen<strong>do</strong><br />

(s, gΓ) ↦→ sgΓ. O espaço <strong>da</strong>s órbitas é S\G/Γ.<br />

Em particular, um subgrupo cíclico S = {s n } n∈Z<br />

gera uma ação Φ : Z × X → X <strong>de</strong>fini<strong>da</strong> por<br />

Φ n (gΓ) = s n gΓ, que consiste em iterar a translação esquer<strong>da</strong><br />

gΓ ↦→ sgΓ .<br />

Proprie<strong>da</strong><strong>de</strong>s genéricas. Tem interesse falar <strong>de</strong> coisas como “a maioria <strong>da</strong>s trajetórias”, ou<br />

“quase to<strong>da</strong>s as trajetórias”.<br />

Sen<strong>do</strong> X um espaço topológico, existe a possibili<strong>da</strong><strong>de</strong> <strong>de</strong> consi<strong>de</strong>rar medi<strong>da</strong>s (<strong>de</strong> probabili<strong>da</strong><strong>de</strong>s<br />

ou infinitas) sobre os borelianos <strong>de</strong> X. Da<strong>da</strong> uma medi<strong>da</strong> <strong>de</strong> probabili<strong>da</strong><strong>de</strong>s µ, uma proprie<strong>da</strong><strong>de</strong><br />

é verifica<strong>da</strong> em µ-quase to<strong>do</strong> ponto se o conjunto C <strong>do</strong>s pontos que têm a proprie<strong>da</strong><strong>de</strong> em causa<br />

tem probabili<strong>da</strong><strong>de</strong> µ (C) = 1 (se a massa <strong>de</strong> µ for infinita, a condição tem que ser substitui<strong>da</strong> por<br />

µ (X\C) = 0).<br />

O análogo topológico <strong>da</strong> dicotomia “probabili<strong>da</strong><strong>de</strong> zero ou um” é possível se X é um espaço <strong>de</strong><br />

Baire, ou seja um espaço topológico <strong>de</strong> Haus<strong>do</strong>rff (ca<strong>da</strong> <strong>do</strong>is pontos distintos admitem vizinhanças<br />

disjuntas) on<strong>de</strong> to<strong>da</strong> interseção enumerável <strong>de</strong> abertos <strong>de</strong>nsos é <strong>de</strong>nsa. Num espaço <strong>de</strong> Baire, um<br />

subconjunto é dito residual (ou gor<strong>do</strong>) se contém uma interseção enumerável <strong>de</strong> abertos <strong>de</strong>nsos, e<br />

é dito magro se é uma reunião enumerável <strong>de</strong> subconjuntos “nowhere <strong>de</strong>nse” (cuja a<strong>de</strong>rência tem<br />

interior vazio), ou seja se o seu complementar é residual. Uma proprie<strong>da</strong><strong>de</strong> é dita genérica se o<br />

conjunto C <strong>do</strong>s pontos <strong>de</strong> X que têm a proprie<strong>da</strong><strong>de</strong> em causa é residual. O teorema <strong>de</strong> Baire diz<br />

que exemplos <strong>de</strong> espaços <strong>de</strong> Baire são os espaços métricos completos.


3 SISTEMAS DINÂMICOS TOPOLÓGICOS, DEFINIÇÕES BÁSICAS 17<br />

3.2 Trajetórias e órbitas<br />

Trajetórias. Estamos interessa<strong>do</strong>s no comportamento assimptótico <strong>da</strong> “história” <strong>de</strong> um ponto<br />

x ∈ X, a sequência <strong>de</strong> pontos<br />

x ↦→ f(x) ↦→ f 2 (x) ↦→ f 3 (x) ↦→ ...<br />

A i<strong>de</strong>ia é que, se X é o espaço <strong>do</strong>s esta<strong>do</strong>s <strong>de</strong> um sistema físico, e se o sistema está no esta<strong>do</strong> x<br />

no tempo 0, então o sistema estará no esta<strong>do</strong> f (x) no tempo 1, no esta<strong>do</strong> f 2 (x) = f (f (x)) no<br />

tempo 2, etc...<br />

A trajetória <strong>de</strong> x ∈ X é a sucessão (x n ) n∈N0<br />

, a função que, <strong>da</strong><strong>da</strong> a “condição inicial” x 0 = x,<br />

associa a ca<strong>da</strong> tempo n ≥ 0 o esta<strong>do</strong> <strong>do</strong> sistema x n = f n (x) no tempo n. Observe que a trajetória<br />

<strong>do</strong> ponto x é a solução <strong>da</strong> equação recursiva (ou equação às diferenças <strong>de</strong> primeira or<strong>de</strong>m)<br />

como condição inicial x 0 = x.<br />

x n+1 = f (x n )<br />

Órbitas.<br />

A órbita <strong>de</strong> x ∈ X é a imagem <strong>da</strong> sua trajetória, ou seja o conjunto<br />

O + f (x) = {f n (x)} n∈N0<br />

É costume abusar <strong>da</strong> linguagem e utilizar indistintamente as palavras “trajetória” e “órbita”, <strong>de</strong>s<strong>de</strong><br />

que seja claro o contexto e o significa<strong>do</strong> <strong>da</strong> frase.<br />

Em geral, um ponto x po<strong>de</strong> ter mais <strong>de</strong> uma pré-imagem, e portanto o seu passa<strong>do</strong> não é único.<br />

A gran<strong>de</strong> órbita <strong>do</strong> ponto x é o conjunto<br />

GO f (x) = {x ′ ∈ X t.q. ∃ n, m ≥ 0 t.q. f n (x ′ ) = f m (x)}<br />

ou seja o conjunto <strong>do</strong>s pontos que têm eventualmente a mesma história futura <strong>de</strong> x.<br />

Observe que “estar na mesma gran<strong>de</strong> órbita” é uma relação <strong>de</strong> equivalência. Vale a pena dizer<br />

<strong>de</strong>s<strong>de</strong> já que o espaço quociente, dito espaço <strong>da</strong>s órbitas, po<strong>de</strong> ser complica<strong>do</strong>, se as trajetórias<br />

forem pouco regulares. Por exemplo, se f admite uma órbita <strong>de</strong>nsa, então a topologia quociente<br />

no espaço <strong>da</strong>s órbitas é a topologia trivial! Isto mostra que o espaço <strong>da</strong>s órbitas, em quanto espaço<br />

topológico, po<strong>de</strong> não conter muita informação acerca <strong>do</strong> sistema dinâmico.<br />

Se f é invertível, também é útil <strong>de</strong>finir a órbita completa (que <strong>de</strong> fato coinci<strong>de</strong> com a gran<strong>de</strong><br />

órbita)<br />

O f (x) = {f n (x)} n∈Z<br />

a história passa<strong>da</strong> e futura <strong>de</strong> x. A relação “estar na mesma órbita completa” é uma relação <strong>de</strong><br />

equivalência, e portanto X é uma reunião disjunta <strong>de</strong> órbitas completas.<br />

3.3 Órbitas periódicas<br />

Pontos fixos.<br />

As órbitas mais simples são os pontos fixos <strong>de</strong> f, os pontos p ∈ X tais que<br />

f(p) = p .<br />

Se X é um espaço linear, os pontos fixos são soluções <strong>da</strong> equação f(x) − x = 0.<br />

Órbitas periódicas. A seguir, as órbitas periódicas. O ponto p ∈ X é dito periódico <strong>de</strong> perío<strong>do</strong><br />

n ≥ 1 se f n (p) = p e se n é o menor <strong>do</strong>s tempos k ≥ 1 tais que f k (p) = p. Assim, a órbita <strong>do</strong><br />

ponto periódico p é um conjunto finito<br />

{<br />

p, f (p) , f 2 (p) , ..., f n−1 (p) }<br />

<strong>de</strong> pontos que são permuta<strong>do</strong>s pela transformação f.<br />

Um ponto x po<strong>de</strong> ter órbita finita sem ser periódico: po<strong>de</strong> acontecer que existe k ≥ 1 tal que<br />

f k (x) é um ponto periódico. Tais pontos, que “caem” numa órbita periódica passa<strong>do</strong> um tempo<br />

positivo, são ditos pré-periódicos.


3 SISTEMAS DINÂMICOS TOPOLÓGICOS, DEFINIÇÕES BÁSICAS 18<br />

Fix (f n ) <strong>de</strong>nota o conjunto <strong>do</strong>s pontos fixos <strong>da</strong> transformação f n , ou seja o conjunto <strong>do</strong>s pontos<br />

periódicos <strong>de</strong> f cujos perío<strong>do</strong>s divi<strong>de</strong>m n.<br />

Per f = ∪ n≥1 Fix (f n )<br />

<strong>de</strong>nota o conjunto <strong>do</strong>s pontos periódicos <strong>da</strong> transformação f. Observe que ca<strong>da</strong> um <strong>do</strong>s conjuntos<br />

Fix (f n ) é fecha<strong>do</strong>, pois f n é contínua, mas a reunião Per f po<strong>de</strong> não ser.<br />

Exercício. Estu<strong>de</strong> a dinâmica, ou seja a estrutura <strong>da</strong>s órbitas, <strong>de</strong> uma transformação arbitrária<br />

<strong>de</strong>fini<strong>da</strong> num conjunto finito {1, 2, . . . , n}. Observe que o estu<strong>do</strong> <strong>da</strong> dinâmica <strong>da</strong>s transformações<br />

bijetivas consiste essencialmente no estu<strong>do</strong> <strong>do</strong>s grupos simétricos S n .<br />

3.4 Observáveis<br />

Observáveis. Os observáveis são funções ϕ : X → R ou C. Se o sistema está inicialmente no<br />

esta<strong>do</strong> x, e portanto é observa<strong>do</strong> o valor ϕ (x) <strong>de</strong> ϕ, passa<strong>do</strong> um tempo n a observação <strong>de</strong> ϕ <strong>da</strong>rá<br />

o valor ϕ (f n (x)).<br />

Constantes <strong>do</strong> movimento. Particularmente interessantes são os observáveis que não mu<strong>da</strong>m<br />

no tempo, que os físicos chamam “constantes <strong>do</strong> movimento”. A função ϕ : X → R é dita<br />

invariante se<br />

ϕ ◦ f = ϕ<br />

ou seja se é constante em ca<strong>da</strong> órbita. Observe que, se ϕ é invariante, I ⊂ R e A = ϕ −1 (I),<br />

então f −1 (A) = A. A existência <strong>de</strong> uma função invariante ϕ contém a seguinte informação:<br />

se sabemos que ϕ (x) = a, então o futuro e o passa<strong>do</strong> <strong>de</strong> x pertencem ao conjunto <strong>de</strong> nível<br />

Σ a = {x ∈ X t.q. ϕ (x) = a}, i.e. GO f (x) ⊂ Σ a . As funções invariantes, portanto, reduzem o<br />

espaço disponível às trajetórias.<br />

Funções <strong>de</strong> Lyapunov. Também úteis são observáveis monótonos, crescentes ou <strong>de</strong>crescentes,<br />

ao variar o tempo, conheci<strong>do</strong>s em física como “funções <strong>de</strong> Lyapunov”. Por exemplos, se sabemos<br />

que ϕ ◦ f ≤ ϕ, e que ϕ (x) = a, então o futuro <strong>de</strong> x “não sai” <strong>do</strong> conjunto <strong>de</strong> sub-nível Σ ≤a =<br />

{x ∈ X t.q. ϕ (x) ≤ a}, e o passa<strong>do</strong> <strong>de</strong> x “vem” <strong>de</strong> Σ ≥a = {x ∈ X t.q. ϕ (x) ≥ a}.<br />

Exercícios.<br />

• Mostre que, se ϕ : X → R é invariante, I ⊂ R e A = ϕ −1 (I), então f −1 (A) = A.<br />

• Mostre que a função característica <strong>do</strong> subconjunto A ⊂ X é invariante sse f −1 (A) = A.<br />

Médias temporais. A média temporal (ou média <strong>de</strong> Birkhoff ) <strong>do</strong> observável ϕ até ao tempo<br />

n ≥ 0 é o observável ϕ n <strong>de</strong>fini<strong>do</strong> por<br />

ϕ n (x) = 1<br />

n + 1<br />

n∑<br />

ϕ ( f k (x) )<br />

i.e. o valor <strong>de</strong> ϕ n no ponto x é a média aritmética <strong>do</strong>s valores <strong>de</strong> ϕ na “n-órbita <strong>de</strong> x”, o subconjunto<br />

{<br />

x, f (x) , f 2 (x) , ..., f n (x) } .<br />

Se o limite<br />

k=0<br />

ϕ (x) = lim<br />

n→∞ ϕ n (x)<br />

existe, tem o significa<strong>do</strong> <strong>de</strong> “valor médio assimptótico” <strong>de</strong> ϕ ao longo <strong>da</strong> órbita <strong>de</strong> x. Observe<br />

também que ϕ (x) = (ϕ ◦ f) (x) nos pontos on<strong>de</strong> o limite existe.<br />

Se, em particular, 1 A <strong>de</strong>nota a função característica <strong>de</strong> um subconjunto A ⊂ X, então o limite<br />

1<br />

1 A (x) = lim<br />

n→∞ n + 1 card { 0 ≤ k ≤ n t.q. f k (x) ∈ A }<br />

se existir, representa “a fração <strong>de</strong> tempo assimptótica” que a trajetória <strong>de</strong> x passa em A, ou seja<br />

”a frequência com que a trajetória <strong>de</strong> x visita o conjunto A”.


3 SISTEMAS DINÂMICOS TOPOLÓGICOS, DEFINIÇÕES BÁSICAS 19<br />

3.5 Conjuntos invariantes<br />

Conjuntos invariantes. A função característica <strong>do</strong> subconjunto A ⊂ X é invariante sse f −1 (A) =<br />

A. Uma <strong>de</strong>finição consistente com esta observação é a seguinte: um subconjunto A ⊂ X é dito<br />

invariante se<br />

f −1 (A) = A<br />

Esta condição implica que f (A) ⊂ A, e portanto um ponto <strong>de</strong> um conjunto invariante tem to<strong>da</strong> a<br />

sua história, futura e passa<strong>da</strong>, conti<strong>da</strong> no conjunto.<br />

Observe que GO f (x) é o menor conjunto invariante que contém x, e portanto um conjunto<br />

invariante é uma reunião <strong>de</strong> gran<strong>de</strong>s órbitas, é composto pelas histórias possíveis passa<strong>da</strong>s e futuras<br />

<strong>do</strong>s seus pontos.<br />

Se f é invertível, O f (x) é o menor conjunto invariante que contém x. Isto implica que, se<br />

f : X → X é invertível, um subconjunto A ⊂ X é invariante sse é uma reunião <strong>de</strong> órbitas<br />

completas, i.e. se A = ∪ x∈A O f (x).<br />

Conjuntos ±invariantes. Não há maneira <strong>de</strong> evitar o problema <strong>de</strong> distinguir entre outras<br />

noções <strong>de</strong> invariância. Um subconjunto A ⊂ X é dito +invariante se f(A) ⊂ A (se o futuro <strong>do</strong>s<br />

pontos <strong>de</strong> A vive em A), e é dito −invariante se f −1 (A) ⊂ A (se o passa<strong>do</strong> <strong>do</strong>s pontos <strong>de</strong> A está<br />

em A, ou os pontos <strong>de</strong> A “veem” <strong>de</strong> A).<br />

Em particular, se A é +invariante é possível <strong>de</strong>finir o sistema dinâmico f | A : A → A.<br />

Exercícios.<br />

• Descubra as implicações entre as condições<br />

f −1 (A) = A , f(A) ⊂ A , f −1 (A) ⊂ A ,<br />

f(A) = A , e f −1 (A) = A = f(A)<br />

para uma transformação qualquer, uma transformação sobrejetiva e uma transformação bijetiva.<br />

• Consi<strong>de</strong>re o conjunto C igual a GO f (x), O f (x) ou O + f<br />

(x) para algum ponto x ∈ X, e<br />

<strong>de</strong>termine as proprie<strong>da</strong><strong>de</strong>s <strong>de</strong> invariância <strong>do</strong>s conjuntos C, C, ∂C e C ′ .<br />

• Seja A ⊂ X. Mostre que ∪ n≥0 f n (A) é um conjunto +invariante, <strong>de</strong> fato o menor conjunto<br />

+invariante que contém os pontos <strong>de</strong> A..<br />

• Seja A ⊂ X. Mostre que, se f : X → X é invertível, então ∪ n∈Z f n (A) é um conjunto<br />

invariante, <strong>de</strong> fato o menor conjunto invariante que contém os pontos <strong>de</strong> A.<br />

• Seja ϕ : X → R um observável, e seja A ⊂ X o conjunto <strong>do</strong>s pontos x ∈ X tais que o limite<br />

ϕ (x) = lim n→∞ ϕ n (x) existe. Mostre que A é invariante, e que o observável ϕ : A → R é<br />

invariante com respeito à transformação f | A : A → A.<br />

3.6 Conjugação topológica<br />

Conjugação. Os sistemas dinâmicos topológicos f : X → X e g : Y → Y são (topologicamente)<br />

conjuga<strong>do</strong>s se existe um homeomorfismo h : X → Y , dito conjugação, tal que<br />

h ◦ f = g ◦ h<br />

Observe que a condição po<strong>de</strong> também ser escrita como f = h −1 ◦ g ◦ h, e que é uma relação <strong>de</strong><br />

equivalência. Por indução, vê-se que f n = h −1 ◦ g n ◦ h para to<strong>do</strong> tempo n ≥ 0. Em particular,<br />

uma conjugação h envia órbitas <strong>de</strong> f em órbitas <strong>de</strong> g.<br />

A i<strong>de</strong>ia é que duas transformações topologicamente conjuga<strong>da</strong>s são indistinguíveis <strong>do</strong> ponto<br />

<strong>de</strong> vista topológico (estamos simplesmente a mu<strong>da</strong>r o nome aos pontos <strong>do</strong> espaço <strong>do</strong>s esta<strong>do</strong>s), e<br />

portanto mais vale estu<strong>da</strong>r a dinâmica <strong>de</strong> um representante por ca<strong>da</strong> classe <strong>de</strong> equivalência.


3 SISTEMAS DINÂMICOS TOPOLÓGICOS, DEFINIÇÕES BÁSICAS 20<br />

Semi-conjugação. Uma função contínua e sobrejetiva h : X → Y é dita semiconjugação entre<br />

os sistemas dinâmicos f : X → X e g : Y → Y se h ◦ f = g ◦ h. Neste caso, g é dito um fator <strong>de</strong><br />

f. A h-imagem <strong>de</strong> to<strong>da</strong> órbita <strong>de</strong> f é uma órbita <strong>de</strong> g. Numa linguagem informal, “a dinâmica <strong>de</strong><br />

g está conti<strong>da</strong> na dinâmica <strong>de</strong> f”. Esta <strong>de</strong>finição é interessante sobretu<strong>do</strong> quan<strong>do</strong> o conjunto <strong>do</strong>s<br />

pontos on<strong>de</strong> h não é injetiva é “pequeno”.<br />

3.7 Estabili<strong>da</strong><strong>de</strong> estrutural<br />

Espaços <strong>de</strong> transformações. Uma distância natural no espaço <strong>da</strong>s transformações contínuas<br />

dum espaço métrico (X, d) é a distância <strong>do</strong> sup<br />

d ∞ (f, g) = sup d (f (x) , g (x))<br />

x∈X<br />

ou seja, f e g estão δ-próximos se d (f (x) , g (x)) < δ para to<strong>do</strong> x ∈ X (cui<strong>da</strong><strong>do</strong>: <strong>do</strong>is pontos f e<br />

g po<strong>de</strong>m estar a distância ∞ se X não é limita<strong>do</strong>!).<br />

Se X tem uma estrutura diferenciável, por exemplo se X é um <strong>do</strong>mínio V ⊂ R n , ou em geral<br />

uma varie<strong>da</strong><strong>de</strong> diferenciável, po<strong>de</strong>mos consi<strong>de</strong>rar a classe <strong>da</strong>s transformações que têm <strong>de</strong>riva<strong>da</strong>s<br />

parciais <strong>de</strong> or<strong>de</strong>m ≤ k contínuas, muni<strong>da</strong> <strong>da</strong> topologia <strong>de</strong> Whitney C k . Sem entrar em <strong>de</strong>talhes<br />

técnicos, se X é um intervalo compacto <strong>da</strong> reta real, as topologias C k são gera<strong>da</strong>s pelas normas<br />

‖f − g‖ C 0<br />

= sup |f (x) − g (x)| ‖f − g‖ C 1 = sup |f (x) − g (x)|+sup |f ′ (x) − g ′ (x)| ...etc.<br />

x∈X<br />

x∈X<br />

x∈X<br />

Estabili<strong>da</strong><strong>de</strong> estrutural. Uma transformação f : X → X é C k -estruturalmente estável se<br />

to<strong>da</strong> transformação g : X → X suficientemente próxima <strong>de</strong> f na topologia C k é topologicamente<br />

conjuga<strong>da</strong> a f.<br />

Se o espaço X tem uma estrutura diferenciável, parece natural procurar conjugações diferenciáveis.<br />

O problema é que <strong>de</strong>sta maneira uma divisão em classes <strong>de</strong> equivalência resulta muito<br />

fina e pouco significativa, <strong>de</strong>vi<strong>do</strong> a existência <strong>de</strong> “moduli”...


4<br />

NÚMEROS E DINÂMICA 21<br />

4 Números e dinâmica<br />

“317 is a prime, not because we think so, or because our minds are shaped in one way<br />

rather than another, but because it is so, because mathematical reality is built that way.”<br />

4.1 Expansão <strong>de</strong>cimal e multiplicação ×10<br />

Ref.<br />

[HW59], chapter IX.<br />

G.H. Hardy, A Mathematician’s Apology, 1940.<br />

Expansão <strong>de</strong>cimal.<br />

When children we learn to represent numbers as <strong>de</strong>cimals, like<br />

3.14159265358979323846264338327950288419716939937510 . . .<br />

Of course, there is nothing especial with the number 10, it is but the number of fingers in our<br />

hands. Any other integer d ≥ 2 would <strong>do</strong>. Representing a non-negative (for simplicity) real<br />

number x ∈ R + in base 10 means writing x as the sum of a convergent series<br />

x = X m . . . X 2 X 1 X 0 .x 1 x 2 x 3 . . .<br />

= X m · 10 m + · · · + X 2 · 10 2 + X 1 · 10 + X 0 + x 1<br />

10 + x 2<br />

10 2 + x 3<br />

10 3 + . . .<br />

m∑<br />

∞∑<br />

= X n · 10 n + x n · 10 −n<br />

n=0<br />

n=1<br />

where X n , x n ∈ {0, 1, 2, . . . , 9} and m ≥ 0. Some representations terminate, i.e. have x n = 0<br />

starting from some n ≥ N, and some others are recurring, i.e. of the form<br />

X m . . . X 2 X 1 X 0 .x 1 x 2 . . . x k−1 x k . . . x k+n<br />

(and of course a terminating <strong>de</strong>cimal is a recurring one with recurring word 0). The representation is<br />

unique, hence there is a bijection between R and the space of infinite words X m . . . X 2 x 1 X 0 .x 1 x 2 x 3 . . .<br />

as above, if we <strong>do</strong> not admit recurrent 9’s, i.e. if we substitute . . . x k−1 9 with . . . (x k−1 +1)0 (where<br />

we assume x k−1 ≠ 9).<br />

The finite sum<br />

m∑<br />

[x] = X n · 10 n ∈ Z<br />

n=0<br />

is the integral part of x, the largest of those integers n such that n ≤ x. The possibly infinite sum<br />

{x} = 0.x 1 x 2 x 3 · · · =<br />

∞∑<br />

x n · 10 −n ∈ [0, 1)<br />

is the fractional part of x, the difference {x} = x − [x]. Consequently, [x] + {x} = x.<br />

Division algorithm. The iterative scheme to obtain the <strong>de</strong>cimal representation of a rational<br />

number is the “division algorithm” that we learn when children. Consi<strong>de</strong>r a positive rational<br />

number x = p/q with p, q ∈ N:<br />

p<br />

q = x 0.x 1 x 2 x 3 . . . .<br />

The integer [x] = x 0 is “the number of times q is contained in p”, i.e. the unique integer such that<br />

n=1<br />

p = x 0 · q + r 0<br />

for some rest r 0 which is an integer 0 ≤ r 0 < q. Hence, p/q = x 0 + r 0 /q and 0 ≤ r 0 /q < 1. The<br />

“geometric” meaning of x 1 is that the point r 0 /q lies between 0.x 1 and 0.x 1 + 0.1. Multiplying by<br />

10 and then by q this means that<br />

x 1 · q ≤ 10 · r 0 < x 1 · q + q


4<br />

NÚMEROS E DINÂMICA 22<br />

or, equivalently, that x 1 is the unique integer between 0 and 9 such that<br />

10 · r 0 = x 1 · q + r 1<br />

where, again, the rest r 1 is a non-negative integer 0 ≤ r 1 < q. And so on. Hence, the digits of the<br />

<strong>de</strong>cimal expansion of p/q are iteratively <strong>de</strong>termined by<br />

10 · r n−1 = x n · q + r n where 0 ≤ r n < q<br />

Theorem. The rational numbers are precisely those real numbers whose representation in base<br />

10 (or any other base d ≥ 2) is repeating/recurring.<br />

Meanwhile, there exists irrational numbers!<br />

Exercícios.<br />

• Show that the <strong>de</strong>cimal representation of a rational terminates iff the <strong>de</strong>nominator is 2 a 5 b .<br />

• Write 1/3 in base 2, and 2/3 in base 3 and 7.<br />

• Show that the <strong>de</strong>cimal (or any other base) representation of a rational number is repeating<br />

(observe that the possibilities for the rests r n are finite).<br />

• Show the converse: a repeating <strong>de</strong>cimal represents a rational number (compute the sum of<br />

the series).<br />

• Give examples of non-repeating <strong>de</strong>cimal expansions (see [HW59], section 9.4).<br />

• Prove that Euler’s number<br />

e =<br />

∞∑<br />

n=0<br />

is irrational (Fourier’s i<strong>de</strong>a: assume that e = p/q for some positive integers p/q, and <strong>de</strong>duce<br />

that x = q! (e − ∑ q<br />

n=0 1/n!) is then an integer. Estimate the series x = ∑ ∞<br />

n=q+1<br />

q!/n! and<br />

prove that 0 < x < 1).<br />

Multiplicação ×d. Seja d ≥ 2 um inteiro. A transformação F : R → R que envia ca<strong>da</strong> número x<br />

no seu múltiplo d · x tem uma dinâmica trivial. As coisas ficam mais interessantes se consi<strong>de</strong>ramos<br />

os números módulo os inteiros, e <strong>de</strong>finimos a multiplicação por d como sen<strong>do</strong> a transformação <strong>do</strong><br />

círculo ×d : R/Z → R/Z que envia<br />

x + Z ↦→ d · x + Z<br />

Se x = 0.x 1 x 2 x 3 . . . é a representação <strong>de</strong> x ∈ R/Z ≃ [0, 1) na base d, então a transformação ×d<br />

envia<br />

0.x 1 x 2 x 3 . . . ↦→ 0.x 2 x 3 x 4 . . .<br />

Exercícios.<br />

• Verifique que ×d é contínua.<br />

• Determine a cardinali<strong>da</strong><strong>de</strong> <strong>da</strong> imagem inversa <strong>de</strong> um ponto arbitrário <strong>de</strong> R/Z.<br />

1<br />

n!<br />

• Determine os pontos periódicos e pré-periódicos <strong>de</strong> ×d.


4<br />

NÚMEROS E DINÂMICA 23<br />

4.2 Deslocamentos <strong>de</strong> Bernoulli<br />

Espaço <strong>da</strong>s palavras infinitas. Seja A = {1, 2, ..., z} um “alfabeto” <strong>de</strong> z ≥ 2 letras, um<br />

conjunto finito muni<strong>do</strong> <strong>da</strong> topologia discreta, e seja Σ + = A N o produto topológico <strong>de</strong> infinitas<br />

cópias <strong>de</strong> A. Os pontos <strong>de</strong> Σ + são <strong>de</strong>nota<strong>do</strong>s por x = (x 1 , x 2 , x 3 , . . . , x n , . . . ), com x n ∈ A, e são<br />

“palavras” infinitas nas letras <strong>do</strong> alfabeto A.<br />

A topologia produto é a menor topologia em A N tal que as projeções π n : Σ + → A, que enviam<br />

x ↦→ x n , sejam contínuas. Uma base <strong>da</strong> topologia produto τ em Σ + é a família C <strong>do</strong>s “cilindros<br />

centra<strong>do</strong>s”, os subconjuntos <strong>do</strong> género<br />

C α = { x ∈ Σ + }<br />

t.q. x 1 = α 1 , x 2 = α 2 , ..., x k = α k<br />

palavras infinitas que “começam” pela palavra α = (α 1 , α 2 , ..., α k ), ao variar α entre to<strong>da</strong>s as<br />

palavras finitas nas letras <strong>de</strong> A. Observe que a família <strong>do</strong>s cilindros centra<strong>do</strong>s é uma base <strong>de</strong> uma<br />

topologia porque é uma cobertura, pois Σ + = C 1 ∪ C 2 ∪ ... ∪ C z , e porque a interseção <strong>de</strong> <strong>do</strong>is<br />

cilindros centra<strong>do</strong>s é um cilindro centra<strong>do</strong> ou o conjunto vazio. De fato, C α e C β têm interseção<br />

não vazia sse uma <strong>da</strong>s duas palavras, por exemplo α = (α 1 , α 2 , ..., α k ), é o pe<strong>da</strong>ço inicial <strong>da</strong> outra<br />

palavra, no senti<strong>do</strong> em que β = (α 1 , α 2 , ..., α k , β k+1 ..., β k+i ), e neste caso C α ∩ C β = C β . A i<strong>de</strong>ia é<br />

que, quanto maior for o comprimento <strong>da</strong> palavra α, quanto “menor” é o cilindro C α . Um aberto<br />

<strong>do</strong> produto topólogico Σ + é, por <strong>de</strong>finição, uma reunião <strong>de</strong> cilindros centra<strong>do</strong>s.<br />

A topologia produto é metrizável. Uma possibili<strong>da</strong><strong>de</strong> é a métrica<br />

d λ (x, x ′ ) =<br />

∞∑<br />

λ −n · |x n − x ′ n|<br />

n=1<br />

on<strong>de</strong> λ > 1 (por exemplo, λ = z). Outra possibili<strong>da</strong><strong>de</strong> é<br />

d ∞ (x, x ′ ) = z − min{n∈N : xn≠x′ n }<br />

Os cilindros centra<strong>do</strong>s são as bolas abertas, e também fecha<strong>da</strong>s, <strong>de</strong> (Σ + , d ∞ ). A métrica d ∞ é uma<br />

ultra-métrica, ou seja, uma métrica tal que d(x, y) ≤ max{d(x, z), d(z, y)}.<br />

O espaço Σ + é um espaço métrico compacto, perfeito e totalmente <strong>de</strong>sconexo, logo homeomorfo<br />

a um conjunto <strong>de</strong> Cantor.<br />

Exercícios.<br />

• Mostre que d ∞ é uma ultra-métrica.<br />

• Mostre que se X é um espaço muni<strong>do</strong> <strong>de</strong> uma ultr-métrica, então ca<strong>da</strong> bola aberta B ε (a) =<br />

{y ∈ X t.q. d(x, y) < ε} é também uma bola fecha<strong>da</strong>, e que ca<strong>da</strong> ponto <strong>de</strong> uma bola é um<br />

seu centro.<br />

Deslocamentos <strong>de</strong> Bernoulli. O <strong>de</strong>slocamento <strong>de</strong> Bernoulli (em inglês, Bernoulli shift) é a<br />

transformação σ : Σ + → Σ + que ”esquece a primeira letra”, <strong>de</strong>fini<strong>da</strong> por<br />

σ : (x 1 , x 2 , x 3 , ...) ↦→ (x 2 , x 3 , x 4 , ...)<br />

Observe que σ é uma transformação contínua, pois a imagem inversa <strong>de</strong> um cilindro centra<strong>do</strong> é uma<br />

reunião finita <strong>de</strong> z cilindros centra<strong>do</strong>s, e portanto a imagem inversa <strong>de</strong> um aberto é uma reunião<br />

<strong>de</strong> cilindros centra<strong>do</strong>s, logo um aberto. Observe também que σ não é invertível, to<strong>do</strong> ponto <strong>de</strong> Σ +<br />

tem z pré-imagens.<br />

A i<strong>de</strong>ia é que o alfabeto A representa os possíveis resulta<strong>do</strong>s <strong>de</strong> uma experiência, como lançar<br />

um <strong>da</strong><strong>do</strong> com z faces, e um ponto <strong>de</strong> Σ + representa os resulta<strong>do</strong>s <strong>de</strong> uma sequência infinita <strong>de</strong><br />

experiências idénticas. Iterar n vezes o <strong>de</strong>slocamento correspon<strong>de</strong> a “esquecer” os resulta<strong>do</strong>s <strong>da</strong>s<br />

primeiras n experiências.


4<br />

NÚMEROS E DINÂMICA 24<br />

Exercícios.<br />

• Describe periodic and pre-preriodic points of σ : Σ + → Σ + . Show that they are <strong>de</strong>nse in Σ + .<br />

• Consi<strong>de</strong>r the alphabet A = {0, 1, 2, . . . , 9}. Define a map h : A N → [0, 1] as<br />

(x 1 , x 2 , x 3 , . . . ) ↦→ 0.x 1 x 2 x 3 . . . .<br />

Show that h is onto, and <strong>de</strong>scribe the map sending h(x) into h(σ(x)).<br />

4.3 Rotações <strong>do</strong> círculo/toro<br />

Arithmetic progressions and exponential sums.<br />

The dynamics of an arithmetic progression<br />

a a + α a + 2α a + 3α . . . a + nα . . . ,<br />

obtained from the initial condition x 0 = a using the recursion x n+1 = x n + α, is quite trivial. All<br />

trajectories x n = a + nα diverge, provi<strong>de</strong>d α ≠ 0.<br />

Nevertheless, if we average the observable ϕ(x) = e 2πix , something interesting appears: apart<br />

from a constant factor e 2πia and the normalization 1/n, the Birkhoff averages read<br />

n−1<br />

∑<br />

S α (n) = e 2πikα .<br />

n=0<br />

Sums as E(N) = ∑ n<br />

k=1 e2πix k<br />

are called exponential sums, and contain “spectral information”<br />

about the distribution of the numbers x k modulo 1. Triangular inequality gives the trivial bound<br />

|E(N)| ≤ N, i.e. E(N) = O(N). If the different exponentials e 2πix k<br />

were “uncorrelated”, as<br />

successive positions of a ran<strong>do</strong>m walk in the plane, we should expect E(N) = O( √ N). This, of<br />

course, <strong>do</strong>es not happen with “<strong>de</strong>terministic” generic sequences. The best we can hope is some<br />

bound as E(N) = o(N) (which, in our case, would mean that the Birkhoff averages ϕ n → 0).<br />

Exercícios.<br />

• Show that the sum of the first n terms of an arithmetic progression x k = a + kα is<br />

n−1<br />

∑<br />

x k = n 2 (x 0 + x n−1 ) = na +<br />

k=0<br />

n(n − 1)<br />

α<br />

2<br />

• Observe that, for q ∈ N, the complex number z = e 2πi/q is a non-trivial q-th root of unity.<br />

Hence,<br />

1 + z + z 2 + · · · + z q−1 = 0 .<br />

Deduce that if α = p/q ∈ Q with p ∈ Z, then<br />

∑q−1<br />

S α (q) = e 2πikp/q = 1<br />

so that the exponential sum S p/q (n) is periodic, and in particular is o(N).<br />

n=0<br />

O círculo. O círculo (o esfera <strong>de</strong> dimensão 1) é o espaço quociente S 1 = R/Z <strong>do</strong> grupo comutativo<br />

R pelo subgrupo Z, muni<strong>do</strong> <strong>da</strong> topologia quociente her<strong>da</strong><strong>da</strong> <strong>da</strong> topologia euclidiana <strong>da</strong> reta.<br />

A métrica euclidiana <strong>da</strong> reta induz uma métrica invariante d no círculo, <strong>de</strong>fini<strong>da</strong> por<br />

d (x + Z, x ′ + Z) = min |y − y ′ |<br />

y∈π −1 {x+Z}, y ′ ∈π −1 {x ′ +Z}<br />

on<strong>de</strong> π : R → R/Z <strong>de</strong>nota a projeção x ↦→ x + Z.<br />

= min<br />

n∈Z |x − x′ + n|


4<br />

NÚMEROS E DINÂMICA 25<br />

Rotações.<br />

As rotações <strong>do</strong> círculo são as transformações +α : R/Z → R/Z <strong>de</strong>fini<strong>da</strong>s por<br />

x + Z ↦→ x + α + Z<br />

on<strong>de</strong> α ∈ R. Observe que o círculo R/Z é um grupo comutativo, e que as as transformações +α,<br />

com α ∈ R/Z, são as translações <strong>do</strong> grupo.<br />

As rotações <strong>do</strong> círculo são as isometrias <strong>de</strong> (R/Z, d) que preservam a orientação.<br />

Em notação multiplicativa, se o círculo é i<strong>de</strong>ntifica<strong>do</strong> com S 1 ≃ {z ∈ C t.q. |z| = 1} ⊂ C, as<br />

rotações <strong>do</strong> círculo são as transformações z ↦→ e i2πα z.<br />

Teorema.<br />

Uma rotação <strong>do</strong> círculo x + Z ↦→ x + α + Z tem pontos periódicos sse α é racional.<br />

De fato, se α = p/q com (p, q) = 1 e q > 0, então to<strong>do</strong> ponto <strong>do</strong> círculo é periódico <strong>de</strong> perío<strong>do</strong><br />

q. Por outro la<strong>do</strong>, se α é irracional, não existe nenhum natural n ≥ 1 tal que x + Z = x + nα + Z,<br />

seja o que for x.<br />

Exercícios.<br />

• Verifique que<br />

é uma métrica no círculo R/Z.<br />

d (x + Z, x ′ + Z) = min<br />

n∈Z |x − x′ + n|<br />

• I<strong>de</strong>ntifique o círculo R/Z com o intervalo [0, 1[ (to<strong>da</strong> classe x+Z tem um e só um representante<br />

x neste intervalo), e dê uma expressão analítica para a distância d (x + Z, x ′ + Z) em função<br />

<strong>de</strong> x e x ′ .<br />

(Observe que se |x − x ′ | ≤ 1/2 então d (x + Z, x ′ + Z) = |x − x ′ |)<br />

• Verifique que as rotações R α : x + Zx + α + Z, com α ∈ R, são isometrias, e portanto<br />

homeomorfismos, <strong>de</strong> (R/Z, d).<br />

Transformações <strong>do</strong> círculo. Uma transformação contínua <strong>do</strong> círculo R/Z po<strong>de</strong> ser pensa<strong>da</strong><br />

como uma transformação contínua <strong>da</strong> reta real que “respeita” o retículo Z. Formalmente, seja<br />

π : R → R/Z a projeção π (x) = x + Z. To<strong>da</strong> função contínua F : R → R tal que F (x + 1) = F (x)<br />

mod Z para to<strong>do</strong> x ∈ R induz uma função contínua f : R/Z → R/Z <strong>de</strong>fini<strong>da</strong> por<br />

here<br />

f (x + Z) = F (x) + Z<br />

Por outro la<strong>do</strong>, po<strong>de</strong>-se mostrar que to<strong>da</strong> função contínua f : R/Z → R/Z admite um levantamento,<br />

i.e. uma função contínua F : R → R tal que f ◦ π = π ◦ F . O levantamento não é único, mas<br />

<strong>do</strong>is levantamentos F e G <strong>de</strong> f diferem por um inteiro, no senti<strong>do</strong> em que existe n ∈ Z tal que<br />

F (x) = G(x) + n para to<strong>do</strong> x ∈ R. De fato, F − G é uma função contínua <strong>da</strong> reta real (que é<br />

conexa) com valores inteiros, e portanto é constante. Isto implica que o número inteiro<br />

<strong>de</strong>g(f) = F (x + 1) − F (x)<br />

dito grau <strong>de</strong> f, não <strong>de</strong>pen<strong>de</strong> <strong>do</strong> levantamento. O grau <strong>de</strong> f é a cardinali<strong>da</strong><strong>de</strong> algébrica <strong>da</strong>s préimagens<br />

x ′ ∈ f −1 {x} <strong>de</strong> um ponto genérico x <strong>do</strong> círculo, on<strong>de</strong> ca<strong>da</strong> x ′ conta ±1 <strong>de</strong>pen<strong>de</strong>n<strong>do</strong> se f<br />

preserva ou inverte a orientação numa sua vizinhança.<br />

Um homeomorfismo <strong>do</strong> círculo tem grau ±1, <strong>de</strong>pen<strong>de</strong>n<strong>do</strong> se preserva ou menos a orientação.<br />

Os recobribentos <strong>do</strong> círculo <strong>de</strong> grau k, com k ∈ Z\ {0}, são as transformações ×k : R/Z → R/Z<br />

<strong>de</strong>fini<strong>da</strong>s por<br />

x + Z ↦→ k · x + Z<br />

Observe que ca<strong>da</strong> ponto <strong>do</strong> círculo tem precisamente |k| pré-imagens.<br />

Em geral, uma transformação <strong>do</strong> círculo <strong>de</strong> grau k tem um levantamento que é <strong>da</strong> forma F (x) =<br />

k · x + h (x), on<strong>de</strong> h é uma função contínua periódica <strong>de</strong> perío<strong>do</strong> um, i.e. tal que h (x + 1) = h (x)<br />

para to<strong>do</strong> x ∈ R.


4<br />

NÚMEROS E DINÂMICA 26<br />

Rotações <strong>do</strong> toro. O toro <strong>de</strong> dimensão n é o espaço quociente T n = R n /Z n , muni<strong>do</strong> <strong>da</strong><br />

métrica<br />

d (x + Z n , x ′ + Z n ) =<br />

min<br />

y∈π −1 {x+Z n }, y ′ ∈π −1 {x ′ +Z n }<br />

|y − y ′ |<br />

on<strong>de</strong> π : R n → R n /Z n é a projeção. As rotações <strong>do</strong> toro são os homeomorfismos +α : R n /Z n →<br />

R n /Z n <strong>de</strong>fini<strong>do</strong>s por<br />

x + Z n ↦→ x + α + Z n<br />

on<strong>de</strong> agora α ∈ R n .<br />

4.4 Dyadic adding machine<br />

Inteiros diádicos. A norma diádica nos inteiros Z é <strong>de</strong>fini<strong>da</strong> por ‖n‖ 2 = 2 −k se 2 k é a maior<br />

potência <strong>de</strong> 2 que divi<strong>de</strong> n (ou seja, se n = 2 k q com q ímpar). O grupo aditivo (<strong>de</strong> fato, o anel) <strong>do</strong>s<br />

inteiros diádicos Z 2 é o completamento <strong>de</strong> Z com respeito à distância diádica d 2 (n, m) = ‖n−m‖ 2 .<br />

É um grupo topológico compacto. Po<strong>de</strong> ser pensa<strong>do</strong> como o conjunto <strong>da</strong>s séries formais<br />

∞∑<br />

x = x n 2 n = . . . x n . . . x 3 x 2 x 1<br />

n=1<br />

com x n ∈ {0, 1}, muni<strong>do</strong> <strong>da</strong> “adição” <strong>de</strong>fini<strong>da</strong> <strong>da</strong> forma usual <strong>da</strong> direita à esquer<strong>da</strong>. Em quanto<br />

espaço topológico, Z 2 é isomorfo ao produto topológico Σ − ≃ {0, 1} −N , o conjunto <strong>da</strong>s palavras<br />

infinitas (. . . x n . . . x 3 x 2 x 1 ) nas letras 0 e 1, muni<strong>do</strong> <strong>da</strong> topologia produto.<br />

Adding machine. A “dyadic adding machine” (ou “Kakutani-von Neumann o<strong>do</strong>meter”) é a<br />

translação η : Z 2 → Z 2 , <strong>de</strong>fini<strong>da</strong> por<br />

x ↦→ x + 1<br />

ou seja,<br />

Exercícios.<br />

{<br />

1 − xn se x<br />

(ηx) n =<br />

k = 1 ∀ k < n<br />

caso contrário<br />

• Verifique que η é um homeomorfismo, com inversa<br />

{<br />

(η −1 1 − xn se x<br />

x) n =<br />

k = 0 ∀ k < n<br />

caso contrário<br />

x n<br />

x n<br />

• A adding machine η tem pontos periódicos<br />

4.5 Frações contínuas e mapa <strong>de</strong> Gauß<br />

Ref.<br />

[HW59] chapter X, and [Kh35].<br />

Frações contínuas.<br />

formais<br />

As frações contínuas (simples e com <strong>de</strong>nomina<strong>do</strong>res naturais) são expressões<br />

[a 0 ; a 1 , a 2 , a 3 , . . . ] = a 0 +<br />

a 1 +<br />

1<br />

a 2 +<br />

1<br />

1<br />

a 3 + 1<br />

. ..<br />

on<strong>de</strong> a 0 ∈ Z e os “<strong>de</strong>nomina<strong>do</strong>res” a n ∈ N se n ≥ 1. Os convergents <strong>de</strong> [a 0 ; a 1 , a 2 , a 3 , . . . ] são as<br />

frações contínuas finitas<br />

[a 0 ; a 1 , a 2 , . . . , a n ] = a 0 +<br />

a 1 +<br />

1<br />

a 2 +<br />

1<br />

1<br />

. .. +<br />

1<br />

a n


4<br />

NÚMEROS E DINÂMICA 27<br />

Observe que se os a n são inteiros, então os convergentes são números racionais p n /q n (com p n , q n ∈<br />

Z, q n ≠ 0 e (p n , q n ) = 1).<br />

Teorema. Os convergentes p n /q n = [a 0 ; a 1 , a 2 , . . . , a n ] <strong>da</strong> fração contínua [a 0 , a 1 , a 2 , a 3 , . . . ] são<br />

<strong>de</strong>termina<strong>do</strong>s pela equação recursiva<br />

p n = a n p n−1 + p n−2<br />

q n = a n q n−1 + q n−2<br />

com condições iniciais p 0 = a 0 e q 0 = 1, e p −1 = 1 e q −1 = 0.<br />

Dem. [Kh35, HW59] to be <strong>do</strong>ne<br />

Exercícios.<br />

• Mostre por indução que<br />

q n p n−1 − p n q n−1 = (−1) n<br />

Deduza que os convergentes p n /q n são frações reduzi<strong>da</strong>s.<br />

• Mostre que<br />

p n+1<br />

q n+1<br />

− p n<br />

q n<br />

= (−1)n<br />

q n+1 q n<br />

Deduza que os convergentes com n par crescem, e os convergentes com n ímpar <strong>de</strong>crescem.<br />

• Use a equação recursiva (e as condições iniciais) para mostrar que os <strong>de</strong>nomina<strong>do</strong>res q n <strong>do</strong>s<br />

convergentes p n /q n <strong>de</strong> uma fração contínua infinita [a 0 ; a 1 , a 2 , a 3 , . . . ] satisfazem<br />

q n+2 ≥ q n+1 + q n ≥ 2q n ,<br />

e portanto crescem exponencialmente (mais <strong>do</strong> que a sucessão <strong>de</strong> Fibonacci!):<br />

q n+1 ≥ 2 n/2 .<br />

Valores. A <strong>de</strong>sigual<strong>da</strong><strong>de</strong> ∣ ∣∣∣ p n+1<br />

− p ∣<br />

n ∣∣∣ 1<br />

= ≤ 2 1−n<br />

q n+1 q n q n+1 q n<br />

implica que a sucessão <strong>do</strong>s convergentes p n /q n <strong>de</strong> uma fração contínua infinita é convergente, ou<br />

seja, existe o lim n→∞ p n /q n = x, chama<strong>do</strong> valor <strong>da</strong> fração contínua e <strong>de</strong>nota<strong>do</strong> por<br />

x = [a 0 ; a 1 , a 2 , a 3 , . . . ] = lim<br />

n→∞ [a 0; a 1 , a 2 , . . . , a n ] ,<br />

De facto, é possível mostrar que se a fração contínua é infinita, este valor é um número irracional,<br />

e os convergentes satisfazem explain the<br />

∣ first inequality!<br />

1 ∣∣∣<br />

q n (q n+1 + q n ) < x − p ∣<br />

n ∣∣∣ 1<br />

<<br />

q n q n+1 q n<br />

Teorema. A ca<strong>da</strong> número real x ∈ R correspon<strong>de</strong> uma única fração contínua, finita se é racional<br />

e infinita se é irracional:<br />

• se x ∈ Q, então<br />

x = [a 0 ; a 1 , a 2 , . . . , a n ] com a n > 1 ,<br />

• se x ∈ R\Q, então<br />

x = [a 0 ; a 1 , a 2 , . . . , a n , . . . ] = lim<br />

n→∞ [a 0; a 1 , a 2 , . . . , a n ] .


4<br />

NÚMEROS E DINÂMICA 28<br />

Construction of continued fractions representation. The recipe to get the (unique) continued<br />

fractions representation of a real number x ∈ R is as follows. First, <strong>de</strong>fine a 0 = [x], so<br />

that<br />

x = a 0 + x 0<br />

for some 0 ≤ x 0 < 1. If x 0 ≠ 0 (i.e. if x is not an integer) we may <strong>de</strong>fine r 1 = 1/x 0 , then<br />

a 1 = [1/x 0 ], and write<br />

1<br />

x = [a 0 ; r 1 ] = a 0 +<br />

a 1 + x 1<br />

for some 0 ≤ x 1 < 1. If x 1 ≠ 0, for otherwise x would be rational, we may <strong>de</strong>fine r 2 = 1/x 1 , then<br />

a 2 = [1/x 1 ] and write<br />

1<br />

x = [a 0 ; a 1 , r 2 ] = a 0 +<br />

1<br />

a 1 +<br />

a 2 + x 2<br />

for some 0 ≤ x 2 < 1. Inductively, we see that<br />

1<br />

x = [a 0 ; a 1 , a 2 , . . . , a n−1 , r n ] = a 0 +<br />

1<br />

a 1 +<br />

1<br />

a 2 +<br />

1<br />

... +<br />

a n + x n<br />

where a n = [1/x n−1 ] and x n = 1/x n−1 − a n . The algorithm stops if some x n+1 = 0, i.e. if r n is an<br />

integer, hence if<br />

x = [a 0 ; a 1 , a 2 , . . . , a n ]<br />

is racional. Conversely, if x = p/q is rational, all the r n ’s are positive rational, and have strictly<br />

<strong>de</strong>creasing <strong>de</strong>nominators (for if r n = a/b, then 1/r n+1 = r n − a n = (a − a n b)/b = c/b, and c < b<br />

because r n − a n < 1). So, there must be some first r n which is an integer, and the algorithm stops.<br />

On the other si<strong>de</strong>, if x is irrational, the x n ’s are never zero, hence all the a n ’s with n > 0 are<br />

positive integers, and x is represented by an infinite continued fraction, i.e.<br />

Exercícios.<br />

x = lim<br />

n→∞ [a 0; a 1 , a 2 , . . . , a n ] = [a 0 ; a 1 , a 2 , a 3 , . . . ]<br />

• Use the quadratic equation φ 2 − φ − 1 = 0 to show that the “ratio” φ has the simplest<br />

continued fraction, namely<br />

1 + √ 5<br />

= [1; 1, 1, 1, 1, 1, . . . ]<br />

2<br />

(observe that φ −1 = φ − 1 is a root of x 2 + x − 1 = 0, hence x = 1/(1 + 1/x), and so on). Its<br />

convergents are 1 , 2 , 3/2 , 5/3 , 8/5 , 13/8 , 21/13 , 34/21 , . . . , ratios between successive<br />

Fibonacci numbers. It is also the (irrational) number with worse rational approximations,<br />

namely |φ − p/q| > (1/ √ 5)/q 2 for any rational p/q.<br />

• Also, the most famous irrational has a simple continued fraction. Show that<br />

√<br />

2 = [1; 2, 2, 2, 2, 2, . . . ]<br />

(observe that 1 + √ 2 is the positive root of x 2 − 2x − 1. Hence x = 2 + 1/x, and so on). Its<br />

convergents are 1 , 3/2 , 7/5 , 17/12 , 41/29 , 99/70 , 239/169 , 577/408 , . . . .<br />

Gauß map. If x is irrational, the sequence (x n ) in the construction of its infinite continued<br />

fraction is the trajectory of x 0 = x − [x] un<strong>de</strong>r the Gauss map g : ]0, 1] → ]0, 1], <strong>de</strong>fined as<br />

x ↦→ 1/x − [1/x]<br />

Observe that g is not <strong>de</strong>fined at the origin, hence to iterate g we need to avoid all the preimages<br />

of 0, which are the rationals.


4<br />

NÚMEROS E DINÂMICA 29<br />

Frações contínuas periódicas e irracionais quadráticos.<br />

são as raizes irracionais <strong>do</strong>s polinómio quadrático<br />

Os números irracionais quadráticos<br />

f(x) = ax 2 + bx + c<br />

com a, b, c ∈ Z, ou seja, os números <strong>da</strong> forma α+√ β<br />

δ<br />

, on<strong>de</strong> α, β, δ ∈ Z, δ ≠ 0 e β > 0 não é um<br />

quadra<strong>do</strong>.<br />

Teorema <strong>de</strong> Lagrange. A fração contínua <strong>de</strong> um número irracional x ∈ R\Q é periódica sse<br />

x é um irracional quadrático.<br />

Dem.<br />

See [Kh35, HW59]. The “if” part is easy, and is suggested in the following exercises.<br />

Exercícios.<br />

• Mostre, por indução, que se x é um irracional quadrático então [a 0 ; a 1 , a 2 , . . . , a n , x] é também<br />

um irracional quadrático, para to<strong>do</strong>s os inteiros a 0 , a 1 , . . . , a n .<br />

• Mostre que para to<strong>do</strong> x ∈ R e to<strong>do</strong>s a 0 , a 1 , . . . , a n inteiros,<br />

com a, b, c, d ∈ Z.<br />

• Observe que se x = [a 0 ; a 1 , a 2 , . . . , a n ], então<br />

[a 0 ; a 1 , a 2 , . . . , a n , x] = ax + b<br />

cx + d<br />

x = ax + b<br />

cx + d<br />

com a, b, c, d ∈ Z, e portanto é um irracional (porque a sua fração contínua é infinita)<br />

quadrático (porque x(cx + d) = ax + b, <strong>do</strong>n<strong>de</strong> cx 2 + (d − a)x − b = 0).<br />

• Deduza que se a fração contínua <strong>de</strong> x é periódica então x é un irracional quadrático.<br />

Rational approximations of irrationals. Rationals are <strong>de</strong>nse in the real line (which is, in<strong>de</strong>ed,<br />

the completion of rationals w.r.t. the Eucli<strong>de</strong>an metric, so that real numbers are equivalence classes<br />

of Cauchy sequences of rationals). Hence, for any x ∈ R and any “precision” ε > 0 we may find<br />

“rational approximations” of x, i.e. solutions p/q of the inequality<br />

∣ x − p q ∣ < ε .<br />

The questions, when x is irrational, are: how large must be the <strong>de</strong>nominator q given ε How <strong>do</strong><br />

the <strong>de</strong>nominators grow when we take smaller and smaller ε <br />

Continued fraction gives the following first answer (but Dirichelet’s proof is much simpler, a<br />

pigeon-hole argument).<br />

Theorem.<br />

Let x be an irrational number. Then there exist an infinity of rationals p/q such that<br />

∣ x − p q ∣ < 1 q 2 .


4<br />

NÚMEROS E DINÂMICA 30<br />

Algebraic and transcen<strong>de</strong>ntal numbers. Algebraic numbers are the roots of polynomials with<br />

integer coefficients. The <strong>de</strong>gree of the algebraic number x is the minimal <strong>de</strong>gree of a polynomial<br />

p ∈ Z[x] such that p(x) = 0. So, algebraic numbers of <strong>de</strong>gree 1 are the rational numbers, algebraic<br />

numbers of <strong>de</strong>gree 2 are the quadratic irrationals, and so on. Numbers which are not algebraic are<br />

called transcen<strong>de</strong>ntal, and the natural problems are: <strong>do</strong> they exist could we write some of them<br />

<strong>do</strong> we recognize them<br />

Let us say that a number x is approximable to or<strong>de</strong>r n if there exists a constant λ(x) (which<br />

may <strong>de</strong>pend on x) such that the inequality<br />

∣ x − p q ∣ < λ(x)<br />

q n .<br />

admits infinite rational solutions p/q.<br />

Liouville theorem. A real algebraic number of <strong>de</strong>gree n is not approximable to or<strong>de</strong>r > n.<br />

Proof. Let x be an algebraic number of <strong>de</strong>gree n, and f(x) = ax n + bx n−1 + · · · ∈ Z[x] be a<br />

polynomial of <strong>de</strong>gree n such that f(x) = 0. Let p/q be a rational approximation to x. We may<br />

assume that p/q belongs to an interval I = (x − ε, x + ε) around x so small that the polynomial<br />

f(x) has no other root than x, and has boun<strong>de</strong>d <strong>de</strong>rivative, say |f ′ (y)| < L if y ∈ I. Then<br />

|f(p/q)| = |apn + bp n−1 q + . . . |<br />

q n ≥ 1<br />

q n<br />

since the numerator is a positive integer. By the mean value theorem<br />

|f(p/q)| = |f(x) − f(p/q)| = |f ′ (y)| · |x − p/q| ≤ L · |x − p/q|<br />

for some y ∈ I. Putting together the two inequalities we get<br />

|x − p/q| ≥ L−1<br />

q n<br />

Existence and construction of transcen<strong>de</strong>ntal numbers. Liouville theorem shows that<br />

transcen<strong>de</strong>ntal numbers <strong>do</strong> exist! Moreover, it allows us to give some examples: it is sufficient to<br />

produce numbers which are approximable to any or<strong>de</strong>r. The example in [HW59] is<br />

0.1100010000000000000000010 · · · = 1<br />

10 1! + 1<br />

10 2! + 1<br />

10 3! + 1<br />

10 4! + . . .


5 ÓRBITAS REGULARES E PERTURBAÇÕES 31<br />

5 Órbitas regulares e perturbações<br />

5.1 Teoremas <strong>de</strong> ponto fixo “topológicos”<br />

Encontrar os pontos periódicos <strong>de</strong> uma transformação f, o seja os pontos fixos <strong>da</strong>s itera<strong>da</strong>s f n , é<br />

tu<strong>do</strong> menos que trivial. Pensem só no caso <strong>de</strong> um polinómio f <strong>de</strong> grau k > 1 <strong>de</strong>fini<strong>do</strong> na reta real.<br />

A itera<strong>da</strong> f n é um polinómio <strong>de</strong> grau nk, e resolver a equação f n (x) = x não é fácil ...<br />

Em dimensão um, conexos e convexos coinci<strong>de</strong>m e são chama<strong>do</strong>s intervalos. Este “milagre” é<br />

responsavel <strong>de</strong> <strong>do</strong>is critérios muito simples para provar a existência <strong>de</strong> pontos fixos em <strong>de</strong>termina<strong>do</strong>s<br />

intervalos <strong>do</strong> <strong>do</strong>mínio <strong>de</strong> uma transformação contínua f : I → R. Numa linguagem sugestiva, dizem<br />

que se uma transformação restringe ou estica um intervalo compacto J ⊂ I, então fixa pelo menos<br />

um ponto <strong>de</strong>ste intervalo. Formalmente,<br />

Teorema <strong>de</strong> ponto fixo. Seja f : I → R uma transformação contínua <strong>de</strong>fini<strong>da</strong> num intervalo<br />

I ⊂ R.<br />

i) Se J ⊂ I é um intervalo compacto tal que f (J) ⊂ J, então f tem um ponto fixo em J.<br />

ii) Se J ⊂ I é um intervalo compacto tal que J ⊂ f(J), então f tem um ponto fixo em J.<br />

A prova é uma aplicação elementar <strong>do</strong> teorema <strong>de</strong> Bolzano à função f − id. É instructivo<br />

procurar <strong>de</strong>monstrações mais abstratas. Observe que, se f não tivesse pontos fixos em J, então<br />

x ↦→ f (x) − x<br />

|f (x) − x|<br />

seria uma aplicação contínua <strong>de</strong> um intervalo (J no caso i) ou um subintervalo <strong>de</strong> J no caso ii))<br />

sobre o espaço <strong>de</strong>sconexo {−1, 1} ...<br />

Outros teorema <strong>de</strong> ponto fixo. Em dimensão maior, o análogo <strong>do</strong> resulta<strong>do</strong> i) é o ”teorema<br />

<strong>de</strong> ponto fixo <strong>de</strong> Brouwer”: uma transformação contínua f : B n → B n <strong>da</strong> bola fecha<strong>da</strong> B n =<br />

{x ∈ R n t.q. |x| ≤ 1} ⊂ R n tem um ponto fixo. O “absur<strong>do</strong>” que produz a <strong>de</strong>monstração <strong>de</strong>ste<br />

resulta<strong>do</strong> não é tão trivial como no caso <strong>do</strong> intervalo, e utiliza i<strong>de</strong>ias <strong>de</strong> topologia algébrica: não é<br />

possível <strong>de</strong>formar <strong>de</strong> maneira contínua a bola B n até obter a esfera S n−1 = ∂B n . A generalização<br />

em dimensão infinita é o teorema <strong>de</strong> ponto fixo <strong>de</strong> Shau<strong>de</strong>r-Tychonov: uma transformação contínua<br />

f : K → K <strong>de</strong> um subconjunto compacto e convexo K <strong>de</strong> um espaço <strong>de</strong> Banach (ou <strong>de</strong> um espaço<br />

vetorial topológico localmente convexo) tem um ponto fixo.<br />

5.2 Bacia <strong>de</strong> atração<br />

Limite <strong>de</strong> trajetórias convergentes. Se a trajetória <strong>de</strong> x é uma sucessão convergente, o seu<br />

limite é um ponto fixo. De fato, se f n (x) → p, a continui<strong>da</strong><strong>de</strong> <strong>de</strong> f implica que<br />

( )<br />

f (p) = f lim f n (x) = lim f n+1 (x) = p .<br />

n→∞ n→∞<br />

Bacia <strong>de</strong> atração. Seja p um ponto fixo <strong>de</strong> f : X → X. A bacia <strong>de</strong> atração, ou conjunto estável,<br />

<strong>de</strong> p é o conjunto <strong>do</strong>s pontos cuja trajetória é assimptótica a p, i.e.<br />

{<br />

}<br />

W s (p) = x ∈ X t.q. lim f n (x) = p<br />

n→∞<br />

A unici<strong>da</strong><strong>de</strong> <strong>do</strong> limite <strong>de</strong> uma sucessão convergente num espaço métrico implica que os conjuntos<br />

estáveis <strong>de</strong> <strong>do</strong>is pontos fixos diferentes são disjuntos.<br />

Execícios.<br />

• Seja f : R → R a transformação linear <strong>da</strong> reta <strong>de</strong>fini<strong>da</strong> por x ↦→ λx. Estu<strong>de</strong> a bacia <strong>de</strong><br />

atração <strong>do</strong> ponto fixo 0 ao variar o parâmetro λ.


5 ÓRBITAS REGULARES E PERTURBAÇÕES 32<br />

• Seja f : R 2 → R 2 a transformação linear <strong>do</strong> plano <strong>de</strong>fini<strong>da</strong> por<br />

( ) a b<br />

x ↦→ x<br />

c d<br />

Estu<strong>de</strong> a bacia <strong>de</strong> atração <strong>do</strong> ponto fixo 0 ao variar os parâmetros a, b, c, d.<br />

5.3 Dinâmica <strong>da</strong>s contrações<br />

Dinâmica <strong>da</strong>s contrações. Seja (X, d) um espaço métrico. Uma aplicação f : X → X é uma<br />

contração (ou λ-contração se é importante lembrar o valor <strong>de</strong> λ) se é Lipschitz e tem constante <strong>de</strong><br />

Lipschitz λ < 1, ou seja se existe 0 ≤ λ < 1 tal que para to<strong>do</strong>s x, x ′ ∈ X<br />

d(f(x), f(x ′ )) ≤ λ · d(x, x ′ )<br />

A dinâmica <strong>da</strong>s contrações é simples, e é <strong>de</strong>scrita pelo<br />

Princípio <strong>da</strong>s contrações (teorema <strong>de</strong> ponto fixo <strong>de</strong> Banach). To<strong>da</strong>s as trajetórias <strong>de</strong><br />

uma contração f : X → X são sucesssões <strong>de</strong> Cauchy, e a distância entre ca<strong>da</strong> duas trajetórias<br />

diminue exponencialmente no tempo. Se X é completo, então f tem um e um único ponto fixo p, e<br />

a trajetória <strong>de</strong> to<strong>do</strong> ponto x ∈ X converge exponencialmente para o ponto fixo, ou seja f n (x) → p<br />

quan<strong>do</strong> n → ∞.<br />

<strong>de</strong>m. Seja x 0 ∈ X um ponto arbitrário, e seja (x n ) a sua trajetória, i.e. x n+1 = f(x n ). Iteran<strong>do</strong><br />

a contrativi<strong>da</strong><strong>de</strong> vê-se que d (x k+1 , x k ) ≤ d(x 1 , x 0 )·λ k . Usan<strong>do</strong> k vezes a <strong>de</strong>sigual<strong>da</strong><strong>de</strong> <strong>do</strong> triângulo<br />

e <strong>de</strong>pois a convergência <strong>da</strong> série geométrica <strong>de</strong> razão λ, vê-se que<br />

d(x n+k , x n )<br />

≤<br />

k−1<br />

∑<br />

k−1<br />

∑<br />

d(x n+j+1 , x n+j ) ≤ d(x 1 , x 0 ) ·<br />

j=0<br />

≤ d(x 1 , x 0 ) · λ n ·<br />

j=0<br />

j=0<br />

λ n+j<br />

∞∑<br />

λ j ≤<br />

λn<br />

1 − λ · d(x 1, x 0 ).<br />

Portanto, (x n ) é uma sucessão <strong>de</strong> Cauchy, pois λ n ·d(x 1 , x 0 )/ (1 − λ) é menor <strong>de</strong> ca<strong>da</strong> ε > 0 a partir<br />

<strong>de</strong> um n (ε) suficientemente gran<strong>de</strong>. A continui<strong>da</strong><strong>de</strong> <strong>de</strong> f implica que o limite p = lim n→∞ x n , que<br />

existe se X é completo, é um ponto fixo <strong>de</strong> f. A unici<strong>da</strong><strong>de</strong> <strong>do</strong> ponto fixo é evi<strong>de</strong>nte, pois se p e p ′<br />

são fixos então d (p, p ′ ) = d (f (p) , f (p ′ )) ≤ λ · d (p, p ′ ) com λ < 1, <strong>do</strong>n<strong>de</strong> d (p, p ′ ) = 0. Por outro<br />

la<strong>do</strong>, a contrativi<strong>da</strong><strong>de</strong> também diz que d(x n , p) ≤ λ n · d(x 0 , p), ou seja que a convergência x n → p<br />

é exponencial.<br />

Estabili<strong>da</strong><strong>de</strong> <strong>da</strong>s contrações. Uma contração f : X → X <strong>do</strong> espaço métrico completo X<br />

po<strong>de</strong> ser pensa<strong>da</strong> como uma “máquina” que calcula o ponto fixo p = lim n→∞ f n (x) a partir <strong>de</strong><br />

uma condição inicial arbotráriax ∈ X. O problema é <strong>de</strong>cidir se uma pequena perturbação <strong>de</strong> f<br />

, digamos g : X → X, produz um ponto fixo p ′ próximo <strong>de</strong> p. A resposta consiste em formular<br />

um resulta<strong>do</strong> <strong>de</strong> “continui<strong>da</strong><strong>de</strong>”, que diga que um controle <strong>da</strong> “distância” entre f e g permite ter<br />

um controle <strong>da</strong> distância entre p ′ e p. Ora, se d ∞ (f, g) < δ, a transformação g po<strong>de</strong> não ser uma<br />

contração, por quanto pequeno seja o δ > 0 (para se convencer, po<strong>de</strong> traçar gráficos <strong>de</strong> contrações<br />

<strong>da</strong> reta real, e ver que numa δ-vizinhança cabem gráficos <strong>de</strong> transformações mais chatas...). Uma<br />

solução é admitir que X tenha uma estrutura diferenciável e que as transformações sejam <strong>de</strong> classe<br />

C 1 . A condição ‖f − g‖ C 1 < δ implica que, se f é uma λ-contração e δ < 1 − λ, então também g é<br />

uma contração e tem constante <strong>de</strong> Lipschitz ≤ λ + δ. Mais vale procurar o teorema <strong>de</strong> estabili<strong>da</strong><strong>de</strong><br />

diretamente <strong>de</strong>ntro <strong>do</strong> espaço <strong>da</strong>s contrações.<br />

Teorema (perturbação <strong>da</strong> contração). Seja f : X → X uma λ-contração <strong>do</strong> espaço métrico<br />

completo (X, d), e seja p ∈ X o seu ponto fixo. Para to<strong>do</strong> ε > 0 existe 0 < δ < 1 − λ tal que se<br />

g : X → X uma (λ + δ)-contração a distância d ∞ (f, g) < δ, e se p ′ é ponto fixo <strong>de</strong> g, então<br />

d(p, p ′ ) < ε


5 ÓRBITAS REGULARES E PERTURBAÇÕES 33<br />

Dem. Se p ′ é o ponto fixo <strong>de</strong> g, então em particular g n (p) → p ′ quan<strong>do</strong> n → ∞. Utilizan<strong>do</strong> a<br />

<strong>de</strong>sigual<strong>da</strong><strong>de</strong> <strong>do</strong> triângulo vê-se que<br />

d (p, p ′ )<br />

≤<br />

∞∑<br />

d ( g n+1 (p) , g n (p) ) ∞∑<br />

≤ d (g (p) , p) · (λ + δ) n<br />

n=0<br />

≤ δ ·<br />

∞∑<br />

(λ + δ) n δ<br />

=<br />

1 − (λ + δ)<br />

n=0<br />

n=0<br />

e esta quanti<strong>da</strong><strong>de</strong> é < ε <strong>de</strong>s<strong>de</strong> que δ seja suficientemente pequeno.<br />

Classes <strong>de</strong> equivalência <strong>da</strong>s contrações lineares <strong>da</strong> reta. As contrações <strong>da</strong> reta real<br />

fornecem também um exemplo simples <strong>de</strong> como po<strong>de</strong> ser utiliza<strong>da</strong> a dinâmica para construir uma<br />

conjugação topológica.<br />

Sejam f : x ↦→ αx e g : x ↦→ βx duas contrações lineares <strong>de</strong> R, com 0 < α, β < 1. A origem é<br />

o ponto fixo <strong>da</strong>s duas contrações. O conjunto A = [−1, −α[ ∪ ]α, 1] é um “<strong>do</strong>mínio fun<strong>da</strong>mental”<br />

pela ação <strong>de</strong> f em R\ {0}, no senti<strong>do</strong> em que, <strong>da</strong><strong>do</strong> um x ∈ R\ {0} arbitrário, existe e é único um<br />

tempo n (x) ∈ Z tal que f n(x) (x) ∈ A. Analogamente, um <strong>do</strong>mínio fun<strong>da</strong>mental pela ação <strong>de</strong> g em<br />

R\ {0} é B = [−1, −β[ ∪ ]β, 1]. Seja H : A → B um homeomorfismo que verifique H(−1) = −1,<br />

H(−α) = −β, H(α) = β e H(1) = 1 (por exemplo, po<strong>de</strong>m escolher um homeomorfismo afim). É<br />

imediato verificar que a receita<br />

{ 0 se x = 0<br />

h(x) =<br />

g −n(x) (H(f n(x) (x))) se x ≠ 0<br />

<strong>de</strong>fine um homeomorfismo h : R → R. Observan<strong>do</strong> que n (x) = n (f (x)) + 1, vê-se que<br />

( (<br />

))<br />

( (<br />

))<br />

(h ◦ f) (x) = g −n(f(x)) H f n(f(x)) f (x) = g −n(x)+1 H f n(x)−1 (f (x))<br />

( ( ( )))<br />

= g g −n(x) H f n(x) (x) = (g ◦ h) (x)<br />

e portanto h é uma conjugação topológica entre f e g.<br />

O caso em que −1 < α, β < 0 po<strong>de</strong> ser trata<strong>do</strong> <strong>da</strong> mesma maneira. Não é dificil verificar que<br />

as contrações x ↦→ αx e x ↦→ βx não po<strong>de</strong>m ser conjuga<strong>da</strong>s se α · β < 0, i.e. se uma é crescente<br />

e a outra é <strong>de</strong>crescente. O resulta<strong>do</strong> é que to<strong>da</strong>s as contrações lineares e não triviais <strong>da</strong> reta real<br />

com a mesma orientação são topologicamente conjuga<strong>da</strong>s, e portanto só existem duas classes <strong>de</strong><br />

equivalências <strong>de</strong> contrações lineares <strong>da</strong> reta.<br />

É importante observar que uma conjugação h entre f : x ↦→ αx e g : x ↦→ βx não po<strong>de</strong> ser <strong>de</strong><br />

classe C 1 , a não ser que α = β. Pois, se f = h −1 ◦ g ◦ h e se h é diferenciável, então a regra <strong>da</strong><br />

ca<strong>de</strong>ia implica que f ′ (0) = g ′ (0), logo que α = β. Este fenómeno explica porque na <strong>de</strong>finição <strong>de</strong><br />

estabili<strong>da</strong><strong>de</strong> estrutural é melhor pedir que a conjugação seja só contínua.<br />

Execícios.<br />

• Utilize o teorema <strong>do</strong> valor médio para mostrar que uma função f : R n → R n <strong>de</strong> classe C 1 é<br />

uma contração sse existe λ < 1 tal que |f ′ (x)| ≤ λ para to<strong>do</strong> x ∈ R n .<br />

• Prove que uma contração <strong>de</strong> um espaço métrico compacto X não po<strong>de</strong> ser invertível, <strong>de</strong>s<strong>de</strong><br />

que o espaço contenha mais <strong>de</strong> um ponto.<br />

(Compare os diâmetros <strong>de</strong> X e <strong>de</strong> f (X))<br />

• Dê exemplos <strong>de</strong> contrações <strong>de</strong><br />

[0, 1] [0, 1]×[0, 1] B r (x) = {y ∈ R n t.q. d (x, y) < r} S 1 = {z ∈ C t.q. |z| = 1}<br />

• Mostre que uma transformação f : X → X <strong>do</strong> espaço métrico completo (X, d) tal que<br />

d(f(x), f(x ′ )) < d(x, x ′ )


5 ÓRBITAS REGULARES E PERTURBAÇÕES 34<br />

para to<strong>do</strong>s x, x ′ ∈ X distintos po<strong>de</strong> não ter pontos fixos.<br />

(Um exemplo com X não completo é obvio: basta retirar o ponto fixo <strong>de</strong> uma contração <strong>de</strong><br />

um espaço completo. Um exemplo “minimalista” com X completo, é um espaço forma<strong>do</strong> por<br />

uma única órbita, ou seja um espaço que só contém um ponto x 0 e os pontos x n = f n (x 0 )<br />

com n ≥ 1. Se d n <strong>de</strong>nota a distância d (x n , x n−1 ), então d n+1 < d n . Não queremos pontos<br />

fixos, portanto a sucessão (x n ) não po<strong>de</strong> ser convergente. Uma condição suficiente é que a<br />

série ∑ d n seja divergente ...)<br />

• Sejam a > 0 e x 0 > 0. Mostre que a sucessão (x n ) <strong>de</strong>fini<strong>da</strong> indutivamente por<br />

x n+1 = 1 (<br />

x n + a )<br />

2 x n<br />

converge para √ a . Assuma que a = 2, escolhe um ponto inicial x 0 > 0, e estime a distância<br />

entre x n e √ 2. Utilize o resulta<strong>do</strong> para <strong>da</strong>r uma aproximação <strong>de</strong> √ 2 com <strong>do</strong>is dígitos <strong>de</strong>cimais<br />

correctos 8 .<br />

(A sucessão é uma trajetória <strong>da</strong> transformação f : x ↦→ (x + a/x) /2. Observe que a restrição<br />

<strong>de</strong> f ao <strong>do</strong>mínio [ √ a, ∞[ é uma contração, e que f (R >0 ) ⊂ [ √ a, ∞[, logo to<strong>da</strong> trajetória cai<br />

neste <strong>do</strong>mínio passa<strong>da</strong> uma iteração...)<br />

• Mostre que as contrações lineares <strong>da</strong> reta x ↦→ αx e x ↦→ βx não po<strong>de</strong>m ser conjuga<strong>da</strong>s se<br />

α · β < 0, i.e. se uma é crescente e a outra é <strong>de</strong>crescente.<br />

(Uma conjugação é um homeomorfismo <strong>da</strong> reta, em particular é monótono...)<br />

Observação: princípio <strong>da</strong>s contrações, teoremas <strong>de</strong> ponto fixo “analíticos” e méto<strong>do</strong>s<br />

variacionais. O princípio <strong>da</strong>s contrações é o ingrediente <strong>de</strong> muitos teoremas <strong>de</strong> existência<br />

em matemática (pense só no teorema <strong>de</strong> existência <strong>da</strong>s soluções <strong>da</strong>s equações diferenciais). Se<br />

queremos provar a existência e a unici<strong>da</strong><strong>de</strong> <strong>de</strong> um ponto p ∈ X que satisfaz uma certa proprie<strong>da</strong><strong>de</strong><br />

P , po<strong>de</strong>mos tentar escrever a condição “x satisfaz P ” na forma “f (x) = x”, on<strong>de</strong> f : X → X<br />

é uma transformação. Se existe uma métrica d tal que f seja uma contração <strong>do</strong> espaço métrico<br />

completo (X, d), então a trajetória <strong>de</strong> to<strong>do</strong> ponto x ∈ X converge para o único ponto p que satisfaz<br />

a proprie<strong>da</strong><strong>de</strong> em causa. O méto<strong>do</strong> funciona porque (f n (x)) é uma sucessão convergente, e a<br />

distância d (f n (x) , p) converge para 0 quan<strong>do</strong> n → ∞. Em outras palavras, a função x ↦→ d (x, p)<br />

é estritamente <strong>de</strong>crescente nas trajetórias <strong>de</strong> f, e tem um mínimo, único, no ponto p. Em falta<br />

<strong>de</strong> uma contração natural f, isto sugere uma outra estratégia. A i<strong>de</strong>ia agora é tentar provar a<br />

existência <strong>de</strong> uma função ϕ tal que “x satisfaz P ” sse “ϕ (x) < ϕ (x ′ ) para to<strong>do</strong> x ′ ≠ x” (ou pelo<br />

menos para to<strong>do</strong> x ′ ≠ x numa vizinhança <strong>de</strong> x, o que quer dizer que ϕ tem um mínimo local<br />

em x), e <strong>de</strong>pois utilizar resulta<strong>do</strong>s <strong>de</strong> compaci<strong>da</strong><strong>de</strong> para provar que o mínimo <strong>de</strong> ϕ existe e, com<br />

alguma sorte, é até único. Estes méto<strong>do</strong>s são ditos “princípios variacionais”, e tiveram origem na<br />

física <strong>do</strong> século XIX. As próprias leis <strong>da</strong> física costumam ser enuncia<strong>da</strong>s na forma <strong>de</strong> princípios<br />

variacionais. Por exemplo, em mecânica clássica, a trajetória <strong>de</strong> um ponto material com posição<br />

inicial q 0 e condição final q T é a (<strong>de</strong>riva<strong>da</strong> <strong>da</strong>) curva q : [0, T ] → R 3 , com q (0) = q 0 e q (T ) = q T ,<br />

que é um ponto crítico <strong>de</strong> um certo funcional<br />

ϕ (q) =<br />

∫ T<br />

0<br />

L (q (t) , ˙q (t)) dt<br />

dito “ação”, o integral <strong>da</strong> Lagrangiana L =“energia cinética−energia potencial” ao longo <strong>da</strong> trajetória.<br />

Esta é também a estratégia utiliza<strong>da</strong> para provar a existência e a unici<strong>da</strong><strong>de</strong> <strong>da</strong>s soluções<br />

<strong>da</strong>s equações às <strong>de</strong>riva<strong>da</strong>s parciais <strong>da</strong> física matemática: procurar uma ação ϕ que tenha um ponto<br />

crítico nas soluções.<br />

5.4 Or<strong>de</strong>m <strong>da</strong> reta real e trajetórias<br />

A or<strong>de</strong>m <strong>da</strong> reta real implica restrições às trajetórias <strong>de</strong> transformações monótonas.<br />

8 Este era o méto<strong>do</strong> utiliza<strong>do</strong> pelos babilónios (embora posteriormente atribuí<strong>do</strong> a Arquitas <strong>de</strong> Taranto, a Heron<br />

<strong>de</strong> Alexandria, ou até ao Newton!) para “calcular” o la<strong>do</strong> <strong>de</strong> um quadra<strong>do</strong> <strong>de</strong> área a. Eles chegaram a ter uma<br />

aproximação <strong>de</strong> √ 2 que, em notação <strong>de</strong>cimal, era 1.414213, um erro <strong>de</strong> apenas ≃ 10 −6 ! Uma conjetura sobre a<br />

origem <strong>do</strong> méto<strong>do</strong> está em O. Neugebauer, The exact sciences in antiquity, Dover, New York 1969.


5 ÓRBITAS REGULARES E PERTURBAÇÕES 35<br />

Transformações crescentes <strong>do</strong> intervalo. Por exemplo, seja f : I → I uma transformação<br />

contínua e crescente <strong>do</strong> intervalo I. Então to<strong>da</strong> trajetória (x n ) n∈N0 é monótona, crescente ou<br />

<strong>de</strong>crescente. A sucessão monótona (x n ) n∈N0<br />

só po<strong>de</strong> fazer duas coisas: ser convergente, i.e. x n → p<br />

para algum ponto fixo p, se é limita<strong>da</strong>, ou ser divergente, no senti<strong>do</strong> em que x n → ±∞, se não é<br />

limita<strong>da</strong>. Em particular, se o intervalo I é compacto, a segun<strong>da</strong> possibili<strong>da</strong><strong>de</strong> é impossível, logo<br />

to<strong>da</strong> trajetória é convergente. Isto implica que, se I é compacto, existe um compacto não vazio<br />

F ⊂ I <strong>de</strong> pontos fixos, e que os pontos em ca<strong>da</strong> componente conexa <strong>de</strong> I\F têm trajetórias conti<strong>da</strong>s<br />

na componente conexa, e convergentes para um ponto <strong>de</strong> ∂F .<br />

Exercícios.<br />

• Prove que um homeomorfismo f : I → I <strong>de</strong> um intervalo I ⊂ R não tem pontos periódicos<br />

com perío<strong>do</strong> superior a 2. Quan<strong>do</strong> tem pontos periódicos <strong>de</strong> perío<strong>do</strong> 2 <br />

(Se o homeomorfismo é crescente então nenhum ponto po<strong>de</strong> ter perío<strong>do</strong> superior a 1. De fato,<br />

as trajetórias são monótonas, portanto ou f (x) = x, ou f n+1 (x) > f n (x) > ... > x para<br />

to<strong>do</strong> n ≥ 1, ou f n+1 (x) < f n (x) < ... < x para to<strong>do</strong> n ≥ 1. Seja agora f um homeomorfismo<br />

<strong>de</strong>crescente. Não é difícil ver que f tem um, e um único, ponto fixo p, e que p divi<strong>de</strong> I em<br />

<strong>do</strong>is subintervalos I − e I + que são permuta<strong>do</strong>s pela transformação f. Observe também que,<br />

se f é <strong>de</strong>crescente, então f 2 é crescente. Seja x ≠ p tal que f 2 (x) ≠ x. Então as sucessões<br />

(<br />

f 2n (x) ) e ( f 2n+1 (x) ) são estritamente monótonas e estão em ”la<strong>do</strong>s” distintos <strong>de</strong> p, i.e.<br />

uma em I ± e a outra em I ∓ ...)<br />

• Sejam I ⊂ R um intervalo compacto e f : I → I uma função contínua e crescente. Prove que<br />

a trajetória <strong>de</strong> ca<strong>da</strong> ponto <strong>de</strong> I converge para um ponto fixo <strong>de</strong> f. Discuta a dinâmica <strong>de</strong> f.<br />

• Estu<strong>de</strong> também a dinâmica <strong>de</strong> uma transformação contínua e <strong>de</strong>crescente f : I → I <strong>de</strong>fini<strong>da</strong><br />

num intervalo compacto I ⊂ R.<br />

(Observe que, se f é <strong>de</strong>crescente, então f 2 é crescente... )<br />

Desafio. Sejam I um intervalo <strong>da</strong> reta real, e f : I → I e g : I → I <strong>do</strong>is homeomorfismos <strong>de</strong> I<br />

sem pontos periódicos. Prove que f e g são topologicamente conjuga<strong>do</strong>s.<br />

Teorema <strong>de</strong> Sharkovskii. A or<strong>de</strong>m <strong>da</strong> reta também influi na distribuição <strong>do</strong>s perío<strong>do</strong>s <strong>da</strong>s<br />

órbitas periódicas. Um resulta<strong>do</strong> <strong>de</strong> Alexan<strong>de</strong>r N. Sharkovskii diz que existe uma or<strong>de</strong>m ≺ nos<br />

naturais<br />

1 ≺ 2 ≺ 2 2 ≺ 2 3 ≺ · · · ≺ 2 m ≺ · · · ≺ 2 k · (2n − 1) ≺ . . .<br />

. . . ≺ 2 k · 3 ≺ · · · ≺ 2 · 3 ≺ ... ≺ 2n − 1 ≺ · · · ≺ 9 ≺ 7 ≺ 5 ≺ 3<br />

tal que, se uma função contínua f : R → R tem uma órbita periódica <strong>de</strong> perío<strong>do</strong> k e se j ≺ k,<br />

então também tem uma órbita periódica <strong>de</strong> perío<strong>do</strong> j. Em particular, a existência <strong>de</strong> uma órbita<br />

<strong>de</strong> perío<strong>do</strong> 3 implica a existência <strong>de</strong> órbitas <strong>de</strong> to<strong>do</strong>s os perío<strong>do</strong>s!<br />

5.5 Análise local: pontos fixos atrativos e repulsivos<br />

A diferenciabili<strong>da</strong><strong>de</strong> <strong>da</strong>s transformações e o princípio <strong>da</strong>s contrações aju<strong>da</strong>m a compren<strong>de</strong>r as<br />

trajetórias <strong>do</strong>s pontos numa vizinhança <strong>do</strong>s pontos periódicos.<br />

Pontos fixos atrativos. Sejam f : X → X uma transformação <strong>de</strong> classe C 1 <strong>de</strong>fini<strong>da</strong> num<br />

aberto X ⊂ R n , e p ∈ X um ponto fixo <strong>de</strong> f.<br />

Teorema Se |f ′ (p)| < 1, então p é “atrativo”, ou seja, admite uma vizinhança B tal que f n (x) →<br />

p para to<strong>do</strong> x ∈ B.


5 ÓRBITAS REGULARES E PERTURBAÇÕES 36<br />

<strong>de</strong>m. Pela continui<strong>da</strong><strong>de</strong> <strong>de</strong> f ′ , existem λ < 1 e uma bola B = B ε (p) centra<strong>da</strong> em p tais que<br />

|f ′ (x)| < λ para to<strong>do</strong> x ∈ B. O teorema <strong>do</strong> valor médio implica que f ( B ) ⊂ B, pois se d (x, p) ≤ ε<br />

então<br />

d (f (x) , p) ≤ λ · d (x, p) < ε<br />

e que d (f (x) , f (x ′ )) ≤ λ · d (x, x ′ ) se x, x ′ ∈ B. Portanto, f | B<br />

: B → B é uma contração, e o<br />

princípio <strong>da</strong>s contrações diz que a trajetória <strong>de</strong> to<strong>do</strong> ponto <strong>de</strong> B converge para p. O resulta<strong>do</strong> é<br />

que B ⊂ W s (p), i.e. a bacia <strong>de</strong> atração <strong>de</strong> p é uma vizinhança <strong>de</strong> p.<br />

Pontos fixos repulsivos. A or<strong>de</strong>m <strong>da</strong> reta real permite codificar um comportamento “oposto”<br />

à atrativi<strong>da</strong><strong>de</strong>. Sejam f : I → I uma transformação <strong>de</strong> classe C 1 <strong>de</strong>fini<strong>da</strong> num intervalo I ⊂ R, e<br />

p ∈ I um ponto fixo <strong>de</strong> f.<br />

Teorema. Se |f ′ (p)| > 1, então p é “repulsivo”, i.e. admite uma vizinhança B tal que a trajetória<br />

<strong>de</strong> to<strong>do</strong> ponto x ∈ B distinto <strong>de</strong> p sai <strong>da</strong> vizinhança em tempo finito.<br />

<strong>de</strong>m. Pela continui<strong>da</strong><strong>de</strong> <strong>de</strong> f ′ , existem λ > 1 e um intervalo B = [p − ε, p + ε] centra<strong>do</strong> em p tais<br />

que |f ′ (x)| > λ para to<strong>do</strong> x ∈ B. Observem também que f é estritamente crescente ou <strong>de</strong>crescente<br />

em B, <strong>de</strong>pen<strong>de</strong>n<strong>do</strong> <strong>do</strong> sinal <strong>de</strong> f ′ (p), e portanto envia bijetivamente intervalos em intervalos. Agora,<br />

seja x ∈ B um ponto diferente <strong>de</strong> p, e suponhamos que f k (x) ∈ B para to<strong>do</strong> tempo 0 ≤ k ≤ n. A<br />

regra <strong>da</strong> ca<strong>de</strong>ia implica que as <strong>de</strong>riva<strong>da</strong>s <strong>da</strong>s f k em x crescem exponencialmente, pois<br />

∣ ( f k) ∣<br />

′ ∣∣ ∣<br />

(x) = ∣f ′ ( f k−1 (x) )∣ ∣<br />

∣ · ∣f ′ ( f k−2 (x) )∣ ∣ · ... · |f ′ (x)| > λ k<br />

para to<strong>do</strong> k ≤ n. O teorema <strong>do</strong> valor médio implica que n não po<strong>de</strong> ser arbitrariamente gran<strong>de</strong>,<br />

porque<br />

d (p, f n (x)) ≥ λ n · d (p, x) e d (p, f n (x)) ≤ ε<br />

são incompatíveis quan<strong>do</strong> n é gran<strong>de</strong>. Portanto, existe um tempo n ≥ 1 tal que f n (x) /∈ B.<br />

Cui<strong>da</strong><strong>do</strong>: este resulta<strong>do</strong> é “local”. A condição |f ′ (p)| > 1 não contém informação acerca <strong>da</strong><br />

bacia <strong>de</strong> atração <strong>de</strong> p.<br />

Também, a condição |f ′ (p)| > 1 não é suficiente para <strong>de</strong>cidir a repulsivi<strong>da</strong><strong>de</strong> <strong>de</strong> um ponto fixo<br />

em dimensão maior, pois po<strong>de</strong>m existir “direções” on<strong>de</strong> f estica as distâncias e outras on<strong>de</strong> f<br />

reduz as distâncias...<br />

Exercícios.<br />

• Dê exemplos que mostram que o conjunto estável <strong>de</strong> um ponto fixo repulsivo p po<strong>de</strong> conter<br />

estritamente {p}.<br />

• Procure uma boa <strong>de</strong>finição <strong>de</strong> órbita periódica atrativa.<br />

(Observe que, se { p, f(p), ..., f n−1 (p) } é uma órbita, a <strong>de</strong>riva<strong>da</strong> <strong>de</strong> f n é a mesma em to<strong>do</strong>s<br />

os seus pontos pela regra <strong>da</strong> ca<strong>de</strong>ia. Se ∣ ∣ (f n ) ′ (p) ∣ ∣ < 1, então p é um ponto fixo atrativo <strong>da</strong><br />

transformação f n , e portanto existe uma vizinhança B <strong>de</strong> p tal que f kn (x) → k→∞ p para<br />

to<strong>do</strong> x ∈ B. Então B ∪ f −1 (B) ∪ ... ∪ f −(n−1) (B) é uma vizinhança <strong>da</strong> órbita periódica, e<br />

as trajetórias <strong>do</strong>s seus pontos são assimptóticas à órbita <strong>de</strong> p ...)<br />

• Consi<strong>de</strong>r the family of quadratic maps<br />

x ↦→ λx 2<br />

<strong>de</strong>pending on the parameter λ. Find the basin of attraction of the fixed point p = 0, and<br />

<strong>de</strong>scribe the speed of convergence of convergent trajectories.<br />

• Se p é um ponto fixo <strong>de</strong> f : R → R tal que f ′ (p) = 1, então tu<strong>do</strong> ou quase tu<strong>do</strong> po<strong>de</strong><br />

acontecer! O conjunto estável <strong>de</strong> p po<strong>de</strong> ser uma vizinhança <strong>de</strong> p, po<strong>de</strong> ser só {x}, ou po<strong>de</strong><br />

conter uma “meia vizinhança” <strong>de</strong> p, um intervalo <strong>do</strong> género [p, p ± ε[ ...<br />

Estu<strong>de</strong> os exemplos<br />

e invente outros.<br />

x ↦→ x ± x 3 e x ↦→ x ± x 2


5 ÓRBITAS REGULARES E PERTURBAÇÕES 37<br />

A família quadrática. A família quadrática, ou logística (<strong>do</strong> francês “logement” 9 ), é a família<br />

<strong>de</strong> transformações f λ : [0, 1] → [0, 1] <strong>de</strong>fini<strong>da</strong>s por<br />

x ↦→ λx(1 − x)<br />

on<strong>de</strong> o parâmetro λ tem valores no intervalo [0, 4].<br />

Os pontos fixos <strong>de</strong> f λ são 0, que é atrativo quan<strong>do</strong> 0 ≤ λ < 1, e p λ = λ−1<br />

λ<br />

, que é atrativo<br />

quan<strong>do</strong> 1 < λ < 3.<br />

Se λ ∈ [0, 1] então to<strong>da</strong> trajetória (fλ n (x)) converge para 0. De fato, to<strong>da</strong> trajetória é uma<br />

sucessão <strong>de</strong>crescente e limita<strong>da</strong>, logo convergente, e o limite é o único ponto fixo 0.<br />

Se λ ∈ ]1, 3] então to<strong>da</strong> trajetória (fλ n (x)) converge para p λ. De fato, se 1 < λ < 3, existe uma<br />

vizinhança V <strong>de</strong> p λ tal que f λ | V é uma contração e tal que para to<strong>do</strong> x ∈ [0, 1] existe um tempo<br />

n ≥ 0 tal que fλ n (x) ∈ V . O caso em que λ = 3 não é muito diferente ...<br />

5.6 Convergência no méto<strong>do</strong> <strong>de</strong> Newton<br />

Newton method. Seja p ∈ R[x] um polinómio com coeficientes reais. O méto<strong>do</strong> <strong>de</strong> Newton<br />

para <strong>de</strong>terminar as raizes <strong>de</strong> p(x), ou seja, resolver a equação p(x) = 0, consiste em escolher uma<br />

primeira aproximação x 0 , e iterar<br />

x n+1 = x n − p(x n)<br />

p ′ (x n ) .<br />

Ou seja, se x 0 é uma primeira conjectura, uma conjectura melhor é o zero <strong>da</strong> aproximação linear<br />

p(x) ≃ p(x 0 ) + p ′ (x 0 ) · (x − x 0 ).<br />

Se a sucessão (x n ) converge, i.e. x n → r, e se p ′ (r) ≠ 0, então o limite r é um zero <strong>do</strong><br />

polinómio p. Vice-versa, se r é uma raiz <strong>do</strong> polinómio p, e se p ′ (r) ≠ 0, então r é um ponto fixo<br />

<strong>da</strong> transformação<br />

x ↦→ f(x) = x − p(x)<br />

p ′ (x)<br />

A <strong>de</strong>riva<strong>da</strong> <strong>de</strong> f em r é<br />

f ′ (r) = 1 − (p′ (r)) 2 − p(r)p ′′ (r)<br />

(p ′ (r)) 2 = 0<br />

Portanto, r é um ponto fixo atrativo <strong>de</strong> f: a trajetória <strong>de</strong> to<strong>da</strong> conjectura inicial x 0 suficientemente<br />

próxima <strong>da</strong> raiz r converge para r.<br />

Quadratic convergence. De facto, sen<strong>do</strong> a <strong>de</strong>riva<strong>da</strong> f ′ (r) = 0, a raiz é um ponto fixo superatractivo<br />

<strong>de</strong> f, e a convergência é, em geral, mais <strong>do</strong> que exponencial.<br />

Theorem. Let r be a non-critical root of the polynomial p ∈ R[x], i.e. a root where p ′ (r) ≠ 0.<br />

Then Newton’s iterations starting with some x 0 sufficiently near the root r converge to this root,<br />

and the convergence is “quadratic”, i.e. the error ε n = |x n − r| <strong>de</strong>creases as<br />

for some K > 0.<br />

ε n+1 ≤ K · ε 2 n<br />

9 A família quadrática nasceu como mo<strong>de</strong>lo <strong>de</strong> dinâmica <strong>de</strong> populações. Num meio ambiente ilimita<strong>do</strong>, uma<br />

população tem crescimento exponencial, e um mo<strong>de</strong>lo razoável a tempo discreto é z n+1 = λz n, on<strong>de</strong> z n é o<br />

tamanho <strong>da</strong> população no tempo n e λ > 0 é um parâmetro que caracteriza a ”fertili<strong>da</strong><strong>de</strong>” <strong>da</strong> especie. Se o meio<br />

ambiente (a disponibili<strong>da</strong><strong>de</strong> <strong>de</strong> espaço e comi<strong>da</strong>) é limita<strong>do</strong>, parece razoável acrescentar um termo negativo −βzn,<br />

2<br />

on<strong>de</strong> β > 0, que toma conta <strong>da</strong> mortali<strong>da</strong><strong>de</strong> <strong>de</strong>vi<strong>da</strong> à falta <strong>de</strong> recursos (a probabili<strong>da</strong><strong>de</strong> <strong>de</strong> <strong>do</strong>is individuos estar<br />

num mesmo sitio, e portanto disputar a comi<strong>da</strong>, é proporcional a zn). 2 O mo<strong>de</strong>lo é portanto z n+1 = λz n − βzn. 2 A<br />

maior população suporta<strong>da</strong> pelo meio ambiente resulta ser λ/β e, se chamamos x n = z nβ/α a população relativa,<br />

obtemos o mo<strong>de</strong>lo x n+1 = λx n (1 − x n).


5 ÓRBITAS REGULARES E PERTURBAÇÕES 38<br />

Proof. We may assume, without loss of generality, that the root we are looking for is the origin,<br />

so that p(0) = 0. Now, suppose we are at x n after n iterations. Taylor’s formula with Lagrange<br />

estimate of the error around x n says that<br />

p(x) = p(x n ) + p ′ (x n ) · (x − x n ) + 1 2 p′′ (y) · (x − x n ) 2<br />

for some y between x and x n . Taking x = 0 (the root!) and dividing by p ′ (x n ) we get<br />

0 = p(0) = p(x n ) − p ′ (x n ) − x n + 1 2 p′′ (y) · x 2 n i.e. x n − p(x n)<br />

p ′ (x n ) = 1 p ′′ (y)<br />

2 p ′ (x n ) · x2 n<br />

But the l.h.s. is x n+1 . There follows that the distance ε n = |x n − 0| between the n-th iterate and<br />

the root satisfies the iterative bound<br />

|x n+1 | ≤ 1 p ′′ (y)<br />

2 ∣p ′ (x n ) ∣ · |x n| 2<br />

Since p ′ (0) ≠ 0 (and polynomials have continuous <strong>de</strong>rivatives), there is an interval I =] − ε, ε[<br />

around the root 0 where M = sup x∈I |p ′′ (x)| < ∞ and δ = inf x∈I |p ′ (x)| > 0. Let K = M/2δ. If<br />

the initial guess is sufficiently near the root 0 (so near that |x 0 | < 1 and also K|x 0 | < 1), then the<br />

x n ’s converge to 0 and the convergence is quadratic, i.e.<br />

|x n+1 | ≤ K · |x n | 2<br />

Exercícios.<br />

• Verifique que o méto<strong>do</strong> <strong>de</strong> Newton aplica<strong>do</strong> ao polinómio quadrático z 2 − a, com a > 0,<br />

correspon<strong>de</strong> ao algoritmo <strong>de</strong> Heron!<br />

• Estime √ 17 ...<br />

• Escreva a receita <strong>do</strong> méto<strong>do</strong> <strong>de</strong> Newton para resolver z n − a = 0, com a > 0 e n ≥ 2.<br />

• Utilize o méto<strong>do</strong> <strong>de</strong> Newton para estimar raizes <strong>de</strong><br />

Iteração <strong>de</strong> funções racionais.<br />

z 2 + 1 + z z 3 − z − 1 z 5 + z + 1 z 3 − 2z − 5


6 FLOWS 39<br />

6 Flows<br />

“... forse stima che la filosofia sia un libro e una fantasia d’un uomo, come l’Ilia<strong>de</strong> e<br />

l’Orlan<strong>do</strong> furioso, libri ne’ quali la meno importante cosa è che quello che vi è scritto<br />

sia vero. Signor Sarsi, la cosa non istà così. La filosofia è scritta in questo grandissimo<br />

libro che continuamente ci sta aperto innanzi agli occhi (io dico l’universo), ma non si<br />

può inten<strong>de</strong>re se prima non s’impara a inten<strong>de</strong>r la lingua, e conoscer i caratteri, ne’<br />

quali è scritto. Egli è scritto in lingua matematica, e i caratteri son triangoli, cerchi,<br />

ed altre figure geometriche, senza i quali mezi è impossibile a inten<strong>de</strong>rne umanamente<br />

parola; senza questi è un aggirarsi vanamente per un oscuro laberinto.”<br />

6.1 Structure of physical mo<strong>de</strong>ls<br />

Galileo Galilei, Il saggiatore, 1623.<br />

Flows of vector fields. The main way in which dynamical systems enter in physics is through<br />

differential equations. Let X be a differentiable manifold, and let v be a vector field on X. If we<br />

assume that the autonomous differential equation<br />

ẋ = v(x)<br />

with any given initial condition x (0) = x, has solutions t ↦→ x (t) which exist for any time t ∈ R<br />

(as is the case when v is smooth and X is compact), then the flow of v is the action Φ : R×X → X<br />

given by Φ t (x) = x (t).<br />

From flows to maps. Given a flow Φ : R×X → X, one could specialize to discrete time looking<br />

at the system at multiples integers nτ of a given time-unit τ > 0, and this amounts to iterate the<br />

transformation f = Φ τ .<br />

Also, given a submanifold U ⊂ X of codimension 1 which is transversal to the flow (i.e. the<br />

tangent space T x U is transversal to Rv(x) for any x ∈ U), one could <strong>de</strong>fine a first return map<br />

f : U → U sending a point x ∈ U into x(t) if t is the smallest positive time t > 0 such that<br />

Φ t (x) ∈ U.<br />

Newtonian mechanics. According to greeks, the “velocity” ˙q = d dtq of a planet, where<br />

q ∈ R 3 is its position in our eucli<strong>de</strong>an space and t is time, was <strong>de</strong>termined by gods or whatever<br />

forced planets to move around circles. Then came Galileo, and showed that gods could at most<br />

<strong>de</strong>termine the “acceleration” ¨q = d2<br />

dt<br />

q, since the laws of physics should be written in the same<br />

2<br />

way by an observer in any reference system at uniform rectilinear motion with respect to the fixed<br />

stars. Finally came Newton, who <strong>de</strong>ci<strong>de</strong>d that what gods <strong>de</strong>termined was to be called “force”,<br />

and discovered that the trajectories of planets, fulfilling Kepler’s experimental three laws 10 , were<br />

solutions of his famous (second or<strong>de</strong>r differential) equation<br />

m¨q = F<br />

where m is the mass of the planet, and where the attractive force F between the planet and the<br />

Sun is proportional to the product of their masses and inverse proportional to the square of their<br />

distance.<br />

Later, somebody noticed that most observed forces were “conservative”, could be written as<br />

F = −∇V , for some real valued function V (q) called “potential energy”. There follows that<br />

Newton equations can be written as m¨q = −∇V , and that the “total energy”<br />

E = 1 2 m | ˙q|2 + V (q)<br />

10 In Astronomia nova, 1609, and Harmonices mundi, 1619, Johannes Kepler published his three laws of planetary<br />

motions:<br />

i) planets moves in ellipses with focus at the Sun,<br />

ii) the radius vector <strong>de</strong>scribes equal areas in equal times,<br />

iii) the squares of the periods are to each other as the cubes of the mean distance from the Sun.<br />

It was with the purpose to <strong>de</strong>rive Kepler laws from a second or<strong>de</strong>r differential equation m¨q = F that Isaac Newton<br />

realized that the force of gravitational attraction between the Sun and a planet (hence between any two bodies!)<br />

should be proportional to m/ρ 2 (Philosophiae naturalis principia mathematica, 1687).


6 FLOWS 40<br />

is constant along trajectories. The function 1 2 m | ˙q|2 is called “kynetic energy” of the system.<br />

An alternative (and in<strong>de</strong>ed useful) formulation of Newtonian mechanics is the one <strong>de</strong>veloped<br />

by Lagrange. He <strong>de</strong>fined the “Lagrangian” of the system as<br />

L (q, ˙q) = 1 2 m | ˙q|2 − V (q)<br />

and observed that Newton equations are equivalent to the (Euler)-Lagrange equations<br />

( )<br />

d ∂L<br />

= ∂L<br />

dt ∂ ˙q ∂q<br />

The product p = m ˙q = ∂L/∂ ˙q is called “(linear) momentum”, and, since p/m is the gradient<br />

of the kinetic energy K (p) = |p| 2 /2m, Hamilton could write Newton’s second or<strong>de</strong>r differential<br />

equations as the system of first or<strong>de</strong>r differential equations<br />

˙q = ∂H<br />

∂p<br />

ṗ = − ∂H<br />

∂q<br />

where H (q, p) = K (p) + V (q) is the total energy as function of q and p, now<strong>da</strong>ys called “Hamiltonian”.<br />

It is a simple check that the energy is a constant of the motion, since<br />

d<br />

dt H = ∂H ∂H · ˙q +<br />

∂q ∂p · ṗ = ∂H<br />

∂q · ∂H<br />

∂p − ∂H<br />

∂p · ∂H<br />

∂q = 0<br />

Hamiltonian flows. The mo<strong>de</strong>rn abstract formulation of classical mechanics is as follows. Let<br />

(X, ω) be a symplectic manifold, i.e. a differentiable manifold X of even dimension 2n, equipped<br />

with a smooth closed differential two-form ω such that ω n ≠ 0. Darboux theorem says that locally<br />

one can choose “canonical” coordinates (q 1 , ..., q n , p 1 , .., p n ) such that ω = ∑ n<br />

k=1 dp k ∧ dq k . Let<br />

H : X → R be a smooth function, called “Hamiltonian” and thought as the “energy” of the system.<br />

Typically, it has the form “kinetic energy+potential energy”, where the kinetic energy is a positive<br />

<strong>de</strong>finite quadratic form in the momenta p, and the potential energy is a function V <strong>de</strong>pending<br />

on the positions q and possibly on the momenta p. The Hamiltonian vector field v is <strong>de</strong>fined by<br />

the i<strong>de</strong>ntity dH = i v ω, and the Hamiltonian flow is the flow of v. In canonical coordinates, the<br />

equations of motion read<br />

q˙<br />

k = ∂H p˙<br />

k = − ∂H<br />

∂p k<br />

∂q k<br />

It happens that the Hamiltonian flow Φ preserves the energy, namely H (Φ t (x)) = H (x) for any<br />

x ∈ X and any time t ∈ R, as follows form the fact that L v H = 0.<br />

Geo<strong>de</strong>sic flows. The simplest mechanical system, the free motion of a particle, belongs to the<br />

class of geo<strong>de</strong>sic flows. Let (M, g) be a Riemannian manifold, g beeing the Riemannian metric.<br />

Let SM be the unit tangent bundle of M. If M is geo<strong>de</strong>sically complete, to every unit vector<br />

v ∈ SM there corresponds a unique geo<strong>de</strong>sic line (i.e. a local isometry) c : R → M such that<br />

ċ (0) = v. The geo<strong>de</strong>sic flow is the action Φ : R × SM → SM, <strong>de</strong>fined as Φ t (v) = ċ (t).<br />

Particularly interesting are geo<strong>de</strong>sic flows over homogeneous spaces. Apart from the rather<br />

trivial exemple of flat spaces, a source of interesting dynamical properties is the geo<strong>de</strong>sic flow<br />

on a manifold with constant negative curvature. The proptotype is as follows. The group G =<br />

P SL (2, R) can be seen as the orientation preserving isometry group of the Poincaré half-plane H,<br />

equipped with the hyperbolic metric of sectional curvature −1. Its action is transitive. Since the<br />

stabilizer of a point in the half-plane is isomorphic to the group of rotations SO (2), we can i<strong>de</strong>ntify<br />

SD with G. Now, let Γ be a discrete cocompact subgroup of G with no torsion. The quotient<br />

space Σ = D/Γ is a compact Riemann surface, which comes equipped with a Riemannian metric<br />

of sectional curvature −1, and its unit tangent bundle is diffeomorphic to G/Γ. The geo<strong>de</strong>sic flow<br />

on SΣ is then the algebraic flow Φ : R × G/Γ → G/Γ <strong>de</strong>fined as Φ t (gΓ) = e t gΓ, where<br />

( )<br />

e<br />

t/2<br />

0<br />

e t =<br />

0 e −t/2


6 FLOWS 41<br />

6.2 Integration of one-dimensional systems<br />

“6acc<strong>da</strong>e13eff7i3l9n4o4qrr4s8t12vx”<br />

(Data aequatione quotcunque fluentes quantitates involvente fluxiones invenire et vice<br />

versa)<br />

Isaac Newton, letter to Gottfried Leibniz, 1677.<br />

Some techniques to integrate ordinary differential equations (ODEs) like<br />

ẋ = v(x, t)<br />

when the phase space X ⊂ R is one or two-dimensional.<br />

Integrating simple ODEs. The simplest case occurs when the velocity field v <strong>do</strong>es not <strong>de</strong>pend<br />

on the phase space variable x, hence<br />

ẋ = v(t) ,<br />

where v(t) is some given (piecewise) continuous function of time. This just says that x must be a<br />

primitive of v, and the fun<strong>da</strong>mental theorem of calculus (i.e. Leibniz and/or Newton’s discovery)<br />

tells us how to compute such a primitive:<br />

∫ t<br />

x(t) = x 0 + v(s)ds .<br />

t 0<br />

Here you may observe that this class of ODEs have “symmetries”. The line field <strong>do</strong>es not <strong>de</strong>pend<br />

on x, hence slopes of solutions are the same along horizontal lines (t = constant) in the exten<strong>de</strong>d<br />

phase space X × R. There follows that any translate ϕ(t) + c of a solution ϕ(t) is still a solution.<br />

Autonomous first or<strong>de</strong>r ODEs and their flows.<br />

A first or<strong>de</strong>r ODE of the form<br />

ẋ = v(x) ,<br />

where the velocity field v <strong>do</strong>es not <strong>de</strong>pend on time, is called autonomous. Most fun<strong>da</strong>mental<br />

equations of physics (those <strong>de</strong>scribing closed systems, without external forces) can be written as<br />

autonomous first or<strong>de</strong>r ODEs, and this corresponds to time-invariance of physical laws.<br />

Here you may notice symmetries again. The line field v of an autonomous equation is constant<br />

along vertical lines (x = constant) of the exten<strong>de</strong>d phase space X ×R. Hence any translate ϕ(t+s)<br />

of a solution ϕ(t) is still a solution. This is the manifestation of time-invariance of a law codified<br />

by an autonomous ODE. This also implies that there is no loss of generality in restricting to an<br />

initial time t 0 = 0.<br />

Equilibrium solutions. First, we observe that an autonomous equation may admit constant<br />

solutions. In<strong>de</strong>ed, if x 0 is a singular point of the vector field v, i.e. a point where v(x 0 ) = 0, then<br />

the constant function<br />

x(t) = x 0 ∀ t ∈ R<br />

obviously solves the equation. Such solutions, which <strong>do</strong> not change with time, are called equilibrium,<br />

or stationary, solutions.<br />

Solutions near non-singular points. The trick used to “guess” other solutions, when the<br />

phase space is one-dimensional, i.e. X ⊂ R, is a first instance of the method of “separation of<br />

variables”. Fix a non-singular point of the velocity field, i.e. a point x 0 where v(x 0 ) ≠ 0. We<br />

want to solve the Cauchy problem with initial condition x(t 0 ) = x 0 . First, rewrite the equation<br />

dx/dt = v(x) formally as “dx/v(x) = dt” (multiply by dt and divi<strong>de</strong> by v(x), so that all x’s are<br />

on the left and all t’s are on the right). Instead of trying to make sense to this last expression<br />

(which is possible, of course, and here you can appreciate the beauty of Leibniz’ notation dx/dt for<br />

<strong>de</strong>rivatives!), observe that it is suggesting that ∫ dx/v(x) = ∫ dt. Now assume that the velocity<br />

field v is continuous and let J = (x − , x + ) be the maximal interval containing x 0 where v is different


6 FLOWS 42<br />

from zero. Integrating, from x 0 to x ∈ J on the left and from t 0 to t on the right, we obtain a<br />

differentiable function x ↦→ t(x) <strong>de</strong>fined as<br />

t(x) = t 0 +<br />

∫ x<br />

x 0<br />

dy<br />

v(y)<br />

for any x ∈ J. Now, observe that the <strong>de</strong>rivative dt/dx is equal to 1/v. Since, by continuity, 1/v<br />

<strong>do</strong>es not change its sign in J, our t(x) is a strictly monotone continuously differentiable function.<br />

We can invoke the inverse function theorem and conclu<strong>de</strong> that the function t(x) is invertible. This<br />

prove that the above relation <strong>de</strong>fines actually a continuously differentiable function t ↦→ x(t) in<br />

some interval I = t(J) of times around t 0 . Finally, you may want to check that the function<br />

t ↦→ x(t) solves the Cauchy problem: just compute the <strong>de</strong>rivative (using the inverse function<br />

theorem),<br />

( ) dt<br />

ẋ(t) = 1/<br />

dx (x(t))<br />

= v(x) ,<br />

and check the initial condition. Observe that the function t(x) − t 0 has then the interpretation of<br />

the “time nee<strong>de</strong>d to go from x 0 to x”.<br />

At the end of the story, if you are lucky enough and know how to invert the function t(x), you’ll<br />

get an explicit solution as<br />

x(t) = F −1 (t − t 0 + F (x 0 )) ,<br />

where F is any primitive of 1/v. Close inspection of the above reasoning shows that the local<br />

solution you’ve found is in<strong>de</strong>ed the unique one. Namely, we have the following<br />

Existence and uniqueness theorem for autonomous ODEs near a non-singular point.<br />

Let v(x) be a continuous velocity field and let x 0 be a non-singular point of v. Then there exist one<br />

and only one solution of the Cauchy problem ẋ = v(x) with initial condition x(t 0 ) = x 0 in some<br />

sufficiently small interval I around t 0 . Moreover, the solution x(t) is the inverse function of<br />

t(x) = t 0 +<br />

<strong>de</strong>fined in some small interval J around x 0 .<br />

∫ x<br />

x 0<br />

dy<br />

v(y) ,<br />

Proof.<br />

Here we give the pe<strong>da</strong>ntic proof. Let J be as above. Define a function H : R × J → R as<br />

H(t, x) = t − t 0 −<br />

∫ x<br />

x 0<br />

dy<br />

v(y) .<br />

If t ↦→ ϕ(t) is a solution of the Cauchy problem, then computation shows that d dtH (t, ϕ(t)) = 0<br />

for any time t. There follows that H is constant along the solutions of the Cauchy problem.<br />

Since H(t 0 , x 0 ) = 0, we conclu<strong>de</strong> that the graph of any solution belongs to the level set Σ =<br />

{(t, x) ∈ R × J s.t. H(t, x) = 0}. Now observe that H is continuously differentiable and that its<br />

differential dH = dt + dx/v(x) is never zero. Actually, both partial <strong>de</strong>rivatives ∂H/∂t and ∂H/∂x<br />

are always different from zero. Hence we can apply the implicit function theorem and conclu<strong>de</strong><br />

that the level set Σ is, in some neighborhood I × J of (t 0 , x 0 ), the graph of a unique differentiable<br />

function x ↦→ t(x), as well as the graph of a unique differentiable function t ↦→ x(t), the inverse of<br />

t, which as we have already seen solves the Cauchy problem.<br />

On the failure of uniqueness near singular points. The interval I = t(J) where the<br />

solution is <strong>de</strong>fined need not be the entire real line: solutions may reach the boun<strong>da</strong>ry of J, i.e. one<br />

of the singular points x ± of the velocity field, in finite time. Since singular points are themselves<br />

equilibrium solutions, this imply that solutions of the Cauchy problem at singular points may not<br />

be unique, un<strong>de</strong>r such mild conditions (continuity) for the velocity field. Later we’ll see Picard’s<br />

theorem, which prescribes stronger regularity conditions on the velocity field v un<strong>de</strong>r which the<br />

Cauchy problem admits unique solutions for any initial condition in the exten<strong>de</strong>d phase space.


6 FLOWS 43<br />

Counter-example.<br />

Both the curves x(t) = 0 and x(t) = t 3 solve the equation<br />

ẋ = 3x 2/3<br />

with initial condition x(0) = 0. The problem here is that the velocity field v(x) = 3x 2/3 , although<br />

continuous, is not differentiable and not even Lipschitz at the origin. You may notice that the<br />

solution starting, for example, at x 0 = 1 reaches (or better comes from) the singular point x − = 0<br />

in finite time, since<br />

∫ 0<br />

t(x − ) − t(x 0 ) =<br />

1<br />

1 3 y−2/3 dy<br />

= −1 .<br />

One-dimensional Newtonian motion in a time in<strong>de</strong>pen<strong>de</strong>nt force field. The onedimensional<br />

motion of a particle of mass m subject to a force F (x) that <strong>do</strong>es not <strong>de</strong>pend on time<br />

is <strong>de</strong>scribed by the Newton equation<br />

mẍ = −U ′ (x) ,<br />

where the potential U(x) = − ∫ F (x)dx is some primitive of the force. The total energy<br />

E (x, ẋ) = 1 2 mẋ2 + U(x)<br />

(which of course is <strong>de</strong>fined up to an arbitrary additive constant) of the system is a constant of<br />

the motion, i.e. is constant along solutions of the Newton equation. In particular, once a value E<br />

of the energy is given (<strong>de</strong>pending on the initial conditions), the motion takes place in the region<br />

where U(x) ≤ E, since the kinetic energy 1 2 mẋ2 is non-negative. Conservation of energy allows to<br />

reduce the problem to the first or<strong>de</strong>r ODE<br />

ẋ 2 = 2 (E − U(x)) ,<br />

m<br />

which has the unpleasant feature to be quadratic in the velocity ẋ. Meanwhile, if we are interested<br />

in a one-way trajectory going from some x 0 to x, say with x > x 0 , we may solve for ẋ and find the<br />

first or<strong>de</strong>r autonomous ODE<br />

√<br />

2<br />

ẋ = (E − U(x)) .<br />

m<br />

There follows that the time nee<strong>de</strong>d to go from x 0 to x is<br />

t(x) =<br />

∫ x<br />

x 0<br />

dy<br />

√<br />

.<br />

2<br />

m (E − U(y))<br />

The inverse function of the above t(x)<br />

√<br />

will give the trajectory x(t) with initial position x(0) = x 0<br />

2<br />

and initial positive velocity ẋ(0) =<br />

m (E − U(x 0)), at least for sufficiently small times t.<br />

6.3 Exponential<br />

The exponential. The exponential function, according to Walter Rudin “the most important<br />

function in mathematics” ([Ru87], 1st line of page 1), is the unique solution of the (autonomous)<br />

differential equation<br />

ẋ = x<br />

with initial condition x(0) = 1. Actually, it is convenient to complexify time, i.e. take z = t+iθ ∈ C<br />

with t, θ ∈ R, and <strong>de</strong>fine the exponential as the power series<br />

exp(z) = 1 + x + x2<br />

2 + x3<br />

6 + x4<br />

24 + · · · = ∑ z n<br />

n!<br />

n≥0<br />

Since lim sup n→∞ (1/n!) 1/n = 0, the radius of convergence is ∞, hence the power series <strong>de</strong>fines an<br />

entire function, i.e. a holomorphic function exp : C → C. Deriving each term of the series, we


6 FLOWS 44<br />

easily verify that in<strong>de</strong>ed exp ′ = exp. The initial condition exp(0) = 1 is obvious. From absolute<br />

convergence of the series and algebraic manipulation we also get the group property<br />

exp(z + w) = exp(z) · exp(w)<br />

for any z, w ∈ C, saying that exp is a homomorphism of the additive group C into the multiplicative<br />

group C × = C\{0}. In particular, exp(−z) = 1/ exp(z), so that the exponential exp(z) is never 0.<br />

This also justifies our notation exp(z) = e z , where<br />

e = exp(1) = 1 + 1 1! + 1 2! + 1 3! + · · · ≃ 2.7182818284590452353602874713526624977572 . . .<br />

(another famous irrational, actually a transcen<strong>de</strong>ntal number!). For real time z = t, we recover<br />

the familiar mo<strong>de</strong>l of “exponential growth” t ↦→ e t , a strictly increasing function from the additive<br />

group R onto the multiplicative group R + =]0, ∞[, growing faster than any power t n as t → ∞.<br />

For pure imaginary times, say z = iθ, we get the Euler’s formula<br />

)<br />

)<br />

e iθ =<br />

(1 − θ2<br />

2! + θ4<br />

4! − . . . + i<br />

(θ − θ3<br />

3! + θ5<br />

5! − . . . = cos(θ) + i sin(θ)<br />

So, θ ↦→ e iθ <strong>de</strong>fines a periodic function with period 2π, sending the real line R onto the unit circle<br />

S = {z ∈ C s.t. |z| = 1}. Finally, the exponential exp is a periodic entire function with period i2π<br />

which only omits the value 0, a holomorphic bijection of the cylin<strong>de</strong>r C/i2πZ onto C\{0}.<br />

Interest rates and the exponential. Let x be the annual interest payed for a <strong>de</strong>posit (so that<br />

an interest of 0.2% mean x = 0.02). If the interest is payed once each year, an initial <strong>de</strong>posit of a<br />

euros increases to<br />

a + xa = a · (1 + x)<br />

after one year. If, however, the interest is “computed” every six months, the same initial <strong>de</strong>posit<br />

produces<br />

a + x (<br />

2 a + a + x ) x<br />

(<br />

2 a 2 = a · 1 + x ) 2<br />

2<br />

after one year. By induction, we see that if the interest is computed every 12/n months, after one<br />

year we get a final capital of<br />

(<br />

a · 1 + x ) n<br />

n<br />

The limit of the gain factor as n → ∞,<br />

(<br />

E(x) = lim 1 + x ) n<br />

n→∞ n<br />

is another <strong>de</strong>finition of the exponential function.<br />

Population dynamics. The exponential mo<strong>de</strong>ls the dynamics of a population in a unlimited<br />

environment. The Malthusian/exponential mo<strong>de</strong>l 11 is<br />

Ṅ = λN<br />

where N(t) is the population at time t, and λ > 0 is some growth constant (the difference α − β<br />

between the natality rate and the mortality rate). The solution is N(t) = N(0)e λt . If we retire at<br />

fixed rate α > 0<br />

Ṅ = λN − α<br />

we have a non-trivial stationary solution N = α/λ, and the difference x(t) = N(t) − N is still<br />

exponential.<br />

This behaviour has to be compared with the super-exponential mo<strong>de</strong>l<br />

Ṅ = αN 2 .<br />

11 T.R. Malthus, An Essay on the Principle of Population, Lon<strong>do</strong>n, 1798.


6 FLOWS 45<br />

which un<strong>de</strong>rgoes a catastrophe (infinite population) in finite time!<br />

Um mo<strong>de</strong>lo mais realista <strong>da</strong> dinâmica <strong>de</strong> uma população num meio ambiente limita<strong>do</strong> é a<br />

equação logística 12<br />

Ṅ = λN(1 − N/M)<br />

on<strong>de</strong> λ > 0 e a constante M > 0 é a população máxima suporta<strong>da</strong> pelo meio ambiente. Observe<br />

que Ṅ ≃ λN se N ≪ M, e que Ṅ → 0 quan<strong>do</strong> N → M. A população relativa x(t) = N(t)/M<br />

satisfaz a equação logística “adimensional”<br />

ẋ = λx(1 − x) .<br />

Here we see two equilibria: the trivial equilibrium x(t) = 0 and the maximum allowed polpulation<br />

x(t) = 1. The generic solution with initial condition 0 < x(0) < 1 is<br />

1<br />

x(t) = ( ) ,<br />

1<br />

1 +<br />

x 0<br />

− 1 e −λt<br />

Exponential growth, super-exponential growth and logistic mo<strong>de</strong>l.<br />

6.4 Linear systems<br />

Linear systems and exponential.<br />

Consi<strong>de</strong>r a linear system<br />

ẋ = Ax<br />

for t ↦→ x(t) ∈ R n and A ∈ Mat n (R). The solution is given formally by<br />

x(t) = e tA x(0)<br />

where the “exponential operator” e tA is <strong>de</strong>fined by the power series<br />

e tA =<br />

∞∑<br />

n=0<br />

t n<br />

n! An<br />

Hyperbolic systems. O campo linear v(x) = Ax é dito hiperbólico se o espectro <strong>de</strong> A, o<br />

conjunto<br />

sp(A) = {λ k = ρ k + iω k ∈ C t.q. <strong>de</strong>t(A − λ k I) = 0}<br />

<strong>do</strong>s valores próprios <strong>de</strong> A, é disjunto <strong>do</strong> eixo imaginário (ou seja, ρ k ≠ 0 ∀k).<br />

• Verifique que<br />

A =<br />

( )<br />

ρ1 0<br />

0 ρ 2<br />

⇒ e tA =<br />

( )<br />

e<br />

ρ 1t<br />

0<br />

0 e ρ2t<br />

A origem é dita no<strong>do</strong> estável se ρ 1 , ρ 2 < 0, no<strong>do</strong> instável se ρ 1 , ρ 2 > 0, ponto <strong>de</strong> sela se<br />

ρ 1 < 0 < ρ 2 .<br />

12 Pierre François Verhulst, Notice sur la loi que la population pursuit <strong>da</strong>ns son accroissement, Correspon<strong>da</strong>nce<br />

mathématique et physique 10 (1838), 113-121.


6 FLOWS 46<br />

• Verifique que<br />

A =<br />

( ρ 1<br />

0 ρ<br />

• Verifique que<br />

( ) 0 ω<br />

A =<br />

−ω 0<br />

( ) ρ ω<br />

A =<br />

−ω ρ<br />

)<br />

⇒ e tA = e ρt ( 1 t<br />

0 1<br />

( )<br />

⇒ e tA cos(ωt) sin(ωt)<br />

=<br />

− sin(ωt) cos(ωt)<br />

( )<br />

⇒ e tA = e ρt cos(ωt) sin(ωt)<br />

− sin(ωt) cos(ωt)<br />

A origem é dita foco estável se ρ < 0, foco instável se ρ > 0.<br />

• Consi<strong>de</strong>re o sistema linear<br />

ẋ = x − y<br />

ẏ = x + y<br />

Determine a solução com condições iniciais x(0) = 1 e y(0) = 0.<br />

6.5 Existence and uniqueness theorems<br />

Here we consi<strong>de</strong>r a generic first or<strong>de</strong>r ODE of the form<br />

ẋ = v(x, t)<br />

where the velocity field v is a (continuous) function <strong>de</strong>fined in some exten<strong>de</strong>d phase space X × R.<br />

The phase space X may be some interval of the real line, an open subset of some Eucli<strong>de</strong>an R n ,<br />

or a differentiable manifold.<br />

The problem we address is the existence and uniqueness of solutions of the initial value (or<br />

Cauchy) problem. A local solution passing through the point (x 0 , t 0 ) ∈ X×R is a solution t ↦→ ϕ(t),<br />

<strong>de</strong>fined in some neighborhood I of t 0 , such that ϕ(t 0 ) = x 0 . Eventually, we’ll be interested also in<br />

the possibility of extending such local solutions to larger intervals of times.<br />

The basic existence theorem is 13<br />

Peano’s theorem. Let v(x, t) be a continuous velocity field in some <strong>do</strong>main A of the exten<strong>de</strong>d<br />

phase space R 2 . Then for any point (x 0 , t 0 ) ∈ A passes at least one integral curve of the differential<br />

equation ẋ = v(x, t).<br />

I<strong>de</strong>a of the proof. Natural guesses for the solutions are Euler lines starting through (x 0 , t 0 ). If<br />

we restrict to a sufficiently small neighborhood of (x 0 , t 0 ), we can assume that the velocity field is<br />

boun<strong>de</strong>d, say |v(x, t)| ≤ K, and that all such Euler lines lies in the “papillon” ma<strong>de</strong> of two triangles<br />

touching at (x 0 , t 0 ) with slopes ±K. Construct a family of Euler lines, graphs of ϕ n (t), such that<br />

the maximal step ε n of the n-th line goes to 0 as n → ∞. One easily sees that the family (ϕ n )<br />

is boun<strong>de</strong>d and equicontinuous. By the Ascoli-Arzelá theorem it admits a (uniformly) convergent<br />

subsequence. Finally, we claim that the sublimit ϕ ni → ϕ solves the differential equation. q.e.d.<br />

Both existence and uniqueness may fail.<br />

(ẋ) 2 − xt + 1 = 0<br />

)<br />

The Hamilton-Jacobi equation<br />

cannot have solutions satisfying the initial condition x(0) = 0, for otherwise we would have a<br />

negative “kinetic energy” (ẋ) 2 = −1 at that point!<br />

Some regularity of the functions involved in a differential equation is also nee<strong>de</strong>d to ensure the<br />

uniqueness of solutions. For example, both curves t ↦→ 0 and t ↦→ t 3 solve the equation<br />

ẋ = 3x 2/3<br />

with initial condition x(0) = 0. The problem here is that the velocity field v(t, x) = 3x 2/3 , although<br />

continuous, is not differentiable and not even Lipschitz at the origin.<br />

13 G. Peano, Sull’integrabilità <strong>de</strong>lle equazioni differenziali <strong>de</strong>l primo ordine, Atti Accad. Sci. Torino 21 (1886),<br />

677-685. G. Peano, Demonstration <strong>de</strong> l’intégrabilité <strong>de</strong>s équations différentielles ordinaires, Mathematische Annalen<br />

37 (1890) 182-228.


6 FLOWS 47<br />

Uniqueness of solutons. A velocity field v(t, x), <strong>de</strong>fined in a <strong>do</strong>main I × D of the exten<strong>de</strong>d<br />

phase space R × R n , is locally Lipschitz w.r.t. to the variable x if for any (t 0 , x 0 ) ∈ I × D there is<br />

a neighborhood J × U ∋ (t 0 , x 0 ) and a constant L ≥ 0 such that<br />

‖v(t, x) − v(t, y)‖ ≤ L · ‖x − y‖<br />

∀ (t, x), (t, y) ∈ J × U<br />

If v(t, x) has continuous <strong>de</strong>rivative w.r.t. x, i.e. if the Jacobian<br />

( ) ∂vi<br />

D x v(t, x) = (t, x)<br />

∂x j<br />

exists and is continuous, then v(t, x) is locally Lipschitz in any compact convex <strong>do</strong>main I × K ⊂<br />

R × R n . The basic uniqueness theorem is 14<br />

Picard-Lin<strong>de</strong>löf theorem. Let v(t, x) be a continuous velocity field <strong>de</strong>fined in some <strong>do</strong>main D<br />

of the exten<strong>de</strong>d phase space R×X. If v is locally Lipschitz (for example continuously differentiable)<br />

w.r.t. the second variable x, then there exist one and only one local solution of ẋ = v(t, x) passing<br />

through any point (t 0 , x 0 ) ∈ D.<br />

Geometrically, the uniqueness theorem says that through any point (t 0 , x 0 ) of the <strong>do</strong>main D<br />

there pass one and only one solution. Hence solutions, consi<strong>de</strong>red as curves in the exten<strong>de</strong>d phase<br />

space, cannot intersect each other.<br />

In a <strong>do</strong>main where Picard’s theorem applies, if two local solutions agree in a common interval<br />

of times then they are in<strong>de</strong>ed restrictions of a unique solution <strong>de</strong>fined in the union of the respective<br />

<strong>do</strong>mains. There follows that solutions are always extendible to a maximum <strong>do</strong>main. Such solutions<br />

are called maximal solutions.<br />

Strategy of the proof of the Picard’s theorem. The first observation is that a function<br />

ϕ(t) is a solution of the Cauchy problem for ẋ = v(t, x) with initial condition ϕ(t 0 ) = x 0 iff<br />

∫ t<br />

ϕ(t) = x 0 + v (s, ϕ(s)) ds<br />

t 0<br />

Now, we notice that the above i<strong>de</strong>ntity is equivalent to the statement that ϕ is a fixed point of the<br />

so called Picard’s map φ ↦→ Pφ, sending a function t ↦→ φ(t) into the function<br />

∫ t<br />

(Pφ) (t) = x 0 + v (s, φ(s)) ds<br />

t 0<br />

At this point, one must chose cleverly the <strong>do</strong>main of the Picard’s map, which is the space of<br />

functions where we think a solution should be. It will be a certain space C of continuous functions,<br />

<strong>de</strong>fined in an appropriate neighborhood I of t 0 , equipped with a norm that makes it a complete<br />

metric space (hence a Banach space). The Lipschitz condition, together with continuity, satisfied<br />

by the velocity field will imply that if the interval I is sufficiently small then the Picard’s map<br />

P : C → C is a contraction. The contraction principle (a.k.a. Banach fixed point theorem) finally<br />

guarantees the existence and uniqueness of the fixed point of P in C.<br />

Picard’s iterations. The contraction principle actually says that the fixed point, i.e. the<br />

solution we are looking for, is the limit of any sequence φ, Pφ, ..., P n φ, ... of iterates of the Picard<br />

map starting with any initial guess φ ∈ C. In other words, the existence part of the theorem is<br />

“constructive”, it gives us a procedure to find out the solution, or at least a sequence of functions<br />

which approximate the solution.<br />

14 M. E. Lin<strong>de</strong>löf, Sur l’application <strong>de</strong> la métho<strong>de</strong> <strong>de</strong>s approximations successives aux équations différentielles<br />

ordinaires du premier ordre, Comptes rendus heb<strong>do</strong>ma<strong>da</strong>ires <strong>de</strong>s séances <strong>de</strong> l’Académie <strong>de</strong>s sciences 114 (1894),<br />

454-457. Digitized version online via http://gallica.bnf.fr/ark:/12148/bpt6k3074


6 FLOWS 48<br />

Example (simple ODEs). Consi<strong>de</strong>r the simple ODE ẋ = v(t) with initial condition x(t 0 ) = x 0 .<br />

Picard’s recipe, starting from the initial guess φ(t) = x 0 gives, already at the first step,<br />

which is the solution we know.<br />

∫ t<br />

(Pφ) (t) = x 0 + v(s)ds<br />

t 0<br />

Example (the exponential). Suppose you want to solve ẋ = x with initial condition x(0) = 1.<br />

You start with the guess φ(t) = 1, and then compute<br />

(Pφ) (t) = 1 + t<br />

(<br />

P 2 φ ) (t) = 1 + t + 1 2 t2 ... (P n φ) (t) = 1 + t + 1 2 t2 + ... + 1 n! tn<br />

Hence the sequence converges (uniformly on boun<strong>de</strong>d intervals) to the Taylor series of the exponential<br />

function<br />

(P n φ) (t) → 1 + t + 1 2 t2 + ... + 1 n! tn + ... = e t ,<br />

which is the solution we already knew.<br />

Details of the proof of the Picard’s theorem. Choose a sufficiently small rectangular<br />

neighborhood<br />

I × B = [t 0 − ε, t 0 + ε] × B δ (x 0 )<br />

around (t 0 , x 0 ), where B = B δ (x 0 ) <strong>de</strong>notes the closed ball with center x 0 and radius δ in X. There<br />

follows from continuity of v that there exists K such that<br />

|v(t, x)| ≤ K<br />

for any (t, x) ∈ I × B. There follows from the local Lipschitz condition for v that there exists M<br />

such that<br />

|v(t, x) − v(t, y)| ≤ M|x − y|<br />

for any t ∈ I and any x, y ∈ B. Now restrict, if nee<strong>de</strong>d, the (radius of the) interval I in such a<br />

way to get both the inequalities Kε ≤ δ and Mε < 1. Let C be the space of continuous functions<br />

t ↦→ φ(t) sending I into B. Equipped with the sup norm<br />

‖φ − ϕ‖ = sup |φ(t) − ϕ(t)|<br />

t∈I<br />

this is a complete space. One verifies that the Picard’s map sends C into C, since<br />

| (Pφ) (t) − x 0 | ≤<br />

∫ t<br />

Finally, given two functions φ, ϕ ∈ C, one sees that<br />

| (Pφ) (t) − (Pϕ) (t)| ≤<br />

∫ t<br />

t 0<br />

|v (s, φ(s)) |ds ≤ Kε ≤ δ.<br />

t 0<br />

|v (s, φ(s)) − v (s, ϕ(s)) |ds ≤ Mε sup<br />

t∈I<br />

|φ(t) − ϕ(t)|<br />

hence ‖Pφ − Pϕ‖ < Mε‖φ − ϕ‖. Since Mε < 1, this proves that the Picard’s map is a contraction<br />

and the fixed point theorem allows to conclu<strong>de</strong>.<br />

We may not be able to solve them! Last but not least, we must keep in mind that we are<br />

not able to solve all equations. Actually, although we may prove the existence and the uniqueness<br />

for large classes of equations, we are simply not able to explicitly integrate the really interesting<br />

differential equations...<br />

Ultimately we must recur to numerical methods to find approximate solutions and to qualitative<br />

analysis


6 FLOWS 49<br />

Depen<strong>de</strong>nce on initial <strong>da</strong>ta and parameters<br />

Consi<strong>de</strong>r a family of ODEs<br />

ẋ = v(t, x, λ)<br />

where λ is a real parameter. We want to un<strong>de</strong>rstand how solutions <strong>de</strong>pend on the parameter λ. A<br />

basic instrument is the 15<br />

Let φ(t) and ψ(t) be two non-negative real valued functions <strong>de</strong>fined in in-<br />

Grönwall’s lemma.<br />

terval [a, b] such that<br />

φ(t) ≤ K +<br />

∫ t<br />

for any a ≤ t ≤ b and some constant K ≥ 0. Then<br />

a<br />

ψ(s)φ(s)ds<br />

φ(t) ≤ Ke R t<br />

a ψ(s)ds .<br />

Proof.<br />

First, assume K > 0. Define<br />

Φ(t) = K +<br />

∫ t<br />

a<br />

ψ(s)φ(s)ds<br />

and observe that Φ(a) = K > 0, hence Φ(t) > 0 for all a ≤ t ≤ b. The logarithmic <strong>de</strong>rivative is<br />

d<br />

ψ(t)φ(t)<br />

log Φ(t) = ≤ ψ(t)<br />

dt Φ(t)<br />

where we used the hypothesis φ(t) ≤ Φ(t). Integrating the inequality we get, for a ≤ t ≤ b,<br />

Exponentiation gives the result, since<br />

log Φ(t) ≤ Φ(a) +<br />

∫ t<br />

a<br />

ψ(s)ds .<br />

φ(t) ≤ Φ(t) ≤ K · e R t<br />

a ψ(s)ds<br />

The case K = 0 follows taking the limit of the above inequalities for a sequence of K n > 0<br />

<strong>de</strong>creasing to zero. q.e.d.<br />

Continuous <strong>de</strong>pen<strong>de</strong>nce on initial conditions.<br />

If x(t) and y(t) are two solutions of<br />

then<br />

ẋ = v(t, x)<br />

∫ t<br />

x(t) − y(t) = x(0) − y(0) + (v(s, x(s)) − v(s, y(s))) ds<br />

t 0<br />

If L(s) <strong>de</strong>notes the Lipschitz constant of v(s, ·), we get<br />

The Gronwall’s lemma gives the control<br />

∫ t<br />

‖x(t) − y(t)‖ ≤ ‖x(0) − y(0)‖ + L(s)‖x(s) − y(s)‖ds<br />

t 0<br />

R t<br />

t<br />

‖x(t) − y(t)‖ ≤ e<br />

L(s)ds 0 ‖x(0) − y(0)‖<br />

Observe that the above control also gives an alternative proof of uniqueness of solutions given<br />

a Lipschitz condition on the vector field.<br />

15 T. H. Gronwall, Note on the <strong>de</strong>rivative with respect to a parameter of the solutions of a system of differential<br />

equations, Ann. of Math 20 (1919), 292-296.


6 FLOWS 50<br />

Theorem (smooth <strong>de</strong>pen<strong>de</strong>nce on parameters). Let v(t, x, λ) be a family of vector fields<br />

<strong>de</strong>fined on some <strong>do</strong>main of the exten<strong>de</strong>d phase space D ⊂ R × X <strong>de</strong>pending on a parameter<br />

λ ∈ Λ ⊂ R. If v is of class C k with k ≥ 1, then in some neighborhood of any (t 0 , x 0 , λ 0 ) ∈ D × Λ<br />

the local solutions of<br />

ẋ = v(t, x, λ)<br />

with initial condition x(t 0 ) = x 0 are differentiable (in<strong>de</strong>ed C k ) functions of (t, x, λ).<br />

Proof.<br />

See [BN05]<br />

Warning. Continuous <strong>de</strong>pen<strong>de</strong>nce <strong>do</strong>es not exclu<strong>de</strong> sensitive <strong>de</strong>pen<strong>de</strong>nce on both initial conditions<br />

and parameters, even in the linear case! For example, the distance between solutions of<br />

ẋ = µx with different x(0) and/or µ may diverge for large time ...


7 OSCILLATIONS AND CYCLES 51<br />

7 Oscillations and cycles<br />

7.1 Harmonic oscillator<br />

Harmonic oscillator.<br />

equation<br />

The harmonic oscillator is the (phenomenon mo<strong>de</strong>led by the) Newton<br />

¨q = −ω 2 q .<br />

This is a quite universal equation, since it <strong>de</strong>scribes small oscillations around a “generic” stable<br />

equilibrium of any one-dimensional Newtonian system 16 (in<strong>de</strong>ed, take a Newton equation mẍ =<br />

−dU ′ (x) of a particle in a potential field U. An equilibrium position is a zero of the force, i.e. a<br />

point x 0 where U ′ (x 0 ) = 0. It is “stable” if x 0 is a local minimum of the potential, so that the Taylor<br />

expansion of the potential around x 0 in powers of q = x − x 0 starts with U(x) = α + 1 2 βq2 + . . . ,<br />

for some positive second <strong>de</strong>rivative U ′′ (x 0 ) = β. If we are only interested in small displacements<br />

of x around x 0 , we can safely disregard high or<strong>de</strong>r terms and approximate the Newton equation<br />

as m¨q ≃ −βq, which is an harmonic oscillator with resonant frequency ω = √ β/m).<br />

Call p = ˙q the momentum. The Newton equation ¨q = −ω 2 q is equivalent to Hamilton’s first<br />

or<strong>de</strong>r equations<br />

˙q = p<br />

ṗ = −ω 2 q .<br />

If we <strong>de</strong>fine the complex variable z = ωq + i ˙q, Newton equation then takes the form of a first or<strong>de</strong>r<br />

linear equation in the complex line, namely ż = −iωz, whose solution is z (t) = e −iωt z (0).<br />

In terms of the original (physical) variables, the solutions read<br />

periodicity of<br />

exp<br />

q (t) = q 0 cos (ωt) + v 0<br />

ω<br />

sin (ωt) = A sin(ωt + φ)<br />

where the amplitu<strong>de</strong> A and the initial phase φ <strong>de</strong>pend on the initial conditions q(0) = q 0 and<br />

˙q(0) = v 0 . So, all trajectories are periodic with common period 2π/ω, and orbits are ellipses in<br />

the q- ˙q plane, <strong>de</strong>termined by the conserved energy<br />

E = 1 2<br />

(<br />

˙q 2 + ω 2 q 2) = ω 2 A 2 .<br />

Harmonic oscillator, phase curves and time series.<br />

16 “The harmonic oscillator, which we are about to study, has close analogs in many other fields; although we start<br />

with a mechanical example of a weight on a spring, or a pendulum with a small swing, or certain other mechanical<br />

<strong>de</strong>vices, we are really studying a certain differential equation. This equation appears again and again in physics and<br />

other sciences, and in fact is a part of so many phenomena that its close study is well worth our while. Some of the<br />

phenomena involving this equation are the oscillations os a mass on a spring; the oscillations of charge flowing back<br />

and forth in an electrical circuit; the vibrations of a tuning fork which is generating sound waves; the analogous<br />

vibrations of the electrons in an atom, which generate light waves; the equations for the operation of a servosystem,<br />

such as a thermostat trying to adjust a temperature; complicated interactions in chemical reactions; the growth of<br />

a colony of bacteria in interaction with the food supply and the poison the bacteria produce; foxes eating rabbits<br />

eating grass, and so on; ...”<br />

Richard P. Feynman [Fe63]


7 OSCILLATIONS AND CYCLES 52<br />

Dumped oscillations.<br />

Adding friction to an harmonic oscillator we get<br />

¨q = −2α ˙q − ω 2 q ,<br />

where α > 0 is some friction coefficient. The guess q(t) = e −αt y(t) gives ÿ = δy where the<br />

“discriminant” is δ = ω 2 − α. Find the general solution, draw pictures and discuss the cases<br />

α 2 < ω 2 (un<strong>de</strong>r-critical <strong>da</strong>mping), α 2 = ω 2 (critical <strong>da</strong>mping), and α 2 > ω 2 (overcritical <strong>da</strong>mping).<br />

Show that the energy<br />

<strong>de</strong>creases with time outsi<strong>de</strong> equilibrium points.<br />

E(q, ˙q) = 1 2 ˙q2 + 1 2 ω2 q 2<br />

Un<strong>de</strong>r<strong>da</strong>mped, critical and over<strong>da</strong>mped oscillations (phase portrait and time series).<br />

7.2 Mathematical pendulum and Jacobi’s elliptic integrals<br />

Mathematical pendulum.<br />

The Newton equation<br />

I ¨θ = −mgl sin θ<br />

mo<strong>de</strong>ls the motion of an i<strong>de</strong>alized pendulum (meaning a point mass attached to a wire of negligible<br />

weight, un<strong>de</strong>r a constant gravitational force) with mass m and length l, where I = ml 2 is the<br />

moment of inertia, g is the gravitational acceleration (near the Earth’s surface), and θ is the angle<br />

of the wire with the origin θ = 0 located at the stable equilibrium point. Observe that in the limit<br />

of small oscillations we could safely replace sin θ ≃ θ and we are back to the harmonic oscillator.<br />

The energy<br />

E = 1 2 ˙θ 2 − mgl cos θ<br />

is a constant of the motion. We can <strong>de</strong>fine the resonant frequency ω = √ mgl/I and write the<br />

equation as<br />

¨θ = −ω 2 sin θ<br />

To simplify thinks, let’s take ω = 1. Solving form ˙q 2 the we see that the motion with energy E is<br />

given implicitly by the “elliptic integral”<br />

∫<br />

dθ<br />

t = √<br />

2(E − cos(θ))


7 OSCILLATIONS AND CYCLES 53<br />

Phase portrait of a mathematical pendulum (without and with friction)<br />

Jacobi elliptic functions. What <strong>do</strong>es a mathematician/physicist <strong>do</strong> when he/she face an integral<br />

and <strong>do</strong>esn’t see how to solve it in terms of known functions He/she gives a name to<br />

it.<br />

√<br />

E+1<br />

Define k =<br />

2<br />

and then x = 1 k<br />

sin(θ/2). The conservation of energy reads<br />

ẋ = √ (1 − x 2 )(1 − k 2 x 2 )<br />

There follows that time is given by the so called Jacobi’s elliptic integral of the first kind<br />

∫<br />

dx<br />

t = √<br />

(1 − x2 )(1 − k 2 x 2 )<br />

The solution, actually the inverse function x = sn(t, k) as a function of t and the parameter k, is<br />

“named” Jacobi elliptic function.<br />

Tis is the beginning of along story. You may want to know that sn, as well its relatives, is a<br />

quotient of products of Jacobi’s theta functions, hence, we are at the intersection between complex<br />

analysis, algebraic geometry, number theory, ...<br />

7.3 Central forces and planetary motions<br />

Bertrand theorem. 17 The unique central forces F (r) such that any boun<strong>de</strong>d orbit is periodic<br />

are the Newtonian force F (r) = k/r 2 and the elastic force F (r) = kr.<br />

Two-body problem. Kepler problem <strong>de</strong>als with the motion of two point-like bodies (planets<br />

and/or stars) un<strong>de</strong>r mutual gravitational interaction. Let m 1 , m 2 > 0 be their masses, and q 1 , q 2 ∈<br />

R 3 their positions, respectively. Gravitational interaction is <strong>de</strong>scribed by the conservative force<br />

−∇V with potential energy<br />

V (q 1 , q 2 ) = G m 1m 2<br />

|q 1 − q 2 |<br />

where G is the gravitational constant. This force verifies the ”third law of dynamics”, hence the<br />

total linear and angular momentum<br />

and<br />

P = m 1 ˙q 1 + m 2 ˙q 2 M = m 1 q 1 ∧ ˙q 1 + m 2 q 2 ∧ ˙q 2<br />

are conserved. This implies that the center of mass moves at uniform rectilinear speed and that<br />

the motion of the two bodies takes place in a plane orthogonal to the angular momentum M. If<br />

we choose a Galileian reference system where P = 0 and M is parallel to the z-axis (in particular<br />

M is supposed different from the zero vector, a case which leads to a collision ...) , the full system<br />

is <strong>de</strong>scribed by the single vector q 2 − q 1 in the x-y plane, which we write in polar coordinates<br />

as ρe i2πθ . It turns out that the two-body problem is equivalent to the motion of a single point<br />

mass m = m1m2<br />

m 1+m 2<br />

moving on a plane un<strong>de</strong>r the influence of a potential energy V (ρ) = −G m ρ , the<br />

(conserved) energy beeing<br />

E = 1 2 m (<br />

˙ρ 2 + ρ 2 ˙θ2 ) + V (ρ)<br />

17 J. Bertrand, Théorème relatif au mouvement d’un point attiré vers un centre fixe, C. R. Acad. Sci. 77 (1873),<br />

849-853.


7 OSCILLATIONS AND CYCLES 54<br />

Observe that if one of the bodies is much bigger than the other (like the Sun and the Earth), say<br />

m 1 ≫ m 2 , then the center of mass nearly coinci<strong>de</strong>s with the position q 1 of the bigger body, while<br />

the reduced mass m is essentially the mass m 2 of the smaller one (hence it looks like the Earth<br />

moving around the Sun, as Galileo had suggested).<br />

Central forces.<br />

Consi<strong>de</strong>r the Newton equation<br />

m¨r = F (|r|) ˆr<br />

<strong>de</strong>scribing the motion of a particle (planet) of mass m in a central force field F . Conservation<br />

of angular momentum implies that the motion is planar, hence we may take r ∈ R 2 . In polar<br />

coordinates r = ρe iθ , the equations reed<br />

¨ρ − ρ ˙θ 2 = F (ρ)/m<br />

ρ¨θ + 2 ˙ρ ˙θ = 0 .<br />

The second equation says that the “areal velocity” (“veloci<strong>da</strong><strong>de</strong> areal”) l = ρ 2 ˙θ is a constant of<br />

the motion (Kepler’s second law).<br />

Taking Newton’s gravitational force F (ρ) = − GmM<br />

ρ<br />

(where M is the mass of the Sun and G is<br />

2<br />

the gravitational constant), the first equation may be written as<br />

m¨ρ = − ∂ ∂ρ V l (ρ) ,<br />

where we <strong>de</strong>fined the ”effective potential energy” as V l (ρ) = 1 2 m l2<br />

ρ<br />

− G mM 2 ρ<br />

is<br />

E = 1 2 m ˙ρ2 + 1 2 m l2<br />

ρ 2 − GmM ρ .<br />

. The conserved energy<br />

Kepler’s effective potential and some energy level sets.<br />

Now we set ρ = 1/x and look for a differential equation for x as a function of θ. Computation<br />

shows that dx/dθ = − ˙ρ/l, and, using conservation of l, that d 2 x/dθ 2 = −ρ 2 ¨ρ/l 2 . There follows<br />

that the first Newton equation reads<br />

we get<br />

d 2 x<br />

dθ 2 + x = − 1<br />

l 2 x 2 m F (1/x) .<br />

d 2 x<br />

dθ 2 + x = −GM l 2 .


7 OSCILLATIONS AND CYCLES 55<br />

The general solution of this second or<strong>de</strong>r linear differential equation is<br />

x (θ) = GM<br />

l 2 (1 + e cos (θ − θ 0 )) ,<br />

for some constants e and θ 0 . Back to the original radial variable we get the solution<br />

ρ (θ) =<br />

l 2 /GM<br />

1 + e cos (θ − θ 0 ) ,<br />

Hence, orbits are conic sections with eccentricity (“excentrici<strong>da</strong><strong>de</strong>” ) e and focus at the origin: an<br />

ellipse for 0 ≤ e < 1 (corresponding to negative energy, hence to planets, and this is Kepler’s first<br />

law), a parabola for e = 1 (corresponding to zero energy), an hyperbola for e > 1 (corresponding<br />

to positive energy). .<br />

The 3-body problem and chaos.<br />

18<br />

“Que lon cherche à se représenter la figure formée par ces <strong>de</strong>ux courbes et leurs intersections<br />

en nombre infini <strong>do</strong>nt chacune correspond à une solution <strong>do</strong>ublement asymptotique,<br />

ces intersections forment une sorte <strong>de</strong> treillis, <strong>de</strong> tissu, <strong>de</strong> réseau à mailles<br />

infiniment serrées ; chacune <strong>de</strong> ces courbes ne <strong>do</strong>it jamais se recouper elle-même, mais<br />

elle <strong>do</strong>it se replier elle-même dune manière très complexe pour venir couper une infinité<br />

<strong>de</strong> fois toutes les mailles du réseau. On sera frappé <strong>de</strong> la complexité <strong>de</strong> cette<br />

figure, que je ne cherche même pas à tracer. Rien nest plus propre à nous <strong>do</strong>nner<br />

une idée <strong>de</strong> la complication du problème <strong>de</strong>s trois corps et, en général, <strong>de</strong> tous les<br />

problèmes <strong>de</strong> dynamique òu il ny a pas d’intégrale uniforme et òu les séries <strong>de</strong> Bohlin<br />

sont divergentes.”<br />

7.4 Cycles in chemistry and biology<br />

Henri Poincaré, 1884. 19<br />

Lotka-Volterra pre<strong>da</strong>tor-prey mo<strong>de</strong>l. The Lotka-Volterra mo<strong>de</strong>l is the system of coupled<br />

first or<strong>de</strong>r differential equations<br />

ẋ = ax − bxy<br />

ẏ = −cy + dxy<br />

<strong>de</strong>fined for positive x and y, where the parameters a, b, c, d are positive constants. These equations,<br />

proposed by the physical chemist Alfred Lotka and by the mathematician Vito Volterra between<br />

1925 and 1926, mo<strong>de</strong>l the population dynamics of two species, x preys and y pre<strong>da</strong>tor, in the<br />

same territory. Preys increase exponentially at rate a and are killed at rate proportional to the<br />

probability of beeing captured by a pre<strong>da</strong>tor, while pre<strong>da</strong>tors <strong>de</strong>crease exponentially at rate c and<br />

increase at rate proportional to the probability of capturing preys.<br />

Discuss the possible dynamics <strong>de</strong>pending on the values of the parameters.<br />

Van <strong>de</strong>r Pols. Consi<strong>de</strong>re o oscila<strong>do</strong>r <strong>de</strong> van <strong>de</strong>r Pol 20<br />

¨q − µ(1 − q 2 ) ˙q + q = 0<br />

que mo<strong>de</strong>la a corrente num circuito com um elemento não-linear.<br />

18 A palavra grega χαoς, que po<strong>de</strong> ser traduzi<strong>da</strong> como “abismo”, contém a mesma base χα- (e probabilmente<br />

<strong>de</strong>riva <strong>de</strong>) <strong>do</strong>s verbos χαινειν e χασχειν, que significam ”abrir-se”, “escancarar”, e “abrir a boca”, “bocejar” (cfr.<br />

χασµα, “abismo”). Foi utiliza<strong>da</strong> em algumas cosmogonias gregas para indicar “a mistura <strong>de</strong>sor<strong>de</strong>na<strong>da</strong> <strong>de</strong> elementos<br />

anterior à formação <strong>do</strong> χoσµoσ, o universo or<strong>de</strong>na<strong>do</strong>”.<br />

19 H. Poincaré, Sur le problème <strong>de</strong> trois corps et les équations <strong>de</strong> la dynamique, Œuvres, volume VII, Gauthier<br />

Villars 1951.<br />

20 B. van <strong>de</strong>r Pol, A theory of the amplitu<strong>de</strong> of free and forced trio<strong>de</strong> vibrations, Radio Review 1 (1920), 701-710<br />

and 754-762. B. van <strong>de</strong>r Pol and J. van <strong>de</strong>r Mark, Frequency <strong>de</strong>multiplication, Nature 120 (1927), 363-364.


7 OSCILLATIONS AND CYCLES 56<br />

Retrato <strong>de</strong> fase e trajectórias <strong>do</strong> oscila<strong>do</strong>r <strong>de</strong> van <strong>de</strong>r Pol.<br />

Lotka-Volterra.<br />

Consi<strong>de</strong>re o sistema <strong>de</strong> Lotka-Volterra<br />

ẋ = ax − bxy<br />

ẏ = −cy + dxy<br />

Foi proposto por Vito Volterra 21 para mo<strong>de</strong>lar a competição entre x presas e y pre<strong>da</strong><strong>do</strong>res, e<br />

por Alfred J. Lotka 22 para mo<strong>de</strong>lar o comportamento cíclico <strong>de</strong> certas reacções químicas, como o<br />

esquema abstracto<br />

A + X → 2X X + Y → 2Y Y → B<br />

A função<br />

H(x, y) = dx + by − c log x − a log y<br />

d<br />

é uma constante <strong>do</strong> movimento, ou seja,<br />

dtH(x(t), y(t)) = 0. Deduza que as órbitas <strong>do</strong> sistema<br />

estão conti<strong>da</strong>s nas curvas <strong>de</strong> nível <strong>de</strong> H(x, y).<br />

Retrato <strong>de</strong> fase <strong>do</strong> sistema <strong>de</strong> Lotka-Volterra.<br />

Brusselator. O Brusselator é um mo<strong>de</strong>lo autocatalítico proposto por Ilya Prigogine e colabora<strong>do</strong>res<br />

23 que consiste na reacção abstracta<br />

A → X B + X → Y + C 2X + Y → 3X X → D<br />

Simule o sistema é<br />

ẋ = α − (β + 1)x + x 2 y<br />

ẏ = βx − x 2 y<br />

21 Vito Volterra, Variazioni e fluttuazioni <strong>de</strong>l numero d’individui in specie di animali conviventi, Mem. Acad.<br />

Lincei 2 (1926), 31-113. Vito Volterra, Leçons sur la Théorie Mathématique <strong>de</strong> la Lutte pour la Vie, Paris 1931.<br />

22 Alfred J. Lotka, J. Amer. Chem. Soc 27 (1920), 1595. Alfred J. Lotka, Elements of physical biology, Williams<br />

& Wilkins Co. 1925.<br />

23 I. Prigogine and R. Lefever, Symmetry breaking instabilities in dissipative systems, J. Chem. Phys. 48 (1968),<br />

1655-1700. P. Glans<strong>do</strong>rff and I. Prigogine, Thermodynamic theory of structure, stability and fluctuations, Wiley,<br />

New York 1971. G. Nicolis and I. Prigogine, Self-organization in non-equilibrium chemical systems, Wiley, New<br />

York 1977.


7 OSCILLATIONS AND CYCLES 57<br />

para as concentrações <strong>da</strong>s espécies catalíticas X e Y , obti<strong>do</strong> quan<strong>do</strong> as concentrações [A] ∼ α e<br />

[B] ∼ β são manti<strong>da</strong>s constantes. Simule o sistema<br />

ẋ = α − (b + 1)x + x 2 y<br />

ẏ = bx − x 2 y<br />

ḃ = −bx + δ<br />

para as concentrações <strong>de</strong> X, Y e B, obti<strong>do</strong> quan<strong>do</strong> a concentração [A] ∼ α é manti<strong>da</strong> constante e<br />

B é injecta<strong>do</strong> a uma veloci<strong>da</strong><strong>de</strong> constante v ∼ δ.<br />

Rerato <strong>de</strong> fase <strong>do</strong> Brusselator.<br />

Oscila<strong>do</strong>r bioquímico <strong>de</strong> Goodwin Um mo<strong>de</strong>lo <strong>de</strong> interações proteinas-mRNA proposto por<br />

Goodwin 24 é<br />

Ṁ = 1<br />

1+P − α<br />

P ˙ = M − β<br />

on<strong>de</strong> M e P <strong>de</strong>notam as concentrações relativas <strong>de</strong> mRNA e proteina, respectivamente.<br />

7.5 Weather report<br />

Retrato <strong>de</strong> fase <strong>do</strong> sistema <strong>de</strong> Goodwin.<br />

Atractor <strong>de</strong> Lorenz Consi<strong>de</strong>re o sistema <strong>de</strong> Lorenz 25<br />

ẋ = σ(y − x)<br />

ẏ = x(ρ − z) − y<br />

ż = xy − βz<br />

• Analize o comportamento assimptótico <strong>da</strong>s trajectórias ao variar os parâmetros σ, ρ e β.<br />

• Observe o comportamento <strong>da</strong>s trajectórias quan<strong>do</strong> σ ≃ 10, ρ ≃ 28 e β ≃ 8/3.<br />

24 B.C. Goodwin, Temporal organization in cells, Aca<strong>de</strong>mic Press, Lon<strong>do</strong>n/New York 1963. B.C. Goodwin,<br />

Oscillatory behaviour in enzymatic control processes, Adv. Enzyme Regul. 3 (1965), 425-438.<br />

25 E.N. Lorenz, Deterministic nonperiodic flow, J. Atmspheric Science 20 (1963), 130-141.


7 OSCILLATIONS AND CYCLES 58<br />

Atractor <strong>de</strong> Lorenz.


8<br />

LINEARIZAÇÃO 59<br />

8 Linearização<br />

8.1 Linearização conforme<br />

Linearização conforme. Seja f : C → C uma função racional <strong>de</strong>fini<strong>da</strong> na esfera <strong>de</strong> Riemann<br />

C = C ∪ {∞}. Ca<strong>da</strong> ponto fixo p <strong>de</strong> f tem uma sua bacia <strong>de</strong> actração B p . A procura <strong>de</strong> meto<strong>do</strong>s<br />

rápi<strong>do</strong>s para calcular itera<strong>da</strong>s, em 1871 E. Schrœ<strong>de</strong>r introduziu a i<strong>de</strong>ia <strong>de</strong> procurar conjugações<br />

conformes <strong>da</strong> restrição f ∣ Bp com funções racionais mais simples, <strong>do</strong> género g : z ↦→ λz , numa<br />

vizinhança B <strong>da</strong> origem. O méto<strong>do</strong> consiste em resolver a equação funcional h◦f ∣ Bp = g ◦h, on<strong>de</strong><br />

h : B p → B é uma função analítica. E. Schrœ<strong>de</strong>r, G. Kœnig e J.H. Poincaré trataram o problema<br />

com |λ| ≠ 1, e <strong>de</strong>pois Carl S. Siegel resolveu o caso |λ| = 1 por volta <strong>de</strong> 1940.<br />

Koenigs linearization theorem. Let z 0 be a fixed point of f with multiplier f ′ (z 0 ) = λ such<br />

that |λ| ≠ 0, 1. Then there exists a conformal map φ, unique up to a non-zero factor, from a<br />

neighborhood of z 0 onto a neighborhood of 0 such that φ ◦ f = λ · φ.<br />

Proof. We assume that z 0 is attracting, i.e. |λ| < 1, since the repelling case follows from<br />

consi<strong>de</strong>ring the local inverse of f. Also, after conjugation, we can assume that z 0 = 0, hence the<br />

map has the form f(z) = λz + a 2 z 2 + ....<br />

Now <strong>de</strong>fine φ n (z) = f n (z)/λ n . There exists a δ > 0 and a constant c < |λ| < 1 such that for<br />

|z| < δ<br />

|φ n+1 (z) − φ n (z)| ≤ k · (c/|λ|) n<br />

for some k > 0. Hence the sequence of holomorphic functions φ n converges uniformly in a small<br />

ball around 0. The functional equation φ ◦ f = λ · φ follows immediatly from its <strong>de</strong>finition.<br />

Comparing coefficients it is easy to see that any conjugation of z ↦→ λz to itself is a constant<br />

multiple of the i<strong>de</strong>ntity, as long as |λ| ≠ 0, 1. Uniqueness follows.<br />

Böttcher theorem<br />

Let z 0 be a superattracting fixed point of f, where<br />

f(z) = z 0 + a p (z − z 0 ) p + ...<br />

with a p ≠ 0 and p ≥ 2. Then there exists a conformal map φ, unique up to multiplication by a<br />

(p − 1)-root of unity, from a neighborhood of z 0 onto a neighborhood of 0 such that φ ◦ f = φ p .<br />

I<strong>de</strong>a of the proof. We can assume that z 0 = 0 and that a p = 1. As in Koenigs proof, we look<br />

for the conjugation as a limit af the functions<br />

φ n (z) = f n (z) p−n .<br />

It can be shown that the φ n converge uniformly in some sufficiently small ball around 0, and the<br />

functional equation follows from the <strong>de</strong>finition. Uniqueness, up to a (p − 1)-root of unity, can be<br />

checked comparing power series.<br />

8.2 Hiperbolici<strong>da</strong><strong>de</strong> e linearização<br />

Hiperbolici<strong>da</strong><strong>de</strong>. As transformações lineares <strong>do</strong>s espaços euclidianos têm dinâmicas simples,<br />

e fornecem mo<strong>de</strong>los para o comportamento <strong>de</strong> uma transformação diferenciável numa vizinhança<br />

<strong>de</strong> um ponto fixo. Um bom exercício é procurar enten<strong>de</strong>r a dinâmica <strong>de</strong> uma transformação linear<br />

<strong>do</strong> plano T : R 2 → R 2 , <strong>de</strong>fini<strong>da</strong> por uma matriz real 2 × 2. A i<strong>de</strong>ia é esboçar o retrato <strong>de</strong><br />

fase <strong>da</strong> transformação, ou seja <strong>de</strong>screver algumas trajetórias típicas, pelo menos uma por ca<strong>da</strong><br />

comportamento possível. Começe por estu<strong>da</strong>r uma transformação diagonalizável<br />

( )<br />

λ 0<br />

T =<br />

0 µ<br />

e reparar as diferenças no comportamento qualitativo <strong>da</strong>s trajetórias ao variar os autovalores λ e<br />

µ. Aju<strong>da</strong> observar que as curvas x log µ = k · y log λ são invariantes. Depois, estu<strong>de</strong> o caso<br />

( )<br />

cos θ sin θ<br />

T = λ ·<br />

− sin θ cos θ


8<br />

LINEARIZAÇÃO 60<br />

ao variar λ e θ. Escreva a transformação em coor<strong>de</strong>na<strong>da</strong>s polares (r, ϕ), e observe que as curvas<br />

r · λ ϕ/θ = k são invariantes. Enfim, trate o caso geral, e discuta quan<strong>do</strong> duas transformações<br />

lineares são topologicamente conjuga<strong>da</strong>s.<br />

Seja agora T : R n → R n uma transformação linear arbitrária ...<br />

Linearização e hiperbolici<strong>da</strong><strong>de</strong>. Seja f : V → R n uma transformação <strong>de</strong> classe C 1 <strong>de</strong>fini<strong>da</strong><br />

num aberto V ⊂ R n , e seja p ∈ V um ponto fixo <strong>de</strong> f. A <strong>de</strong>riva<strong>da</strong> f ′ (p) é a transformação linear<br />

L : R n → R n que “melhor aproxima” f (x) − p numa vizinhança <strong>de</strong> p. Isto sugere que tal vez seja<br />

possível que a dinâmica <strong>de</strong> f numa vizinhança B <strong>de</strong> p seja “igual” à dinâmica <strong>de</strong> L numa vizinhança<br />

A <strong>da</strong> origem. Tecnicamente, o problema é <strong>de</strong>cidir se a restrição f | B : B → B ′ é topologicamente<br />

conjuga<strong>da</strong> à restrição L | A : A → A ′ , por meio <strong>de</strong> uma “conjugação local” h : B ∪ B ′ → A ∪ A ′ .<br />

Em geral, a resposta é negativa. É possível dizer algo quan<strong>do</strong> p é um ponto fixo hiperbólico, ou<br />

seja quan<strong>do</strong> L não tem valores próprios λ com módulo |λ| = 1. O resulta<strong>do</strong> importante é o<br />

Teorema <strong>de</strong> Grobman-Hartman Um difeomorfismo local f : V → R n com um ponto fixo<br />

hiperbólico p é localmente topologicamente conjuga<strong>do</strong> à sua parte linear f ′ (p).


9 TRANSVERSALIDADE E BIFURCAÇÕES 61<br />

9 Transversali<strong>da</strong><strong>de</strong> e bifurcações<br />

9.1 Transversali<strong>da</strong><strong>de</strong> e persistência <strong>do</strong>s pontos fixos<br />

Transversali<strong>da</strong><strong>de</strong>. Sejam f : I → R uma transformação <strong>de</strong> classe C 1 <strong>de</strong>fini<strong>da</strong> num intervalo<br />

I ⊂ R, e p um ponto fixo <strong>de</strong> f. Se f ′ (p) ≠ 1, então o ponto fixo p é “isola<strong>do</strong>”, ou seja, é o único<br />

ponto fixo <strong>de</strong> f numa vizinhança B <strong>de</strong> p. De fato, um ponto fixo é uma solução <strong>da</strong> equação<br />

F (x) = f (x) − x = 0<br />

Se f ′ (p) ≠ 1 então F ′ (p) ≠ 0. O teorema <strong>da</strong> função inversa diz então que F é invertível numa<br />

vizinhança B <strong>de</strong> p, e isso implica que p é o único zero <strong>de</strong> F em B. Os pontos fixos que satisfazem<br />

a condição f ′ (p) ≠ 1 são ditos transversais, porque a tagente ao gráfico graph (f) =<br />

{(x, y) t.q. y = f (x)} <strong>de</strong> f em p é transversal ao gráfico <strong>da</strong> função i<strong>de</strong>nti<strong>da</strong><strong>de</strong>, a reta {(x, y) t.q. y = x}.<br />

Peristência. A condição f ′ (p) ≠ 1 é uma condição aberta, e isto faz suspeitar que também seja<br />

estável por pequenas perturbações <strong>de</strong> f.<br />

Teorema Sejam f : I → R uma transformação <strong>de</strong> classe C 1 , e p um ponto fixo transversal <strong>de</strong> f.<br />

To<strong>da</strong> transformação g : I → R suficientemente C 1 -próxima <strong>de</strong> f tem um, e um único, ponto fixo,<br />

também transversal, numa vizinhança <strong>de</strong> p.<br />

<strong>de</strong>m. Seja g = f − h uma perturbação <strong>de</strong> f, com ‖h‖ C 1 < δ. Um ponto fixo <strong>de</strong> g é uma solução<br />

<strong>da</strong> equação g (x) − x = 0, ou seja <strong>da</strong> equação<br />

F (x) = h (x)<br />

on<strong>de</strong> <strong>de</strong>finimos F (x) = f (x) − x. Sabemos que F é invertível numa vizinhança B ′ <strong>de</strong> p, logo um<br />

ponto fixo <strong>de</strong> g em B ′ é uma solução <strong>de</strong> x = ( F −1 ◦ h ) (x), ou seja um ponto fixo <strong>de</strong> F −1 ◦ h. A<br />

estratégia é provar que F −1 ◦h é uma contração numa vizinhança <strong>de</strong> p. Se a vizinhança B = B r (p)<br />

é suficientemente pequena, a inversa <strong>de</strong> F tem <strong>de</strong>riva<strong>da</strong> limita<strong>da</strong>, por exemplo ∣ ( F −1) ∣<br />

′ ∣∣ (x) < λ<br />

em F (B). Se δ é suficientemente pequeno, a <strong>de</strong>riva<strong>da</strong> ∣ ( F −1 ◦ h ) ∣<br />

′ ∣∣ (x) < λ · δ é uniformemente<br />

< 1 em B, e portanto F −1 ◦ h tem boas chances <strong>de</strong> ser uma contração. O que falta verificar é<br />

que a imagem ( F −1 ◦ h ) (B) seja conti<strong>da</strong> em B. Ora, <strong>da</strong><strong>do</strong> x ∈ B, a <strong>de</strong>sigual<strong>da</strong><strong>de</strong> <strong>do</strong> triângulo, o<br />

teorema <strong>do</strong> valor médio e a regra <strong>da</strong> ca<strong>de</strong>ia, implicam que<br />

d (( F −1 ◦ h ) (x) , p ) ≤ d ( F −1 (h (x)) , F −1 h (p) ) + d ( F −1 (h (p)) , p )<br />

≤ d ( F −1 (h (x)) , F −1 h (p) ) + d ( F −1 (h (p)) , F −1 (0) )<br />

≤<br />

λ · δ · r + λ · δ<br />

(on<strong>de</strong> utilizamos o fato <strong>de</strong> que p é um ponto fixo <strong>de</strong> f) e esta quanti<strong>da</strong><strong>de</strong> é < r se δ é suficientemente<br />

pequeno. O princípio <strong>da</strong>s contrações enfim implica que um ponto fixo p ′ ∈ B <strong>de</strong> g existe e é único.<br />

A <strong>de</strong>riva<strong>da</strong> <strong>de</strong> g neste ponto está δ-próxima <strong>da</strong> <strong>de</strong>riva<strong>da</strong> <strong>de</strong> f em p, e isto implica a transversali<strong>da</strong><strong>de</strong><br />

<strong>de</strong> p ′ se δ é pequeno.<br />

Exercícios.<br />

• Seja f : R → R uma transformação <strong>de</strong> classe C 1 , e seja p um ponto periódico <strong>de</strong> perío<strong>do</strong> n<br />

tal que (f n ) ′ (p) ≠ 1. To<strong>da</strong> transformação g suficientemente C 1 -próxima <strong>de</strong> f tem um ponto<br />

periódico <strong>de</strong> perío<strong>do</strong> n próximo <strong>de</strong> p. (Repita a <strong>de</strong>monstração anterior com f n em vez <strong>de</strong> f)<br />

• Sejam f : V → R n uma transformação <strong>de</strong> classe C 1 <strong>de</strong>fini<strong>da</strong> num aberto V ⊂ R n , e p um<br />

ponto fixo <strong>de</strong> f. A transversali<strong>da</strong><strong>de</strong> <strong>de</strong> p se traduz na condição <strong>de</strong> que o opera<strong>do</strong>r f ′ (p) não<br />

tenha 1 como autovalor. Prove que se o opera<strong>do</strong>r f ′ (p) não tem 1 como autovalor, então o<br />

ponto fixo p é ”isola<strong>do</strong>”, existe uma vizinhança B <strong>de</strong> x tal que x é o único ponto fixo <strong>de</strong> f<br />

em B. Enuncie e prove um resulta<strong>do</strong> <strong>de</strong> ”persistência” análogo ao caso <strong>da</strong> reta.


9 TRANSVERSALIDADE E BIFURCAÇÕES 62<br />

9.2 Bifurcações<br />

Os pontos fixos não transversais não são persistentes, em presença <strong>de</strong> perturbações genéricas po<strong>de</strong>m<br />

<strong>de</strong>saparecer ou mu<strong>da</strong>r <strong>de</strong> natureza. Este fenómeno é chama<strong>do</strong> bifurcação. A i<strong>de</strong>ia <strong>da</strong> teoria <strong>da</strong>s<br />

bifurcações é tratar famílias <strong>de</strong> transformações f λ <strong>de</strong>fini<strong>da</strong>s numa vizinhança <strong>de</strong> um ponto fixo, e<br />

<strong>de</strong>screver as possíveis mu<strong>da</strong>nças <strong>da</strong> dinâmica ao variar o parâmetro λ.<br />

Consi<strong>de</strong>re a família <strong>de</strong> transformações<br />

f λ (x) = x + x 2 − λ<br />

<strong>de</strong>fini<strong>da</strong>s na reta real. A origem é um ponto fixo não transversal <strong>de</strong> f 0 . Se λ ≠ 0 é pequeno, então<br />

f λ tem <strong>do</strong>is pontos fixos ± √ λ, um repulsivo e outro atrativo, quan<strong>do</strong> λ > 0, ou nenhum quan<strong>do</strong><br />

λ < 0. A família<br />

f λ (x) = x + x 3 + λx<br />

mostra um comportamento diferente.<br />

O problema é <strong>de</strong>cidir quais fenomenos são “genéricos”, e possívelmente “estáveis” num senti<strong>do</strong><br />

a precisar. Admitin<strong>do</strong> a existência <strong>de</strong> um número suficiente <strong>de</strong> <strong>de</strong>riva<strong>da</strong>s parciáis contínuas, uma<br />

família arbitrária <strong>de</strong> transformações tais que a origem seja um ponto fixo não transversal <strong>de</strong> f 0 é<br />

<strong>da</strong> forma<br />

f λ (x) = a λ + b λ x + c λ x 2 + ...<br />

= ( a ′ λ + a ′′ λ 2 + ... ) + ( 1 + b ′ λ + b ′′ λ 2 + ... ) x + ( c + c ′ λ + c ′′ λ 2 + ... ) x 2 + ...<br />

O caso genérico é quan<strong>do</strong> c ≠ 0 (ou seja f 0 é <strong>da</strong> forma x + cx 2 + ...) e uma perturbação genérica<br />

tem a ′ ≠ 0 (ou seja o termo constante <strong>de</strong> f λ é diferente <strong>de</strong> zero <strong>de</strong>s<strong>de</strong> que λ ≠ 0). Não é dificil<br />

convercer-se que o comportamento qualitativo <strong>de</strong>sta família é o mesmo <strong>da</strong> família x + x 2 − λ: uma<br />

pequena perturbação <strong>de</strong> f 0 po<strong>de</strong> <strong>de</strong>struir o ponto fixo, numa direção, ou criar <strong>do</strong>is novos pontos<br />

fixos, na outra direção. Enuncie este resulta<strong>do</strong>, e dê uma <strong>de</strong>monstração formal. Observe que<br />

procurar raizes <strong>da</strong> equação f λ (x) = x, em função <strong>de</strong> λ, é equivalente a <strong>de</strong>finir funções λ ↦→ x (λ)<br />

que verifiquem G (λ, x) = f λ (x)−x = 0, e a este problema respon<strong>de</strong> o teorema <strong>da</strong> função implícita.<br />

9.3 Duplicação <strong>do</strong> perío<strong>do</strong> e cascata <strong>de</strong> Feigenbaum<br />

Também interessante é o caso <strong>de</strong> uma família f λ <strong>de</strong> transformações <strong>do</strong> intervalo tal que f 0 tenha um<br />

ponto fixo em 0 com f ′ 0 (0) = −1. Observe que este ponto fixo é transversal, logo persistente. Por<br />

outro la<strong>do</strong>, (−1) 2 = 1, e portanto a <strong>de</strong>riva<strong>da</strong> <strong>de</strong> f 2 0 em 0 é igual a ( f 2 0<br />

) ′<br />

(0) = 1. Isto diz que 0 não<br />

é transversal em quanto ponto fixo <strong>de</strong> f 2 0 . Uma perturbação <strong>de</strong> f 0 po<strong>de</strong> produzir pontos periódicos<br />

<strong>de</strong> perio<strong>do</strong> 2, em proximi<strong>da</strong><strong>de</strong> <strong>do</strong> ponto fixo persistente 0. Para ver um exemplo, consi<strong>de</strong>re o caso<br />

<strong>da</strong> família<br />

f λ (x) = −x + x 2 + λx<br />

Este tipo <strong>de</strong> bifurcação é dito “duplicação <strong>do</strong> perío<strong>do</strong>”. Ao fazer simulações num computa<strong>do</strong>r,<br />

Mitchell J. Feigenbaum <strong>de</strong>scubriu nos anos ’70 que certas famílias <strong>de</strong> transformações produzem<br />

uma ”cascata” <strong>de</strong> duplicações <strong>do</strong> perío<strong>do</strong>, no senti<strong>do</strong> em que existe uma sucessão λ 1 < λ 2 < ... <<br />

λ n < λ n+1 ... <strong>de</strong> valores <strong>do</strong> parâmetro λ tal que, ao passar λ n+1 nascem órbita <strong>de</strong> perío<strong>do</strong> 2 n+1<br />

em proximi<strong>da</strong><strong>de</strong> <strong>da</strong>s órbitas <strong>de</strong> perío<strong>do</strong> 2 n cria<strong>da</strong>s pelo valor anterior λ n . Este fenómeno po<strong>de</strong> ser<br />

facilmente observa<strong>do</strong> com a aju<strong>da</strong> <strong>de</strong> um computa<strong>do</strong>r. Aliás, parece que aconteça para to<strong>da</strong> família<br />

em que po<strong>de</strong>mos pensar, <strong>de</strong>s<strong>de</strong> que acertamos o ponto certo on<strong>de</strong> centrar uma lupa e ve-lo. Ain<strong>da</strong><br />

mais misterioso é o fato, também observa<strong>do</strong> por Feigenbaum, <strong>de</strong> que o limite λ ∞ = lim n→∞ λ n<br />

parece existir, é exponencial, i.e. |λ ∞ − λ n | ≃const×δ −n on<strong>de</strong><br />

λ n − λ n−1<br />

δ = lim<br />

n→∞ λ n+1 − λ n<br />

e que δ ≃ 4.669201609102990671853... in<strong>de</strong>pen<strong>de</strong>ntemente <strong>da</strong> família f λ ! O misterio só foi explica<strong>do</strong><br />

mais tar<strong>de</strong> por Lanford, Epstein, Dennis Sullivan...


10 STATISTICAL DESCRIPTION OF ORBITS 63<br />

10 Statistical <strong>de</strong>scription of orbits<br />

Together with the topological point of view, a source of informations about dynamical systems is<br />

their statistical <strong>de</strong>scription. The i<strong>de</strong>a is to measure the relative size of those points whose orbits<br />

have certain <strong>de</strong>finite properties. This is <strong>do</strong>ne looking for invariant probability measures, and the<br />

main result is the Birkhoff-Khinchin ergodic theorem. To state and prove the Birkhoff-Khinchin<br />

ergodic theorem, we need to recall many stan<strong>da</strong>rd facts and results of integration theory. You can<br />

find most of them in the classical manuals by W. Rudin, Real and complex analysis, McGraw-Hill,<br />

New York 1966, or by P. Halmos, Measure theory, Springer-Verlag. New York 1974.<br />

10.1 Probability measures<br />

Probability spaces. A measurable space is a pair (X, E), a non-empty set X together with a σ-<br />

algebra of subsets E. Recall that a (Boolean) algebra is a nonempty family A of subsets of X which<br />

contains X, which contains the complement of any of its elements, and which is closed un<strong>de</strong>r finite<br />

unions and intersections. A σ-algebra is an algebra which is also closed un<strong>de</strong>r countable unions<br />

and intersections. Given any family C of subsets of X, there exists a minimal σ-algebra σ (C) which<br />

contains all the elements of C, which is called the σ-algebra generated by C.<br />

If (X, τ) is a topological space, the Borel σ-algebra is σ (τ), the smallest σ-algebra which<br />

contains all open sets.<br />

A measure on the measurable space (X, E) is a σ-additive function µ : E → [0, ∞] such that<br />

µ (∅) = 0. Here σ-additivity means that, if (S n ) is a countable family of pairwise disjoint elements<br />

of E, then<br />

µ (∪ n S n ) = ∑ µ (S n )<br />

n<br />

The triple (Ω, E, µ) is said a measure space, or probability space if it happens that µ (X) = 1. Given<br />

a probability space, measurable sets A ∈ E are commonly called ”events”, and the number µ (A)<br />

is called ”probability of the event A”. Basic properties of probability measures are the following:<br />

probability measures are monotone, i.e. µ(S) ≤ µ(T ) if S ⊂ T , and σ-subadditive, i.e. if (S n ) is<br />

a countable family of elements of E then<br />

µ (∪ n S n ) ≤ ∑ n<br />

µ (S n )<br />

Probability measures are continuous from below and from above, in the following sense: if S n ↑ S<br />

then µ (S n ) ↑ µ (S), and if S n ↓ S then µ (S n ) ↓ µ (S). Both continuity properties are equivalent,<br />

and in<strong>de</strong>ed a simple argument shows that they are equivalent to continuity from above at ∅: if<br />

S n ↓ ∅ then µ (S n ) ↓ 0. Moreover, continuity is equivalent to σ-aditivity if the set function µ is<br />

only assumed (finitely) additive.<br />

A subset E ⊂ X has zero measure if it is contained in a measurable set S ∈ E with µ (S) = 0.<br />

If any set with zero measure belongs to E, then the measure space (X, E, µ) is said complete. Any<br />

measure space can be canonically completed, extending the measure to the σ-algebra E ma<strong>de</strong> of<br />

E and of subsets of zero measure. A property (like continuity of a function, or convergence of a<br />

sequence of functions) holds µ-a.e. (“almost everywhere” with respect to the measure µ) if the set<br />

of points of X where it <strong>do</strong>es not hold has zero measure.<br />

Construction of probability measures. Measures are never ”explicitely” given as functions<br />

on a σ-algebra. A set function µ : P(X) → [0, ∞] is an exterior measure if it is monotone,<br />

σ-subadditive, and if µ (∅) = 0. It happens that, given an exterior measure µ, the family of<br />

µ-measurable sets, <strong>de</strong>fined as<br />

E = {E ⊂ X such that µ(S) = µ(S ∩ E) + µ(S ∩ E c ) for any S ⊂ X}<br />

is a σ-algebra, and that µ is a complete measure if restricted on E (the proof is quite long and<br />

<strong>de</strong>licate, but the only i<strong>de</strong>a it uses is the following: in or<strong>de</strong>r to check that E ∈ E it is in<strong>de</strong>ed sufficient,<br />

by virtue of monotonicity and subadditivity of µ, to check that µ(S) ≥ µ(S ∩ E) + µ(S ∩ E c ) for<br />

any S ⊂ X). A strategy to construct interesting measures on uncountable spaces is: start with an


10 STATISTICAL DESCRIPTION OF ORBITS 64<br />

exterior measure (it is very easy to produce exterior measures, for example by means of variational<br />

principles) and then check that the σ-algebra of measurable sets is sufficiently big for our purpose.<br />

The i<strong>de</strong>a of Carathéo<strong>do</strong>ry is the following. A probability measure on an algebra A of subsets<br />

of X is an additive function m : A → [0, 1] such that m (∅) = 0, m (X) = 1, and such that A n ↓ ∅<br />

implies m (A n ) ↓ 0. Given a probability measure m on a algebra A , the recipe<br />

{∑ }<br />

µ (S) = inf m(An ) with S ⊂ ∪ n A n e A n ∈ A<br />

<strong>de</strong>fines an exterior measure on P(X), hence the above construction produces a measure µ on the<br />

σ-algebra of µ-measurable sets, which contains A and so contains σ (A). One then checks that<br />

µ (A) = m (A) for any A ∈ A, so that µ is an “extension” of the measure m. Carathéo<strong>do</strong>ry’s<br />

extension theorem is then stated in the following form:<br />

Carathéo<strong>do</strong>ry’s extension theorem . Given a probability measure m on a algebra A of<br />

subsets of X, there exists a unique measure µ on σ (A) which extends m.<br />

The following corollary of Carathéo<strong>do</strong>ry’s theorem is also useful, for example when trying to<br />

prove that some event has a <strong>de</strong>finite probability.<br />

Approximation theorem . Let (X, E, µ) be a probability space, and let A be an algebra of<br />

subsets of X such that σ (A) = E. Then, for any A ∈ E and any ε > 0, we can find a A ε ∈ A<br />

such that<br />

µ (A∆A ε ) < ε.<br />

In<strong>de</strong>ed, one easily sees that the family C = {A ∈ E s.t. ∀ε > 0 ∃A ε ∈ A s.t. µ (A∆A ε ) < ε} is<br />

a σ-algebra. Since A is obviously contained in C, this implies that E =σ (A) ⊂ C ⊂ E.<br />

Lebesgue measure. The collection I of intervals of the real line is a semi-algebra, i.e. the<br />

intersection of two elements of I is in I and the complement of an element of I is a union of<br />

elements of I. The function m : I → [0, ∞], <strong>de</strong>fined as m ([a, b]) = |b − a| if a e b are finite, and<br />

∞ if the interval is unboun<strong>de</strong>d, is monotone and gives value zero to the empty set. Postulating<br />

additivity, the function m extends to a measure on the algebra A ma<strong>de</strong> of disjoint unions of<br />

elements of I (this is not trivial!, the proof uses the Heine-Borel theorem about compact subsets<br />

of the real line). The function µ : P(R) → [0, ∞], <strong>de</strong>fined as<br />

{∑ }<br />

µ (E) = inf m(Cn ) with E ⊂ ∪ n C n e C n ∈ A<br />

is then an exterior measure on the real line. The σ-algebra L of µ-measurable sets, called Lebesgue<br />

σ-algebra, contains the Borel sets, because it contains the intervals. The restriction l = µ | L , as<br />

well as µ ∣ ∣ B(R) , is called Lebesgue measure.<br />

Observe that Lebesgue measure on the real line is not a probability measure, having infinite<br />

mass. Nevertheless, one can easily <strong>de</strong>fine probability measures on boun<strong>de</strong>d intervals taking<br />

normalized restrictions of Lebesgue measure. For example, take X = [0, 1], and E = B (X) =<br />

{X ∩ B with B ∈ B (R)}, the Borel subsets of the interval. The restriction of l to E is a probability<br />

measure, called Lebesgue measure on the unit interval.<br />

The very same construction works in R n , starting with the semi-algebra of “rectangles” measured<br />

by the “eucli<strong>de</strong>an volume”, and produces a measure l on B (R n ), also called Lebesgue measure.<br />

Lebesgue measure is the unique measure over the Borel sets of the eucli<strong>de</strong>an space which is invariant<br />

un<strong>de</strong>r traslations, i.e. l (λ + B) = l (B) for any λ ∈ R n and any Borel set B, and which is<br />

normalized to give measure one to the unit square, i.e. l ([0, 1] n ) = 1.<br />

The axiom of choice allows one to “give examples” of subsets wich are not Lebesgue-measurable<br />

(for example, the set ma<strong>de</strong> of one point for each orbit of an irrational rotation of the circle).<br />

The following result is useful (see [Mat95] for a proof). Below, B ε (x) = {y ∈ R n s.t. ‖x −<br />

y‖ 2 < ε} <strong>de</strong>notes the open ball of radius ε > 0 and center x ∈ R n w.r.t. the Eucli<strong>de</strong>an distance<br />

‖x − y‖ 2 2 = ∑ n<br />

i=1 |x i − y i | 2 .


10 STATISTICAL DESCRIPTION OF ORBITS 65<br />

Lebesgue <strong>de</strong>nsity theorem.<br />

the <strong>de</strong>nsity<br />

Let A ⊂ R n be a Lebesgue-measurable set. For l-almos any x ∈ A<br />

l(A ∩ B ε (x))<br />

lim<br />

= 1<br />

ε→0 l(B ε (x))<br />

Kolmogorov extension. Let X be a finite space, equipped with the discrete topology, and<br />

let Σ + be the topological product X N = {x : N → X}, its point in<strong>de</strong>ntified with sequences x =<br />

(x 1 , x 2 ..., x n , ...) with x n ∈ X. Let C be the collection of cylin<strong>de</strong>rs of X, the subsets of the form<br />

C B = { x ∈ Σ + s.t. (x 1 , x 2 ..., x n ) ∈ B }<br />

with B an open subset of X n . Cylin<strong>de</strong>rs form a basis of the product topology of Σ + , which<br />

makes Σ + a compact metrizable space. In particular, the Borel σ-álgebra of Σ + is B = σ (C).<br />

Let µ 1 , µ 2 , µ 3 , . . . , µ n , . . . be probability measures <strong>de</strong>fined on the Borel sets of X, X 2 , . . . , X n , . . . ,<br />

respectively. The sequence (µ n ) is said consistent if<br />

µ n+1 (B × X) = µ n (B)<br />

for any n and any Borel subset B ⊂ X n . The (most elementary version of) Kolmogorov extension<br />

theorem says that<br />

Kolmogorov extension theorem. Given a consistent family of probability measures as above,<br />

there exists a unique probability measure µ, <strong>de</strong>fined on the Borel σ-algebra of Σ + , such that<br />

for any cilin<strong>de</strong>r C B .<br />

µ (C B ) = µ n (B)<br />

The proof consists in the following two steps. First, observe that cylin<strong>de</strong>rs form an algebra, and<br />

use consistency of the µ n ’s to verify that the formula above <strong>do</strong>es <strong>de</strong>fine a function µ : C → [0, 1] on<br />

cylin<strong>de</strong>rs (i.e. it <strong>do</strong>es not <strong>de</strong>pend on the different ways the same cylin<strong>de</strong>r may be presented) which<br />

is additive and properly normalized. Then, use compactness of X to check that µ is continuous at<br />

∅, in or<strong>de</strong>r to apply Carathéo<strong>do</strong>ry theorem. In<strong>de</strong>ed, let (A n ) be a sequence of cilin<strong>de</strong>rs such that<br />

A n ↓ ∅, and assume by contradiction that µ (A n ) > δ > 0 for any n. This implies that A n ≠ ∅ for<br />

any n, but, since the A n are compact, then the Cantor intersection theorem says that ∩ n A n ≠ ∅,<br />

contrary to the hypothesis.<br />

Kolmogorov theorem is the key tool in probability theory, since it allows one to construct measures<br />

which <strong>de</strong>scribe an infinite sequence of trials starting with some rule which gives information<br />

about the n-th trial given the knowledge of the first n−1. It actually works with much more general<br />

spaces and in a more general setting. Also, one can easily a<strong>da</strong>pt the construction to ∏ n∈N X n, the<br />

topological product of a countable family of finite spaces. In some precise sense, this is a universal<br />

mo<strong>de</strong>l of a dynamical system.<br />

If X = {0, 1}, then Σ + = X N is the state space of infinite Bernoulli trials with two possible<br />

outcomes: sucess and failure. Let µ 1 : P (X) → [0, 1] be a any probability measure, <strong>de</strong>fined by<br />

µ 1 ({1}) = p. Kolmogorov construction can be applied postulating the in<strong>de</strong>pen<strong>de</strong>nce of different<br />

trials, i.e. <strong>de</strong>claring that the family formed by the cilin<strong>de</strong>rs {x n = 1} is an in<strong>de</strong>pen<strong>de</strong>nt family,<br />

and giving measure p to each {x n = 1}. The resulting probability space (Σ + , B, µ) <strong>de</strong>scribes the<br />

infinite in<strong>de</strong>pen<strong>de</strong>nt Bernoulli trials. Of course, the very same construction can be ma<strong>de</strong> when X<br />

is a finite space with any finite numer z of elements.<br />

10.2 Transformations and invariant measures<br />

Measurable transformations. A transformation f : X → X of the measurable space (X, E)<br />

is said measurable if f −1 (A) ∈ E for any A ∈ E. A measurable transformation f is said an<br />

en<strong>do</strong>morphism of the measurable space, or an automorphism if it is invertible and its inverse is<br />

measurable too.


10 STATISTICAL DESCRIPTION OF ORBITS 66<br />

Observe that an en<strong>do</strong>morphism f of a measurable space (X, E) acts naturally on the space of<br />

measures on E by ”push forward”: if µ is a measure, then f ∗ µ, <strong>de</strong>fined by (f ∗ µ) (A) = µ ( f −1 (A) )<br />

for any A ∈ E, is also a measure.<br />

Let f be an en<strong>do</strong>morphism of the measurable space (X, E). A probability measure µ on E is<br />

invariant (w.r.t. the transformation f) if f ∗ µ = µ, namely if<br />

µ ( f −1 (A) ) = µ (A)<br />

for any A ∈ E. If this happens, we also say that f is an en<strong>do</strong>mrphism (resp. an automorphism) of<br />

the probability space (X, E, µ). The meaning of this <strong>de</strong>finition is that ”mean values” of integrable<br />

observables ϕ : X → R with respect to invariant probability measures <strong>do</strong> not change with time, in<br />

the sense that ∫ X ϕdµ = ∫ (ϕ ◦ f) dµ.<br />

X<br />

Given an en<strong>do</strong>morphism f of the probability space (X, E, µ), one says that an event A ∈ E is<br />

invariant mod 0 if µ ( A △ f −1 (A) ) = 0. The set of invariant mod 0 events form a sub-σ-algebra<br />

of E, <strong>de</strong>noted by E f .<br />

How to prove that a measure is invariant. The very <strong>de</strong>finition of invariance <strong>do</strong>es not help<br />

too much if we want to prove that a certain measure µ on the σ-algebra E is invariant w.r.t. the<br />

measurable transformation f : X → X. The trick is the following. Suppose that we can prove that<br />

µ ( f −1 (C) ) = µ (C) for any C ∈ C, where C is some subset of E. Caratheo<strong>do</strong>ry theorem implies<br />

that f ∗ µ and µ are the same measure on the σ-algebra σ (C) generated by C. On the other si<strong>de</strong>,<br />

the family of those A ∈ E such that µ ( f −1 (A) ) = µ (A) is easily seen to be a σ-algebra. Hence,<br />

if it happens that σ (C) = E, then µ is actually invariant. In other words, in or<strong>de</strong>r to prove that<br />

µ is invariant it is sufficient to check that µ ( f −1 (C) ) = µ (C) for any C belonging to a family of<br />

subsets of X which generate the σ-algebra E.<br />

Observables as ran<strong>do</strong>m variables. When <strong>de</strong>aling with a en<strong>do</strong>morphism f : X → X of the<br />

probability space (X, E, µ), one should consi<strong>de</strong>r measurable observables ϕ : X → R (or C), those<br />

functions such that ϕ −1 (A) ∈ E for any Borel set A ⊂ R. In the context of probability theory<br />

they are called ”ran<strong>do</strong>m variables”, and the sequence of observables ϕ ◦ f n may be interpreted as<br />

a ”ran<strong>do</strong>m process”. If ϕ is integrable, the Lebesgue integral ∫ ϕdµ is interpreted as the ”mean<br />

X<br />

value” of ϕ. Of course, invariance of a measurable observable must be inten<strong>de</strong>d modulo sets of zero<br />

measure. Then, one can consi<strong>de</strong>r the Banach spaces L p (µ) of (equivalence classes of ) observables<br />

equipped with the L p -norm<br />

(∫ ) 1/p<br />

‖ϕ‖ p<br />

= |ϕ| p dµ<br />

and use the full power of integration theory to get informations about the dynamical system. In<br />

particular, L 2 (µ) is a Hilbert space if equipped with the inner product<br />

∫<br />

〈ϕ, ψ〉 = ϕψdµ<br />

X<br />

Conditional mean. Recall that, given a measurable space (X, E), a measure ν is said absolutely<br />

continuous w.r.t. the measure µ if ν (A) = 0 whenever µ (A) = 0. The following technical result<br />

(which may be proved using Hilbert space techniques) is particularly useful:<br />

Ra<strong>do</strong>n-Nikodym theorem. Let (X, E, µ) be a probability space, and let ν be a finite measure<br />

over E which is absolutely continuous with respect to µ. Then there exists a nonnegative integrable<br />

ran<strong>do</strong>m variable ρ (called the Ra<strong>do</strong>n Nikodym <strong>de</strong>rivative of ν w.r.t. µ and <strong>de</strong>noted by dν/dµ) such<br />

that<br />

∫<br />

ν (A) = ρdµ<br />

for any A ∈ E.<br />

A


10 STATISTICAL DESCRIPTION OF ORBITS 67<br />

A particularly important tool, taken from the theory of probability, is the conditional mean.<br />

Let (X, E, µ) be a probability space, and let F be a sub-σ-algebra of E. Given an integrable ran<strong>do</strong>m<br />

variable ϕ, there exists a unique ran<strong>do</strong>m variable ϕ F , called the conditional mean of ϕ w.r.t. F,<br />

which is F-measurable (i.e. the inverse image of any Borel set belongs to F) and such that<br />

∫ ∫<br />

ϕ F dµ = ϕdµ<br />

A<br />

for any A ∈ F. In<strong>de</strong>ed, if ϕ ≥ 0, then one can <strong>de</strong>fine ϕ F as equal to the Ra<strong>do</strong>n-Nikodym <strong>de</strong>rivative<br />

of the measure A ↦→ ∫ A ϕdµ, <strong>de</strong>fined on F, with respect to the restriction µ | F . The general case is<br />

treated by linearity, writing ϕ as a difference of two non-negative ran<strong>do</strong>m variables. Uniqueness is<br />

inten<strong>de</strong>d µ-a.e., i.e. modulo sets of zero probability. The conditional mean is monotone, namely if<br />

ϕ ≥ 0 then ϕ F ≥ 0, and preserves the mean value, since ∫ X ϕ Fdµ = ∫ ϕdµ. It can be consi<strong>de</strong>red<br />

X<br />

as a ”projection” of ϕ onto the space of F-measurable ran<strong>do</strong>m variable, preserving the mean value.<br />

In particular, if N is the trivial σ-algebra ma<strong>de</strong> of events of measure 0 or 1, then ϕ N is constant<br />

a.e. and equal to ∫ X ϕdµ.<br />

A<br />

Topological dynamical systems and Borel measures. If we are interested in the dynamics<br />

of a continuous transformation f : X → X of a topological space X, it is natural to consi<strong>de</strong>r<br />

the Borel σ-algebra B, the smallest σ-algebra of subsets of X which contain all open sets. The<br />

map f is then an en<strong>do</strong>morphism of (X, B). Probability measures on B are said Borel probability<br />

measures. If, moreover, X is a compact metric space, one can consi<strong>de</strong>r the space C 0 (X, R) of<br />

boun<strong>de</strong>d continuous real valued functions of X (observe that, since X is compact, any continuous<br />

function is automatically boun<strong>de</strong>d), equipped with the sup norm<br />

‖ϕ − ψ‖ ∞<br />

= sup |ϕ (x) − ψ (x)|<br />

x∈X<br />

These observables are clearly integrable w.r.t. to any Borel probability measure µ, and the mean<br />

value map<br />

∫<br />

ϕ ↦→ ϕdµ<br />

is a boun<strong>de</strong>d, positive <strong>de</strong>finite (in the sense that ∫ ϕdµ ≥ 0 for any ϕ ≥ 0) linear functional on<br />

X<br />

C 0 (X, R). The basic fact about Borel measures is the converse of that, namely<br />

X<br />

Riesz-Markov representation theorem . Let X be a compact metric space. Given any<br />

boun<strong>de</strong>d and positive <strong>de</strong>finite linear functional L on C 0 (X, R) such that L (1) = 1, there exists a<br />

unique Borel probability measures µ such that<br />

∫<br />

L (ϕ) = ϕdµ<br />

for any ϕ ∈ C 0 (X, R).<br />

X<br />

The space of invariant probability measures. The space Prob of probability measures on<br />

a measurable space (X, E) has a natural convex structure: convex combinations of probability<br />

measures are also probability measures. An arbitrary measurable transformation f : X → X of a<br />

measurable space may not admit any invariant probability measure. On the other si<strong>de</strong>, if µ 0 and<br />

µ 1 are invariant probability measures, so are their convex combinations µ t = (1 − t) µ 0 + tµ 1 for<br />

any t ∈ [0, 1]. This means that the set Prob f of invariant probabilty measures on E is a convex<br />

set: if it contains two points, it contains the whole segment between them.<br />

Now, let (X, d) be a compact metric space and let B its Borel σ-algebra. The space Prob of<br />

probability measures on B can be equipped with a natural topology, called the weak ∗ topology,<br />

which says essentially that two measures are near if they give nearby mean values to some well<br />

behaved observables. Formally, one says that a sequence of measures (µ n ) converge weakly* to a<br />

measure µ, which we <strong>de</strong>note simply as µ n → µ, if<br />

∫ ∫<br />

ϕdµ n → ϕdµ<br />

X<br />

X


10 STATISTICAL DESCRIPTION OF ORBITS 68<br />

for any (boun<strong>de</strong>d) continuous function ϕ : X → R. The space C 0 (X, R) of boun<strong>de</strong>d continuous real<br />

valued functions on X, equipped with the sup norm, is a separable Banach space. In particular,<br />

it admits a countable set of points {ϕ n } n∈N<br />

which is <strong>de</strong>nse in its unit sphere. Given that, one<br />

<strong>de</strong>fines, for any couple of Borel probability measures µ and ν, a distance<br />

∞∑<br />

∫ ∫<br />

d (µ, ν) = 2 −n ·<br />

∣ ϕ n dµ − ϕ n dν<br />

∣<br />

n=1<br />

It turns out that d is in<strong>de</strong>ed a metric, and that it induces the weak ∗ topology on Prob. The<br />

important fact (somewhere called ”Helly’s theorem”), which follows from the Ascoli-Arzela theorem<br />

together with the above Riesz-Markov representation theorem, is that Prob, equipped with the<br />

weak ∗ topology, is a compact space: any sequence (µ n ) of Borel probability measures admits a<br />

weakly ∗ convergent subsequence µ ni → µ.<br />

Now, we are in position to prove the existence of invariant probability measures for certain well<br />

behaved dynamical systems.<br />

X<br />

X<br />

Krylov-Bogolyubov theorem. A continuous transformation f : X → X of a metrizable<br />

compact space X admits at least one Borel invariant probability measure.<br />

proof. Take any Borel probability measure µ 0 on X, and inductively <strong>de</strong>fine a family of probability<br />

measures µ n by µ n+1 = f ∗ µ n . Consi<strong>de</strong>r the family of Cesaro means<br />

µ n = 1 n∑<br />

µ k<br />

n + 1<br />

Since the space of Borel probability measures on a compact metrizable space is compact w.r.t.<br />

weak ∗ convergence, there exist a weakly ∗ convergent subsequence µ ni<br />

→ µ. One then easily sees<br />

that<br />

∫<br />

1 ∑n i<br />

∫<br />

(ϕ ◦ f) dµ = lim<br />

(ϕ ◦ f) dµ k<br />

X<br />

i→∞ n i + 1<br />

k=0<br />

X<br />

1 ∑n i<br />

∫<br />

= lim<br />

ϕdµ k+1<br />

i→∞ n i + 1<br />

k=0<br />

X<br />

1 ∑n i<br />

∫<br />

= lim<br />

ϕdµ k + 1 (∫<br />

∫ )<br />

ϕdµ ni+1 − ϕdµ 0 i→∞ n i + 1<br />

k=0<br />

X n i + 1 X<br />

X<br />

∫<br />

= ϕdµ<br />

X<br />

for any boun<strong>de</strong>d continuous observable ϕ, hence that µ is an invariant measure. □<br />

k=0<br />

10.3 Invariant measures and time averages<br />

The relevance of invariant measures when studying the dynamics of continuous transformations is<br />

due to the following crucial observations.<br />

Invariant measures and time averages. Assume that, for a given point x ∈ X, the time<br />

averages<br />

1<br />

n∑<br />

ϕ (x) = lim ϕ ( f k (x) )<br />

n→∞ n + 1<br />

<strong>do</strong> exist for any boun<strong>de</strong>d continuos observable ϕ. One easily shows that the funcional Cb 0 (X, R) →<br />

R <strong>de</strong>fined by ϕ ↦→ ϕ (x) is linear, boun<strong>de</strong>d and positive <strong>de</strong>finite. There follows from the Riesz-<br />

Markov representation theorem that there exists a unique Borel probability measure µ x on X such<br />

that<br />

∫<br />

ϕ (x) = ϕdµ x<br />

X<br />

k=0


10 STATISTICAL DESCRIPTION OF ORBITS 69<br />

for any ϕ ∈ C 0 b (X, R). The invariance property ϕ (x) = (ϕ ◦ f) (x) then implies that ∫ X (ϕ ◦ f) dµ x =<br />

∫<br />

X ϕdµ x for any ϕ, hence that µ x is an invariant probability measure. In the language of physicists,<br />

this says that ”time averages” along the orbit of x are equal to ”space averages” with respect to<br />

the measure µ x .<br />

One is thus lead to consi<strong>de</strong>r the following questions. Do there exist points x for which time<br />

averages exists Given an invariant measure µ, <strong>do</strong> there exist, and how many, points x such that<br />

µ = µ x <br />

Example: periodic orbits. Let p be a periodic point with period n. The time average ϕ (p)<br />

of any observable ϕ exists, and is equal to the arithmetic mean of ϕ along the orbit, namely<br />

ϕ (p) = 1 n−1<br />

∑<br />

ϕ (f n (p))<br />

n<br />

k=0<br />

If µ p <strong>de</strong>notes the normalized sum 1 ∑ n−1<br />

n k=0 δ f n (p) of Dirac masses placed on the orbit of p, this<br />

amount to say that ϕ (p) = ∫ X ϕdµ p.<br />

Let p be a fixed point, and ϕ : X → R be an observable which is continuous at p. If x ∈ W s (p),<br />

then the time average ϕ (x) exists and is equal to ϕ (p), i.e. time averages of points in the basin of<br />

attraction of p are <strong>de</strong>scribed by the Dirac measure µ p = δ p .<br />

The Birkhoff-Khinchin ergodic theorem. Ergodic theorems are the milestones of ergodic<br />

theory, and <strong>de</strong>al with various type of convergence of the time means ϕ n for certain classes of<br />

observables ϕ. In particular, the Birkhoff-Khinchin ergodic theorem must be thougth as the generalization<br />

of the Kolmogorov strong law of large numbers, as it says that time means of certain<br />

well-behaved observables exist almost everywhere. The Birkhoff-Khinchin ergodic theorem was<br />

actually precee<strong>de</strong>d by the von Neumann’s ”statistic” ergodic theorem, which says that<br />

von Neumann “statistic” ergodic theorem. Let U be a unitary operator on a Hilbert space<br />

H, let H U = {v ∈ H s.t. Uv = v} <strong>de</strong>note the closed subspace of those vectors which are fixed by<br />

U, and P U : H → H U <strong>de</strong>note the orthogonal projection onto H U . Then, for any vector v ∈ H we<br />

have<br />

1<br />

n∑<br />

lim<br />

U k v − P<br />

n→∞ ∥<br />

U v∥<br />

= 0<br />

n + 1<br />

k=0<br />

If f : X → X is an en<strong>do</strong>morphism of the probability space (X, E, µ), one can consi<strong>de</strong>r the<br />

“shift” operator U : L 2 (µ) → L 2 (µ) given by (Uϕ) (x) = ϕ (f (x)). It is clearly unitary, its<br />

fixed point set is the space of invariant L 2 -observable. The von Neumann theorem then asserts<br />

convergence of time means ϕ n → ϕ in L 2 (µ). Here, we prove the<br />

∥<br />

H<br />

Birkhoff-Khinchin “individual” ergodic theorem. Let f : X → X be an en<strong>do</strong>morphism<br />

of the probability space (X, E, µ), and let ϕ ∈ L 1 (µ) be an integrable observable. Then the limit<br />

1<br />

ϕ(x) = lim<br />

n→∞ n + 1<br />

n∑<br />

ϕ ( f k (x) )<br />

exists for µ-almost any x ∈ X. Moreover, the observable ϕ is in L 1 (µ), is invariant, and satisfies<br />

∫ ∫<br />

ϕdµ = ϕdµ<br />

k=0


10 STATISTICAL DESCRIPTION OF ORBITS 70<br />

proof. (by A. Garsia) Let E f be the invariant σ-algebra. For any ψ ∈ L 1 ∑ n−1<br />

, set ψ n = max k≤n k=0 ϕ◦<br />

f k and observe that E ψ = {x ∈ X s.t. ψ n (x) → ∞} ∈ E f . One easily sees that the sequence<br />

ψ n+1 − ψ n ◦ f is <strong>de</strong>creasing, and converges to ψ at the points of E ψ . The monotone convergence<br />

theorem and the invariance of µ imply that<br />

∫<br />

∫<br />

∫ ∫<br />

0 ≤ (ψ n+1 − ψ n ) dµ = (ψ n+1 − ψ n ◦ f) dµ → ψdµ = ψ Ef dµ ∣ Ef<br />

E ψ E ψ E ψ E ψ<br />

In particular, if ψ Ef<br />

< −ε < 0 then µ (E ψ ) = 0. On the other si<strong>de</strong>,<br />

lim sup 1 n−1<br />

∑<br />

ψ ◦ f k (x) ≤ lim sup 1 n<br />

n ψ n ≤ 0<br />

k=0<br />

on X\E ψ . Applying twice these observations to the observables ϕ − ϕ Ef − ε and −ϕ + ϕ Ef − ε,<br />

with ε > 0, we find<br />

lim sup 1 n−1<br />

∑<br />

ϕ ◦ f k (x) − ϕ Ef − ε ≤ 0 lim inf 1 n−1<br />

∑<br />

ϕ ◦ f k (x) − ϕ Ef + ε ≥ 0<br />

n<br />

n<br />

k=0<br />

µ-almost everywhere. Since ε was arbitrary, the limit ϕ(x) exists and is equal to ϕ Ef (x) for µ-<br />

almost every x. The rest of the theorem then follows easily from the properties of the conditional<br />

mean. □<br />

10.4 Examples of invariant measures<br />

Haar measures. Any locally compact topological group G admits a Haar measure, a measure<br />

µ on its Borel sets which is left-invariant, i.e. satisfies L g µ = µ for any g ∈ G. Moreover, the Haar<br />

measure is unique up to a constant factor. It is an exercise that µ is a finite measure, hence can<br />

be renormalized to give a probability measure, iff G is compact. There follows that translations<br />

on compact topological groups admits invariant probability measures.<br />

On the other si<strong>de</strong>, for some groups G, called unimodular, the Haar measure µ is both left and<br />

right invariant. If Γ ⊂ G is a lattice, i.e. a subgroup such that µ (G/Γ) < ∞, then the normalized<br />

Haar measure on the homogeneous space G/Γ is an invariant probability measure for any left<br />

translation gΓ ↦→ sgΓ.<br />

k=0<br />

Rotations of the circle. Lebesgue probability measure l on the circle is invariant for the<br />

rotations +α : x + Z ↦→ x + α + Z, with α ∈ R. In<strong>de</strong>ed, rotations of the circle are isometries, and<br />

the Lebesgue measure l (I) of an interval is its ”lenght”.<br />

Coverings of the circle. Lebesgue probability measure l on the circle is invariant for the<br />

maps ×λ : x + Z ↦→ λ · x + Z, with λ ∈ Z\ {0}. This comes from the fact that the inverse image<br />

of a sufficiently small interval I with lenght l (I) is the disjoint union of |λ| intervals with lenght<br />

l (I) / |λ|.<br />

Bernoulli shifts. Consi<strong>de</strong>r the Bernoulli shift σ : Σ + → Σ + over the alphabet X = {1, 2, ..., z}.<br />

Let p be a ”probability on X”, i.e. a finite set of nonegative numbers p 1 , p 2 , ..., p z such that<br />

p 1 + p 2 + ... + p z = 1. Given a centered cilin<strong>de</strong>r C α , we <strong>de</strong>fine µ (C α ) as equal to the product<br />

p α1 p α2 ...p αn . This function µ extends in a unique way as a finitely additive function on the algebra<br />

A generated by the centered cilin<strong>de</strong>rs, the algebra which contains all finite unions of centered<br />

cilin<strong>de</strong>rs as well as the empty set and Σ + . One then show that µ is σ-additive on A (for example,<br />

showing that if a <strong>de</strong>creasing sequence A 1 ⊃ A 2 ⊃ ... has empty intersection then µ (A n ) → 0).<br />

Since centered cilin<strong>de</strong>rs generates the topology of Σ + , Carathéo<strong>do</strong>ry theorem implies that there<br />

exists a unique extension, which we still call µ, of this measure on the Borel σ-algebra of Σ + . This<br />

measure is called the Bernoulli measure <strong>de</strong>fined by p.


10 STATISTICAL DESCRIPTION OF ORBITS 71<br />

As for the ”physical” meaning of this measure, you may imagine that X represents the possible<br />

outcomes when tossing a coin with z si<strong>de</strong>s, and p k is the probability of obtaining the k-th si<strong>de</strong>.<br />

Then points in Σ + represent the outcomes of an infinite sequence of tossings, and the very <strong>de</strong>finition<br />

of µ says that each trial is <strong>de</strong>scribed by the probability p, and each trial is ”in<strong>de</strong>pen<strong>de</strong>nt” from<br />

any finite collection of different trials.<br />

It is not surprising that µ is in<strong>de</strong>ed an invariant probability measure. This comes from the fact<br />

that the inverse image σ −1 (A) of any A ∈ A is the disjoint union of z elements B 1 , B 2 , ..., B z of<br />

the algebra (obtained from A chosing the first letter in z different ways) with measures µ (B k ) =<br />

p k · µ (A), so that<br />

µ ( σ −1 (A) ) z∑<br />

= p k · µ (A) = µ (A)<br />

k=1<br />

Absolutely continuous invariant measures for maps and flows. Let U be a <strong>do</strong>main in<br />

some eucli<strong>de</strong>an R n , and let vol <strong>de</strong>note the Lebesgue measure on U, given locally as dvol = dx =<br />

dx 1 dx 2 ...dx n . A local diffeomorphism f : U → U of class C 1 preserves the measure vol iff<br />

∑<br />

x∈f −1 {x ′ }<br />

1<br />

|<strong>de</strong>t f ′ (x)| = 1<br />

for any point x ′ ∈ U, as one can check using the change of coordinates formula. Also interesting is<br />

to see wheather f preserves an absolutely continuous measure µ = ρvol, and this happens iff the<br />

”<strong>de</strong>nsity” ρ satisfies the equation<br />

∑<br />

x∈f −1 {x ′ }<br />

ρ (x)<br />

|<strong>de</strong>t f ′ (x)| = ρ (x′ )<br />

for any point x ′ ∈ U.<br />

Now, let φ be the flow of a vector field ξ = ∑ n<br />

consi<strong>de</strong>ring the Jacobian of the diffeomorphisms φ t . Since<br />

k=1 ξ k ∂<br />

∂x k<br />

on U. The above obviously applies,<br />

<strong>de</strong>t φ ′ t =<br />

∫ t<br />

0<br />

divξ ◦ φ s ds<br />

we get the result that Lebesgue measure vol is invariant un<strong>de</strong>r the flow of ξ iff<br />

divξ =<br />

n∑<br />

k=1<br />

∂ξ k<br />

∂x k<br />

= 0<br />

In general, the absolutely continuous measure µ = ρvol is invariant un<strong>de</strong>r the flow of ξ iff its <strong>de</strong>nsity<br />

satisfies div (ρξ) = 0.<br />

Hamiltonian flows. Consi<strong>de</strong>r a symplectic manifold (X, ω). Liouville measure dvol = ω n is<br />

invariant un<strong>de</strong>r the Hamiltonian flow of any Hamiltonian function H. If X has finite volume, it<br />

can be normalized to give an invariant probability measure.<br />

Geo<strong>de</strong>sic flows. Consi<strong>de</strong>r a geo<strong>de</strong>sic flow on the unit tangent bundle π : SM → M of the<br />

Riemannian manifold (M, g). Let dvol = √ gdx <strong>de</strong>note the Riemannian volume form on M, and<br />

let dσ m <strong>de</strong>notes the Lebesgue probability measure on the sphere S m M = π −1 {m}. The Liouville<br />

measure µ, <strong>de</strong>fined locally as dvol (m) × dσ m , is invariant un<strong>de</strong>r the geo<strong>de</strong>sic flow.


10 STATISTICAL DESCRIPTION OF ORBITS 72<br />

Gauss map.<br />

of the form<br />

Any irrational real number x ∈ ]0, 1] has a unique continued fraction representation<br />

x = [0; a 1 , a 2 , a 3 , . . . ] =<br />

a 1 +<br />

1<br />

a 2 +<br />

1<br />

1<br />

a 3 + 1<br />

. ..<br />

where the a n are nonnegative integers. The equality sign and the “infinite fraction” above mean<br />

that the sequence of finite continued fractions<br />

1<br />

r n = [0; a 1 , a 2 , . . . , a n ] =<br />

1<br />

a 1 +<br />

1<br />

a 2 +<br />

. .. 1 +<br />

a n<br />

which are called “convergents”, <strong>do</strong> converge to x as n → ∞. The sequence of rationals r n (any<br />

such r n provi<strong>de</strong> the best rational approximation for x with <strong>de</strong>nominator less or equal than that<br />

of r n , as you may have been teached in a course on number theory) is inductively constructed as<br />

follows. First, observe that if a 1 = [1/x] and x 1 = 1/x − a 1 we may write<br />

1<br />

x =<br />

a 1 + x 1<br />

with x 1 ∈ [0, 1]. Then, since x 1 ≠ 0, for otherwise x would be rational, we may <strong>de</strong>fine a 2 = [1/x 1 ]<br />

and x 2 = 1/x 1 − a 2 to get<br />

1<br />

x =<br />

1<br />

a 1 +<br />

a 2 + x 2<br />

Inductively, we see that<br />

1<br />

x =<br />

1<br />

a 1 +<br />

1<br />

a 2 +<br />

... + 1<br />

a n+xn<br />

where x n = 1/x n−1 − a n and a n = [1/x n−1 ]. This amounts to say that the sequence (x n ) is the<br />

trajectory of x un<strong>de</strong>r the Gauss map g : ]0, 1] → ]0, 1], <strong>de</strong>fined as<br />

x ↦→ 1/x − [1/x]<br />

Observe that g is not <strong>de</strong>fined at the origin, hence to iterate g we need to avoid all the preimages<br />

of 0, which are the rationals. This is not a problem if we want to study the statistical properties<br />

of g with respect to Lebesgue measure, since rationals form a subset of zero measure. The Gauss<br />

map admits an absolutely continuous invariant measure µ = ρdx, <strong>de</strong>fined as<br />

µ (A) = 1<br />

log 2 ·<br />

∫<br />

A<br />

1<br />

1 + x dx<br />

for any Borel subset A ⊂ ]0, 1]. The <strong>de</strong>nominator log 2 is there to normalize the measure, so we<br />

just have to check the invariance criterium for the <strong>de</strong>nsity ρ (x) = 1/ (1 + x). Since any x ′ ∈ ]0, 1]<br />

has one preimage x k = 1/ (x ′ + k) in each interval ]1/ (k + 1) , 1/k], we compute<br />

∑<br />

x∈g −1 {x ′ }<br />

ρ (x)<br />

|<strong>de</strong>t g ′ (x)|<br />

x 2 k<br />

= ∑ 1 + x k<br />

k≥1<br />

= ∑ ( )<br />

1<br />

x ′ + k − 1<br />

x ′ + k + 1<br />

k≥1<br />

=<br />

1<br />

1 + x ′ = ρ (x′ )


10 STATISTICAL DESCRIPTION OF ORBITS 73<br />

and we are <strong>do</strong>ne.


11<br />

RECORRÊNCIAS 74<br />

11 Recorrências<br />

O objectivo <strong>da</strong> dinâmica topológica é a caracterização (topológica!) <strong>da</strong>s possíveis histórias <strong>do</strong>s<br />

pontos. Isso começa a ser interessante quan<strong>do</strong> a órbita <strong>de</strong> x não é finita.<br />

11.1 Comportamento assimptótico <strong>da</strong>s órbitas infinitas: conjuntos ω e<br />

α limite<br />

A coisa mais simples que po<strong>de</strong> acontecer, é que a trajetória <strong>de</strong> x seja uma sucessão convergente, e<br />

neste caso o seu limite é um ponto fixo.<br />

As trajetórias po<strong>de</strong>m não ser convergentes, mas pelo menos ter subsucessões convergentes. O<br />

conjunto ω-limite <strong>de</strong> x é o conjunto <strong>do</strong>s pontos limites <strong>da</strong> trajetória <strong>de</strong> x, ou seja<br />

ω f (x) = ∩ ∞ n=0∪ k≥n {f k (x)}<br />

o conjunto <strong>do</strong>s pontos x ′ ∈ X tais que existe uma subsucessão n i → ∞ <strong>de</strong> tempos tal que f ni (x) →<br />

x ′ quan<strong>do</strong> i → ∞. Observe que, se a órbita <strong>de</strong> x não é finita, então ω f (x) = O + f (x)′ . O conjunto<br />

ω f (x) é fecha<strong>do</strong> e +invariante.<br />

Lim f = ∪ x∈X ω f (x) <strong>de</strong>nota o conjunto <strong>do</strong>s pontos ω-limites. Observe que, se x é periódico,<br />

então ω f (x) é a sua órbita, e portanto<br />

Per f ⊂ Lim f<br />

Se f é invertível, o conjunto α-limite <strong>de</strong> x é <strong>de</strong>fini<strong>do</strong> por α f (x) = ω f −1(x), ou seja é o conjunto<br />

<strong>do</strong>s pontos x ′ ∈ X tais que existe uma subsucessão n i → ∞ <strong>de</strong> tempos tal que f −ni (x) → x ′ quan<strong>do</strong><br />

i → ∞. Neste caso, os conjuntos ω f (x) e α f (x) são fecha<strong>do</strong>s e invariantes. Lim f −1 = ∪ x∈X α f (x)<br />

<strong>de</strong>nota o conjunto <strong>do</strong>s pontos α-limites.<br />

Estes conjuntos po<strong>de</strong>m ser vazios. Por exemplo, ω f (x) = ∅ quer dizer que a trajetória <strong>de</strong> x<br />

an<strong>da</strong> pelo espaço X sem voltar muitas vezes numas vizinhanzas <strong>do</strong>s pontos que já visitou, e isto<br />

é possível <strong>de</strong>s<strong>de</strong> que X não seja compacto. Se Lim f ±1 não forem vazios, têm a interpretação <strong>do</strong>s<br />

conjuntos on<strong>de</strong> as trajetórias ”morrem” e ”nascem”, respetivamente (<strong>do</strong>n<strong>de</strong> a notação ω e α).<br />

( X compacto ⇒ ω f (x) ≠ ∅) Se X é compacto, então a trajetória (f n (x)) n∈N0<br />

<strong>de</strong> to<strong>do</strong> ponto<br />

x ∈ X admite subsucessões convergentes, e portanto ω f (x) ≠ ∅. Analogamente, se f é um<br />

homeomorfismo, α f (x) ≠ ∅ para to<strong>do</strong> ponto x ∈ X. Em particular, os conjuntos Lim f ±1 não são<br />

vazios.<br />

Exercícios.<br />

• Prove que ω f (x) é fecha<strong>do</strong> e +invariante. Prove que, se f é um homeomorfismo, então ω f (x)<br />

e α f (x) são fecha<strong>do</strong>s e invariantes.<br />

• Dê exemplos que mostram que ω f (x) e α f (x) po<strong>de</strong>m ser vazios.<br />

• Mostre que Per f ⊂Lim f .<br />

11.2 Pontos recorrentes<br />

O ponto x é recorrente se x ∈ ω f (x). Observe que x é recorrente se, <strong>da</strong><strong>da</strong> uma vizinhança arbitrária<br />

B <strong>de</strong> x, existe um tempo n ≥ 1 tal que f n (x) ∈ B, ou seja se a trajetória <strong>de</strong> x volta a visitar to<strong>da</strong><br />

vizinhança <strong>de</strong> x. Isto implica que a trajetória <strong>de</strong> x passa infinitas vezes numa vizinhança arbitrária<br />

<strong>de</strong> x. Rec f <strong>de</strong>nota o conjunto <strong>do</strong>s pontos recurrentes <strong>de</strong> f.<br />

Se f é um homeomorfismo, também tem interesse o conjunto Rec f −1, o conjunto <strong>do</strong>s pontos x<br />

tais que x ∈ α f (x).<br />

Um ponto periódico é recorrente, logo<br />

Per f ⊂ Rec f


11<br />

RECORRÊNCIAS 75<br />

Exercícios.<br />

• Defina uma or<strong>de</strong>m parcial em X <strong>da</strong> seguinte maneira: x ≺ x ′ se para to<strong>da</strong>s vizinhanças U<br />

<strong>de</strong> x e V <strong>de</strong> x ′ existe um tempo n ≥ 1 tal que f n (U) ∩ V ≠ ∅. Prove que x é recorrente sse<br />

x ≺ x.<br />

• Mostre que Per f ⊂ Rec f .<br />

• Dê exemplos que mostram que Rec f e Rec f −1 po<strong>de</strong>m ser vazios.<br />

Pseu<strong>do</strong>-trajetórias e “chain-recurrent points”. Da<strong>do</strong> ε > 0, a sequência <strong>de</strong> pontos<br />

{x k } k=0,1,...,n<br />

com x 0 = x é dita ε-pseu<strong>do</strong>-trajetória <strong>de</strong> x se<br />

d (x k+1 , f (x k )) < ε<br />

para to<strong>do</strong> k = 0, 1, 2, ..., n−1. O ponto x ∈ X é dito chain-recurrent se, para to<strong>do</strong> ε > 0, existe uma<br />

ε-trajetória {x k } k=0,1,...,n<br />

com x 0 = x n = x. Rec ε f<br />

<strong>de</strong>nota o conjunto <strong>do</strong>s pontos chain-recurrent<br />

<strong>de</strong> f.<br />

so what<br />

11.3 Invariant measures and recurrent points: Poincaré theorem<br />

If f satisfies a condition (natural in physics) like ”preserving a probability measure”, then there<br />

are a lot of recurrent points, actually almost any point is recurrent. If, moreover, the probability<br />

measure is diffuse, i.e. any non-empty open set has positive measure, then the set of recurrent<br />

points is also <strong>de</strong>nse. These results, discovered by Jules Henri Poincaré around 1890, motivated the<br />

mo<strong>de</strong>rn theory of dynamical systems. They show how weak informations on the transformation<br />

f may yeld significative qualitative information about ”almost all” orbits of the system. Here<br />

follow the precise statements, together with all the necessary technical <strong>de</strong>tails. If you <strong>do</strong>n’t know<br />

the meaning of some words, like ”measurable” or ”Borel set”, <strong>do</strong>n’t worry, just try to un<strong>de</strong>rstand<br />

what’s going on. Poincaré himself didn’t know, yet!<br />

Poincaré recurrence theorem (probabilistic version). Let f : X → X be an en<strong>do</strong>morphism<br />

of a probability space (X, E, µ), and let A ∈ E. Then the set<br />

A rec = {x ∈ A t.q. f n (x) ∈ i.o. A}<br />

of those points of A whose orbit passes through A infinitely often has total probability, namely<br />

µ (A rec ) = µ (A).<br />

proof. For k ≥ 1, let B k = {x ∈ A s.t. f n (x) /∈ A ∀ n ≥ k} be the set of those points of A<br />

which never return in A after n ≥ k iterates. Observe that B k = A ∩ (∩ n≥k f −n (X\A)), and<br />

that A rec = A\ (∪ k≥1 B k ), and this shows in particular that A rec is measurable. One sees that<br />

f −nk (B k ) ∩ B k = ∅ for any n ≥ 1 (for a point x in the intersection would be a point of B k with<br />

f kn (x) ∈ A for some kn ≥ k), and this implies that f −nk (B k ) ∩ f −mk (B k ) = ∅ for any n > m ≥ 0.<br />

The sets f −nk (B k ) all have the same measure µ (B k ), because µ is invariant, and are pairwise<br />

disjoint. This implies that µ (B k ) = 0, because<br />

∑<br />

µ ( f −nk (B k ) ) = µ ( ∪ n≥1 f −nk (B k ) ) ≤ µ (X) = 1<br />

n≥1<br />

µ (B k )) = ∑ n≥1<br />

and so µ (A rec ) = µ (A). □<br />

Now, let f : X → X be a continuous transformation of a metrizable topological space X, and<br />

let µ be an invariant Borel probability measure. If X admits a countable basis (U i ) i∈N , we can<br />

apply the above theorem to every open set U i . This easily implies that the set of recurrent points<br />

has full measure, i.e.<br />

µ (Rec f ) = 1<br />

In particular, since any set of full measure is <strong>de</strong>nse in the support of a Borel measure, we get the<br />

following general result.


11<br />

RECORRÊNCIAS 76<br />

Poincaré recurrence theorem (topologic version). Let f : X → X be a continuous<br />

transformation of a separable metrizable topological space X. The support of any invariant Borel<br />

probability measure µ is contained in the closure of the set of recurrent points, namely<br />

supp (µ) ⊂ Rec f .<br />

If, in particular, f admits an invariant measure µ which is diffuse (i.e. gives positive measure to<br />

any nonempty open set) then the set of recurrent points is <strong>de</strong>nse in X, namely<br />

Rec f = X.<br />

Observe that if f is a homeomorphism, then the same applies to Rec f −1, and the support of<br />

any invariant Borel probability measure is contained in the closure of Rec f ∩Rec f −1.<br />

If you <strong>do</strong>n’t like the above proof, here is another, perhaps more elemenary, of the last statement.<br />

Alternative proof. Assume that the continuous map f : X → X preserves a diffuse Borel<br />

probability measure µ. For each n ≥ 1, let<br />

R n = { x ∈ X s.t. ∃ k ≥ 1 s.t. d(f k (x), x) < 1/n }<br />

be the set of ”1/n-recurrent” points. Of course, Rec f = ∩ ∞ n=1R n . The sets R n are clearly open.<br />

To show that Rec f is <strong>de</strong>nse we must show that each R n is, since then the Baire theorem implies<br />

that also their countable intersection is <strong>de</strong>nse. So, take any nonempty ball B with diameter<br />

< 1/n. Its inverse images f −1 (B), f −2 (B), f −3 (B),... have all the same measure µ(B) > 0. Since<br />

µ(X) = 1, they cannot be disjoint. There follows that there exist k > 0 and n ≥ 0 such that<br />

f −(n+k) (B) ∩ f −n (B) ≠ 0, and this implies that B contains a 1/n-recurrent point (for a point x in<br />

the intersection has both images f n (x) and f n+k (x) = f k (f n (x)) in B, hence at distance < 1/n).<br />

Since B was arbitrary, this proves that each R n is <strong>de</strong>nse, and Baire theorem implies that Rec f is<br />

<strong>de</strong>nse too.<br />

Example. Rotations of the circle preserve the Lebesgue probability measure. Hence, almost any<br />

point x + Z is recurrent for the rotation R α : x + Z ↦→ x + α + Z. If α is rational this is trivial, since<br />

all points are periodic. When α is irrational, this says that for any ε > 0 there exist an infinity of<br />

times q ∈ N that<br />

d(x + Z, x + qα + Z) < ε<br />

hence for any ε > 0, there exist an infinity of rationals p/q such that<br />

|qα − p| < ε i.e.<br />

∣ α − p q ∣ < ε q<br />

We know from continued factions that the estimate is in<strong>de</strong>ed better, since ε/q may be substituited<br />

by 1/q 2 .<br />

11.4 Conjunto não-errante<br />

Por volta <strong>do</strong>s anos trinta, George D. Birkhoff teve a i<strong>de</strong>ia <strong>de</strong> dividir o espaço <strong>do</strong>s esta<strong>do</strong>s <strong>de</strong> um<br />

sistema dinâmico em duas classes <strong>de</strong> pontos com dinâmicas qualitativamente distintas.<br />

O ponto x é errante 26 se admite uma vizinhança disjunta <strong>de</strong> to<strong>da</strong>s as suas itera<strong>da</strong>s, i.e. se<br />

existe um aberto U que contém x tal que U ∩ f n (U) = ∅ para to<strong>do</strong> tempo n ≥ 1. O ponto x não<br />

é errante se para to<strong>da</strong> vizinhança U <strong>de</strong> x existe um tempo n ≥ 1 tal que f n (U) ∩ U ≠ ∅.<br />

O conjunto não-errante NW f (<strong>do</strong> inglês “non-wan<strong>de</strong>ring set”) é o conjunto <strong>do</strong>s pontos x que não<br />

são errantes. A i<strong>de</strong>ia informal é que conjunto não-errante é on<strong>de</strong> acontece a dinâmica interessante,<br />

enquanto o conjunto errante é o conjunto <strong>do</strong>s pontos que a dinâmica esquece.<br />

26 A palavra grega por “errante”, ou seja, “vagabun<strong>do</strong>”, “que vagueia ao acaso”, era πλανητης, ou seja, planeta.


11<br />

RECORRÊNCIAS 77<br />

O conjunto não-errante NW f é fecha<strong>do</strong> (o cojnunto <strong>do</strong>s pontos errantes é aberto quase por<br />

<strong>de</strong>finição, pois, se x é errante, to<strong>do</strong> ponto duma sua vizinhança é errante) e +invariante. Contém<br />

os ω-limites <strong>de</strong> to<strong>do</strong>s os pontos <strong>de</strong> X, assim como os pontos recorrentes. As inclusões são<br />

Per f ⊂ Lim f ⊂ NW f e Per f ⊂ Rec f ⊂ NW f<br />

Se f é um homeomorfismo, NW f , que é igual a NW f −1, é também invariante, e contém os ω-<br />

e α-limites <strong>de</strong> to<strong>do</strong>s os pontos <strong>de</strong> X.<br />

( X compacto ⇒ NW f ≠ ∅) Se X é compacto, então NW f ≠ ∅, porque to<strong>do</strong> ponto x ∈ X tem<br />

ω f (x) ≠ ∅ e porque Lim f ⊂ NW f .<br />

Exercícios.<br />

• Prove que o conjunto não-errante <strong>de</strong> um homeomorfismo é fecha<strong>do</strong>, invariante e contém os<br />

ω- e α-limites <strong>de</strong> to<strong>do</strong>s os pontos.<br />

• Mostre que, se f é um homeomorfismo, então NW f = NW f −1.<br />

• Dê exemplos que mostram que NW f po<strong>de</strong> ser vazio.<br />

• Mostre que Per f ⊂ Rec f ⊂ NW f ⊂ Rec ε f . Dê exemplos que mostram que as inclusões po<strong>de</strong>m<br />

ser estrictas.<br />

• Mostre que Per f ⊂ Rec f ⊂ NW f e portanto Per f ⊂ Rec f ⊂ NW f . Mais dificil é arranjar<br />

exemplos que mostram que as inclusões po<strong>de</strong>m ser estrictas.<br />

• Determine os conjuntos não errantes <strong>da</strong>s transformações lineares <strong>do</strong> plano.


12 TRANSITIVIDADE E ÓRBITAS DENSAS 78<br />

12 Transitivi<strong>da</strong><strong>de</strong> e órbitas <strong>de</strong>nsas<br />

Na sua genial tentativa <strong>de</strong> justificar a termodinâmica a partir <strong>da</strong> hipótese molecular, Ludwig<br />

Boltzmann fez a sua famosa ”hipótese ergódica”. Ele conjeturou que ”a superficie <strong>de</strong> energia<br />

constante <strong>de</strong> um sistema <strong>de</strong> muitas partículas interagentes (um gas) é composta <strong>de</strong> uma única<br />

órbita” e esta órbita ”passa em ca<strong>da</strong> região <strong>da</strong> superficie um tempo assinptoticamente proporcional<br />

ao volume <strong>da</strong> região”. A primeira parte <strong>da</strong> hipótese equivale a dizer que a ação <strong>do</strong> tempo no espaço<br />

<strong>do</strong>s esta<strong>do</strong>s é ”transitiva”: para ca<strong>da</strong> <strong>do</strong>is esta<strong>do</strong>s x e x ′ existe um tempo t tal que φ t (x) = x ′ .<br />

Ora, se o tempo é Z, isto não po<strong>de</strong> acontecer, a não ser que X seja enumerável. Em reali<strong>da</strong><strong>de</strong> o<br />

Boltzmann pensava no caso contínuo, on<strong>de</strong> o tempo é R, mas mesmo assim esta hipótese é falsa se<br />

X tem dimensão maior <strong>de</strong> um e se a ação é suficientemente suave para evitar fenómenos patológicos<br />

como curvas <strong>de</strong> Peano (e, aliás, as órbitas <strong>do</strong>s sistemas físicos são soluções <strong>de</strong> equações diferenciais,<br />

logo curvas diferenciáveis). O que sim po<strong>de</strong> acontecer, é que o sistema admita órbitas <strong>de</strong>nsas, e que<br />

estas sejam muitas. Este fenómeno, formaliza<strong>do</strong> nas <strong>de</strong>finições à seguir, é o correspetivo topológico<br />

<strong>da</strong> ergodici<strong>da</strong><strong>de</strong>, e o seu signfica<strong>do</strong> é que o espaço <strong>do</strong>s esta<strong>do</strong>s é essencialmente um único pe<strong>da</strong>ço.<br />

A segun<strong>da</strong> parte <strong>da</strong> hipótese é <strong>de</strong> natureza probabílistica, e é formaliza<strong>da</strong> na <strong>de</strong>finição <strong>de</strong> medi<strong>da</strong><br />

invariante ergódica.<br />

12.1 Transitivi<strong>da</strong><strong>de</strong><br />

Transformações transitivas. Seja X um espaço métrico completo e separável. Uma transformação<br />

contínua f : X → X é (topologicamente) +transitiva se verifica uma <strong>da</strong>s condições<br />

equivalentes:<br />

i) para ca<strong>da</strong> <strong>do</strong>is abertos não vazios U, V ⊂ X existe um tempo n ≥ 0 tal que f n (U) ∩ V ≠ ∅,<br />

ii) existe um ponto x ∈ X tal que ω f (x) = X,<br />

iii) existe um conjunto residual <strong>de</strong> pontos x ∈ X tais que ω f (x) = X.<br />

As implicações iii) ⇒ ii) ⇒ i) são obvias, pois se ω f (x) = X, então a trajetória <strong>de</strong> x passa uma<br />

infini<strong>da</strong><strong>de</strong> <strong>de</strong> vezes por to<strong>do</strong>s os abertos não vazios <strong>de</strong> X. Para provar que i) ⇒ iii), a primeira<br />

observação é que a condição i) é equivalente a dizer que, para to<strong>do</strong> aberto não vazio V , a sua<br />

órbita ∪ n≥0 f −n (V ) é <strong>de</strong>nsa, e ain<strong>da</strong> mais, as suas órbitas ∪ n≥k f −n (V ) = ∪ n≥0 f −n ( f −k (V ) ) são<br />

<strong>de</strong>nsas para to<strong>do</strong> k ≥ 0. Agora, seja (U i ) i∈N uma base enumerável <strong>da</strong> topologia <strong>de</strong> X . A família<br />

<strong>do</strong>s ∪ n≥k f −n (U i ), com k ≥ 0 e i ≥ 1, é uma família <strong>de</strong> abertos <strong>de</strong>nsos em X. A sua interseção<br />

enumerável R = ∩ i∈N ∩ k≥0 ∪ n≥k f −n (U i ) é um conjunto residual, e um ponto x ∈ R tem uma<br />

trajetória que passa infinitas vezes por ca<strong>da</strong> um <strong>do</strong>s abertos U i , i.e. ω f (x) = X.<br />

Também, é facil <strong>de</strong> ver que i) implica que X não tem pontos isola<strong>do</strong>s (<strong>de</strong>s<strong>de</strong> que não tenha<br />

cardinali<strong>da</strong><strong>de</strong> finita, caso trivial em que X é composto por una única órbita). A ausência <strong>de</strong> pontos<br />

isola<strong>do</strong>s implica que, <strong>de</strong> fato, O + f (x)′ = X se x ∈ R.<br />

( +transitivo ⇒ NW f = X) Se f : X → X é +transitiva, então o seu conjunto não-errante é<br />

X, porque NW f contém os conjuntos ω-limite <strong>do</strong>s pontos <strong>de</strong> X.<br />

( +transitivo ⇒ Rec f residual) Observe também que uma transformação +transitiva tem muitos<br />

pontos recorrentes, <strong>de</strong> fato um conjunto residual, porque se ω f (x) = X então x ∈ ω f (x).


12 TRANSITIVIDADE E ÓRBITAS DENSAS 79<br />

Homeomorfismos transitivos. Existe uma noção mais fraca <strong>de</strong> transitivi<strong>da</strong><strong>de</strong>, que só é significativa<br />

para as transformações invertíveis. Um homeomorfismo f : X → X é um homeomorfismo<br />

(topologicamente) transitivo se verifica uma <strong>da</strong>s condições equivalentes:<br />

i) para ca<strong>da</strong> <strong>do</strong>is abertos não vazios U, V ⊂ X existe um tempo n ∈ Z tal que f n (U) ∩ V ≠ ∅,<br />

ii) existe um ponto x ∈ X tal que O f (x) = X,<br />

iii) existe um conjunto residual <strong>de</strong> pontos x ∈ X tais que O f (x) = X.<br />

As implicações iii) ⇒ ii) ⇒ i) são obvias, pois, se a órbita completa <strong>de</strong> x é <strong>de</strong>nsa, passa pelo<br />

menos uma vez por to<strong>do</strong>s os abertos não vazios <strong>de</strong> X. Para provar que i) ⇒ iii), a primeira<br />

observação é que a condição i) é equivalente a dizer que a órbita ∪ n∈Z f n (V ) <strong>de</strong> to<strong>do</strong> aberto não<br />

vazio V é <strong>de</strong>nsa em X. Agora, seja (U i ) i∈N uma base enumerável <strong>da</strong> topologia <strong>de</strong> X . A família <strong>do</strong>s<br />

∪ n∈Z f n (U i ) é uma família <strong>de</strong> abertos <strong>de</strong>nsos. A sua interseção enumerável R = ∩ i∈N ∪ n∈Z f n (U i )<br />

é um conjunto residual, e um ponto x ∈ R tem uma trajetória completa que passa pelo menos uma<br />

vez por ca<strong>da</strong> um <strong>do</strong>s abertos U i , i.e. O f (x) = X.<br />

Observe que f : X → X é um homeomorfismo transitivo sse f −1 é um homeomorfismo transitivo.<br />

Um homeomorfismo transitivo po<strong>de</strong> não ser +transitivo, e, aliás, po<strong>de</strong> até não ter pontos<br />

recorrentes e ter conjunto não-errante vazio, <strong>de</strong>s<strong>de</strong> que X não seja compacto!<br />

(transitivo ⇔ “dinamicamente conexo”) Mais interessante é observar que um homeomorfismo<br />

f : X → X é um homeomorfismo transitivo sse X não contém uma reunião disjunta <strong>de</strong> <strong>do</strong>is<br />

subconjuntos abertos invariantes e não vazios. A implicação ⇒ é trivial. Para provar a implicação<br />

⇐ , observe que, se U, V ⊂ X são <strong>do</strong>is abertos não vazios, então ∪ n∈Z f n (U) e ∪ n∈Z f n (V ) são<br />

abertos, invariantes e não vazios. Se não forem disjuntos, existem n, m ∈ Z tais que f n (U) ∩<br />

f m (V ) ≠ ∅, o que implica f n−m (U) ∩ V ≠ ∅.<br />

(transitivo ⇒ as funções contínuas invariantes são triviais) Se f : X → X é um homeomorfismo<br />

transitivo, então to<strong>da</strong> função contínua ϕ : X → R invariante é constante. De fato, se ϕ não é<br />

constante, então assume pelo menos <strong>do</strong>is valores, a < b. Logo existe c = (a + b) /2 tal que {ϕ < c}<br />

e {ϕ > c} são invariantes, abertos, disjuntos, e não vazios, mas isto contradiz o resulta<strong>do</strong> anterior.<br />

Exercícios.<br />

• Prove as implicações iii) ⇒ ii) ⇒ i) na <strong>de</strong>finição <strong>de</strong> “transformação +transitiva”.<br />

• Prove que, se f : X → X é +transitiva, então NW f = X.<br />

• Prove que se f : X → X é +transitiva, então o conjunto Rec f<br />

residual.<br />

<strong>do</strong>s pontos recorrentes é<br />

• Prove as implicações iii) ⇒ ii) ⇒ i) na <strong>de</strong>finição <strong>de</strong> “homeomorfismo transitivo”.<br />

• Prove que um homeomorfismo f : X → X é transitivo sse X não contém uma reunião<br />

disjunta <strong>de</strong> <strong>do</strong>is subconjuntos abertos invariantes e não vazios.<br />

• Prove que, se f : X → X é um homeomorfismo transitivo, então to<strong>da</strong> função contínua<br />

ϕ : X → R invariante é constante.<br />

• Dê exemplos <strong>de</strong> homeomorfismos f : X → X que sejam transitivos mas que não sejam<br />

+transitivos.<br />

Desafios.<br />

• (transitivo e NW f = X ⇔ +transitivo) Mostre que um homeomorfismo f : X → X<br />

é +transitivo sse é um homeomorfismo transitivo e o seu conjunto não-errante é X. A<br />

implicação ⇐ é imediata ...<br />

• Po<strong>de</strong> acontecer que uma transformação f : X → X seja topologicamente +transitiva mas<br />

tenha uma itera<strong>da</strong> f n , com n > 1, que não é topologicamente +transitiva. Um exemplo<br />

trivial é uma permutação <strong>de</strong> um espaço finito, pois alguma itera<strong>da</strong> é a i<strong>de</strong>nti<strong>da</strong><strong>de</strong>. Em geral,<br />

se X é compacto, o que acontece é o seguinte: existe uma cobertura X = X 1 ∪ X 2 ∪ ... ∪ X k ,<br />

on<strong>de</strong> k é um inteiro que divi<strong>de</strong> n e os X i são subconjuntos compactos com interseções X i ∩X j


12 TRANSITIVIDADE E ÓRBITAS DENSAS 80<br />

nowhere <strong>de</strong>nse se i ≠ j, tal que f (X i ) = X i+1 mod k e as restrições f n | Xi são topologicamente<br />

+transitivas. ( A i<strong>de</strong>ia é escolher um ponto x ∈ X tal que ω f (x) = X, e <strong>de</strong>finir X i =<br />

ω f n f i (x) ) ...<br />

12.2 Minimali<strong>da</strong><strong>de</strong><br />

A transitivi<strong>da</strong><strong>de</strong> implica que muitos pontos têm órbitas <strong>de</strong>nsas. Isto não impe<strong>de</strong> que exitam pontos<br />

x cujas órbitas O + f<br />

(x) tenham a<strong>de</strong>rências estritamente conti<strong>da</strong>s em X.<br />

Conjuntos minimais. Seja f : X → X uma transformação contínua. Um subconjunto fecha<strong>do</strong><br />

e não vazio K ⊂ X é dito minimal se é +invariante e se não contém subconjuntos próprio fecha<strong>do</strong>s<br />

e +invariantes.<br />

A órbita <strong>de</strong> um ponto periódico é um exemplo <strong>de</strong> um conjunto minimal.<br />

Se K é minimal, então a órbita <strong>de</strong> to<strong>do</strong> x ∈ K é <strong>de</strong>nsa em K, pois caso contrário a a<strong>de</strong>rência<br />

O + f<br />

(x) seria um subconjunto próprio <strong>de</strong> K, fecha<strong>do</strong> e +invariantes. Isto implica que em particular<br />

x ∈ ω f (x), e portanto to<strong>do</strong> ponto <strong>de</strong> um conjunto minimal é recorrente.<br />

Se Min f <strong>de</strong>nota a reunião <strong>do</strong>s subconjuntos minimais <strong>de</strong> X, as inclusões são<br />

Per f ⊂ Min f ⊂ Rec f<br />

Uma transformação arbitrária f : X → X po<strong>de</strong> não admitir conjuntos minimais (pense numa<br />

translação <strong>da</strong> reta real).<br />

( X compacto ⇒ Min f ≠ ∅) Se o espaço X é compacto, po<strong>de</strong>mos consi<strong>de</strong>rar a família C<br />

<strong>do</strong>s subconjunto C ⊂ X que são fecha<strong>do</strong>s, não vazios e +invariantes, muni<strong>da</strong> <strong>da</strong> or<strong>de</strong>m parcial<br />

“⊂”. A família contém pelo menos um elemento, o próprio X. Pelo lema <strong>de</strong> Zorn 27 (observe<br />

que to<strong>da</strong> ca<strong>de</strong>ia ... ⊂ C i+1 ⊂ C i ⊂ ... <strong>de</strong> elementos <strong>de</strong> C tem um limite inferior, porque uma<br />

interseção <strong>de</strong> compactos encaixa<strong>do</strong>s é um compacto não vazio, e a invariância é preserva<strong>da</strong>), C<br />

contém um elemento minimal K, e este elemento minimal é um conjunto minimal. Em geral, se<br />

uma transformação f : X → X admite um compacto C ⊂ X tal que f (C) ⊂ C, então admite pelo<br />

menos um conjunto minimal K ⊂ C.<br />

( X compacto ⇒ Rec f ≠ ∅) Corolario é que uma transformação f : X → X <strong>de</strong>fini<strong>da</strong> num<br />

compacto admite pelo menos um ponto recorrente (que po<strong>de</strong> ser único!), pois Min f ⊂ Rec f .<br />

Transformações minimais. Uma transformação contínua f : X → X é minimal se verifica<br />

uma <strong>da</strong>s condições equivalentes:<br />

i) to<strong>da</strong> órbita O + f<br />

(x) é <strong>de</strong>nsa em X,<br />

ii) X não contém um subconjunto próprio fecha<strong>do</strong> e +invariante, e portanto é um conjunto<br />

minimal.<br />

A equivalência i) ⇔ ii) acima é obvia. Se X é um espaço discreto, a minimali<strong>da</strong><strong>de</strong> implica<br />

que X é composto por uma unica órbita, que po<strong>de</strong> ser finita. Caso contrário, uma transformação<br />

minimal não tem pontos periódicos.<br />

(minimal ⇒ +transitiva) Obviamente, uma transformação minimal é +transitiva.<br />

27 O lema <strong>de</strong> Zorn é um teorema <strong>de</strong> existência equivalente ao axioma <strong>da</strong> escolha.<br />

Seja Ω um conjunto não vazio. Uma or<strong>de</strong>m parcial em Ω é uma relação ≼ reflexiva (x ≼ x ∀x ∈ Ω), anti-simétrica<br />

(x ≼ y e y ≼ x ⇒ x = y) e transitiva (x ≼ y e y ≼ z ⇒ x ≼ z). Um conjunto parcialmente or<strong>de</strong>na<strong>do</strong> é um par<br />

(Ω, ≼), um conjunto não vazio Ω muni<strong>do</strong> <strong>de</strong> uma or<strong>de</strong>m parcial ≼.<br />

Uma or<strong>de</strong>m em Ω é uma or<strong>de</strong>m parcial ≼ tal que ∀x, x ′ ∈ Ω temos x ≼ x ′ ou x ′ ≼ x. Um conjunto (totalmente)<br />

or<strong>de</strong>na<strong>do</strong> é um par (Ω, ≼), um conjunto não vazio Ω muni<strong>do</strong> <strong>de</strong> uma or<strong>de</strong>m ≼.<br />

Seja (Ω, ≼) um conjunto parcialmente or<strong>de</strong>na<strong>do</strong>. Uma ca<strong>de</strong>ia em Ω é um subconjunto não vazio C ⊂ Ω tal que a<br />

restrição <strong>de</strong> ≼ <strong>de</strong>fine uma or<strong>de</strong>m em C, i.e. tal que ∀c, c ′ ∈ C temos c ≼ c ′ ou c ′ ≼ c.<br />

Sejam (Ω, ≼) um conjunto parcialmente or<strong>de</strong>na<strong>do</strong> e seja A ⊂ Ω um subconjunto não vazio. Um elemento s ∈ Ω é<br />

dito um limite superior (inferior) <strong>de</strong> A se s ≼ a ∀a ∈ A (se a ≼ s ∀a ∈ A). Um elemento m ∈ A é dito elemento<br />

maximal (minimal) <strong>de</strong> A se nenhum outro elemento <strong>de</strong> A é maior (menor) que m, ou seja se ∀a ∈ A m ≼ a (a ≼ m)<br />

⇒ a = m.<br />

Lema <strong>de</strong> Zorn. Seja Ω um conjunto não vazio e parcialmente or<strong>de</strong>na<strong>do</strong> por ≼, tal que to<strong>da</strong> ca<strong>de</strong>ia C ⊂ Ω tem<br />

limite superior (inferior). Então Ω contém um elemento maximal (minimal).


12 TRANSITIVIDADE E ÓRBITAS DENSAS 81<br />

Homeomorfismos minimais. O homeomorfismo f : X → X é um homeomorfismo minimal<br />

se to<strong>da</strong> órbita completa O f (x) é <strong>de</strong>nsa em X, ou seja se X não contém um subconjunto próprio<br />

fecha<strong>do</strong> e invariante.<br />

Os homeomorfismos minimais são transitivos. A discussão acima po<strong>de</strong> ser repeti<strong>da</strong> tiran<strong>do</strong><br />

os “+”... Em particular, um homeomorfismo f : X → X <strong>de</strong>fini<strong>do</strong> num espaço compacto admite<br />

pelo menos um subconjunto minimal K, ou seja neste caso um subconjunto fecha<strong>do</strong>, não vazio e<br />

invariante que não contém subconjuntos próprios fecha<strong>do</strong>s e invariantes.<br />

Exercícios.<br />

• Dê exemplos <strong>de</strong> transformações f : X → X tais que Min f = ∅.<br />

• Prove as implicações i) ⇔ ii) na <strong>de</strong>finição <strong>de</strong> “transformação minimal”.<br />

• Prove as implicações i) ⇔ ii) na <strong>de</strong>finição <strong>de</strong> “homeomorfismo minimal”.<br />

12.3 Rotações irracionais <strong>do</strong> círculo<br />

Teorema.<br />

Uma rotação irracional <strong>do</strong> círculo é um homeomorfismo minimal.<br />

<strong>de</strong>m. Seja +α : x+Z ↦→ x+α+Z uma rotação <strong>do</strong> círculo R/Z, com α /∈ Q. Se +α não é minimal,<br />

então existe uma órbita O +α (x) cuja a<strong>de</strong>rência F não é igual a R/Z. O complementar (R/Z) \ F<br />

é aberto, invariante e não vazio. Pela classificação <strong>do</strong>s abertos <strong>da</strong> reta, sabemos que (R/Z) \ F<br />

é uma reunião enumerável <strong>de</strong> intervalos abertos (um ’“intervalo” <strong>do</strong> círculo é, por <strong>de</strong>finição, um<br />

subconjunto conexo) não vazios e <strong>do</strong>is a <strong>do</strong>is disjuntos. Seja I o (ou um <strong>do</strong>s) que tem comprimento<br />

maior (porque existe). Como as rotações preservam o comprimento, as imagems (+α) n (I) com<br />

n ∈ Z não po<strong>de</strong>m coincidir (porque +α não tem pontos periódicos) nem intersetar-se (porque a<br />

reunião seria um intervalo <strong>de</strong> comprimento maior). Logo elas são disjuntas e têm to<strong>da</strong>s o mesmo<br />

comprimento |I| > 0, mas isto é impossível porque o círculo tem comprimento finito.<br />

A informação “aritmética” <strong>de</strong>ste teorema é que, <strong>da</strong><strong>do</strong> α /∈ Q, to<strong>da</strong> órbita<br />

{x + nα + Z, com n ∈ Z}<br />

é <strong>de</strong>nsa no círculo R/Z. De fato, é possível provar mais: to<strong>da</strong> órbita é “equidistribui<strong>da</strong>” no círculo,<br />

no senti<strong>do</strong> em que, <strong>da</strong><strong>da</strong> uma função integrável ϕ no intervalo [0, 1], as médias aritmética<br />

1<br />

n + 1<br />

n∑<br />

ϕ ({x + nα})<br />

j=0<br />

convergem para o integral ∫ 1<br />

ϕ (x) dx (veja o teorema <strong>de</strong> Kronecker e Weyl no capitulo sobre a<br />

0<br />

ergodici<strong>da</strong><strong>de</strong>).<br />

Existe também a possibili<strong>da</strong><strong>de</strong> <strong>de</strong> <strong>da</strong>r uma leitura “algébrica” <strong>de</strong>ste resulta<strong>do</strong>. Basta observar<br />

que a órbita <strong>de</strong> 0, a i<strong>de</strong>nti<strong>da</strong><strong>de</strong> <strong>do</strong> grupo, é o subgrupo cíclico <strong>de</strong> R/Z gera<strong>do</strong> por α + Z. Portanto<br />

o teorema diz que os subgrupos próprios e fecha<strong>do</strong>s <strong>de</strong> R/Z são os subgrupos finitos.<br />

Example of a non-measurable set. If you believe the axiom of choice, you may consi<strong>de</strong>r a<br />

set B ma<strong>de</strong> of one (exactly one!) point for any orbit of an irrational rotation R α of the circle.<br />

The images B n = Rα(B), n for n ∈ Z, are pairwise disjoint and cover the circle. If B, hence all its<br />

images, were Lebesgue-measurable, then<br />

∑<br />

|B| = ∑ |B n | = |∪ n∈Z B n | = |R/Z| = 1<br />

n∈Z n∈Z<br />

since rotations preserve Lebesgue measure, so that |B n | = |B|. But there exists no size b = |B| ≥ 0<br />

such that ∑ n∈Z b = 1.


12 TRANSITIVIDADE E ÓRBITAS DENSAS 82<br />

Exercício. Embora o resulta<strong>do</strong> seja óbvio, é instructivo provar que as rotações racionais não<br />

são topologicamente transitivas usan<strong>do</strong> o critério <strong>da</strong>s funções invariantes, porque a <strong>de</strong>monstração<br />

po<strong>de</strong> exten<strong>de</strong>r-se às translações <strong>do</strong> toro. (Basta observar que, se α = p/q com p e q inteiros, a<br />

função x ↦→ sin(2πqx) está bem <strong>de</strong>fini<strong>da</strong> no círculo, é contínua, não é constante, e é invariante pela<br />

rotação +α)<br />

Rotações <strong>do</strong> toro.<br />

Seja +α : R n /Z n → R n /Z n a translação <strong>do</strong> toro <strong>de</strong>fini<strong>da</strong> por<br />

(x 1 , x 2 , ..., x n ) + Z n ↦→ (x 1 + α 1 , x 2 + α 2 , ..., x n + α n ) + Z n<br />

Prove que, se os α i não são racionalmente in<strong>de</strong>pen<strong>de</strong>ntes, i.e. se existe k ∈ Z n \ {0} tal que<br />

∑ n<br />

i=1 k iα i = 0 mod Z, então +α não é topologicamente transitiva. Mais difícil é provar que a<br />

translação +α é minimal sse os α i são racionalmente in<strong>de</strong>pen<strong>de</strong>ntes, i.e. se não existe k ∈ Z n \ {0}<br />

tal que ∑ n<br />

i=1 k iα i = 0 mod Z.


13 HOMEOMORFISMOS DO CÍRCULO 83<br />

13 Homeomorfismos <strong>do</strong> círculo<br />

O estu<strong>do</strong> <strong>do</strong>s campos <strong>de</strong> vetores no toro R 2 /Z 2 levou Poincaré a consi<strong>de</strong>rar a necessi<strong>da</strong><strong>de</strong> <strong>de</strong><br />

classificar as possíveis dinâmicas <strong>do</strong>s homeomorfismos <strong>do</strong> círculo. Um mo<strong>de</strong>lo é constitui<strong>do</strong> pelas<br />

rotações +α, cujo comportamento é <strong>de</strong>termina<strong>do</strong> pela racionali<strong>da</strong><strong>de</strong> ou menos <strong>do</strong> “número <strong>de</strong><br />

rotação” α. Se α é racional, to<strong>do</strong> ponto é periódico, logo as órbitas são finitas. Se α é irracional,<br />

o sistema é minimal, e portanto to<strong>da</strong> órbita é <strong>de</strong>nsa. A chave para compreen<strong>de</strong>r homeomorfismos<br />

genéricos é a <strong>de</strong>finição <strong>de</strong> um “invariante” que jogue o papel <strong>de</strong> α ...<br />

13.1 Número <strong>de</strong> rotação<br />

Sejam f : R/Z → R/Z um homeomorfismo <strong>do</strong> círculo, e F : R → R um levantamento <strong>de</strong> f. A<br />

seguir, assumimos que f “preserva a orientação”, ou seja que <strong>de</strong>g (f) = 1, e portanto F é uma<br />

função contínua e estritamente crescente que verifica F (x + 1) = F (x) + 1 para to<strong>do</strong> x ∈ R.<br />

O número <strong>de</strong> rotação <strong>de</strong> f é<br />

ρ (f) = τ (F ) mod Z<br />

on<strong>de</strong> τ (F ) é o número <strong>de</strong> translação <strong>de</strong> F , <strong>de</strong>fini<strong>do</strong> por<br />

F n (x) − x<br />

τ (F ) = lim<br />

n→∞ n<br />

on<strong>de</strong> x é um ponto arbitrário <strong>da</strong> reta. A prova <strong>de</strong> que a <strong>de</strong>finição acima faz senti<strong>do</strong>, e que o número<br />

<strong>de</strong> rotação é um invariante topológico, está conti<strong>da</strong> nas seguintes observações.<br />

O limite τ (F ) existe. A transformação F e as suas itera<strong>da</strong>s F n são homeomorfismos crescentes<br />

<strong>da</strong> reta que satisfazem F n (x + 1) = F n (x) +1 para to<strong>do</strong> x ∈ R. Em particular, F n − id são funções<br />

periódicas <strong>de</strong> perío<strong>do</strong> um. Isto implica que<br />

max<br />

x,x ′ |(F n (x) − x) − (F n (x ′ ) − x ′ )| ≤ 1<br />

pois, pela periodici<strong>da</strong><strong>de</strong> basta calcular o máximo no intervalo [0, 1], e sabemos que F n é crescente<br />

e que a imagem F n ([0, 1]) é um intervalo <strong>de</strong> comprimento um. Seja agora a n = F n (x) − x. A<br />

<strong>de</strong>sigual<strong>da</strong><strong>de</strong> acima implica que a sucessão (a n ) é “quase-subaditiva”, i.e. satisfaz<br />

a n+m ≤ a n + a m + c<br />

para to<strong>do</strong>s n, m ≥ 0, on<strong>de</strong> c é uma constante. De fato,<br />

F n+m (x) − x = F n (F m (x)) − F m (x) + F m (x) − x<br />

= F n (x) − x − F n (x) + x + F n (F m (x)) − F m (x) + F m (x) − x<br />

≤ F n (x) − x + F m (x) − x + 1<br />

e portanto basta escolher c = 1. A existência <strong>do</strong> limite lim n→∞ a n /n é equivalente à existência <strong>do</strong><br />

limite lim n→∞ b n /n, on<strong>de</strong> b n = a n +c. A sucessão (b n ) é subaditiva, ou seja satisfaz b n+m ≤ b n +b m .<br />

A sucessão (b n ) é crescente, e pela subaditivi<strong>da</strong><strong>de</strong> satisfaz b n ≤ nb 1 . Portanto, a sucessão (b n /n)<br />

é limita<strong>da</strong>, logo existe λ =lim n→∞ b n /n. Da<strong>do</strong> ε > 0, existe um natural N tal que b N /N < λ + ε.<br />

Seja agora n = kN + r, com k inteiro não negativo e 0 ≤ r < N, e seja B = max 1≤i


13 HOMEOMORFISMOS DO CÍRCULO 84<br />

O limite τ (F ) não <strong>de</strong>pen<strong>de</strong> <strong>do</strong> ponto x. Já vimos que |(F n (x) − x) − (F n (x ′ ) − x ′ )| ≤ 1,<br />

portanto<br />

∣ ∣∣∣ F n (x) − x<br />

− F n (x ′ ) + x<br />

n<br />

n ∣ ≤ 1/n<br />

para to<strong>do</strong>s x, x ′ e n. Isto implica que τ (F ) é in<strong>de</strong>pen<strong>de</strong>nte <strong>do</strong> ponto x escolhi<strong>do</strong> na sua <strong>de</strong>finição.<br />

ρ (f) não <strong>de</strong>pen<strong>de</strong> <strong>do</strong> levantamento F . Observe que <strong>do</strong>is levantamentos F e G <strong>de</strong> f diferem<br />

por um inteiro, ou seja G (x) = F (x) + k para algum k ∈ Z. Isto implica que τ (F ) = τ (G) + k,<br />

pois G n (x) − x = F n (x) − x + nk. Portanto o número <strong>de</strong> rotação ρ (f) está bem <strong>de</strong>fini<strong>do</strong>, não<br />

<strong>de</strong>pen<strong>de</strong> <strong>do</strong> levantamento escolhi<strong>do</strong>.<br />

ρ (f) é invariante para conjugações topológicas. Seja h : R/Z → R/Z uma conjugação<br />

entre os homeomorfismos f e g. Se H é um levantamento <strong>de</strong> h e F é um levantamento <strong>de</strong> f,<br />

é imediato verificar que H ◦ F ◦ H −1 é um levantamento <strong>de</strong> g. Não é difícil mostrar que a<br />

diferença ( H ◦ F ◦ H −1) n<br />

(x) − F n (x) é limita<strong>da</strong>, in<strong>de</strong>pen<strong>de</strong>ntemente <strong>de</strong> x e <strong>de</strong> n. Basta observar<br />

que ( H ◦ F ◦ H −1) n<br />

= H ◦ F n ◦ H −1 , que |H (x) − x| e ∣ ∣H −1 (x) − x ∣ são limita<strong>do</strong>s por uma<br />

constante in<strong>de</strong>pen<strong>de</strong>nte <strong>de</strong> x, e utilizar a <strong>de</strong>sigual<strong>da</strong><strong>de</strong> <strong>do</strong> triângulo. Isto implica que τ (F ) =<br />

τ ( H ◦ F ◦ H −1) , e portanto que ρ (f) = ρ (g).<br />

Exercícios.<br />

• Determine o número <strong>de</strong> rotação <strong>de</strong> uma rotação <strong>do</strong> círculo.<br />

• Seja f um homeomorfismo <strong>do</strong> círculo. Mostre que ρ (f q ) = q · ρ (f) mod Z. (Observe que, se<br />

F é um levantamento <strong>de</strong> f, então F q é um levantamento <strong>de</strong> f q ...)<br />

13.2 Teorema <strong>de</strong> classificação <strong>de</strong> Poincaré<br />

O número <strong>de</strong> rotação contém a seguinte informação acerca <strong>da</strong> dinâmica <strong>de</strong> f.<br />

Teorema.<br />

O número <strong>de</strong> rotação ρ (f) é racional sse f tem pontos periódicos.<br />

<strong>de</strong>m. ⇐ Se F q (x) = x + p com q e p inteiros, então F nq (x) − x = np para to<strong>do</strong> n, e portanto<br />

τ (F ) = p/q.<br />

⇒ Observan<strong>do</strong> que ρ (f q ) = q · ρ (f) mod Z, basta provar que ρ (f) = 0 implica que f tem um<br />

ponto fixo. Se f não tem pontos fixos, então a função F − id tem valores em R\Z. Em particuar,<br />

existe um levantamento tal que F −id tem valores no intervalo ]0, 1[ (porque F −id é contínua e o seu<br />

<strong>do</strong>mínio é conexo). Observan<strong>do</strong> que F −id é periódica <strong>de</strong> perío<strong>do</strong> um, <strong>de</strong>duzimos que o seu máximo<br />

e o seu mínimo são diferentes <strong>de</strong> 1 e 0 respetivamente, i.e. existe ε > 0 tal que ε < F (x) < 1 − ε<br />

para to<strong>do</strong> x ∈ [0, 1]. Iteran<strong>do</strong> as <strong>de</strong>sigual<strong>da</strong><strong>de</strong>s, isto implica que nε < F n (0) < n (1 − ε) e portanto<br />

que τ (F ) não é inteiro.<br />

É possível provar com pouco esforço que, se ρ (f) é racional, então to<strong>do</strong>s os pontos periódicos <strong>de</strong><br />

f têm o mesmo perío<strong>do</strong>. Portanto, para compreen<strong>de</strong>r a estrutura <strong>da</strong>s órbitas <strong>de</strong> um homeomorfismo<br />

com número <strong>de</strong> rotação racional é suficiente compreen<strong>de</strong>r as órbitas <strong>de</strong> um homeomorfismo f com<br />

pontos fixos. Se F = Fix (f), então f induzes homeomorfismos em ca<strong>da</strong> componente conexa I <strong>de</strong><br />

(R/Z) \F . As imagens f n (x) <strong>do</strong>s pontos x ∈ I ⊂ (R/Z) \F convergem para pontos <strong>de</strong> ∂I ⊂ F<br />

quan<strong>do</strong> n → ±∞. A estrutura <strong>de</strong> F é arbitrária: to<strong>do</strong> subconjunto compacto <strong>do</strong> círculo é o<br />

conjunto <strong>do</strong>s pontos fixos <strong>de</strong> um homeomorfismo.<br />

A dinâmica <strong>do</strong>s homeomorfismos com número <strong>de</strong> rotação irracional é <strong>de</strong>scrita pelo seguinte<br />

resulta<strong>do</strong>.<br />

Teorema <strong>de</strong> Poincaré. Seja f : R/Z → R/Z um homeomorfismo <strong>do</strong> círculo (que preserva a<br />

orientação) com número <strong>de</strong> rotação irracional. Então<br />

i) ou f é minimal, i.e. a órbita <strong>de</strong> to<strong>do</strong> ponto é <strong>de</strong>nsa no círculo,<br />

ii) ou existe um conjunto invariante K ⊂ R/Z, compacto, perfeito e com interior vazio (i.e.<br />

um conjunto <strong>de</strong> Cantor), tal que o conjunto ω-limite <strong>de</strong> to<strong>do</strong> ponto <strong>do</strong> círculo é igual a K.


13 HOMEOMORFISMOS DO CÍRCULO 85<br />

<strong>de</strong>m. Pelo lema <strong>de</strong> Zorn, a família <strong>do</strong>s subconjuntos não vazios <strong>do</strong> círculo que são compactos<br />

e invariantes, parcialmente or<strong>de</strong>na<strong>da</strong> pela inclusão, admite um elemento minimal K. Pela<br />

minimali<strong>da</strong><strong>de</strong>, a órbita <strong>de</strong> to<strong>do</strong> ponto <strong>de</strong> K é <strong>de</strong>nsa em K. A fronteira ∂K e o conjunto <strong>de</strong>riva<strong>do</strong><br />

K ′ são compactos, invariantes e conti<strong>do</strong>s em K, logo têm que ser vazios ou iguais a K. O<br />

homemorfismo não tem pontos periódicos, logo K não po<strong>de</strong> ser finito. Pelo teorema <strong>de</strong> Bolzano-<br />

Weierstrass K ′ ≠ ∅, logo K ′ = K, i.e. K é perfeito. Se ∂K = ∅, então K = R/Z e portanto f<br />

é minimal. Se, por outro la<strong>do</strong>, ∂K = K, então K tem interior vazio. Seja x ∈ (R/Z) \K e seja<br />

I a componente conexa <strong>de</strong> (R/Z) \K que contém x. As imagens f n (I) são <strong>do</strong>is a <strong>do</strong>is disjuntas<br />

(sempre porque f não tem pontos periódicos), e portanto diam (f n (I)) → 0 quan<strong>do</strong> n → ∞. Se<br />

x ′ ∈ ∂I ⊂ K, então ω f (x ′ ) = K, e a observação anterior implica que também ω f (x) = K, pois<br />

d (f n (x), f n (x ′ )) ≤ diam (f n (I)) → 0 quan<strong>do</strong> n → ∞. Em particular, isto mostra que o conjunto<br />

minimal K é único.<br />

Mais interessante ain<strong>da</strong> é o seguinte resulta<strong>do</strong>.<br />

Teorema <strong>de</strong> classificação <strong>de</strong> Poincaré. Seja f : R/Z → R/Z um homeomorfismo <strong>do</strong> círculo<br />

(que preserva a orientação) com número <strong>de</strong> rotação irracional.<br />

i) Se f é minimal, então f é topologicamente conjuga<strong>do</strong> à rotação +ρ (f).<br />

ii) Se f não é minimal, então a rotação +ρ (f) é um fator <strong>de</strong> f.<br />

Se f é minimal, po<strong>de</strong>mos construir uma conjugação H entre uma órbita <strong>de</strong> f e uma órbita <strong>de</strong><br />

+ρ (f), e <strong>de</strong>pois <strong>de</strong>finir uma conjugação h : R/Z → R/Z por continui<strong>da</strong><strong>de</strong>, utilizan<strong>do</strong> o fato <strong>da</strong>s<br />

órbitas serem <strong>de</strong>nsas. Isto é possível porque as órbitas <strong>de</strong> f têm “a mesma or<strong>de</strong>m” <strong>da</strong>s órbitas <strong>de</strong><br />

+ρ (f). Se f não é minimal, é possível construir uma semiconjugação h : R/Z → R/Z tal que o<br />

próprio R/Z seja a imagem h (K) <strong>do</strong> conjunto minimal <strong>de</strong> f. De alguma maneira, a semiconjugação<br />

“esquece” (R/Z) \K, o conjunto errante <strong>de</strong> f.<br />

13.3 Difeomorfismos <strong>do</strong> círculo e teorema <strong>de</strong> Denjoy<br />

Um homeomorfismo f : R/Z → R/Z com número <strong>de</strong> rotação irracional po<strong>de</strong> não ser minimal,<br />

logo ter um conjunto não errante (R/Z) \K, composto por intervalos abertos I com imagens f n (I)<br />

disjuntas. Se f é <strong>de</strong> classe C 1 , um controle sobre a <strong>de</strong>riva<strong>da</strong> f ′ e o teorema <strong>do</strong> valor médio aju<strong>da</strong>m<br />

a estimar os comprimentos <strong>do</strong>s f n (I). O resulta<strong>do</strong>, obti<strong>do</strong> por Arnaud Denjoy nos anos ’30, é o<br />

seguinte.<br />

Teorema <strong>de</strong> Denjoy. Um homeomorfismo f : R/Z → R/Z com número <strong>de</strong> rotação irracional,<br />

<strong>de</strong> classe C 1 e com <strong>de</strong>riva<strong>da</strong> <strong>de</strong> variação limita<strong>da</strong>, é minimal, e portanto topologicamente conjuga<strong>do</strong><br />

à rotação +ρ (f).<br />

A i<strong>de</strong>ia é provar que, se f ′ tem variação limita<strong>da</strong> e I é um “intervalo errante”, os comprimentos<br />

<strong>do</strong>s f n (I) são uniformemente > ε para algum ε > 0. Sen<strong>do</strong> disjuntos, isto leva a um absur<strong>do</strong>. O<br />

próprio Denjoy mostrou como construir homeomorfismos <strong>de</strong> classe C 1 , com <strong>de</strong>riva<strong>da</strong> f ′ <strong>de</strong> classe<br />

α-Hol<strong>de</strong>r e α < 1 arbitrário, que têm número <strong>de</strong> rotação irracional sem seres minimais.<br />

Problema. Discuta a dinâmica <strong>da</strong> família <strong>de</strong> tranformações <strong>do</strong> círculo f α,ε : R/Z → R/Z <strong>do</strong> it<br />

<strong>de</strong>fini<strong>da</strong>s por<br />

x + Z ↦→ x + α + ε sin (2πx) + Z<br />

2π<br />

ao variar os parâmetros α e ε.


14 PERDA DE MEMÓRIA E INDEPENDÊNCIA ASSIMPTÓTICA 86<br />

14 Per<strong>da</strong> <strong>de</strong> memória e in<strong>de</strong>pendência assimptótica<br />

14.1 Órbitas <strong>de</strong>sor<strong>de</strong>na<strong>da</strong>s<br />

Dicotomia: pontos regulares ou não regulares. Seja f : X → X uma transformação <strong>do</strong><br />

espaço métrico (X, d). As iterações <strong>de</strong> f divi<strong>de</strong>m <strong>de</strong> maneira natural o espaço X em duas classes<br />

<strong>de</strong> pontos, <strong>de</strong>pen<strong>de</strong>n<strong>do</strong> se as órbitas são “estáveis” ou “instáveis” por pequenas perturbações <strong>da</strong><br />

condição inicial.<br />

O ponto x ∈ X é regular se a família <strong>de</strong> transformações {f n } n∈N0 é equicontínua em x, ou seja,<br />

se para to<strong>do</strong> ε > 0 existe uma vizinhança B <strong>de</strong> x tal que para to<strong>do</strong> x ′ ∈ B e to<strong>do</strong> tempo n ≥ 0<br />

d (f n (x) , f n (x ′ )) < ε<br />

Do ponto <strong>de</strong> vista físico isto quer dizer que, se os instrumentos têm sensibili<strong>da</strong><strong>de</strong> ε, as trajetórias<br />

<strong>de</strong> apenas um ponto em ca<strong>da</strong> ε-bola são suficientes para <strong>de</strong>screver to<strong>da</strong>s as trajetórias <strong>do</strong>s pontos<br />

regulares. Em particular, se X é compacto e to<strong>do</strong> ponto é regular, um número finito <strong>de</strong> trajetórias<br />

<strong>de</strong>screve o comportamento <strong>de</strong> to<strong>da</strong>s as trajetórias a menos <strong>de</strong> um erro ε, por tempos arbitrariamente<br />

gran<strong>de</strong>s.<br />

O ponto x ∈ X não é regular se existe δ > 0 tal que para quaisquer vizinhança B <strong>de</strong> x existem<br />

x ′ ∈ B e um tempo n ≥ 0 tais que<br />

d (f n (x) , f n (x ′ )) > δ<br />

O significa<strong>do</strong> <strong>de</strong>sta condição é que f “tem <strong>de</strong>pendência sensível <strong>da</strong>s condições iniciais” nas vizinhanças<br />

<strong>de</strong> x. Num certo senti<strong>do</strong>, as trajetórias <strong>de</strong> pontos numa vizinhança arbitrária <strong>de</strong> x<br />

“per<strong>de</strong>m memória” <strong>de</strong> x.<br />

Dependência sensível <strong>da</strong>s condições iniciais. Se o conjunto <strong>do</strong>s pontos não regulares for<br />

compacto, o δ acima po<strong>de</strong> ser escolhi<strong>do</strong> in<strong>de</strong>pen<strong>de</strong>nte <strong>do</strong> ponto. Isto sugere a seguinte <strong>de</strong>finição.<br />

A transformação f : X → X tem <strong>de</strong>pendência sensível <strong>da</strong>s condições iniciais se to<strong>do</strong>s os pontos<br />

<strong>de</strong> X são “uniformemente” não regulares, ou seja, se existe δ > 0 tal que para to<strong>do</strong> x ∈ X e to<strong>da</strong><br />

vizinhança B <strong>de</strong> x, existem x ′ ∈ B e um tempo n ≥ 0 tais que<br />

d (f n (x ′ ) , f n (x)) > δ<br />

O significa<strong>do</strong> físico <strong>de</strong>ste fenómeno é: não inporta quanto pequena seja a sensibili<strong>da</strong><strong>de</strong> ε <strong>do</strong>s nossos<br />

instrumentos, as trajetórias <strong>de</strong> <strong>do</strong>is pontos x e x ′ que nos consi<strong>de</strong>ramos “indistinguíveis” (ou seja<br />

a distância d(x, x ′ ) < ε) distam mais <strong>de</strong> um certo δ, in<strong>de</strong>pen<strong>de</strong>nte <strong>de</strong> ε, passa<strong>do</strong> um certo tempo<br />

n.<br />

Conjuntos <strong>de</strong> Julia e <strong>de</strong> Fatou. A dicotomia acima é particularmente significativa para os<br />

en<strong>do</strong>morfismos <strong>da</strong> esfera <strong>de</strong> Riemann C = C∪{∞}, as transformações racionais f : C→C, <strong>de</strong>fini<strong>da</strong>s<br />

por<br />

z ↦→ f(z) = p (z) /q (z)<br />

on<strong>de</strong> q e q são polinómios. Um ponto z ∈ C é dito “regular” se admite uma vizinhança U tal que a<br />

família {f n | U } n≥1 é uma família normal (i.e. to<strong>da</strong> sucessão <strong>de</strong> elementos <strong>da</strong> família admite uma<br />

subsucessão localmente uniformemente convergente). O conjunto F <strong>do</strong>s pontos regulares, que é um<br />

subconjunto aberto <strong>da</strong> esfera <strong>de</strong> Riemann, é dito conjunto <strong>de</strong> Fatou. O conjunto complementar,<br />

o fecha<strong>do</strong> J = C\F , é dito conjunto <strong>de</strong> Julia. O conjunto <strong>de</strong> Julia é on<strong>de</strong> acontece a dinâmica<br />

“<strong>de</strong>sor<strong>de</strong>na<strong>da</strong>” <strong>de</strong> f. Se a transformação é <strong>da</strong> forma f (z) = z n com n > 1 (ou conformemente<br />

conjuga<strong>da</strong> a um polinómio <strong>de</strong>ste tipo), então J é um círculo. Se f é mais complica<strong>do</strong>, acontece que<br />

J é tipicamente um conjunto muito irregular: um conjunto <strong>de</strong> Cantor, uma curva não retificável<br />

<strong>de</strong> dimensão <strong>de</strong> Haus<strong>do</strong>rff > 1, ou um conjunto ain<strong>da</strong> mais esquisito. O estu<strong>do</strong> <strong>de</strong>stes fenómenos<br />

começou por volta <strong>de</strong> 1918-19, com os trabalhos <strong>de</strong> Gaston Julia e Pierre Fatou. A compreensão <strong>da</strong><br />

dinâmica <strong>do</strong>s en<strong>do</strong>morfismos <strong>da</strong> esfera <strong>de</strong> Riemann (<strong>de</strong>vi<strong>da</strong> essencialmente às técnicas disponíveis<br />

<strong>de</strong> análise complexa) é um <strong>do</strong>s maiores sucessos <strong>da</strong> mo<strong>de</strong>rna teoria <strong>do</strong>s sistemas dinâmicos. Uma<br />

introdução excelente está nas notas <strong>de</strong> John Milnor, Dynamics in one complex variable, IMS-SUNY<br />

Stony Brook 1990.


14 PERDA DE MEMÓRIA E INDEPENDÊNCIA ASSIMPTÓTICA 87<br />

14.2 Mixing topológico<br />

Transformações mixing. A transformação f : X → X é topologicamente mixing (ou seja,<br />

“mistura<strong>do</strong>ra”) se para ca<strong>da</strong> <strong>do</strong>is abertos não vazios U, V ⊂ X existe um tempo n ≥ 0 tal que para<br />

to<strong>do</strong> tempo k ≥ n<br />

f k (U) ∩ V ≠ ∅<br />

(ou seja, basta esperar um certo tempo finito n para ver pontos <strong>de</strong> U cujas órbitas visitam V ).<br />

O mixing topológico captura a i<strong>de</strong>ia <strong>de</strong> que o futuro f k (U), com k > 1, <strong>de</strong> ca<strong>da</strong> aberto U é<br />

“assimptoticamente in<strong>de</strong>pen<strong>de</strong>nte” <strong>do</strong> seu presente, pois interseta estavelmente ca<strong>da</strong> outro aberto<br />

não vazio V .<br />

(mixing ⇒ +transitivo) Uma transformação topologicamente mixing é topologicamente +transitiva.<br />

Em particular, NW f = X, e ω f (x) = X é uma proprie<strong>da</strong><strong>de</strong> genérica.<br />

(mixing ⇒ <strong>de</strong>pendência sensível) O mixing topológico é uma proprie<strong>da</strong><strong>de</strong> ain<strong>da</strong> mais forte<br />

<strong>de</strong> que a <strong>de</strong>pendência sensível <strong>da</strong>s condições iniciais. Pois, seja f : X → X uma transformação<br />

topologicamente mixing <strong>do</strong> espaço métrico (X, d) com pelo menos <strong>do</strong>is pontos, e sejam U e V <strong>do</strong>is<br />

abertos disjuntos a distância > 2δ, com δ > 0. Da<strong>do</strong> x ∈ X, a órbita <strong>de</strong> to<strong>da</strong> vizinhança B <strong>de</strong> x<br />

interseta os <strong>do</strong>is abertos a partir <strong>de</strong> um certo tempo n ≥ 0, e portanto existe um ponto x ′ ∈ B tal<br />

que d (f n (x ′ ) , f n (x)) > δ.<br />

Em particular, uma isometria não po<strong>de</strong> ser topologicamente mixing.<br />

Desafios.<br />

• Existe um homeomorfismo minimal (portanto topologicamente transitivo) que não é topologicamente<br />

mixing<br />

• Existe uma transformação topologicamente transitiva que não é nem minimal nem topologicamente<br />

mixing<br />

• Uma transformação f : X → X é dita weakly mixing se a ”transformação produto” f × f :<br />

X × X → X × X, <strong>de</strong>fini<strong>da</strong> por<br />

(x, x ′ ) ↦→ (f (x) , f (x ′ ))<br />

é topologicamente mixing. Mostre que uma transformação weak mixing (<strong>de</strong> um espaço X<br />

que contém mais <strong>do</strong> que um ponto) tem <strong>de</strong>pendência sensível <strong>da</strong>s condições iniciais. Mostre<br />

que to<strong>da</strong>s as itera<strong>da</strong>s f n <strong>de</strong> uma transformação weak mixing <strong>de</strong> um espaço compacto são<br />

+transitivas. Prove que<br />

mixing ⇒ weak mixing ⇒<br />

+ transitivo<br />

e dê exemplos que mostram que as implicações contrárias são falsas.<br />

Transformação ten<strong>da</strong>.<br />

por<br />

A transformação ten<strong>da</strong> 28 é a transformação T : [0, 1] → [0, 1] <strong>de</strong>fini<strong>da</strong><br />

T (x) =<br />

{ 2x se x < 1/2<br />

2 − 2x se x ≥ 1/2<br />

28 Um pa<strong>de</strong>iro estica, <strong>do</strong>bra e amassa repeti<strong>da</strong>mente a sua massa com o objetivo <strong>de</strong> ”misturar”, ou seja <strong>de</strong> chegar<br />

a ter uma mistura <strong>de</strong> farinha e água e outros ingredientes que seja o quanto mais possível homogénea... Isto é mais<br />

ou menos o que faz a transformação ten<strong>da</strong>. Por alguma razão, o nome <strong>de</strong> transformação <strong>do</strong> pa<strong>de</strong>iro é reserva<strong>do</strong> ao<br />

seu análogo bidimensional e invertível.


14 PERDA DE MEMÓRIA E INDEPENDÊNCIA ASSIMPTÓTICA 88<br />

Cobweb diagram of the tent map.<br />

A iteração <strong>de</strong> T é simples, pois a composição <strong>de</strong> duas transformações afins é uma transformação<br />

afin.<br />

Não é difícil provar por indução que em ca<strong>da</strong> um <strong>do</strong>s intervalos I k,n = [ ]<br />

k<br />

2<br />

, k+1<br />

n 2 com k =<br />

n<br />

0, 1, 2, ..., 2 n − 1 a transformação T n tem a forma<br />

{<br />

x ↦→ T n 2<br />

(x) =<br />

n x + k se k é par<br />

−2 n x + k + 1 se k é impar<br />

Em particular, T n é uma bijeção estritamente crescente ou <strong>de</strong>crescente <strong>de</strong> I k,n sobre o intervalo<br />

[0, 1]. O teorema <strong>de</strong> ponto fixo implica que T n tem um e um único ponto fixo em ca<strong>da</strong> um <strong>do</strong>s<br />

intervalos I k,n (que é repulsivo, pois a <strong>de</strong>riva<strong>da</strong> <strong>de</strong> T n é 2 n > 1, e só coinci<strong>de</strong> com um <strong>do</strong>s extremos<br />

quan<strong>do</strong> k = 0), e portanto que |Fix(T n )| = 2 n . Além disso, sen<strong>do</strong> que to<strong>do</strong> aberto não vazio<br />

U ⊂ [0, 1] contém um <strong>do</strong>s intervalos I k,n se n é suficientemente gran<strong>de</strong>, os pontos periódicos <strong>de</strong> T<br />

são <strong>de</strong>nsos no intervalo [0, 1].<br />

A transformação T é topologicamente mixing. De fato, to<strong>do</strong> aberto não vazio U ⊂ [0, 1] contém<br />

um <strong>do</strong>s intervalos I k,n com n suficientemente gran<strong>de</strong>, logo T n (U) = [0, 1] e portanto T k (U) = [0, 1]<br />

para to<strong>do</strong> tempo k ≥ n porque T é sobrejetiva. Isto implica que T k (U) ∩ V ≠ ∅ para to<strong>do</strong> tempo<br />

k ≥ n e para to<strong>do</strong> aberto não vazio V ⊂ [0, 1]. Portanto existe um conjunto residual (i.e. gran<strong>de</strong>!)<br />

<strong>de</strong> pontos x tais que ω f (x) = [0, 1], ou seja cuja trajetória é essencialmente imprevisível!<br />

Exercícios.<br />

• Verifique que h : x ↦→ sin 2 (πx/2) realiza uma conjugação topológica entre a transformação<br />

ten<strong>da</strong> T e a transformação f 4 : [0, 1] → [0, 1] <strong>da</strong> família quadrática, <strong>de</strong>fini<strong>da</strong> por f 4 (x) =<br />

4x (1 − x). Deduza ....<br />

• Discuta a dinâmica <strong>da</strong> transformação S : [0, 1] → [0, 1] <strong>de</strong>fini<strong>da</strong> por<br />

{<br />

2x se x < 1/2<br />

S(x) =<br />

2x − 1 se x ≥ 1/2<br />

Cui<strong>da</strong><strong>do</strong>, S não é contínua!, mas não é muito diferente <strong>da</strong> transformação ten<strong>da</strong>...


14 PERDA DE MEMÓRIA E INDEPENDÊNCIA ASSIMPTÓTICA 89<br />

14.3 Dinâmica <strong>do</strong>s <strong>de</strong>slocamentos <strong>de</strong> Bernoulli<br />

O <strong>de</strong>slocamento <strong>de</strong> Bernoulli σ : Σ + → Σ + sobre um alfabeto finito X = {1, 2, ..., z} é o protótipo<br />

<strong>de</strong> uma transformação topologicamente mixing, e tem to<strong>da</strong>s as proprie<strong>da</strong><strong>de</strong>s típicas <strong>de</strong>sta classe<br />

<strong>de</strong> transformações.<br />

Uma base <strong>da</strong> topologia produto em Σ + = X N é a família <strong>do</strong>s “cilindros centra<strong>do</strong>s”, a família<br />

<strong>do</strong>s subconjuntos C α = {x = (α, ∗)} =“palavras infinitas que começam pela palavra α”, ao variar<br />

α entre to<strong>da</strong>s as palavras finitas nas letras <strong>do</strong> alfabeto X. Ora, se U ⊂ Σ + é um aberto não vazio,<br />

existe um cilindro centra<strong>do</strong> C α ⊂ U, e, se |α| <strong>de</strong>nota o comprimento <strong>da</strong> palavra α, é imediato ver<br />

que σ n (C α ) = Σ + para to<strong>do</strong> n ≥ |α|, logo a fortiori σ n (U) interseta to<strong>do</strong> aberto não vazio a partir<br />

<strong>do</strong> tempo |α|. Isto prova que σ é topologicamente mixing.<br />

Sen<strong>do</strong> σ topologicamente mixing, logo +transitiva, um ponto genérico <strong>de</strong> Σ + tem órbita <strong>de</strong>nsa.<br />

Uma curiosi<strong>da</strong><strong>de</strong> é que neste exemplo é <strong>de</strong> fato imediato “construir” um ponto com órbita<br />

<strong>de</strong>nsa. Basta enumerar o conjunto <strong>da</strong>s palavras finitas nas letras <strong>de</strong> X, por exemplo α 1 , α 2 , α 3 , ...<br />

, e <strong>de</strong>pois observar que a trajetória <strong>do</strong> ponto x = (α 1 , α 2 , α 3 , ...) passa por to<strong>do</strong>s os elementos <strong>da</strong><br />

base <strong>da</strong> topologia.<br />

Menos obvio é construir um ponto x tal que ω σ (x) = Σ + , que também sabemos ser uma<br />

proprie<strong>da</strong><strong>de</strong> genérica! Um exemplo é o ponto<br />

x = (α 1 , α 1 , α 2 , α 1 , α 2 , α 3 , α 1 , α 2 , α 3 , α 4 , α 1 , α 2 , α 3 , α 4 , α 5 , ...)<br />

cuja trajetória passa infinitas vezes por to<strong>do</strong>s os elementos <strong>da</strong> base <strong>da</strong> topologia.<br />

O shift <strong>de</strong> Bernoulli tem também muitos pontos periódicos. Per f é um conjunto enumerável e<br />

<strong>de</strong>nso em Σ + . De fato, <strong>da</strong><strong>da</strong> uma palavra finita α arbitrária, o ponto x = (α, α, α, ...) é periódico,<br />

e o seu perío<strong>do</strong> é um inteiro positivo que divi<strong>de</strong> |α|. Isto prova que a cardinali<strong>de</strong> <strong>de</strong> Fix (σ n ) é igual<br />

a cardinali<strong>da</strong><strong>de</strong> <strong>da</strong>s palavras <strong>de</strong> comprimento n nas letras <strong>do</strong> alfabeto X. Além disso, to<strong>do</strong> cilindro<br />

centra<strong>do</strong> contém um ponto periódico, pois C α contém (α, α, α, ...), logo os pontos periódicos são<br />

<strong>de</strong>nsos em Σ + .<br />

Além <strong>de</strong> pontos periódicos e <strong>de</strong> pontos cuja órbita é <strong>de</strong>nsa, o shift <strong>de</strong> Bernoulli admite pontos<br />

cuja órbita é <strong>de</strong>nsa em subconjuntos próprios <strong>de</strong> Σ + . Por exemplo, a restrição <strong>de</strong> σ ao subconjunto<br />

(X\ {1}) N ⊂ Σ + forma<strong>do</strong> pelas palavras infinitas que não contêm a letra “1” é uma transformação<br />

topologicamente mixing (basta repetir a <strong>de</strong>monstração anterior), logo um ponto genérico x ∈<br />

(X\ {1}) N tem órbita <strong>de</strong>nsa em (X\ {1}) N ...<br />

Exercícios.<br />

• Discuta em <strong>de</strong>talhes a dinâmica <strong>do</strong> <strong>de</strong>slocamento <strong>de</strong> Bernoulli. Consi<strong>de</strong>re o produto cartesiano<br />

Σ + = X N , on<strong>de</strong> X = {1, 2, ..., z} é um alfabeto finito. Verifique que a familia <strong>do</strong>s<br />

cilindros centra<strong>do</strong>s é uma base <strong>de</strong> uma topologia em Σ + , dita topologia produto.<br />

Verifique que o shift <strong>de</strong> Bernoulli σ : Σ + → Σ + sobre um alfabeto finito é uma transformação<br />

contínua<br />

(observe que a imagem inversa <strong>de</strong> um cilindro centra<strong>do</strong> é uma reunião finita <strong>de</strong> z cilindros<br />

centra<strong>do</strong>s, e <strong>de</strong>duza que a imagem inversa <strong>de</strong> um aberto é um aberto).<br />

Prove que σ : Σ + → Σ + é uma transformação expansora se a métrica em Σ + é <strong>de</strong>fini<strong>da</strong> por<br />

d(x, x ′ ) = ∑ ∞<br />

n=1 λ−n · |x n − x ′ n|, on<strong>de</strong> λ > 1.<br />

Mostre que |Fix(σ n )| = |X| n .<br />

Mostre que to<strong>do</strong> cilindro centra<strong>do</strong> <strong>de</strong> Σ + contém um ponto periódico <strong>de</strong> σ, e que portanto o<br />

conjunto <strong>do</strong>s pontos periódicos Per σ é <strong>de</strong>nso em Σ + .<br />

Prove que σ : Σ + → Σ + é topologicamente mixing.<br />

Dê exemplos <strong>de</strong> pontos x ∈ Σ + tais que ω σ (x) = X.<br />

De exemplos <strong>de</strong> pontos não pré-periódicos x ∈ Σ + tais que tais que a a<strong>de</strong>rência <strong>da</strong> órbita<br />

O + σ (x) seja um subconjunto próprio <strong>de</strong> Σ + .


14 PERDA DE MEMÓRIA E INDEPENDÊNCIA ASSIMPTÓTICA 90<br />

• Seja Σ = X Z , o espaço <strong>da</strong>s palavras infinitas x = (..., x −2 , x −1 , x 0 x 1 , x 2 , ..., x n , ...) nas letras<br />

<strong>do</strong> alfabeto finito X = {1, 2, ..., z}, muni<strong>do</strong> <strong>da</strong> topologia produto. Verifique que o shift<br />

σ : Σ → Σ, <strong>de</strong>fini<strong>do</strong> por (σ (x)) k<br />

= x k+1 , é um homeomorfismo.<br />

Determine a cardinali<strong>da</strong><strong>de</strong> <strong>de</strong> Fix (σ n ), e prove que os pontos periódicos são <strong>de</strong>nsos em Σ.<br />

Prove que σ : Σ → Σ é topologicamente mixing.<br />

Ca<strong>de</strong>ias <strong>de</strong> Markov topológicas e codificação. A restrição <strong>do</strong> shift σ a um subconjunto<br />

invariante <strong>de</strong> Σ + (ou Σ) é dita um sistema dinâmico simbólico. A maneira mais simples <strong>de</strong> produzir<br />

subconjuntos invariantes é por meio <strong>de</strong> matrizes <strong>de</strong> transição (a i<strong>de</strong>ia vem <strong>da</strong> teoria <strong>da</strong>s ca<strong>de</strong>ias <strong>de</strong><br />

Markov). Seja A = (a ij ) uma ”matiz <strong>de</strong> transição”, ou seja uma matriz z × z com entra<strong>da</strong>s 0 ou<br />

1. Seja<br />

Σ + A = { x ∈ Σ + t.q. a xnx n+1<br />

= 1 ∀ n ≥ 0 }<br />

E facil <strong>de</strong> ver que σ ( Σ + ) A ⊂ Σ<br />

+<br />

A . A restrição σ A = σ ∣ Σ<br />

+ : Σ + A → Σ+ A é dita ca<strong>de</strong>ias <strong>de</strong> Markov<br />

A<br />

topológicas (ou subshift of finite type). A i<strong>de</strong>ia é que o alfabeto representa os possíveis ”esta<strong>do</strong>s”<br />

<strong>do</strong> sistema, e a “transição” entre o esta<strong>do</strong> i e o esta<strong>do</strong> j é possível se a ij = 1.<br />

Uma palavra finita x 1 , x 2 , ..., x n é admissivel se a xk x k+1<br />

= 1 para to<strong>do</strong>s k = 1, 2, ..., n − 1,<br />

i.e. se é um pe<strong>da</strong>ço <strong>de</strong> uma história possível <strong>do</strong> esta<strong>do</strong> x 1 . O número <strong>de</strong> palavras admissiveis <strong>de</strong><br />

comprimento n + 1 que começam pela letra i e terminam pela letra j é igual a (A n ) ij<br />

. Isto mostra<br />

que |Fix (σA n)| = trAn . Este número po<strong>de</strong> ser estima<strong>do</strong> utilizan<strong>do</strong> o teorema <strong>de</strong> Perron-Frobenius.<br />

A ca<strong>de</strong>ia <strong>de</strong> Markov topológica σ A é dita transitiva se existe um tempo k ≥ 1 tal que to<strong>da</strong>s as<br />

entra<strong>da</strong>s <strong>de</strong> A k (e portanto as entra<strong>da</strong>s <strong>de</strong> A n se n ≥ k) são positivas. O resulta<strong>do</strong> relevante é que<br />

uma ca<strong>de</strong>ia <strong>de</strong> Markov topológica transitiva é topologicamente mixing, e tem órbitas periódicas<br />

<strong>de</strong>nsas.<br />

Os sistemas dinâmicos simbólicos são mo<strong>de</strong>los abstratos <strong>de</strong> sistemas dinâmicos. Uma <strong>da</strong>s<br />

i<strong>de</strong>ias centrais <strong>da</strong> teoria é procurar “codificar” um sistema ”concreto” f : X → X com um sistema<br />

simbólico. Uma estratégia possível é dividir X em subconjuntos fecha<strong>do</strong>s B 1 , B 2 , ..., B z tais que a<br />

historia <strong>de</strong> to<strong>do</strong> x ∈ X, <strong>de</strong>fini<strong>da</strong> por (x 0 , x 1 , x 2 , ..., x n , ...) on<strong>de</strong> x n = i sse f n (x) ∈ B i , <strong>de</strong>termina<br />

univocamente o ponto x. Então, se A = (a ij ) é a matriz <strong>de</strong> 0 e 1’s <strong>de</strong>fini<strong>da</strong> por a ij = 1 se<br />

B j ⊂ f(B i ), e se f é suficientemente “<strong>de</strong>sor<strong>de</strong>na<strong>da</strong>”, a ca<strong>da</strong> história (x 0 , x 1 , x 2 , ..., x n , ...) ∈ Σ + A<br />

correspon<strong>de</strong> um único ponto x = ∩ ∞ n=0f −n (B xn ). A esperança é que f seja conjuga<strong>do</strong> a σ A . Se<br />

X é conexo, os B i têm que ter interseções não vazias, e portanto a correspondência entre Σ + A e<br />

X não po<strong>de</strong> ser biunívoca. Mesmo assim, fora <strong>da</strong>s histórias ambíguas, a dinâmica <strong>de</strong> f é <strong>de</strong>scrita<br />

pela dinâmica <strong>de</strong> σ.<br />

Transformação <strong>de</strong> pa<strong>de</strong>iro. A transformação <strong>do</strong> pa<strong>de</strong>iro é f : [0, 1] × [0, 1] → [0, 1] × [0, 1]<br />

<strong>de</strong>fini<strong>da</strong> por<br />

{ (2x, y/2) se 0 ≤ x ≤ 1/2<br />

(x, y) ↦→<br />

(2x − 1, (y + 1) /2) se 1/2 < x ≤ 1<br />

Discuta a sua dinâmica. Consi<strong>de</strong>re o shift <strong>de</strong> Bernoulli σ : Σ → Σ no produto cartesiano Σ =<br />

{0, 1} Z . Mostre que a aplicação h : Σ → [0, 1] × [0, 1] <strong>de</strong>fini<strong>da</strong> por<br />

( ∞<br />

)<br />

∑ x ∞ −n<br />

x = (..., x −2 , x −1 , x 0 x 1 , x 2 , ..., x n , ...) ↦→<br />

2 n , ∑ x n<br />

2 n<br />

é uma semiconjugação entre σ e f. Deduza ...<br />

n=0<br />

n=1<br />

14.4 Conjuntos <strong>de</strong> Cantor<br />

As a<strong>de</strong>rências <strong>da</strong>s órbitas <strong>de</strong> transformações suficientemente “<strong>de</strong>sor<strong>de</strong>na<strong>da</strong>s” po<strong>de</strong>m ter uma estrutura<br />

complica<strong>da</strong>, e, se forem <strong>de</strong>sconexas, são tipicamente conjuntos <strong>de</strong> Cantor. Um conjunto <strong>de</strong><br />

Cantor é um espaço métrico compacto, perfeito e totalmente <strong>de</strong>sconexo.


14 PERDA DE MEMÓRIA E INDEPENDÊNCIA ASSIMPTÓTICA 91<br />

Middle-third Cantor set.<br />

set”)<br />

O arquétipo é o conjunto <strong>de</strong> Cantor stan<strong>da</strong>rd (“middle-third Cantor<br />

K =<br />

{ ∞<br />

∑<br />

n=1<br />

x n<br />

3 n com x n ∈ {0, 2}<br />

}<br />

⊂ [0, 1]<br />

o conjunto <strong>do</strong>s números entre 0 e 1 cuja representação em base 3 utiliza só as letras 0 e 2.<br />

Outra <strong>de</strong>finição é K = [0, 1]\∪ ∞ k=1 I k , on<strong>de</strong> os intervalos abertos I k são <strong>de</strong>fini<strong>do</strong>s iterativamente<br />

<strong>da</strong> seguinte maneira: I 1 é o terço central ]1/3, 2/3[ <strong>de</strong> [0, 1], I 2 e I 3 são os terços centrais <strong>do</strong>s<br />

intervalos <strong>de</strong> [0, 1] \ I 1 , a saber ]1/9, 2/9[ e ]7/9, 8/9[, ...etc.<br />

Mais uma <strong>de</strong>finição é K = ∩ k≥0 K n , on<strong>de</strong><br />

K n =<br />

{ ∞<br />

∑<br />

n=1<br />

x n<br />

3 n com x 1, x 2 , ..., x k ∈ {0, 2} e x i ∈ {0, 1, 2} se i > k<br />

Observe que ... ⊂ K n+1 ⊂ K n ⊂ ... ⊂ K 0 = [0, 1], e que ca<strong>da</strong> K n é uma reunião disjunta <strong>de</strong> 2 n<br />

intervalos fecha<strong>do</strong>s <strong>de</strong> comprimento 3 −n . Em particular, K é compacto, pois é uma interseção<br />

enumerável <strong>de</strong> compactos encaixa<strong>do</strong>s.<br />

As estranhas proprie<strong>da</strong><strong>de</strong>s <strong>do</strong> conjunto <strong>de</strong> Cantor tem <strong>de</strong>monstrações muito simples observan<strong>do</strong><br />

que K é homeomorfo ao produto topológico {0, 2} N , i.e. ao espaço <strong>do</strong> <strong>de</strong>slocamentos <strong>de</strong> Bernoulli<br />

num alfabeto <strong>de</strong> duas letras. O homeomorfismo é simplesmente<br />

{0, 2} N ∋ x = (x 1 , x 2 , ..., x n , ...) ↦→<br />

∞∑<br />

x n /3 n ∈ K<br />

K não tem pontos isola<strong>do</strong>s, e portanto K ′ = K, i.e. é perfeito. De fato, um ponto x ∈<br />

K pertençe a uma interseção ∩ n≥1 J n , on<strong>de</strong> J n = [a n , b n ] são certas componentes conexas <strong>do</strong>s<br />

compactos K n . Logo, pelo menos as duas sucessões distintas (a n ) e (b n ) <strong>de</strong> pontos <strong>de</strong> K convergem<br />

para x, pois |b n − a n | = 3 −n → 0 quan<strong>do</strong> n → ∞.<br />

A componente conexa <strong>de</strong> to<strong>do</strong> ponto x ∈ K é {x}, i.e. K é totalmente <strong>de</strong>sconexo. De fato,<br />

sejam x e x ′ <strong>do</strong>is pontos distintos <strong>de</strong> K. Se n é suficientemente gran<strong>de</strong>, i.e. se 3 −n < d (x, x ′ ), os<br />

pontos x e x ′ estão em duas componentes conexas distintas <strong>de</strong> K n .<br />

A função {0, 2} N → {0, 2} N × {0, 2} N <strong>de</strong>fini<strong>da</strong> por<br />

n=1<br />

(x 1 , x 2 , ..., x n , ...) ↦→ ((x 1 , x 3 , ..., x 2n−1 , ...), (x 2 , x 4 , ..., x 2n , ...))<br />

induz um homeomorfismo <strong>de</strong> K sobre K × K. Por indução, vê-se que K é homeomorfo a K n para<br />

to<strong>do</strong> n ∈ N. De fato, não é difícil provar que K é homeomorfo a K N .<br />

Observe que {0, 2} N é homeomorfo a {0, 1} N , e que a representação binária <strong>do</strong>s reais entre<br />

0 e 1 é uma aplicação contínua <strong>de</strong> {0, 1} N sobre o intervalo [0, 1]. Portanto, existe uma função<br />

contínua <strong>de</strong> K sobre o intervalo [0, 1], e em particular, pelo teorema <strong>de</strong> Schrö<strong>de</strong>r-Bernstein, K tem<br />

a cardinali<strong>da</strong><strong>de</strong> <strong>do</strong> intervalo.<br />

Outra proprie<strong>da</strong><strong>de</strong> muito aprecia<strong>da</strong> <strong>do</strong> conjunto <strong>de</strong> Cantor é a “auto-similari<strong>da</strong><strong>de</strong>”. Assim<br />

como um intervalo compacto <strong>da</strong> reta é homeomorfo a to<strong>do</strong> seu subintervalo (não trivial) compacto,<br />

o conjunto <strong>de</strong> Cantor K contém muitos subconjuntos próprios homeomorfos a K. Por exemplo,<br />

a aplicação x ↦→ 3x <strong>de</strong>fine um homeomorfismo <strong>de</strong> K ∩ [0, 1/3] sobre K (isto não é casual, mas<br />

tem muito a ver com a dinâmica <strong>da</strong> transformação ×3 no círculo). De fato, to<strong>do</strong> aberto não vazio<br />

<strong>do</strong> conjunto <strong>de</strong> Cantor contém uma “cópia” <strong>do</strong> próprio conjunto. Formalmente, to<strong>do</strong> intervalo<br />

aberto <strong>da</strong> reta I tal que I ∩ K ≠ ∅ contém um subconjunto J ⊂ I ∩ K homeomorfo a K. Pois,<br />

se um intervalo aberto contém um ponto <strong>de</strong> K, então contém pelo menos uma <strong>da</strong>s componentes<br />

conexas <strong>de</strong> K n , digamos J n = [a n , b n ], <strong>de</strong>s<strong>de</strong> que n seja suficientemente gran<strong>de</strong>. Não é difícil <strong>de</strong>pois<br />

arranjar um homeomorfismo (por exemplo afim, <strong>da</strong> forma x ↦→ 3 n (x − a n )) <strong>de</strong> J n sobre K.<br />

O “comprimento” (i.e. a medi<strong>da</strong> <strong>de</strong> Lebesgue) <strong>de</strong> K é<br />

|K| = lim<br />

n→∞ |K n| = lim<br />

n→∞ 2n · 3 −n = 0 .<br />

O conjunto <strong>de</strong> Cantor é “muito pequeno”, mesmo ten<strong>do</strong> “o mesmo número <strong>de</strong> pontos” <strong>do</strong> intervalo!<br />

}


14 PERDA DE MEMÓRIA E INDEPENDÊNCIA ASSIMPTÓTICA 92<br />

Cantor invariante pela família quadrática. Seja f λ : R → R a transformação <strong>de</strong>fini<strong>da</strong> por<br />

x ↦→ λx (1 − x), on<strong>de</strong> λ > 0. A trajetória <strong>do</strong>s pontos x /∈ I = [0, 1] diverge, <strong>de</strong> fato |fλ n (x)| → ∞<br />

quan<strong>do</strong> n → ∞. O conjunto <strong>do</strong>s pontos <strong>da</strong> reta que têm órbitas limita<strong>da</strong>s é<br />

Λ = ∩ n≥0 f −n<br />

λ<br />

(I)<br />

Se λ > 4, então f −1<br />

λ<br />

([0, 1]) é a reunião disjunta <strong>de</strong> <strong>do</strong>is intervalos fecha<strong>do</strong>s I 0 e I 1 conti<strong>do</strong>s em<br />

I. Se λ é suficientemente gran<strong>de</strong>, o módulo <strong>da</strong> <strong>de</strong>riva<strong>da</strong> f<br />

λ ′ é uniformemente > 1 nos pontos <strong>de</strong><br />

I 0 e I 1 . Mostre que, se λ é suficientemente gran<strong>de</strong>, f −(n+1)<br />

λ<br />

(I) é uma reunião disjunta <strong>de</strong> 2 n+1<br />

intervalos compactos estritamente conti<strong>do</strong>s, em pares, nos 2 n intervalos <strong>de</strong> f −n<br />

λ<br />

(I). Deduza que Λ<br />

é um conjunto <strong>de</strong> Cantor, e que a transformação f λ | Λ : Λ → Λ é topologicamente conjuga<strong>da</strong> ao<br />

shift <strong>de</strong> Bernoulli σ : Σ + → Σ + no alfabeto {0, 1}.<br />

14.5 Transformações expansoras<br />

A <strong>de</strong>pendência sensível <strong>da</strong>s condições iniciais po<strong>de</strong> ser induzi<strong>da</strong> por proprie<strong>da</strong><strong>de</strong>s mais fortes. Uma<br />

maneira obvia é “obrigar” f a esticar as distâncias, e isto po<strong>de</strong> ser feito <strong>de</strong> muita maneiras.<br />

Transformações expansoras. Uma transformação contínua f : X → X é expansiva se existe<br />

δ > 0 tal que para to<strong>do</strong>s x, x ′ ∈ X distintos existe um tempo n ≥ 0 tal que<br />

d(f n (x), f(x ′ )) > δ<br />

Uma transformação contínua f : X → X é expansora se existem µ > 1 e ε > 0 tais que para<br />

to<strong>do</strong>s x, x ′ ∈ X distintos com d(x, x ′ ) < ε<br />

d(f(x), f(x ′ )) > µ · d(x, x ′ )<br />

Esta é uma condição local, porque se ε fosse infinito nenhum espaço compacto admitiria transformações<br />

expansoras. Por outro la<strong>do</strong>, é precisamente nos espaços compactos que a expansivi<strong>da</strong><strong>de</strong><br />

causa recorrências interessantes <strong>da</strong>s trajetórias: os pontos querem fugir uns <strong>do</strong>s outros, mas não<br />

têm muito espaço por on<strong>de</strong> ir, e acabam se reencontran<strong>do</strong> <strong>de</strong> vez em quan<strong>do</strong>...<br />

A existência <strong>de</strong> transformações expansoras implica fortes restrições topológicas sobre o espaço<br />

X. Se X é uma varie<strong>da</strong><strong>de</strong>, o recobrimento universal <strong>de</strong> X tem que ser R n e o grupo fun<strong>da</strong>mental<br />

<strong>de</strong> X não po<strong>de</strong> ser arbitrário. Por exemplo, entre as superfícies fecha<strong>da</strong>s e orientáveis, só o toro<br />

admite transformações expansoras!<br />

Exercício. Dê exemplos <strong>de</strong> transformações expansoras <strong>de</strong> R, <strong>de</strong> R/Z e <strong>de</strong> R 2 /Z 2 .<br />

Desafios.<br />

• Prove que não existe nenhuma transformação expansiva f : I → I <strong>de</strong>fini<strong>da</strong> num intervalo<br />

compacto I ⊂ R. Observe que uma tal transformação seria localmente injetiva, logo estritamente<br />

crescente ou <strong>de</strong>crescente...<br />

• Uma transformação expansora <strong>de</strong> um espaço compacto po<strong>de</strong> ser um homeomorfismo A<br />

resposta é sim, mas só se o espaço compacto tiver cardinali<strong>da</strong><strong>de</strong> finita! Arranjar um exemplo<br />

não é difícil. Por outro la<strong>do</strong>, mostrar que um espaço compacto e infinito não admite<br />

homeomorfismos expansores não é trivial...<br />

Expansão <strong>de</strong>cimal. Seja F a função x ↦→ 10 · x <strong>de</strong>fini<strong>da</strong> na reta real. Mostre que ela “induz”<br />

uma transformação contínua f : R/Z → R/Z <strong>do</strong> círculo, por meio <strong>de</strong><br />

f (x + Z) = F (x) + Z<br />

(ou seja, mostre que esta expressão é in<strong>de</strong>pe<strong>de</strong>nte <strong>do</strong> representante x escolhi<strong>do</strong> para o ponto x + Z<br />

<strong>do</strong> círculo, e mostre que f é contínua).<br />

Mostre que f é expansora, se o círculo é muni<strong>do</strong> <strong>da</strong> métrica stan<strong>da</strong>rd her<strong>da</strong><strong>da</strong> <strong>da</strong> métrica<br />

euclidiana <strong>da</strong> reta. (Observe que, se d(x, x ′ ) < 1/20, então d(f(x), f(x ′ )) = 10 · d(x, x ′ ) ...)


14 PERDA DE MEMÓRIA E INDEPENDÊNCIA ASSIMPTÓTICA 93<br />

Seja x = 0, x 1 x 2 x 3 ..., com x n ∈ {0, 1, 2, ..., 9}, uma representação <strong>de</strong>cimal <strong>de</strong> x ∈ [0, 1[, pensa<strong>do</strong><br />

como um ponto <strong>de</strong> R/Z. Mostre que f(0, x 1 x 2 x 3 ... + Z) = 0, x 2 x 3 x 4 ... + Z.<br />

Procure os pontos fixos, periódicos, e pré-periódicos <strong>de</strong> f.<br />

Calcule a cardinali<strong>da</strong><strong>de</strong> <strong>de</strong> Fix(f n ). Mostre que os pontos periódicos <strong>de</strong> f são <strong>de</strong>nsos no círculo.<br />

Um número x é dito ”periódico” se a sua representação <strong>de</strong>cimal é <strong>da</strong> forma<br />

x = b n b n−1 ...b 0 .x 1 x 2 ...x n (a 1 a 2 ...a k )<br />

Existem número não periódicos Quantos Sabe fazer exemplos<br />

Mostre que, para to<strong>do</strong> ε > 0 e to<strong>do</strong> x ∈ R/Z, existem x ′ ∈ R/Z e um tempo n ≥ 0 tais que<br />

d(x, x ′ ) < ε e d(f n (x), f n (x ′ )) > 1/4<br />

ou seja, que a transformação f tem a proprie<strong>da</strong><strong>de</strong> <strong>de</strong> <strong>de</strong>pendência sensível <strong>da</strong>s condições iniciais.<br />

(Observe que, se d(x, x ′ ) < 1/2 · 10 −n , então d(f n (x), f n (x ′ )) = 10 n · d(x, x ′ ) ...)<br />

Mostre que, para to<strong>do</strong> intervalo não vazio I ⊂ R/Z, existe um tempo n ≥ 0 tal que f k (I) = R/Z<br />

para to<strong>do</strong> tempo k ≥ n. Deduza que f é topologicamente mixing.<br />

Seja b = (b 1 b 2 ...b n ) uma palavra finita no alfabeto {0, 1, 2, ..., 9}. Prove que existe um conjunto<br />

residual <strong>de</strong> pontos x ∈ [0, 1[ tais que a representação em base 10 <strong>de</strong> x contém a palavra b uma<br />

infini<strong>da</strong><strong>de</strong> <strong>de</strong> vezes (no senti<strong>do</strong> em que, se x é <strong>da</strong> forma 0.x 1 x 2 x 3 ...x k ..., existem uma infini<strong>da</strong><strong>de</strong> <strong>de</strong><br />

k ≥ 0 tais que (x k+1 x k+2 ...x k+n ) = (b 1 b 2 ...b n )). Prove que existe um conjunto residual <strong>de</strong> pontos<br />

x ∈ [0, 1[ tais que a representação em base 10 <strong>de</strong> x contém to<strong>da</strong>s as palavras finitas no alfabeto<br />

{0, 1, 2, ..., 9} uma infini<strong>da</strong><strong>de</strong> <strong>de</strong> vezes. Dê exemplos.<br />

(Emile Borel provou um teorema muito mais forte: o conjunto <strong>do</strong>s números x ∈ [0, 1[ tais que<br />

a representação em base 10 <strong>de</strong> x contém ca<strong>da</strong> palavra finita b com frequência assimptótica igual a<br />

1 sobre o comprimento <strong>de</strong> b tem probabili<strong>da</strong><strong>de</strong> (medi<strong>da</strong> <strong>de</strong> Lebesgue) igual a 1. Veja a observação<br />

sobre números normais no capítulo sobre a ergodici<strong>da</strong><strong>de</strong>.)<br />

Transformações expansoras <strong>do</strong> círculo Seja λ um inteiro tal que |λ| > 1. A transformação<br />

expansora stan<strong>da</strong>rd <strong>de</strong> grau λ é a transformação ×λ : R/Z → R/Z, <strong>de</strong>fini<strong>da</strong> por<br />

x + Z ↦→ λ · x + Z<br />

A transformação ×λ é topologicamente mixing. De fato, to<strong>do</strong> aberto não vazio U ⊂ R/Z<br />

contêm um intervalo I <strong>de</strong> comprimento |I| > |λ| −n , para algum n suficientemente gran<strong>de</strong>, e<br />

(×λ) k (I) = R/Z para to<strong>do</strong> tempo k ≥ n.<br />

A transformação ×λ tem um conjunto enumerável e <strong>de</strong>nso <strong>de</strong> pontos periódicos.<br />

A transformação ×λ é um fator <strong>do</strong> shift <strong>de</strong> Bernoulli sobre um alfabeto <strong>de</strong> |λ| letras (e o<br />

conjunto on<strong>de</strong> a semicojugação falha <strong>de</strong> ser injetiva é pequeno!).<br />

As transformações expansoras, além <strong>de</strong> pontos periódicos <strong>de</strong>nsos e <strong>de</strong> órbitas <strong>de</strong>nsas, admitem<br />

trajetórias que se acumulam em conjuntos bem mais complica<strong>do</strong>s. Por exemplo, a transformação<br />

×3 preserva o conjunto <strong>de</strong> Cantor stan<strong>da</strong>rd K (pensa<strong>do</strong> como um subconjunto <strong>do</strong> círculo), i.e.<br />

×3(K) ⊂ K. Agora, a restrição ×3 | K : K → K é topologicamente conjuga<strong>da</strong> ao shift <strong>de</strong> Bernoulli<br />

σ : Σ + → Σ + sobre o alfabeto {0, 2} (quase!, <strong>de</strong> fato é um fator, pois a semiconjugação obvia não<br />

é injetiva no ponto (2, 2, 2, 2, ...), que é igual a (0, 0, 0, 0, ...) mod 1), que é topologicamente mixing,<br />

logo existem (e muitos!) pontos <strong>de</strong> K ⊂ R/Z cuja ×3-órbita é <strong>de</strong>nsa em K.<br />

Transformações expansoras não lineares. Seja agora f : R/Z → R/Z uma transformação<br />

expansora <strong>de</strong> classe C 1 , ou seja tal que um seu levantamento F : R → R é <strong>de</strong> classe C 1 . Sen<strong>do</strong><br />

F ′ uma função periódica <strong>de</strong> perío<strong>do</strong> um, a expansivi<strong>da</strong><strong>de</strong> <strong>de</strong> f implica que existe µ > 1 tal que<br />

|F ′ (x)| > µ em to<strong>do</strong> x ∈ R, e que F ′ não mu<strong>da</strong> <strong>de</strong> sinal. Em particular, o grau <strong>de</strong> f tem módulo<br />

> 1, porque<br />

∫ 1<br />

∫ 1<br />

|<strong>de</strong>g(f)| = |F (1) − F (0)| =<br />

∣ F ′ (t)dt<br />

∣ = |F ′ (t)| dt > 1.<br />

0<br />

Teorema. To<strong>da</strong> transformação expansora f : R/Z → R/Z <strong>de</strong> classe C 1 e grau λ é topologicamente<br />

conjuga<strong>da</strong> à transformação expansora stan<strong>da</strong>rd ×λ.<br />

0


14 PERDA DE MEMÓRIA E INDEPENDÊNCIA ASSIMPTÓTICA 94<br />

<strong>de</strong>m. Por simplici<strong>da</strong><strong>de</strong>, assumimos que λ seja um inteiro > 1. A i<strong>de</strong>ia é construir uma conjugação<br />

entre os conjuntos <strong>da</strong>s pré-imagens <strong>de</strong> um ponto fixo pelas itera<strong>da</strong>s <strong>de</strong> f e ×λ, e aproveitar<br />

<strong>do</strong> fato <strong>de</strong>les ser <strong>de</strong>nsos para exten<strong>de</strong>r a conjugação em to<strong>do</strong> o círculo. Sejam x i k = i/λk com<br />

i = 0, 1, ..., λ k − 1. Então ×λ(x i k ) = xi′ k−1 , on<strong>de</strong> i′ é o único inteiro entre 0 e λ k−1 − 1 tal que<br />

i = i ′ mod λ k−1 . Sejam F um levantamento <strong>de</strong> f, e p o ponto fixo <strong>de</strong> F . Como F é estrictamente<br />

crescente e F (p + 1) = p + λ, existem p = y1 0 < y1 1 < ... < y1 λ−1 < p + 1 tais que F (y1) i = p + i.<br />

Indutivamente (em k) <strong>de</strong>finimos os pontos yk i com i = 0, 1, ..., λk − 1 tais que<br />

y i k−1 = y λi<br />

k<br />

< y λi+1<br />

k<br />

< ...y λi+λ−1<br />

k<br />

< y λi+λ<br />

k<br />

= y i+1<br />

k−1<br />

e F (yk i ) = yi′ k−1 , on<strong>de</strong> i′ é o único inteiro entre 0 e λ k−1 − 1 tal que i = i ′ mod λ k−1 . Para ca<strong>da</strong><br />

intervalo Ik i = π ([ yk i , ]) yi+1 k temos que f k (Ik i ) = R/Z. Como f é expansora, i.e. existe µ > 1<br />

tal que |F ′ (x)| > µ em to<strong>do</strong> ponto x, ca<strong>da</strong> um <strong>de</strong>sses intervalos tem comprimento ∣ ∣ I<br />

i k < µ −k , e<br />

portanto a família <strong>de</strong> pontos { }<br />

yk<br />

i é <strong>de</strong>nsa em [p, p + 1]. A função<br />

k∈N, i=0,1,...,m k −1<br />

H : { yk<br />

i }<br />

k∈N, i=0,1,...,λ k −1 → { x i }<br />

k<br />

k∈N, i=0,1,...,λ k −1<br />

<strong>de</strong>fini<strong>da</strong> por H(y i k ) = xi k é estritamente monótona. A <strong>de</strong>nsi<strong>da</strong><strong>de</strong> <strong>do</strong>s pontos { y i k}<br />

e<br />

{<br />

x<br />

i<br />

k<br />

}<br />

permite<br />

exten<strong>de</strong>r H como um homeomorfismo H : [p, p + 1] → [0, 1], logo como um homeomorfismo h :<br />

R/Z → R/Z. Vê-se facilmente que ×λ ◦ h = h ◦ f.<br />

Em particular, <strong>da</strong><strong>da</strong> uma transformação expansora <strong>do</strong> círculo f : R/Z → R/Z <strong>de</strong> classe C 1 ,<br />

to<strong>da</strong> transformação g suficientemente próxima <strong>de</strong> f na topologia C 1 é topologicamente conjuga<strong>da</strong><br />

a f, porque a expansivi<strong>da</strong><strong>de</strong> é uma condição aberta, e o grau é localmente constante (pois é uma<br />

função contínua com valores inteiros). Acabamos <strong>de</strong> provar o seguinte<br />

Teorema.<br />

As transformações expansoras <strong>do</strong> círculo <strong>de</strong> classe C 1 são C 1 -estruturalmente estáveis.<br />

14.6 Automorfismos hiperbólicos <strong>do</strong> toro<br />

A expansivi<strong>da</strong><strong>de</strong> não é necessária para induzir o mixing topológico. Foi o Dmitri Victorovich<br />

Anosov que, a partir <strong>do</strong>s exemplos geométricos <strong>do</strong>s fluxos geodésicos em superficies <strong>de</strong> curvatura<br />

negativa estu<strong>da</strong><strong>do</strong>s por Ha<strong>da</strong>mard, Hopf, ..., <strong>de</strong>scobriu nos anos sessenta uma classe muito<br />

gran<strong>de</strong> <strong>de</strong> transformações ”<strong>de</strong>sor<strong>de</strong>na<strong>da</strong>s” e estruturalmente estáveis. O protótipo é a familia <strong>do</strong>s<br />

automorfismos hiperbólicos <strong>do</strong> toro.<br />

O toro <strong>de</strong> dimensão <strong>do</strong>is é o espaço quociente R 2 /Z 2 . Uma aplicação linear A : R 2 → R 2 ,<br />

<strong>de</strong>fini<strong>da</strong> por uma matriz 2×2 com coeficientes inteiros, induz uma aplicação contínua f : R 2 /Z 2 →<br />

R 2 /Z 2 , <strong>de</strong>fini<strong>da</strong> por<br />

f ( x + Z 2) = A (x) + Z 2<br />

Se a matriz A tem <strong>de</strong>terminante ±1, então também a sua inversa tem coeficientes inteiros, logo<br />

respeita o retículo Z 2 , e portanto f é invertível, é um ”automorfismo” <strong>do</strong> toro. A existência <strong>de</strong> tais<br />

homeomorfismos é <strong>de</strong>vi<strong>da</strong> a razões aritméticas: as linhas e as colunas <strong>de</strong>stas matrizes são pares <strong>de</strong><br />

intéiros relativamente primos. Os automorfismos <strong>do</strong> toro que preservam a orientação, i.e. induzi<strong>do</strong>s<br />

por matrizes com <strong>de</strong>terminante +1, formam o grupo SL(2, Z). Um exemplo é o automorfismo f<br />

induzi<strong>do</strong> pela matriz<br />

( ) 2 1<br />

A =<br />

1 1<br />

É imediato verificar que, se x ∈ R 2 /Z 2 é um ponto periódico, então as suas coor<strong>de</strong>na<strong>da</strong>s são<br />

racionais. Por outro la<strong>do</strong>, o conjunto <strong>do</strong>s pontos <strong>do</strong> toro cujas coor<strong>de</strong>na<strong>da</strong>s são múltiplos inteiros<br />

<strong>de</strong> 1/n é um conjunto finito e +invariante. Isto implica que to<strong>do</strong>s os pontos com coor<strong>de</strong>na<strong>da</strong>s<br />

racionais são periódicos, e portanto que os pontos periódicos são <strong>de</strong>nsos. Também, é possível<br />

mostrar que |Per n (f)| = |<strong>de</strong>t (A n − id)|. Os autovalores <strong>de</strong> A são<br />

λ + = 3 + √ 5<br />

2<br />

e λ − = 3 − √ 5<br />

2


14 PERDA DE MEMÓRIA E INDEPENDÊNCIA ASSIMPTÓTICA 95<br />

Como A é simétrica, os vetores próprios são ortogonais. Resulta que R 2 é a soma direta E + ⊕ E −<br />

<strong>do</strong>s espaços próprios <strong>de</strong> A. A transformação A estica os vetores <strong>de</strong> E + pelo fator λ + e contrai os<br />

vetores <strong>de</strong> E − pelo fator λ − . Observe que f preserva a área, pois λ + · λ − = 1, mas não preserva<br />

as ”formas”. As projeções <strong>da</strong> linhas x + E ± ⊂ R 2 em R 2 /Z 2 contêm as órbitas <strong>de</strong> uma translação<br />

minimal <strong>do</strong> toro (porque λ ± são irracionais) e portanto são <strong>de</strong>nsas. Seja R um pequeno quadra<strong>do</strong><br />

com la<strong>do</strong>s <strong>de</strong> comprimento ε paralelos às linhas E ± . A imagem f n (R) é um ”retângulo” com<br />

la<strong>do</strong>s ε · λ n + e ε · λ n −, paralelos às linhas E ± , respetivamente. Quan<strong>do</strong> n cresce, o complementar<br />

(<br />

R 2 /Z 2) \f n (R) não contém bolas <strong>de</strong> raio maior <strong>de</strong> ε, on<strong>de</strong> ε → 0 quan<strong>do</strong> n → ∞, logo f n (R)<br />

interseta estavelmente ca<strong>da</strong> aberto não vazio <strong>do</strong> toro. Isto mostra que f é topologicamente mixing.<br />

O resulta<strong>do</strong> realmente interessante é o teorema <strong>de</strong> Anosov, que diz que f é C 1 -estruturalmente<br />

estável.


15 DIMENSIONS, FRACTALS AND ENTROPY 96<br />

15 Dimensions, fractals and entropy<br />

15.1 Dimensions of metric spaces<br />

Conjunto ε-<strong>de</strong>nsos e ε-separa<strong>do</strong>s. The following notions of the approximate massiveness of<br />

a metric space (X, d) are due to Kolmogorov’s school 29 .<br />

An ε-covering of (X, d) is a covering of X ⊂ ∪ α C α by subsets of diameters diam(C α ) < 2ε.<br />

Call C ε (X, d) the minimal cardinality of an ε-covering of X.<br />

An ε-net for (X, d) is a collection A ⊂ X of points such that any point of X is at a distance<br />

not exceeding ε from some point of A, i.e. X ⊂ ∪ a∈A {x ∈ X s.t. d(x, a) < ε}. Call N ε (X, d)<br />

the minimal cardinality of an ε-net for X. If X is a centered space (any subset of diameter 2r is<br />

contained in a ball of radius r centered in some point of X) then N ε (X, d) = C ε (X, d).<br />

A subset B ⊂ X is said ε-separated if its points are a distance greater than ε from each other.<br />

Call S ε (X, d) the maximal cardinality of a set of ε-separated points insi<strong>de</strong> X.<br />

These three <strong>de</strong>finitions make sense if the above extremal cardinalities are finite for every ε > 0,<br />

and it is not difficult to see that this happens simultaneously. The class of metric spaces with this<br />

property is called the class of totally boun<strong>de</strong>d sets and the main examples are compact spaces.<br />

The base 2 logarithms of these quantities have interpretations related to the probabilistic theory<br />

of transmission of signal, and are called<br />

Exercícios.<br />

log 2 C ε (X, d) minimal (or absolute) ε-entropy of (X, d)<br />

log 2 N ε (X, d) ε-entropy of (X, d)<br />

log 2 S ε (X, d) ε-capacity of (X, d)<br />

• Show that an ε-net <strong>de</strong>fines an ε-covering, and any ε-covering <strong>de</strong>termines a 2ε-net, so that<br />

C ε (X, d) ≤ N ε (X, d) ≤ C 2ε (X, d)<br />

• Show that a maximal ε-separated set is a ε-net, and that any ε-ball centered at a point of a<br />

minimal ε-net cannot contain more than one point of a 2ε-separated set, so that<br />

S 2ε (X, d) ≤ N ε (X, d) ≤ S ε (X, d)<br />

Box-counting dimensions. The upper and lower box counting dimension (also known as Minkowski<br />

dimensions or metric dimensions) of the metric space (X, d) are <strong>de</strong>fined as<br />

dim b (X) = lim sup<br />

ε↓0<br />

− log N ε(X, d)<br />

log ε<br />

dim b (X) = lim inf<br />

ε↓0<br />

− log N ε(X, d)<br />

log ε<br />

We get the same values if we substitute S ε (X, d) or C ε (X, d) to N ε (X) in the above formulas (just<br />

compare the counting functions at the values ε and 2ε).<br />

For reasonable self-similar metric spaces the two limits coinci<strong>de</strong>, and their common value<br />

dim b (X) is simply called box counting dimension.<br />

Exercícios.<br />

• Show that the box-counting dimension of the n-dimensional cube [0, 1] n is what you expect,<br />

namely dim b ([0, 1] n ) = n.<br />

• Consi<strong>de</strong>r the interval [0, 1] equipped with the Eucli<strong>de</strong>an metric d, and <strong>de</strong>fine new metrics<br />

d α (x, y) = d(x, y) α , for α ≤ 1. Compute the box-counting dimension of ([0, 1], d α ).<br />

29 A.N. Kolmogorov and V.M. Tihomirov, ε-entropy and ε-capacity of sets in functional spaces, Uspekhi Mat.<br />

Nauk 14 (1959), 3-86. [Translated in Amer. Math. Soc. Transl., series 2, 17 (1961), 277-364.]


15 DIMENSIONS, FRACTALS AND ENTROPY 97<br />

15.2 Fractals<br />

The word “fractal” (from the Latin FRACTUS) was coined by Benoît Man<strong>de</strong>lbrot in 1975 [Ma75]<br />

to generically <strong>de</strong>note a family of self-similar, scale-invariant metric spaces with non-integer boxcounting<br />

(or other) dimension.<br />

Peano curves. The dimension is not preserved un<strong>de</strong>r continuous maps! In 1890 Giuseppe Peano<br />

30 discovered the existence of “space-filling curves”, continuous maps of the interval [0, 1] onto<br />

the unit square [0, 1] × [0, 1].<br />

Here is a mo<strong>de</strong>rn construction. The middle-third Cantor set K ⊂ [0, 1] is homeomorphic to<br />

its powers, in particular to K × K. Since there exists a continuous map of K onto [0, 1], one can<br />

<strong>de</strong>fine a continuous map f of K onto the unit square [0, 1] × [0, 1]. This map can be exten<strong>de</strong>d<br />

(the complement [0, 1]\K is a countable union of open intervals (a n , b n ), where we may take, for<br />

example, the affine segment joining f(a) to f(b)) to a continuous map of the unit interval onto the<br />

unit square.<br />

Middle-third Cantor set and <strong>de</strong>vil’s staircase.<br />

Seven stages of the construction of the Cantor set and graph of the Cantor function<br />

(from http://en.wikipedia.org/wiki/Cantor_set and http://en.wikipedia.org/wiki/Cantor_function)<br />

Sierpinski gasket.<br />

Five stages of the construction of the Sierpinski gasket<br />

(from http://en.wikipedia.org/wiki/Sierpinski_gasket)<br />

von Koch snowflake. The von Koch snowflake is a continuous nowhere differentiable curve 31 .<br />

The box-counting dimension is log 4/ log 3.<br />

Four stages of the construction of the von Koch snowflake<br />

(from http://en.wikipedia.org/wiki/Koch_snowflake)<br />

30 G. Peano, Sur une courbe, qui remplit toute une aire plane”, Mathematische Annalen 36 (1) (1890), 157-160.<br />

<strong>do</strong>i: 10.1007/BF01199438<br />

31 Helge von Koch, Sur une courbe continue sans tangente, obtenue par une construction géométrique élémentaire,<br />

Archiv för Matemat., Astron. och Fys. 1 (1904), 681- 702.


15 DIMENSIONS, FRACTALS AND ENTROPY 98<br />

Brownian trajectories. Other continuous curves which are not differentiable are “typical”<br />

paths of a Brownian motion.<br />

Trajectories of a ran<strong>do</strong>m walk on the plane and a Wiener process in 3-dimensional space<br />

(from http://en.wikipedia.org/wiki/Brownian_motion)<br />

15.3 Self-similarity and iterated function systems<br />

Iterated Function Systems.<br />

An iterated function system (IFS) is a finite collection<br />

f 1 : R n → R n , f 2 : R n → R n , . . . , f m : R n → R n<br />

of contractions of the Eucli<strong>de</strong>an space R n . An invariant set for the IFS is a compact subset<br />

K ⊂ R n such that<br />

K = f 1 (K) ∪ f 2 (K) ∪ · · · ∪ f m (K)<br />

Let Comp(R n ) be the space of non-empty compact subsets X ⊂ R n , equipped with the Haus<strong>do</strong>rff<br />

metric<br />

d H (X, Y ) = max{sup<br />

inf<br />

x∈X y∈Y<br />

d(x, y) , sup<br />

y∈Y<br />

inf<br />

x∈X<br />

d(x, y)}<br />

= inf{ε > 0 s.t. X ⊂ Y ε and Y ⊂ X ε }<br />

(above, C ε = ∪ c∈C {x ∈ R n s.t. d(x, c) < ε} <strong>de</strong>notes the ε-neighborhood of a subset C ⊂ R n ). One<br />

can prove that (Comp(R n ), d H ) is a complete space. The Hutchinson operator 32 H : Comp(R n ) →<br />

Comp(R n ), <strong>de</strong>fined as<br />

H(X) = ∪ m k=1f k (X) ,<br />

is a contraction of Comp(R n ). There follows from the Banach fixed point theorem that<br />

Theorem. There exists a unique non-empty compact subset K ⊂ R n such that H(K) = K.<br />

Moreover, K = lim n→∞ H(C) for any non-empty compact set C ⊂ R n .<br />

The “chaos game” to plot the attractor. To plot the attractor, one can start with a (small)<br />

set of points, and apply ran<strong>do</strong>mly the contractions f k ’s.<br />

Exercícios.<br />

• Show that the middle-third Cantor set is the invariant set for the contractions<br />

x ↦→ 1 3 x x ↦→ 1 3 x + 2 3<br />

on the real line.<br />

Sierpinski gasket.<br />

32 J.E. Hutchinson, Fractals and self-similarity, Indiana Univ. Math. J. 30, no. 5 (1981), 713-747.


15 DIMENSIONS, FRACTALS AND ENTROPY 99<br />

von Koch snowflake.<br />

The snowflake may be <strong>de</strong>fined as the invariant set K ⊂ C for the IFS<br />

z ↦→ az<br />

z ↦→ a + (1 − a)z<br />

with a = 1 2 + i 1 √<br />

12<br />

.<br />

De Rham’s curves.<br />

33<br />

Paul Lévy’s dragon curve.<br />

The Lévy’s dragon, or Lévy C curve, is a curve with non-empty<br />

interiror 34 z ↦→ az z ↦→ a + az<br />

with a = 1 2 + i 1 2 .<br />

Leaves. Using affine contractions of the plane R 2 ,<br />

f k : x ↦→ A k x + α k<br />

with A k ∈ M 2×2 (R) and α k ∈ R 2 , playing with their parameters, Michael Barnsley was able to<br />

reproduce patterns similar to the one observed in ferns.<br />

Below are different kinds of Barnsley fern.<br />

Pictures taken from http://en.wikipedia.org/wiki/Barnsley’s_fern<br />

15.4 Kleinian groups<br />

[MSW02] . . .<br />

to be <strong>do</strong>ne<br />

15.5 Entropia topológica<br />

O fenómeno <strong>da</strong> <strong>de</strong>pendência sensível <strong>da</strong>s condições iniciais por ser “quantifica<strong>do</strong>”, e isto produz<br />

um importante invariante topológico chama<strong>do</strong> “entropia topoloógica”.<br />

Entropia topológica. Seja f : X → X uma transformação contínua <strong>do</strong> espaço topológico<br />

compacto X. Se d é uma métrica que induz a topologia <strong>de</strong> X, po<strong>de</strong>mos <strong>de</strong>finir uma família <strong>de</strong><br />

métricas d n , <strong>de</strong>pen<strong>de</strong>ntes <strong>do</strong> tempo n ≥ 0, por meio <strong>de</strong><br />

d n (x, y) = max d ( f k (x) , f k (y) )<br />

0≤k≤n<br />

Ou seja, d n (x, y) é “a distância máxima distância entre as n-trajetórias <strong>de</strong> x e y”.<br />

Se pensamos em ε > 0 como a precisão <strong>do</strong>s nossos instrumentos, N ε (X, d n ) representa “o<br />

número mínimo <strong>de</strong> n-órbitas necessárias para <strong>de</strong>screver as órbitas <strong>de</strong> to<strong>do</strong>s os pontos <strong>de</strong> X com<br />

erro ≤ ε”, e S ε (X, d n ) representa “o número máximo <strong>de</strong> n-órbitas que os nossos instrumentos<br />

com sensibili<strong>da</strong><strong>de</strong> ε conseguem distinguir”. Se X é compacto, estes números são finitos, e crescem<br />

quan<strong>do</strong> n cresce e quan<strong>do</strong> ε <strong>de</strong>cresce.<br />

33 G. <strong>de</strong> Rham, Sur quelques courbes définies par <strong>de</strong>s équations fonctionnelles, Rend. Sem. Mat. Torino 16<br />

(1957), 101-113.<br />

34 P. Lévy, Les courbes planes ou gauches et les surfaces composées <strong>de</strong> parties semblables au tout, J. Ecole<br />

Polytechn. (1938), 227-247, 249-291.


15 DIMENSIONS, FRACTALS AND ENTROPY 100<br />

De facto, é imediato ver que<br />

C ε (X, d n+m ) ≤ C ε (X, d n ) · C ε (X, d m )<br />

Portanto, a sequência c n = log C ε (X, d n ) é subaditiva, ou seja, satisfaz c n+m ≤ c n + c m .<br />

Subadditive sequence lemma. Let (a n ) n∈N be a quasi-subadditive real sequence, i.e. a sequence<br />

such that<br />

a n+m ≤ a n + a m + c<br />

for any n, m ∈ N and some c ≥ 0. Then there exists the limit<br />

a n<br />

lim<br />

n→∞ n ∈ R ∪ {−∞} .<br />

Proof. A existência <strong>do</strong> limite lim n→∞ a n /n é equivalente à existência <strong>do</strong> limite lim n→∞ b n /n,<br />

on<strong>de</strong> b n = a n + c. A sucessão (b n ) é subaditiva, ou seja satisfaz b n+m ≤ b n + b m , <strong>do</strong>n<strong>de</strong> b n ≤ nb 1 .<br />

Portanto, a sucessão (b n /n) é limita<strong>da</strong>, logo existe λ =lim n→∞ b n /n. Da<strong>do</strong> ε > 0, existe N ∈ N<br />

tal que b N /N < λ + ε. Seja agora n = kN + r, com k ∈ N e 0 ≤ r < N, e seja B = max 1≤i 0 existe δ ′ (ε) tal que se d ′ (x, y) < δ ′ (ε) então d(x, y) < ε. Isto implica que<br />

C ε (X, d n ) ≤ C δ′ (ε)(X, d ′ n). Por outro la<strong>do</strong>, para ca<strong>da</strong> ε > 0 existe δ(ε) tal que se d(x, y) < δ(ε)<br />

então d ′ (x, y) < ε. Isto implica que C ε (X, d ′ n) ≤ C δ(ε) (X, d n ). As duas <strong>de</strong>sigual<strong>da</strong><strong>de</strong>s provam que<br />

a entropia topológica não <strong>de</strong>pen<strong>de</strong> <strong>da</strong> métrica.<br />

Seja h : X → Y é uma conjugação topológica entre f : X → X e g : Y → Y . Se d ′<br />

é uma métrica que induz a topologia <strong>de</strong> Y , então d(x, y) = d ′ (h(x), h(x ′ )) é uma métrica que<br />

induz a topologia <strong>de</strong> X, e a conjugação h : (X, d) → (Y, d ′ ) é uma isometria. Isto implica que<br />

C ε (X, d n ) = C ε (Y, d ′ n).<br />

Além disso, não é dificil provar que, como espera<strong>do</strong>, se g é um fator <strong>de</strong> f então h top (g) ≤<br />

h top (f).


15 DIMENSIONS, FRACTALS AND ENTROPY 101<br />

Exercícios.<br />

• Mostre que as contrações e as isometrias têm entropia topológica igual a zero.<br />

• Calcule a entropia topológica <strong>da</strong> multiplicação x + Z ↦→ d · x + Z quan<strong>do</strong> d = 2, 3, 4, . . . .<br />

Deduza que a entropia topológica <strong>de</strong> uma transformação expansora <strong>do</strong> círculo f : S → S é<br />

h top (f) = log (<strong>de</strong>g (f)) .<br />

• Seja σ : Σ + → Σ + o <strong>de</strong>slocamento <strong>de</strong> Bernoulli num alfabeto <strong>de</strong> z letras. Use a métrica<br />

em Σ + = {1, 2, . . . , z} N para mostrar que<br />

d(x, y) = z − min{k∈N s.t. x k≠y k }<br />

h top (σ) = log z .


16 ERGODICITY AND CONVERGENCE OF TIME MEANS 102<br />

16 Ergodicity and convergence of time means<br />

16.1 Ergodicity<br />

Ergodic maps. Let f : X → X be an en<strong>do</strong>morphism of the measurable space (X, E). The<br />

invariant probability measure µ is said ergodic if any of the following equivalent conditions is<br />

satisfied:<br />

i) for any observable ϕ ∈ L 1 (µ), the time average<br />

1<br />

ϕ (x) = lim<br />

n→∞ n + 1<br />

n∑<br />

ϕ ( f k (x) )<br />

exists and is equal to the mean value ∫ ϕdµ for µ-almost any x ∈ X,<br />

X<br />

ii) any invariant event A ∈ E has probability µ (A) = 0 or 1, namely the invariant σ-algebra<br />

E f is equal to the trivial σ-algebra N generated by events of zero measure,<br />

iii) any invariant (measurable) observable ϕ is constant µ-a.e.<br />

If this happens, one also says that f is an ergodic en<strong>do</strong>morphism of the probability space<br />

(X, E, µ).<br />

Condition i) is the physical meaning of ergodicity, as it says that “time averages are almost<br />

everywhere constant and equal to space averages”. In particular, taking ϕ equal to the characteristic<br />

function of any event A, almost any trajectory spend in A a fraction of time asymptotically<br />

proportional to µ (A), as dreamed by Boltzmann in his ergodic hypothesis.<br />

Condition ii) is what one usually check in or<strong>de</strong>r to prove ergodicity of a probability measure.<br />

To see that i) ⇒ ii), let A be an invariant event, and ϕ its characteristic function. Invariance of A<br />

implies that ϕ is invariant, hence that ϕ = ϕ. There follows fom i) that µ (A) = ∫ ϕdµ = ϕ (x)<br />

X<br />

for some x ∈ X, hence that µ (A) = 0 or 1, the only values of characteristic functions.<br />

Conditions ii) and iii) are clearly equivalent, since any invariant event <strong>de</strong>fines an invariant<br />

function (its characteristic function), and conversly level sets of invariant functions are invariant<br />

events.<br />

Finally, in or<strong>de</strong>r to show that iii) ⇒ i), let ϕ ∈ L 1 (µ) be an integrable observable. According<br />

to the Birkhoff-Khinchin ergodic theorem, the time average ϕ (x) exists for µ-almost any x ∈ X<br />

and ∫ X ϕdµ = ∫ ϕdµ. Since ϕ is invariant mod 0, by iii) it is constant with probability one. This<br />

X<br />

implies that ϕ (x) = ∫ ϕdµ for µ-almost any x ∈ X.<br />

X<br />

k=0<br />

Warning. Ergodic dynamical systems exist, and some are listed below. On the other si<strong>de</strong>, to<br />

show that a physically interesting system is ergodic turns out to be extremely difficult, and very<br />

few examples are known. The most famous are some “billards”, systems of hard spheres insi<strong>de</strong> a<br />

billard table interacting via elastic collisions, studied by Yakov Sinai in the sixties...<br />

Ergodic measures as extremal measures. We already saw that the space Prob f of invariant<br />

probability measure is a convex and closed subset of the compact space Prob. Here, we observe<br />

that ergodic measures are the “in<strong>de</strong>composable” elements of this set.<br />

Proposition. Ergodic invariant measures are the extremals of Prob f . Namely, an invariant<br />

measure µ is ergodic iff it cannot be written as<br />

µ = tµ 1 + (1 − t) µ 0<br />

where t ∈ ]0, 1[ and µ 0 and µ 1 are distinct invariant measures.<br />

proof. First, observe that if ν is an invariant measure which is absolutely continuous w.r.t. the<br />

ergodic measure µ, then ν = µ. In<strong>de</strong>ed, one easily verifies that the Ra<strong>do</strong>n-Nykodim <strong>de</strong>rivative<br />

ρ = dν/dµ is an invariant function, and ergodicity of µ implies that it is constant and equal to one<br />

µ-a.e. Now, let µ be an ergodic measure, and assume that µ = tµ 1 + (1 − t) µ 0 for some t ∈ ]0, 1[.<br />

Since both µ 0 and µ 1 are absolutely continuous w.r.t. µ, they coinci<strong>de</strong> with µ, hence, are not


16 ERGODICITY AND CONVERGENCE OF TIME MEANS 103<br />

different. To prove the converse, assume that the invariant measure µ is not ergodic, hence there<br />

exists an invariant event C such that 0 < µ (C) < 1. Let µ 0 and µ 1 be the ”conditional probability<br />

measures” <strong>de</strong>fined as µ 1 (A) = µ (A ∩ C) /µ (C) and µ 0 (A) = µ (A ∩ C c ) /µ (C c ). Clearly they are<br />

different, both are invariant, and µ = µ (C) µ 1 + (1 − µ (C)) µ 0 . □<br />

Ergodic <strong>de</strong>composition. In the first lines of the above proof, we actually showed that any<br />

two ergodic invariant measure µ and ν are either equal or ”mutually singular”, namely, if µ ≠ ν<br />

then there exists a measurable set A such that µ (A) = ν (A c ) = 1 and µ (A c ) = ν (A) = 0. This<br />

suggests that maybe any invariant measure could be ”disintegrated” along a partition whose atoms<br />

are the support of all the different ergodic measure, in other word that µ is a ”convex combination”,<br />

namely an integral, of the ergodic measures. This is true, sometimes, but both its statement and<br />

proof are quite technical: we just quote the result.<br />

Ergodic <strong>de</strong>composition theorem. Let f : X → X be a continuous transformation of the<br />

compact metrizable space X. There exists a partition P = {P e } e∈E<br />

of X (modulo sets of zero<br />

measure) into invariant measurable sets in<strong>de</strong>xed by a Lebesgue space E, and a measurable map<br />

E ∋ e ↦→ µ e ∈Prob f with values in the space of ergodic Borel probability measures and with the<br />

property that µ e (P e ) = 1 for any P e ∈ P, such that any invariant Borel probability measure µ can<br />

be written as an integral<br />

∫<br />

µ = µ e dµ (e)<br />

where µ is some probability measure on E.<br />

E<br />

Observe that the above theorem contains the statement that any continuous transformation of<br />

a compact space admits at least one ergodic Borel probability measure.<br />

16.2 Examples of ergodic maps<br />

Bernoulli shift. Let σ : Σ + → Σ + be the Bernoulli shift over the alphabet X = {1, 2, ..., z},<br />

and p any probability on X. The Bernoulli invariant measure µ <strong>de</strong>fined by p is ergodic. First<br />

observe that, given two centered cilin<strong>de</strong>rs C α and C β , the <strong>de</strong>finition of µ implies that there exists<br />

a time n ≥ 1 such<br />

µ ( C α ∩ σ −k (C β ) ) = µ (C α ) · µ ( σ −k (C β ) ) = µ (C α ) · µ (C β )<br />

whenever k ≥ n. In<strong>de</strong>ed, one can take n = |α| + 1, and the above reflect the ”in<strong>de</strong>pen<strong>de</strong>nce” of<br />

the different trials enco<strong>de</strong>d in the construction of the Bernoulli measure. By aditiviity, the same<br />

holds true for any couple of elements of A, the algebra ma<strong>de</strong> of finite unions of centered cilin<strong>de</strong>rs.<br />

Now, assume that A ∈ B is invariant. Since any Borel set A ∈ B can be aproximated in measure<br />

by an elements of A, given any ε > 0 one can find an A ε ∈ A such that µ (A∆A ε ) < ε. Using the<br />

above result, we can find an n ≥ 1 such that<br />

µ ( A ε ∩ σ −n (A ε ) ) = µ (A ε ) · µ ( σ −n (A ε ) ) = µ (A ε ) 2<br />

where the last equality comes from invariance of µ. Then, observe that the symmetric difference<br />

between A ∩ σ −n (A) and A ε ∩ σ −n (A ε ) is contained in (A∆A ε ) ∪ σ −n (A∆A ε ). This gives<br />

∣ µ<br />

(<br />

A ∩ σ −n (A) ) − µ ( A ε ∩ σ −n (A ε ) )∣ ∣ ≤ µ (A∆A ε ) + µ ( σ −n (A∆A ε ) )<br />

≤<br />

2 · µ (A∆A ε ) < 2ε<br />

which, together with<br />

∣ ∣∣µ (A) 2 − µ (A ε ) 2∣ ∣ ∣ ≤ 2 · µ (A∆Aε ) < 2ε<br />

gives<br />

∣ ∣∣µ (A) − µ (A)<br />

2 ∣ ∣ ∣ < 4ε<br />

Since ε > 0 was arbitrary, we just showed that the measure of any invariant Borel set A satisfies<br />

µ (A) = µ (A) 2 , hence it is either 0 or 1. Observe that this proof is very similar to the argument<br />

in the Kolmogorov zero-one law for tail events in the theory of stochastic processes.


16 ERGODICITY AND CONVERGENCE OF TIME MEANS 104<br />

Now, let ϕ k be the the characteristic function of {x ∈ Σ + s.t. x 1 = k}. The observables ϕ k ◦σ n<br />

form a sequence of in<strong>de</strong>pen<strong>de</strong>nt and i<strong>de</strong>ntically distributed ran<strong>do</strong>m variables with mean p k . One<br />

can interprete the event {ϕ k ◦ σ n = 1} = {x ∈ Σ + s.t. x n = k} as ”sucess in the n-th trial”, where<br />

the probability of sucess in each trial is p k . The Birkhoff-Khinchin ergodic theorem, together with<br />

the ergodicity of µ, gives the result that<br />

µ<br />

{<br />

x ∈ Σ + s.t.<br />

1 (<br />

ϕk + ϕ k ◦ σ 1 + ϕ k ◦ σ 2 + ... + ϕ k ◦ σ n) }<br />

(x) → p k = 1<br />

n + 1<br />

which is the Kolmogorov strong law of large numbers.<br />

Expanding en<strong>do</strong>morphisms of the circle. Let ×λ : x+Z ↦→ λ·x+Z, with λ ∈ Z and |λ| > 1,<br />

be an expanding en<strong>do</strong>morphism of the circle. Lebesgue probability measure l is an ergodic measure<br />

for ×λ. To prove ergodicity, let A be an invariant Borel set, and assume that l (A) < 1. We<br />

must show that the complement B = (R/Z) \A, that has positive measure, has in<strong>de</strong>ed probability<br />

one. The argument goes as follows: if l (B) > 0, then, according to Lebesgue <strong>de</strong>nsity theorem, B<br />

contains nearly all the mass of some nonempty interval. Namely, given any ε > 0, we can find an<br />

open interval I n with lenght l (I n ) = |λ| −n and centered at a <strong>de</strong>nsity point of B such that<br />

l (B ∩ I n ) > (1 − ε) · l (I n )<br />

Now observe that the restriction (×λ) n | In is an injective map sending I n onto the circle minus<br />

one point, in particular, l ((×λ) n (I n )) = 1. Since ×λ uniformly dilatates lenghts by a factor |λ|,<br />

there follows that<br />

l ((×λ) n (B ∩ I n ))<br />

l ((×λ) n (I n ))<br />

= l (B ∩ I n)<br />

l (I n )<br />

Since, moreover, A is invariant, its complement B is +invariant, and this implies that the left-hand<br />

si<strong>de</strong> above is equal to l (B). There follows that<br />

and, since ε was arbitrary, that l (B) = 1.<br />

16.3 Normal numbers<br />

l (B) = l (B ∩ I n)<br />

l (I n )<br />

> (1 − ε)<br />

Normal numbers. In particular, Lebesgue measure l is ergodic w.r.t. multiplication by 10<br />

in the unit circle. I<strong>de</strong>ntify the circle with the interval [0, 1[, and let x = 0, x 1 x 2 x 3 ... be the base<br />

10 expression of a point of the circle, which is unique outsi<strong>de</strong> a subset of Lebesgue measure zero.<br />

For k = 0, 1, 2, ..., 9, let ϕ k be the characteristic function of the interval [k/10, (k + 1) /10[, i.e. the<br />

observable which is equal to ϕ k (x) = 1 if x 1 = k and ϕ k (x) = 0 otherwise. The time mean of ϕ k<br />

is<br />

1<br />

n + 1<br />

n∑<br />

j=0<br />

)<br />

ϕ k<br />

((×10) j (x) = 1<br />

n + 1 · card {1 ≤ j ≤ n + 1 s.t. x j = k}<br />

that is the number of k’s within the first n + 1 digits of the <strong>de</strong>cimal expansion of x. The limit as<br />

n → ∞, if it exists, is the “asymptotic frequency” of k’s contained in the expansion of x. Ergodicity<br />

of µ implies that there exists a set A k ⊂ [0, 1[ of Lebesgue measure one where the limit ϕ k (x)<br />

exists and is equal to ∫ ϕ k dl = 1/10. Since the intersection A 0 ∩ A 1 ∩ ... ∩ A 9 has still probability<br />

one, the result is that Lebesgue almost any number x ∈ [0, 1[ contains in its <strong>de</strong>cimal expansion any<br />

of the letters 0, 1, 2, ..., 9 with asymptotic frequency 1/10.<br />

Actually, one could repeat the same argument consi<strong>de</strong>ring any finite word b = b 1 b 2 ...b n in the<br />

alphabeth {0, 1, 2, ..., 9}, and show that there is a set A b ⊂ [0, 1[ of probability one such that the<br />

base 10 expansion of any x ∈ A b contains the word b with asymptotic frequency 10 −n . A real<br />

number x whose base 10 expansion contains any finite word with the right asymptotic frequency is<br />

called 10-normal (meaning “normal in base 10”). Since finite words in the alphabeth {0, 1, 2, ..., 9}<br />

are countable, and a countable union of zero measure sets still has zero measure, we just showed<br />

that Lebesgue almost any real number x is 10-normal. This observation, and in<strong>de</strong>ed the stronger


16 ERGODICITY AND CONVERGENCE OF TIME MEANS 105<br />

statement that Lebesgue almost any real number is normal in every base m ≥ 2, is due to Emile<br />

Borel (1909).<br />

It is not so easy to give examples of normal numbers, actually of series whose sum is a normal<br />

number. Much more difficult is to show that a “given” number, such as π, √ 2 or e ..., is normal.<br />

Here we quote Mark Kac: 35<br />

“As is often the case, it is much easier to prove that an overhelming majority of objects<br />

possess a certain property that to exhibit even one such object. The present case is<br />

no exception. It is quite difficult to exhibit a ‘normal’ number! The simplest example<br />

is the number (written in <strong>de</strong>cimal notation) x = .1234567891011 . . . where after the<br />

<strong>de</strong>cimal point we write the positive integers in succession. The proof that this number<br />

is normal is by no means trivial.”<br />

Continued fractions and Gauss map.<br />

to be <strong>do</strong>ne<br />

16.4 Unique ergodicity<br />

Unique ergodicity. A homeomorphism f : X → X of a compact metric space (X, d) is uniquely<br />

ergodic if it admits one, and only one, invariant Borel probability measure µ. The above discussion<br />

implies that this unique invariant measure is ergodic.<br />

This notion is the probabilistic counterpart of minimality, and in<strong>de</strong>ed both minimality and<br />

unique ergodicity are often observed simultaneously (this means that, although equivalence of the<br />

two is false, it is not easy to think at a couterexample!). Observe that we <strong>de</strong>fined unique ergodicity<br />

in the context of continuous transformations. The reason is that this notion is interesting due to<br />

the following<br />

Oxtoby’s theorem. Let f : X → X be a homeomorphism of a compact metric space X. The<br />

following statements are equivalent:<br />

i) f is a uniquely ergodic,<br />

ii) there exists an invariant Borel probability measure µ such that, for any continuous observable<br />

ϕ, the time averages ϕ (x) exist and are equal to ∫ ϕdµ for any initial condition x ∈ X,<br />

X<br />

iii) there exists an invariant Borel probability measure µ such that, for any continuous observable<br />

ϕ, the convergence<br />

1<br />

n∑<br />

ϕ ( f k (x) ) ∫<br />

→ ϕdµ<br />

n + 1<br />

k=0<br />

as n → ∞ holds and is uniform in x ∈ X.<br />

X<br />

Kronecker-Weyl equidistribution theorem.<br />

ergodic.<br />

An irrational rotation of the circle is uniquely<br />

Proof. In<strong>de</strong>ed, let +α : x + Z ↦→ x + α + Z be an irrational rotation. We must check that time<br />

means of continuous observables ϕ converge uniformly to the average ∫ ϕdl, where l is Lebesgue<br />

probability measure on the circle. Since, according to Weierstrass theorem, trigonometric polinomials<br />

are <strong>de</strong>nse in the space of continuous functions of the circle, it suffices to check that the above<br />

holds for any of the functions x ↦→ ϕ k (x) = e i2πkx with k ∈ Z. A computation gives, for k ≠ 0,<br />

1<br />

n∑<br />

ϕ j<br />

((+α) (x)) ∣ ∣ ∣∣∣∣ j =<br />

1<br />

n∑ ∣∣∣∣∣<br />

∣n + 1<br />

e i2πkjα ≤ 2<br />

∣n + 1<br />

n + 1 · 1<br />

|1 − e i2πkα | → 0<br />

j=0<br />

j=0<br />

uniformly in x, while the time averages of ϕ 0 are constant and equal to 1. Hence, the time means<br />

of each ϕ k converge uniformly to their space means as times goes to infinity, and we are <strong>do</strong>ne. The<br />

35 Mark Kac, Statistical in<strong>de</strong>pen<strong>de</strong>nce in probability, analysis, and number theory, Carus Math. Monographs, 12,<br />

New York 1959 (pag. 18).


16 ERGODICITY AND CONVERGENCE OF TIME MEANS 106<br />

theorem owes its name to the fact that<br />

1<br />

n + 1<br />

n∑<br />

∫<br />

ϕ (x + jα) →<br />

j=0<br />

ϕdl<br />

uniformly for any continuous function ϕ on the circle, and this is interpreted as saying that the<br />

sequence of points {x, x + α, x + 2α, x + 3α, ...} is “equidistributed” w.r.t. Lebesgue measure.<br />

Linear flows on tori. Now, consi<strong>de</strong>r the torus X = R n /Z n of dimension n ≥ 2, and the linear<br />

flow φ t : x + Z n ↦→ x + tα + Z n <strong>de</strong>fined by the differential equation<br />

ẋ = α<br />

where α ∈ R n . The “frequency vector” α = (α 1 , α 2 , ..., α n ) is said non resonant if the scalar<br />

product 〈α, k〉 = ∑ n<br />

j=1 α jk j ≠ 0 for any k ∈ Z n \ {0}. As above, one can approximate any<br />

continuous function on the torus with trigonometric functions. One then checks that<br />

∫<br />

1 T<br />

(<br />

)<br />

e i2π〈k,x+tα〉 dt = ei2π〈k,x〉<br />

e i2πT 〈k,x〉 − 1 → 0<br />

T 0<br />

iT 〈k, x〉<br />

as T → ∞, for any k ∈ Z n \ {0}, while the time mean of the observable 1 is constant and equal<br />

to one. There follows that a non resonant linear flow on the torus is uniquely ergodic w.r.t. to<br />

Lebesgue measure.<br />

Dyadic adding machine.<br />

to be <strong>do</strong>ne


REFERÊNCIAS 107<br />

Referências<br />

[AA67]<br />

V.I. Arnold & A. Avez, Problèmes ergodiques <strong>de</strong> la mécanique classique, Gauthier-<br />

Villars, 1967.<br />

[Ap69] T.M. Apostol, Calculus, John Wiley & Sons, New York 1969.<br />

[Ar78]<br />

[Ar79]<br />

V.I. Arnold, Metodi geometrici <strong>de</strong>lla teoria <strong>de</strong>lle equazioni differenziali ordinarie, Editori<br />

Riuniti - MIR, Roma 1978.<br />

V.I. Arnold, Metodi matematici <strong>de</strong>lla meccanica classica, Edizioni MIR - Editori Riuniti,<br />

Roma 1979.<br />

[Ar85] V.I. Arnold, Equações diferenciais ordinárias, MIR 1985.<br />

[AS64]<br />

[BN05]<br />

M. Abramowitz and I. Stegun, Handbook of Mathematical Functions with Formulas,<br />

Graphs, and Mathematical Tables, Dover, 1964.<br />

P. Buttà e P. Negrini, Note <strong>de</strong>l corso di Sistemi Dinamici, Università di Roma “La<br />

Sapienza”, 2005.<br />

[CG93] L. Carleson and T.W. Gamelin Complex dynamics, UTX, Springer-Verlag, 1993.<br />

[Chaos]<br />

P. Cvitanović, R. Artuso, P. Dahlqvist, R. Mainieri, G. Tanner, G. Vattay, N. Whelan<br />

and A. Wirzba, Chaos: Classical and Quantum, http://ChaosBook.org (Niels Bohr<br />

Institute, Copenhagen 2008).<br />

[CR48] R. Courant and H. Robbins, What is mathematics, Oxford University Press, 1948.<br />

[De89] R.L. Devaney, An introduction to chaotic dynamical systems, Addison-Wesley, 1989.<br />

[De92] R.L. Devaney, A first course in chaotic dynamical systems, Addison-Wesley, 1992.<br />

[Fa85] K. J. Falconer, The geometry of fractal sets, Cambridge University Press, 1985.<br />

[Fe63]<br />

[Gh07]<br />

[HK03]<br />

[HS74]<br />

[HSD04]<br />

[HW59]<br />

[Kh35]<br />

[KH95]<br />

[Ma75]<br />

[Mat95]<br />

R.P. Feynman, R.B. Leighton and M. Sands, The Feynman lectures on physics, Addison-<br />

Wesley, Reading, 1963.<br />

E. Ghys, Résonances et petits diviseurs, in L’héritage scientifique <strong>de</strong> Kolmogorov, Berlin<br />

2007.<br />

B. Hasselblatt and A. Katok, A first course in dynamics: with a panorama of recent<br />

<strong>de</strong>velopments, Cambridge University Press 2003.<br />

M.W. Hirsch and S. Smale, Differential equations, dynamical systems and linear algebra,<br />

Aca<strong>de</strong>mic Press (Pure and Applied Mathematics. A series of Monographs and<br />

Textbooks), San Diego 1974.<br />

M.W. Hirsch, S. Smale and R.L. Devaney, Differential Equations, Dynamical Systems,<br />

and an Introduction to Chaos, 2nd ed., Elsevier Aca<strong>de</strong>mic Press, 2004.<br />

G.H. Hardy and E.M. Wright, An Introduction to the Theory of Numbers, fourth edition,<br />

Oxford University Press 1959.<br />

A.Ya. Khinchin, Continued Fractions, 1935 [translation by University of Chicago Press,<br />

1954].<br />

A. Katok and B. Hasselblat, Introduction to the mo<strong>de</strong>rn theory of dynamical systems,<br />

Encyclopedia of mathematics and its applications, Cambridge University Press 1995.<br />

B. Man<strong>de</strong>lbrot, Les object fractals: forme, hasard, et dimension, Flammarion, Paris<br />

1975.<br />

P. Mattila Geometry of Sets and Measures in Eucli<strong>de</strong>an Spaces: Fractals and rectifiability,<br />

Cambridge University Press, 1995.


REFERÊNCIAS 108<br />

[Mi91] J. Milnor, Dynamics in one complex variable, IMS preprint (1991)<br />

[MSW02] D. Mumford, C. Series and D. Wright, Indra’s Pearls: The Vision of Felix Klein, Cambridge<br />

University Press 2002.<br />

[Ro99]<br />

[Ro04]<br />

J.C. Robinson, Dynamical Systems, Stability, Symbolic Dynamic and Chaos, CRC Press,<br />

Cambridge 1999.<br />

J.C. Robinson, An introduction to ordinary differential equations, Cambridge University<br />

Press, Cambridge 2004.<br />

[Ru87] W. Rudin, Real and complex analysis, McGraw-Hill, 1987.<br />

[Sm67] S. Smale, Differentiable dynamical systems, Bull. of the AMS 73 (1967), 747-817.<br />

[SS03]<br />

E.M. Stein and R. Shakarchi, Fourier Analysis. An Introduction, Princeton University<br />

Press, 2003.<br />

[St94] S.H. Strogatz, Nonlinear Dynamics and Chaos, Addison-Wesley, 1994.<br />

[Vi06]<br />

[Wa82]<br />

J. Villate, Introdução aos sistemas dinâmicos. Uma abor<strong>da</strong>gem prática com Maxima,<br />

2006.<br />

P. Walters, An Introduction to ergodic theory, Graduate Texts in Math. 79, Springer-<br />

Verlag 1982

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!