C:\Documents and Settings\yuritzi\Mis documentos\01 REVISTA ...

INGENIERÍA Investigación y Tecnología VIII. 3. 123-133, 2007 

(artículo arbitrado) 

A Mixed distribution with EV1 and GEV 

components for analyzing 

heterogeneous samples 

C. Escalante-Sandoval 

División de Ingeniería Civil y Geomática 

Facultad de Ingeniería, UNAM 

E-mail: caes@servidor.unam.mx 

(Recibido: agosto de 2006; aceptado: abril de 2007) 

Abstract 

Flood char ac ter is tics are re quired to solve sev eral wa ter-engineering prob lems. Tra di - 

tional flood fre quency anal y sis in volves the as sump tion of ho mo ge ne ity of the flood dis - 

tri bu tion. How ever, floods are of ten gen er ated by dis tri bu tions com posed of a mix ture of 

two or more pop u la tions. Dif fer ences be tween the pop u la tions may be the re sult, for in - 

stance, of the ENSO phe nom e non. If these phys i cal pro cesses are not con sid ered in con - 

ven tional flood fre quency anal y sis, the T-year flood es ti mate can be in ef fi cient for de - 

sign pur poses. In or der to model het er o ge neous sam ples, a mixed dis tri bu tion with Ex - 

treme Value Type I (EV1 or Gumbel) and Gen eral Ex treme Value (GEV) com po nents is 

pro posed. A re gion in North west ern Mex ico with 35 gaug ing sta tions has been se lected 

to ap ply the model and at-site quantiles were es ti mated based on the max i mum like li - 

hood pro ce dure. Re sults pro duced by fit ting the EV1-GEV dis tri bu tion were com pared 

through the use of a good ness-of-fit test with those ob tained by the mixed Gumbel and 

mixed GEV dis tri bu tions. The EV1-GEV dis tri bu tion was the best op tion for the 40% of 

an a lyzed sam ples and thus it is sug gested its ap pli ca tion when mod el ing het er o ge neous 

se ries in flood fre quency anal y sis. 

Keywords: Het er o ge neous sam ples, flood fre quency anal y sis, mixed dis tri bu tions, 

max i mum like li hood pa ram e ter es ti ma tion. 

Resumen 

Muchos problemas en ingeniería hidráulica requieren conocer las características 

de una creciente. El análisis tradicional de frecuencias implica la consideración 

de homogeneidad de la serie. Sin embargo, en ocasiones los gastos máximos 

anuales son generados por distribuciones formadas por dos o más poblaciones. 

La diferencia entre poblaciones puede ser el resultado, entre otros, de la 

presencia del fenómeno ENSO. Si estos procesos físicos no se consideran en el 

análisis convencional, el evento estimado de cierto período de retorno puede ser 

ineficiente para propósitos de diseño. Con el fin de modelar muestras 

heterogéneas se propone la aplicación de una distribución mezclada, cuyas 

componentes son la distribución de Valores Extremos Tipo 1 (VE1 o Gumbel) y 

la General de Valores Extremos (GVE). Para aplicar el modelo se eligió una 

región del Noroeste de México que cuenta con 35 estaciones de aforos y se 

empleó la técnica de máxima verosimilitud para la estimación de los eventos de 

diseño. Los resultados de la distribución VE1-GVE, se compararon con aquellos 

obtenidos con las distribuciones Gumbel mixta y GVE mixta, a través de un

A Mixed distri bu tion with EV1 and GEV compo nents for analyzing heter o ge neous samples 

criterio de bondad de ajuste. La distribución EV1-GVE fue la de mejor ajuste 

en el 40% de las muestras analizadas, por lo que se sugiere su aplicación en el 

caso de requerir estimar eventos de diseño a partir de series no homogéneas. 

Descriptores: Muestras heterogéneas, análisis de frecuencias de crecientes, 

distribuciones mezcladas, estimación de parámetros por máxima verosimilitud. 

Intro duc tion 

The objective of flood frequency analysis is to 

estimate the flood magnitude corresponding 

to any return period of occurrence through 

the use of probability distributions, which are 

needed in many studies and projects such as 

flood plain delineation, flood protection works, 

river crossings, and channel improvements. 

Most flood studies have been analyzed 

through the use univariate distributions. 

Several efforts have been made to provide 

physical and statistical basics for selecting the 

type of probability distribution function that 

best fits the frequency distribution of the 

actual data. One common assumption in statistical 

analysis of flood frequency is the 

homogeneity of flood distributions. However, 

floods are often generated by distributions 

composed of a mixture of two or 

more populations. Differences between the 

populations may be the result of El Niño or 

La Niña oscillations. The occurrences of this 

phenomenon modify the normal precipitation 

patterns in Mexico (Cavazos and Hastenrath, 

1990; Magaña et al., 2003; Magaña 

and Ambrizzi, 2005). Its signal reflects in 

more intense winter precipitation in the 

Northern states, particularly in Northwestern 

Mexico. As mentioned by Alila and Mtiraoui 

(2002) if these physical processes are not 

considered in conventional flood frequency 

analysis, the T-year flood estimate can be 

inefficient for design purposes. 

The Mexican government has recognized 

that climate variability affects many of the its 

socio-economical activities and has begun to 

implement actions to diminish the negative 

effects of extreme climate conditions (floods 

and droughts). However, poverty has forced 

people to live almost on the water of rivers, 

situation that becomes an additional problem 

for the local governments. In order to protect 

their lives and goods is very important to 

account with an additional mathematical tool 

that might reduce the uncertainties in computing 

the design events for different return 

periods, which are needed in many studies 

and projects such as flood plain delineation. 

In order to estimate more efficient quantiles 

of short or heterogeneous samples, a 

mixed distribution with Extreme Value Type 

I (EV1 or Gumbel) and General Extreme 

Value (GEV) components for the maxima is 

proposed and it will be called EV1-GEV 

distribution. 

Mixed distri bu tions 

The use of a mixture of probability distributions 

functions for modeling samples of 

data coming from two populations have been 

proposed long time ago (Mood et al , 1974): 

Pr( X ≤ x ) = F( x) = pF ( x) + ( 1 − p ) F ( x) 

(1) 

1 2 

Where p is a factor used to weigh the 

relative contribution of each population 

(0


Mixed Gumbel Distri bu tion 

If F ( 1 

x ) and F x 2 

( ) of equation (1) are Gumbel distributions (NERC, 1975) then the five-parameter 

mixture model of annual floods is (Raynal and Guevara, 1997): 

⎛ x−υ 

− 

1 ⎞ 

− exp ⎜ 

α1 

⎟ 

⎝ ⎠ 

F( x) = p exp + ( 1 − p)exp 

⎛ x − υ 

− 

2 ⎞ 

⎜ 

− exp ⎝ α2 

⎟ 

⎠ 

(2) 

where υ 1 , α 1 and υ 2 , α 2 are the location and scale parameters for the first and second population, respectively 

The corresponding probability density function is 

x −υ 

⎛ x− 

υ ⎞ 

⎛ x −υ 

− 

⎛ 

1 ⎞ 

p 

⎝ 

⎜ 

⎠ 

⎟ 

− 

1 

α 

f ( x) = exp exp exp 

⎜ ⎟ 

1 − ⎝ α1 − 2 

⎠ ( 1 − ) 

⎜ ⎟ 

− 

p ⎝ α 2 ⎠ −exp 

+ exp exp 

α 1 

α2 

⎞ 

⎛ x − υ2 

⎞ 

⎜ 

⎝ α2 

⎟ 

⎠ 

(3) 

Mixed General Extreme Value Distri bu tion 

If F1 ( x) and F2( x) of equation (1) are GEV distributions (NERC, 1975) then the seven- parameter 

mixture model of annual floods is (Raynal and Santillan, 1986): 

⎧ 

x 

F( x) = p exp 

⎪ ⎡ ⎛ − ω1 

⎞ 

⎨−⎢1 − 

⎜ 

⎟ 

β 

⎩⎪ ⎣ ⎝ λ1 

⎠ 

1 

⎤ 

⎥ 

⎦ 

1 / β 1 

⎫ 

⎪ 

⎧ 

2 

⎬ + ( 1 − )exp 

⎪ ⎡ ⎛ x − ω 

p ⎨ −⎢1 − 

⎜ 

2 

⎭⎪ 

⎩⎪ ⎣ ⎝ λ 

⎞ 

⎟ 

β 

⎠ 

2 

⎤ 

⎥ 

⎦ 

1 / β 2 

⎫ 

⎪ 

⎬ 

⎭⎪ 

(4) 

Where ω1 , λ1 , β1 

and ω2 , λ 

2 

, β2 

are the location, scale and shape parameters for the first and 

second population, respectively. 

The corre sponding prob a bility density func tion is 

p ⎧ 

⎪ ⎡ ⎛x 

− ω ⎞ ⎤ 

1 

f ( x ) = exp⎨− ⎢1 

− 

⎜ 

⎟ 

β1 

⎥ 

λ1 

⎩⎪ ⎣ ⎝ λ1 

⎠ ⎦ 

1/ 

β 1 

⎫ 

⎪ 

⎬ 

⎭⎪ 

⎡ 

⎢ 

⎣ 

⎛ x − ω ⎞ 

⎜ 

⎟ 

β 

⎝ λ1 

⎠ 

1 

1 − 

1 

⎤ 

⎥ 

⎦ 

1/ 

β 1−1 

+ 

/ 

( 1 −p) ⎧ 

⎪ ⎡ ⎛ x − ω 

exp 

2 ⎞ ⎤ 

⎨−⎢1 

− ⎜ ⎟β 

2 ⎥ 

λ2 

⎣ ⎝ λ 2 

⎩⎪ 

⎠ ⎦ 

1 β2 

⎫ 

⎪ ⎡ ⎛x 

− ω2 

⎞ 

⎬ ⎢1 

− ⎜ ⎟β 

2 

⎭⎪ ⎣ ⎝ λ ⎠ 

2 

⎤ 

⎥ 

⎦ 

1/β 

2 −1 

(5) 

EV1-GEV Distri bu tion 

Assuming that first and second populations behave as EV1 and GEV distributions, respectively, 

equation (1) yields to the six-parameter mixture model of annual floods: 

x 

F( x) = p exp ex p 

− 

⎛ −υ 

⎞ 

1/ 

β 

⎜ ⎟ 

− ⎝ α ⎠ 

⎧⎪ 

⎡ − 

+ ( 1 − )exp − 1 − 

⎛ x ω ⎞ ⎤ ⎫⎪ 

p ⎨ ⎢ 

⎜ ⎟β 

⎣ ⎝ ⎠ 

⎥ ⎬ 

(6) 

⎩⎪ λ ⎦ ⎭⎪ 

Where υ, α and ω, λ are the location and scale parameters for the first and second population, 

respectively; β is the shape parameter for the second population. 

Vol.VIII No.3 -julio-septiembre- 2007 125


The corresponding probability density function is 

⎛ x− 

υ⎞ 

x − 

p 

− ⎜ ⎟ 

⎝ ⎠ − 

f ( x) = exp exp exp 

− 

⎛ υ ⎞ 

⎜ ⎟ 

α 

⎝ ⎠ 

+ 

( ) 

1/ 

β−1 

1 − p α ⎡ − 

1 − 

⎛ x ω ⎞ ⎤ 

⎧ 

⎪ ⎡ − 

exp 1 

α 

⎜ ⎟ 

⎣ 

⎢ ⎝ ⎠ ⎦ 

⎥ 

− − 

⎛x 

ω⎞ 

⎤ 

β 

λ λ 

⎨ ⎜ ⎟ 

⎣ 

⎢ 

β 

⎝ λ ⎠ ⎦ 

⎥ 

⎩⎪ 

1/ β 

⎫ 

⎪ 

⎬ 

⎭⎪ 

(7) 

Esti ma tion of param e ters by maximum like li hood 

The likelihood function of n random variables is defined to be the joint density of n random 

variables and it is a function of the parameters. If X 1 ,X 2 , ..., Xn is a random sample of a univariate 

density function, the corresponding likelihood function is (Mood et al., 1974): 

L( x , θ ) = f ( x i 

, θ) 

n 

∏ 

i= 

1 

(8) 

The logarithmic function will be used instead of the likelihood function because it is easier to 

handle. So, equation (8) is transformed: 

InL ( x, θ) = In f ( x , θ ) 

n 

∏ 

i= 

1 

i 

(9) 

Where L is called the likelihood function, ln is the natural logarithm, θ is the set of parameters to be 

estimated and f ( x , θ ) is the EV1-GEV density function, thus 

In L( x , θ) 

= 

n 

∑ 

i= 

1 

x υ 

x υ 

p 

−⎛ 

− 

⎜ 

⎞ 

⎛ − ⎞ 

⎧ 

⎟ 

α 

exp exp ex p 

− ⎜ ⎟ 

α 

⎫ 

⎝ ⎠ − ⎝ ⎠ 

⎪ 

⎪ 

⎪ 

α 

⎪ 

In⎨ 

+ − 1/ 

β−1 

1/ β 

( 1 p) 

⎡ − 

− 

⎛ x ω ⎞ ⎤ ⎧⎪ 

⎡ − 

⎢ 

1 ⎜ ⎟ ⎥ 

exp − 1 − 

⎛ x ω 

β 

⎞ ⎤ ⎫⎬ 

(10) 

⎪ 

⎪ 

⎨ ⎜ ⎟β 

λ ⎣ ⎝ λ 

⎢ 

⎠ ⎦ ⎣ ⎝ λ 

⎥ ⎬⎪ 

⎩ 

⎪ 

⎩⎪ 

⎠ ⎦ ⎭⎪ 

⎭ 

⎪ 

And the corresponding first order partial derivatives of such function with respect to each of 

the parameters are 

x υ 

x− 

υ 

− 

⎛ − ⎞ 

∂InL 

p 

α 

α 

= ∑ 

n 

⎜ ⎟ −2 

⎛ ⎞ 

1 ⎧ 

− ⎝ 

⎜ ⎟ 

⎪ exp ⎠ ⎡ 

⎝ ⎠ 

exp exp − ⎛ x − υ ⎞ 

⎤⎫ 

⎪ 

2 ⎨ 

⎢ 

⎜ ⎟⎥⎬ 

∂υ α i= 

1 f ( x) ⎣⎢ 

⎝ ⎠ 

⎩ 

⎪ 

α 

⎦⎥ 

⎭ 

⎪ 

(11) 

− ⎛ x − υ 

x− 

υ 

⎜ 

⎞ 

⎟ ⎛ ⎞ 

⎛ x −υ 

∂InL 

p 

n 

1 ⎧ 

⎞ 

α − 

− ⎝ ⎠⎡ 

⎝ 

⎜ 

α ⎠ 

⎟ −2 

⎪ ex p 

⎝ 

⎜ 

⎠ 

⎟ ⎤⎫ 

α ⎪ 

= − exp e xp + exp − ( − ) 

2 ∑ ⎨ 

⎢ 

x υ ⎥⎬ 

(12) 

∂α α i= 

1 f ( x) 

⎩⎪ 

⎣⎢ 

⎦⎥ 

⎭⎪ 

⎧ 

⎧⎪ 

⎡ x ω 

− − 

⎛ − ⎞ ⎤ ⎫⎪ 

⎪ exp⎨ 

⎢ 

1 ⎜ ⎟β 

∂InL 

− p 

⎣ ⎝ λ ⎠ 

⎥ ⎬ 

n 

( 1 ) 1 ⎪ 

⎦ 

= − 

⎩ 

⎪ 

⎭ 

⎪ 

2 

∂ ω λ f ( x) 

⎨ 

1/ 

β−2 

i= 

1 

⎪ 

⎧⎪ 

⎡ − 

− − 

⎛ x ω⎞ 

⎤ ⎡ − 

( 1 β) 

⎢ 

1 ⎜ ⎟β 

⎥ 

− 1 − 

⎛ x ω ⎞ ⎤ 

⎜ ⎟β 

⎪ ⎨ 

⎣ ⎝ λ 

⎢ 

⎠ ⎦ ⎣ ⎝ λ 

⎥ 

⎩ ⎩⎪ 

⎠ ⎦ 

1/ 

β 

∑ 2/β 

− 2 

⎫ 

⎪ 

⎪ 

⎫ 

⎬ 

⎪⎪ 

⎬⎪ 

⎭⎪ 

⎭ 

(13) 

126 INGENIERIA Investigación y Tecnología FI-UNAM


1/ 

β 

1/β−1 

⎧ ⎧ 

− 

⎪ 

− 

⎡ 

− 

⎛ x − ω⎞ 

⎜ β 

⎤ ⎫ 

exp⎨ 

⎢ 

1 

⎪⎡ 

⎟ 

∂InL 

−p 

⎣ ⎝ λ ⎠ 

⎥ ⎬ − 

⎛ − ⎞ 

⎢ 

1 

x ω ⎤ 

⎪ 

⎜ ⎟β 

( 1 ) 1 

⎦ 

= 

⎩⎪ 

⎭⎪ ⎣ ⎝ ⎠ 

⎥ 

+ 

n 

⎪ 

λ ⎦ 

2 ∑ ⎨ 

∂λ λ i= 

1 f( x ) ⎪ ⎧⎪ 

⎡ x − ω 

ω 

( x −ω) f(x) ( 1 − β) 

1 − 

⎛ ⎞ ⎤ 

⎢ ⎜ ⎟β 

β 

⎣ ⎝ λ ⎠ ⎦ 

⎥ − ⎡ 

− ⎛ x 

⎜ 

− ⎞ ⎤ 

⎨ 

⎢ 

1 

⎪ 

⎟ 

⎣ ⎝ λ ⎥ 

⎩ ⎩⎪ 

⎠ ⎦ 

1 / β− 

1 

⎫ 

⎪ 

⎪ 

⎬ 

⎫⎪ 

⎪ 

⎬ 

⎪ 

⎭⎪ 

⎭ 

(14) 

⎧ 

⎪ 

⎪ 

⎪ 

∂InL 

( 1 −p 

) 

n 

1 

⎪ ⎧⎪ 

⎡ ⎛ x − ω⎞ 

⎤ 

= 

exp ⎨ − 1 − ⎜ ⎟β 

2 ∑ ⎨ 

∂β λ i= 

1 f( x ) ⎢ 

⎣ ⎝ λ ⎠ 

⎥ 

⎪ ⎩⎪ 

⎦ 

⎪ 

⎪ 

⎪ 

⎩⎪ 

1 / β 

1/ 

β−2 

⎧ 1 ⎛ x −ω 

⎞⎡ 

⎜ ⎟ − 

⎛ x − ω⎞ 

⎤ 

⎪ 

⎜ ⎟ 

⎝ ⎠ 

⎢ 

1 β 

⎣ ⎝ ⎠ 

⎥ 

⎪ 

β λ λ ⎦ 

⎪ 1 ⎡ x − 

⎫ + In 1 − 

⎛ ω⎞ 

⎤ ⎡ − 

⎪ 2 ⎜ ⎟ 

β ⎢ 

⎝ ⎠ 

⎥ 

− 

⎛x 

ω ⎞ ⎤ 

β 

⎢ 

1 ⎜ ⎟β 

⎪ 

⎬ 

⎣ λ ⎦ ⎣ ⎝ λ ⎠ 

⎥ 

⎨ 

⎦ 

⎭⎪ ⎪ −⎛ 

x − ω⎞⎛ 

1 

⎜ ⎟⎜ 

−1 ⎞ ⎡ 

⎟ −⎛ 

− ⎞ ⎤ 

⎜ ⎟ 

⎝ λ ⎠ 

⎢ 

1 

x ω 

β 

⎪ 

⎝ β ⎠ ⎣ ⎝ λ ⎠ 

⎥ 

⎦ 

⎪ 

⎪ −1 1 In 

⎡ 

1 − ⎛ x −ω 

⎞ 

2 ⎜ ⎟β 

⎤ 

β 

⎢ 

⎣ ⎝ λ ⎠ 

⎥ 

⎩⎪ 

⎦ 

1/ 

β−1 

⎫⎫ 

⎪⎪ 

⎪⎪ 

⎪⎪ 

⎪ 

⎪ 

⎬⎬ 

⎪⎪ 

⎪⎪ 

⎪⎪ 

⎪⎪ 

⎭⎪ 

⎭⎪ 

(15) 

⎛ x− 

υ ⎞ 

x υ 

− 

− 

⎛ − ⎞ 

n 

α 

∂InL 

⎜ ⎟ 

⎜ ⎟ 

1 1 

⎝ ⎠ 

⎝ α ⎠ − 

= exp exp exp − 1 − 

x − 

β− 

⎧ 

⎪ 

⎧ 

⎪ 

⎡ ⎛ ω ⎞ ⎤ ⎧ ⎡ 

⎜ ⎟ 

x − 

∂p 

αλ f( x ) 

⎢ 

⎣ ⎝ ⎠ 

⎥ − − 

⎛ ω⎞ 

⎤ 

∑ ⎨ ⎨ 

β exp⎨ 

⎪ ⎢1 

⎜ ⎟β 

λ ⎦ ⎣ ⎝ λ ⎠ 

⎥ 

i= 

1 

⎩⎪ ⎩⎪ 

⎩ ⎪ 

⎦ 

1 / 1 1 / β 

⎫⎪ 

⎫ 

⎪ 

⎫ 

⎪ ⎬ ⎬⎬ 

⎭⎪ ⎭⎪ ⎭⎪ 

(16) 

The exact solution provided by the system of 

equations (11)-(16) is not known, so the maximum 

likelihood estimators of the parameters 

were obtained by the direct maximization 

of the log-likelihood function (eq. 

10), which is constrained to α > 0, λ> 0, 0 

and x> 0. The suggested procedure is the 

constrained multivariable Rosenbrock method 

(Kuester and Mize, 1973). 

As it is known, in any of the multivariable 

constrained non-linear optimization techniques, 

global optimality is never assured. Therefore, 

care must be taken in order to avoid a local 

optimum. It is suggested to start always with 

values of the location, scale and shape 

parameters computed by considering the 

sample divided into two equal parts. If sample 

is sorted in decreasing order of magnitude, 

the first set of data is fitted to the 

univariate GEV distribution (Prescott and 

Walden, 1980), and the second one to the univariate 

Gumbel distribution (NERC, 1975). 

The initial value of the association parameter 

p will be equal to 0.5. 

For the mixed Gumbel and the mixed GEV 

distributions parameters are estimated following 

the same optimization procedure. 

Case study 

A region located in Northwestern Mexico, 

with a total of 35 gauging stations was 

selected to apply the EV1-GEV distribution to 

flood frequency analysis. Table 1 shows 

statistical characteristics of data for each 

station in the region. 

In the area considered in this study, flood 

outliers correspond to observed rainfall values 

much higher than the other annual 



maxima. Such extremely heavy rainfall is due 

to special meteorological conditions in 

connection with ENSO events in the Pacific 

Ocean. In the analyzed area, 62% of the 

highest annual maximum discharges gauged 

were generated in an El Niño year and 38% 

for its counterpart, La Niña. 

Results provided by the EV1-GEV distribution 

were compared with those produced 

by the mixed Gumbel and mixed GEV 

distributions. For each station the best one 

was chosen according to the criterion of 

minimum standard error of fit (SE), as 

defined by Kite (1988): 

n 

SE = 

⎡ 

2 

gi 

−h i 

n − q 

⎤ 

⎣ 

⎢∑( ) / ( ) 

i= 

1 

⎦ 

⎥ 

1 / 2 

(17) 

Where gi, i =1 ,... n are the hi , i =1 , ... n 

recorded events; are the event magnitudes 

computed from the probability distribution 

at probabilities obtained from the sorted 

ranks of, g , i 

i = 1 ,..., n , n is the length of record, 

and q is the number of parameters 

estimated for the mixed distribution. For the 

mixed distributions, Gumbel, GEV and EV1-GEV 

q will be equal to 5, 7 and 6, respectively. 

that the hydraulic project might become 

economically unfeasible or unsafe. 

An additional problem is when a short 

record is used (less than 30 years), because 

there is an increased risk that the flood 

estimate will not provide adequate protection 

of designated uses. One way to reduce 

the bias or uncertainty in the flood estimate is 

to use a regional data set with observations 

from several sites. 

Mixed Gumbel, GEV and EV1-GEV distributions 

can be easily used to obtain regional 

at-site estimates of floods by using the 

station-year method in regions with heterogeneous 

sample data. The general procedure 

of this regional technique can be found 

in paper written by Cunnane (1988). 

This regional technique was not applied in 

the paper and it just was mentioned to be 

considered for users in their hydrological 

analyses. 

In table 2 is depicted the SE for all mixed 

distributions along with the best model for 

the sample of data considered. 

The final at-site design events Q (m 3 /s) for 

different return periods T(years) in each 

station are presented in Table 3. 

In some sites a comparison is made among 

different at-site design events (Table 4). For 

instance, in station Chinipas the computed SE 

are very similar, however, as return period 

increases, differences among flood estimates 

are more significant. A bad selection of the 

best distribution in the analyzed site can 

substantially modify the design event and 



Table 1. Statis tical char ac ter is tics of flood data for each analyzed gauging station 

Years of Period o f Co efficient of Coefficiento f C oefficient of 

m Gauging Statio n r ecor d r ecor d Mean 

Standard 

Deviation Skewness Kurtosis Var iation 

1 Acatitan 31 1955-1985 1031.6 864.5 2.63 12.79 0.84 

2 Alam os 22 1948-1969 247.6 178.8 0.83 3.60 0.72 

3 Badiraguato 27 1959-1985 957.9 1853.6 3.92 20.65 1.94 

4 Bami cori 32 1951-1982 194.5 176.7 1.39 4.46 0.91 

5 Cazanate 19 1967-1985 555.0 727.9 3.06 15.04 1.31 

6 Chini pas 21 1965-1985 1061.0 524.4 0.31 2.83 0.49 

7 Choix 29 1955-1983 392.9 336.5 2.59 11.84 0.86 

8 El Ble dal 48 1938-1985 286.0 273.4 2.83 13.92 0.96 

9 El Mahone 20 1966-1985 198.4 26.3 0.69 5.96 0.13 

10 El Naranjo 47 1939-1985 621.9 655.5 1.87 6.98 1.05 

11 El Queli te 26 1960-1985 468.5 445.2 1.72 6.27 0.95 

12 Guamuchil 36 1938-1973 605.9 630.4 3.09 16.22 1.04 

13 Guatenipa 21 1965-1985 1888.8 1393.2 0.84 3.27 0.74 

14 Huites 53 1941-1993 2942.0 3124.3 2.63 10.39 1.06 

15 Ixpali no 31 1953-1983 1317.8 1218.2 2.79 12.68 0.92 

16 Jaina 46 1941-1986 1197.4 1189.9 3.20 16.30 0.99 

17 La Huerta 17 1969-1985 934.2 574.3 0.29 2.43 0.61 

18 La Tina 24 1960-1983 106.5 152.3 4.00 22.39 1.43 

19 Las Cañas 24 1948-1971 2497.0 3194.2 1.60 4.84 1.28 

20 Palo Dulce 29 1957-1985 975.9 1195.7 4.40 25.89 1.23 

21 Palo s Bl ancos 47 1939-1985 1481.8 1726.4 1.92 7.85 1.17 

22 Peric os 26 1960-1985 201.0 95.1 0.14 2.56 0.47 

23 Pi axtl a 16 1958-1973 1419.8 1587.8 2.48 10.79 1.12 

24 Pte Sud Pacífic o 35 1924-1958 2961.0 2204.9 1.41 7.20 0.74 

25 Puente C añed o 22 1932-1953 1116.0 932.7 0.76 3.35 0.84 

26 San Franci sco 33 1941-1973 1724.6 1450.1 1.89 7.03 0.84 

27 San Ignac io 19 1967-1985 1622.4 813.4 1.70 7.38 0.50 

28 Sanalona 42 1944-1985 447.3 505.4 2.99 13.49 1.13 

29 Santa Cruz 43 1943-1985 1269.7 1216.5 2.94 14.86 0.96 

30 Tamazula 23 1962-1984 583.6 278.0 1.38 5.46 0.48 

31 Tecusiapa 17 1958-1974 975.7 792.7 1.66 6.49 0.81 

32 Toahayana 29 1957-1985 1048.9 629.7 0.67 3.19 0.60 

33 Urique 19 1967-1985 302.6 148.0 1.16 6.81 0.49 

34 Zapotitlán 22 1960-1981 624.6 645.4 2.03 9.09 1.03 

35 Zopilote 47 1939-1985 363.2 275.9 0.69 2.81 0.76 



Table 2. The computed SE (in m 3 /s) for each analyzed gauging station 

Gauging S tation EVI-GVE M ixed Gumbel Mixed GVE Best distribution 

Acati tan 308.9 337.0 386.3 EV1-GVE 

Alamos 25.9 28.4 25.8 Mixed GV E 

Badirag uato 769.5 921.3 * EV1-GVE 

Bamicori 30.1 46.5 30.8 EV1-GVE 

Cazanate 377.9 443.8 372.1 Mixed GV E 

Chinipas 89.2 81.6 91.2 Mixed Gumbel 

Choix 152.7 118.5 146.2 Mixed Gumbel 

El Bledal 74.7 69.4 86.3 Mixed Gumbel 

El Mahone 24.0 8.5 8.6 Mixed Gumbel 

El Naranjo 112.0 174.4 125.9 EV1-GVE 

El Quelite 126.1 143.1 116.3 Mixed GV E 

Guamuchil 241.9 263.2 352.1 EV1-GVE 

Guatenipa 225.1 355.9 337.0 EV1-GVE 

Huites 614.1 987.0 805.6 EV1-GVE 

Ixpal ino 390.3 370.8 * Mixed Gumbel 

Jai na 402.8 411.2 * EV1-GVE 

La Huerta 364.0 99.0 * Mixed Gumbel 

La Ti na 122.4 105.4 127.3 Mixed Gumbel 

Las Cañas * 2139.1 790.5 Mixed GV E 

Pal o Dulce 884.9 963.3 900.5 EV1-GVE 

Pal os Blancos 340.1 550.9 294.4 Mixed GV E 

Pericos 19.2 18.1 26.3 Mixed Gumbel 

Pi axtl a 641.0 502.5 828.6 Mixed Gumbel 

Pte SudPací fico 614.8 658.0 624.5 EV1-GVE 

Puente Cañedo 149.8 135.6 174.8 Mixed Gumbel 

San Franc isco 323.4 333.8 302.8 Mixed GV E 

San Ignacio 296.6 344.4 273.8 Mixed GV E 

Sanalo na 115.8 214.6 214.5 EV1-GVE 

Santa Cruz 390.9 341.4 * Mixed Gumbel 

Tamazula 93.5 77.2 * Mixed Gumbel 

Tecusiapa 278.5 211.9 308.8 Mixed Gumbel 

Toahay ana 104.6 106.6 101.8 Mixed GV E 

Urique 92.2 44.1 * Mixed Gumbel 

Zapotitl án 219.0 301.1 238.6 EV1-GVE 

Zopi lote 37.4 37.6 38.6 EV1-GVE 

* No conver gence was attained in the esti ma tion of param e ters 



Table 3. Design events Q(m 3 /s) for the best fitted distri bu tion in each analyzed gauging station 

Retu rn period Tr(y ears) 

Gauging S tation 2 5 10 20 50 100 500 1000 

Acati tan 693.2 1610.3 2175.5 2720.9 3502.6 4168.2 6049.8 7039.0 

Alamos 198.1 418.5 522.0 589.4 651.0 685.1 742.8 770.0 

Alamos 203.9 396.2 496.0 585.3 697.6 780.7 971.7 1053.6 

Badirag uato 415.0 686.5 2369.1 4770.6 7736.6 10461.1 19586.4 25268.6 

Bamicori 116.4 353.7 499.8 574.5 635.0 665.2 706.8 717.3 

Cazanate 304.9 728.5 1295.8 1944.6 2934.4 3824.0 6550.4 8097.6 

Chinipas 1050.5 1484.1 1751.1 2003.3 2327.4 2569.5 3128.1 3368.2 

Choix 299.7 500.4 713.5 1013.9 1419.1 1709.0 2359.6 2636.2 

El Bledal 209.0 375.9 572.8 830.2 1147.9 1373.2 1879.4 2094.8 

El Mahone 197.7 214.6 226.9 240.4 260.5 276.8 315.8 332.8 

El Naranjo 377.2 937.0 1647.7 2001.4 2450.2 2808.3 3753.9 4223.0 

El Quelite 307.1 749.0 1052.7 1384.2 1896.1 2357.1 3757.6 4543.1 

Guamuchil 431.4 830.3 1236.2 1728.5 2472.7 3114.0 4953.5 5935.7 

Guatenipa 1593.2 3211.7 3903.2 4451.4 5041.7 5414.1 6096.2 6327.7 

Huites 1865.7 3428.2 6929.2 9949.8 13232.7 15504.8 20439.9 22464.1 

Ixpal ino 963.7 1580.2 2334.1 3720.8 5550.2 6835.9 9716.7 10941.7 

Jai na 807.3 1576.7 2480.2 3401.5 4707.4 5809.4 8894.1 10502.4 

La Huerta 801.9 1474.2 1627.1 1764.4 1937.2 2065.3 2359.5 2485.7 

La Ti na 71.0 127.2 173.6 254.1 563.3 726.9 1051.5 1184.8 

Las Cañas 929.2 4382.3 7643.8 8899.5 9703.0 10022.1 10355.7 10416.1 

Pal o Dulce 676.4 1097.1 1518.3 2137.7 3160.1 4012.9 6300.9 7450.2 

Pal os Blancos 871.2 2682.6 3850.1 5076.2 6882.0 8432.5 12820.8 15123.2 

Pericos 199.4 274.6 319.7 362.0 416.2 456.7 550.0 590.1 

Pi axtl a 781.0 1490.9 3902.2 5156.8 6582.3 7602.4 9910.7 10895.7 

Pte SudPaci fico 2833.8 4573.0 5709.2 6866.1 8493.5 9824.7 13327.1 15039.5 

Puente Cañedo 894.5 1914.3 2424.0 2889.1 3478.1 3915.5 4921.8 5353.7 

San Franc isco 1149.8 2590.9 3717.4 4733.3 6042.8 7045.4 9475.7 10577.5 

San Ignacio 1509.3 2246.5 2754.5 3308.9 4156.9 4911.2 7156.5 8391.5 

Sanalo na 301.4 517.5 764.3 1651.6 2296.9 2512.4 2728.8 2768.1 

Santa Cruz 927.0 1667.6 2625.1 3833.9 5249.3 6245.8 8480.8 9431.4 

Tamazula 510.4 747.8 939.4 1136.9 1398.4 1595.2 2049.7 2245.0 

Tecusiapa 698.5 1400.1 2112.2 2732.2 3480.1 4023.9 5262.5 5792.2 

Toahay ana 926.5 1666.1 1977.3 2214.4 2462.4 2615.7 2895.6 2995.6 

Urique 294.5 354.2 480.4 602.6 757.5 872.6 1137.5 1251.2 

Zapotitl án 533.7 1099.7 1517.6 1969.9 2646.9 3233.8 4911.4 5798.8 

Zopi lote 316.2 610.6 748.6 858.5 977.0 1052.0 1189.8 1236.8 



Table 4. Compar ison of design events Q(m 3 /s) and SE (in m 3 /s) for some selected stations of case study 

Return perio d Tr (years) 

Gaug ing Statio n Distributio n 2 5 10 20 50 100 500 1000 S E 

Chinipas EV1-GVE 1040 1542 1752 1912 2079 2181 2359 2417 89.2 

Mi xe d GVE 1040 1551 1763 1925 2096 2203 2427 2573 91.2 

Mi xe d Gumbel* 1051 1484 1751 2003 2327 2569 3128 3368 81.6 

Palo Dulce EV1-GVE* 676 1097 1518 2138 3160 4013 6301 7450 884.9 

Mi xe d GVE 672 1114 1539 2137 3262 4321 7402 9039 900.5 

Mi xe d Gumbel 702 1094 1395 1776 2806 4097 6984 8191 963.3 

San Francisco EV1-GVE 1155 2524 3543 4626 6256 7687 11879 14151 323.4 

Mi xe d GVE* 1150 2591 3717 4733 6043 7045 9476 10578 302.8 

Mi xe d Gumbel 1141 2613 3676 4605 5760 6613 8566 9404 333.8 

* Best distri bu tion according to the minimum value of SE. 

Conclu sions 

Floods are often generated by heterogeneous 

distributions composed of a mixture of two 

populations. Differences between the populations 

may be the result of a number of 

factors such as the El Niño/La Niña oscillations. 

In the analyzed area 62% of the highest 

annual maximum discharges (outliers) were 

generated in an El Niño year. The magnitude 

of these events is very important and floods 

can seriously affect people. For this reason, it 

is necessary to account with an additional 

mathematical tool that be able to reduce the 

uncertainty in estimating of design events, 

which are needed in many water-engineering 

studies and projects. 

In this paper a mixed distribution has been 

derived by considering different components 

in an opposite way as usually do. F ( x ) and 

1 

F2 ( x) of equation (1) were the EV1 and the 

GEV distributions, respectively. 

Results shown that there exists a reduction 

in the standard error of fit when using the 

EV1-GEV distribution in comparison with 

the mixed Gumbel or mixed GEV distributions, 

and just in one out of the 35 analyzed 

cases, the proposed distribution could not 

reach convergence in the estimation of parameters 

process. By contrast, the Mixed GEV 

distribution had seven failures with the same 

estimation process. 

In 13 sample data the EV1-GEV distribution 

produced the least standard error of 

fit (40% of analyzed cases) and in other 

different cases it was very close to the mixed 

Gumbel and mixed GEV distributions, However, 

as it was shown, differences between 

at-site design events can be significant as 

return period increases. A bad selection of the 

best distribution in the analyzed site can 

substantially modify the design event and 

also that the hydraulic project might become 

economically unfeasible or unsafe. Thus, by 

taking into consideration the mixed flood 

distributions a more accurate, physically 

based flood frequency analysis can be obtained 

and sensible savings in costs of 

construction of flood protection structures 

can be expected. This can also improve the 

setting of flood plain limits and the safety of 

control structures. 



Refer ences 

Alila Y. and Mtiraoui A. (2002). Implications 

of Heter o ge neous Flood-Frequency 

Distri bu tions on Tradi tional 

Stream-Discharge Predic tion Tech niques. 

Hydro log ical Processes, 16:1065-1084. 

Cavazos T. and Hastenrath S. (1990). 

Convec tion and Rain fall Over Mexico 

and their Modu la tion by the Southern 

Oscil la tion. Inter na tional Journal of 

Clima tology , 10: 377-386. 

Kite G.W. (1988). Frequency and Risk 

Analyses in Hydrology. Water Resources 

Publications, Littleton, Colo rado, USA. 

Kuester J.L. and Mize J.H. (1973). Opti mi - 

za tion Tech niques with FORTRAN . 

McGraw-Hill. 

Magaña V. and Ambrizzi T. (2005). 

Dynamics of Subtrop ical Vertical Motions 

Over the Amer icas During El 

Niño Boreal Winters. Atmósfera, 18(4): 

211-233. 

Magaña V., Vázquez J., Pérez J. and Pérez 

J.B. (2003). Impact of El Niño on 

Precip i ta tion in Mexico. Geofísica Internacional 

, 42(3): 313-330. 

Mood A., Graybill F. and Boes D. (1974). 

Intro duc tion to the Theory of Statis tics. 

Third Ed., McGraw-Hill. 

NERC (1975). Natural Envi ron ment Research 

Council. Flood Studies Report I, Hydrologic 

Studies. Whitefriars Press Ltd., 

London, United Kingdom. 

Prescott P. and Walden A. (1980). Maximum 

Like li hood Esti ma tion of the 

Param e ters of the Gener al ized Extreme 

Value Distri bu tion. Biometrika, 67(3): 

723-724. 

Raynal J. and Guevara J. (1997). Maximum 

Like li hood Esti ma tors for the 

two Popu la tions Gumbel distri bu tion. 

Hydro log ical Science and Tech nology 

Journal, 13(1-4):47-56. 

Raynal J. and Santillan O. (1986). Maximum 

Like li hood Esti ma tors of the 

Param e ters of the Mixed GEV Distri bu - 

tion. IX Congreso Nacional de Hidráulica. 

AMH. Querétaro, Qro., Mex. pp. 

79-90. (In Spanish) 

Semblanza del autor 

Dr. Carlos Agustín Escalante-Sandoval. Es doctor en ingeniería hidráulica por la Facultad de Ingeniería de la UNAM. 

Actualmente es profesor titular “C” de tiempo completo definitivo. Ha impartido 85 cursos en el Posgrado de 

la UNAM; dirigido 38 tesis de maestría y cinco de doctorado. Dentro de su producción académica se 

encuentran: 30 publicaciones en revistas con arbitraje, 45 en congresos nacionales e internacionales, 3 capítulos 

en libro, 2 libros como autor y otro como co-editor. Recibió la medalla Gabino Barreda por sus estudios de 

doctorado, el premio Distinción Universidad Nacional para Jóvenes Académicos en Docencia en Ciencias 

Exactas 1999 que otorga la UNAM y el Premio Nacional Enzo Levi “Investigación y Docencia en Hidráulica 

2002”, por parte de la Asociación Mexicana de Hidráulica. Es miembro del Sistema Nacional de Investigadores, 

Academia Mexicana de Ciencias, Academia de Ingeniería, Colegio de Ingenieros Civiles de México y la 

Asociación Mexicana de Hidráulica. 




Aplicación del algoritmo de solución 

paso-a-paso de la ecuación que determina la 

estabilidad de un generador síncrono 

H.A. Grajales-Román 

División de Ingeniería Eléctrica y Departamento de Ingeniería Eléctrica de Potencia 

Facultad de Ingeniería, UNAM 

E-mail: alfhugo@gmail.com 

(Recibido: marzo de 2006; aceptado: septiembre de 2006) 

Resumen 

La solución de la ecuación diferencial de orden dos, que representa en 

forma matemámática la dinámica de máquinas generadoras de corriente 

alterna, requiere de un algoritmo para su solución. La traducción a 

lenguaje de computadora del método paso-a-paso para la solución de la 

ecuación de oscilación que representa la dinámica del generador, permite 

el análisis de redes eléctricas cuando son sometidas a cambios repentinos 

que provocan oscilaciones de frecuencia, y por lo tanto, de tensión. El 

algoritmo se basa en la consideración del hecho que; se puede calcular un 

nuevo valor del ángulo δ , si se conoce su valor de cambio en el intervalo 

ante rior y se conoce la potencia acelerante en el nuevo intervalo de 

estudio. Con el apoyo del programa de computo llamado Matlab, se 

pueden realizar un sin número de corridas con valores diferentes de los 

parámetros del sistema, así como de los tiempos de apertura de los 

interruptores. Como resultado, el programa despliega la tendencia del 

rotor conocida como curva de oscilación. 

Descriptores: Ecuación diferencial, integración, lenguaje de computadora. 

Abstract 

The sec ond or der dif fer en tial equa tion so lu tion, which math e mat i cally rep re sents 

the dy namic of altern cur rent gen er at ing ma chines, re quires an al go rithm for its 

so lu tion. The com puter ma chine lan guage trans la tion of step-by-step method for 

the so lu tion of swing ing equa tion which rep re sents the dy namic gen er a tor, al lows 

the anal y sis of elec tri cal net works when are sub ject to sud den changes that mo tive 

os cil la tion of fre quency and there fore ten sion. The al go rithm is based on the fact of 

the pos si bil ity to ob tain a new value of the ä (delta) an gle, as long as its value is 

known in the pre ced ing in ter val and its ac cel er at ing power is known in the new 

study in ter val. With the sup port of Mathlab soft ware, it is pos si ble to ac com plish 

end less num ber of runs with many dif fer ent val ues and sys tem pa ram e ters, as well 

as time open ing of cir cuit break ers. As a re sult, the pro gram plots a curve that 

shows the os cil la tion ten dency. 

Keywords: Dif fer en tial equa tion, in te gral, com pu ta tion lan guage.

Aplicación del algoritmo de solución paso-a-paso de la ecuación que determina la estabilidad ... 

Introducción 

Los sistemas eléctricos de potencia están sujetos 

a cambios de cargas, algunas graduales 

y otras bruscas, unas por conexión de cargas 

ligeras y otras como fallas en las líneas de 

conducción, o en sus torres soportes, causando 

por lo tanto, que la estabilidad del 

sistema de transmisión de energía eléctrica 

entre en crisis. 

Se define como límite de estabilidad en 

estado permanente de un generador o de un 

sistema, a la máxima potencia que puede ser 

transmitida a cambios de carga que permitan 

ajustes de excitación suficientes como para 

que se recupere el valor normal de la tensión 

que se tenía antes del cambio. 

Si el ajuste de excitación se presenta con o 

inmediatamente después del cambio de carga, 

el limite de estabilidad en estas condiciones 

es llamado “límite dinámico del estado 

permante”. 

La bondad, flexibilidad o rigidez de un 

sistema eléctrico de potencia, dependerá de 

los elementos que lo conforman para este fin, 

como son, dispositivos de control, regulación, 

excitación, protección, elevación y reducción, 

por mencionarlos; de los cuales, 

algunos permanecen censando, otros enviando 

información sobre el estado y otros operando 

para mantener el sistema dentro de los 

parámetros de seguridad. 

La base de los sistemas, el 

generador 

De estos sistemas, el más importante por su 

razón de ser, es el generador de corriente 

alterna, también conocido como generador 

síncrono. 

La expresión matemática de una fase del 

generador síncrono de polos lisos conforme a 

la ley de tensiones de Kirchhoff es: 

E = V + ( r + jX ) I [ v ] (1) 

AC A d A 

y su representación fasorial se muestra en la 

figura 1. 

En donde: 

E A C 

: tensión inducida en las bobinas de la 

armadura 

V: tensión en las terminales del generador 

I m 

E A C 

FM MC 

Xd IA 

ρ 

V 

r A I A 

R e 

I A 

FM M A 

Figura 1. Representación fasorial de un generador síncrono de polos lisos 



I A : corriente de armadura 

rA yX 

d 

: rA 

: valor de la resistencia de los 

conductores que conforman las bobinas de la 

armadura y X d : el valor de la característica de 

magnetización que genera la corriente de 

armadura en las laminaciones de acero en 

donde están alojadas las bobinas. 

Esta representación del generador es por 

fase, siendo los generadores trifásicos. 

El resultado de la expresión (1), E AC 

, es un 

vector que tiene una dirección determinada 

por el ángulo δ. Este ángulo representa en 

grados eléctricos la desviación que existe entre 

la tensión inducida en las bobinas de la 

armadura y la tensión en las terminales de la 

máquina. 

Por otro lado, del desarrollo de la potencia 

aparente se determina la potencia real o 

activa que el generador entrega en sus terminales 

al sistema eléctrico y que resulta ser 

P E V AC 

* 

= sen δ [ w/fase] 

(2) 

X 

d 

La potencia trifásica es la expresión (2) 

multiplicada por 3. Como lo muestra la 

expresión (2), la potencia que entrega un 

generador es directamente proporcional al 

producto de la tensión inducida en las 

bobinas de la armadura por la tensión en sus 

terminales e inversamente proporcional al 

valor de la reactancia que separa estas dos 

tensiones. La representación de la expresión 

(2) es una senoide como se muestra en la 

figura 2, y el valor de generación de potencia 

máxima se presenta precisamente cuando el 

ángulo entre la tensión inducida y la tensión 

en el extremo final de la reactancia que las 

separa, que es la de las terminales, tiene un 

valor de 90°. 

Cuando d = 90° 

P 

MAX 

EAC 

= 

* V 

X 

d 

[ w] 

El control que se tiene sobre los generadores 

conectados a un sistema o sistemas es 

entre otros, el de la velocidad de rotación. Si 

un generador aumenta o disminuye su velocidad, 

lo mismo lo hace la frecuencia de 

generación. La frecuencia en México es de 60 

Hertz y se mantiene en toda la red eléctrica. 

P n 

f = × Hertz 

2 60 [ ] 

En donde f es la frecuencia, P el número de 

polos del rotor y n las revoluciones por 

minuto del rotor. Como se mencionó anteriormente, 

la ocurrencia de algún tipo de 

falla, hace que todo el sistema interconectado 

actúe de forma que la sección que circunda la 

Figura 2. Curva Ángulo-Potencia de un generador síncrono de polos lisos 



falla pueda ser aislada eléctricamente. Lo 

anterior es de gran trascendencia, puesto que 

equivale afirmar que en el tiempo más corto 

posible después de ocurrida una falla en 

algún punto de la red de suministro, el 

sistema continúe activo, logrando equilibrarse 

con las máquinas generadoras que continúan 

activas y aportando la alimentación 

eléctrica lo más estable posible. 

Leyes de la dinámica del rotor 

Por la relación existente entre la frecuencia 

y las revoluciones de giro del rotor, continuamente 

se hacen ejercicios y pruebas a 

ciertas partes de los sistemas eléctricos. El 

más riguroso es precisamente la simulación 

de la estabilidad de los generadores interconectados. 

Con el apoyo de programas de 

computo se simula el comportamiento 

dinámico de los generadores, ya sea individualmente 

o interconectados, y se analizan 

sus resultados para posibles prevenciones. 

La transformación de la energía se realiza a 

través del rotor del generador. La máquina 

primaria aporta su potencia al rotor del 

generador y éste, en su rotación alrededor de 

las bobinas del estator, induce una tensión 

eléctrica que debe ser igual en unidades de 

potencia a la aplicada al rotor. La corriente que 

demanda la carga es suministrada por el valor 

de la excitación de los polos del rotor y de la 

potencia de la máquina impulsora. Las tres 

corrientes monofásicas generan en el núcleo 

del estator un campo magnético giratorio. 

Al presentarse una falla en el sistema, la 

potencia eléctrica que aporta el generador 

sufre un cambio en el campo magnético giratorio 

y éste como se separa del eje del rotor, 

acciona a favor o en contra del par aplicado 

por la máquina impulsora, dependiendo de 

la característica de la falla. 

Durante el corto tiempo que dura la respuesta 

de control sobre el rotor, éste pierde 

sincronismo y se va separando del eje magnético 

del campo giratorio. 

La diferencia de potencia entre la entrada 

y la salida presenta un desequilibrio. Esta 

diferencia es, naturalmente, una potencia 

acelerante o desacelerante, según sea la magnitud 

de la potencia de salida. Así 

Pa = Pmec − P [ w ] (3) 

eléc 

Cuando la potencia eléctrica es mayor a la 

mecánica, la potencia eléctrica está frenando 

a la máquina impulsora, por lo tanto, es una 

potencia desacelerante. Lo contrario a lo 

anterior, es una potencia acelerante. 

La ecuación matemática que resuelve la 

expresión 3, se deriva de los principios de la 

cinemática. Sabemos que el trabajo es igual a 

fuerza por distancia o en fórmula para trabajo 

circular. 

T = F × r × θ [ Kg − m − rad] 

La diferencial en el tiempo del trabajo es 

d 

d( T) = τ θ = τω [ Joules] 

dt 

? es el desplazamiento circular del rotor. 

Por otro lado, la energía cinética de un 

cilindro macizo es 

1 m × r 

EC = 

2 g 

2 

2 

ω [ Joules] 

En donde m es la masa del cilindro en Kg. 

y r su radio en metros. 

Cuando la velocidad angular aumenta en 

dω, el incremento de energ ía cinética es 



d( EC) = 

m × r 

2 ω 

d ω [ Joules] 

g dt 

Puesto que el trabajo realizado es igual al 

incremento de energía cinética, podemos 

escribir 

y 

d( T) = d( EC ) 

τ dθ m × r 

2 d 

= ω ω 

(4) 

dt g dt 

d 

τ = Iω ω = Iα 

[ Newtons −m 

] (5) 

dθ 

respecto a una referencia en el estator. Estos 

grados irán en aumento a manera que transcurre 

el tiempo. Sin embargo, la corriente de 

armadura genera un campo magnético que 

gira en el estator y es estacionario con 

relación al rotor; sin embargo, siguen teniendo 

distintas referencias. 

Idealmente instalaremos una tercera referencia 

en la que las otras dos coincidan 

(Figura 3). 

θ = ωst 

+ δ [ grados ] 

En donde 

m r 

I = 

g 

× 2 

momento de inercia de la masa m[ Kg −m 

2 

] 

α = ω dθ dω 

aceleración angular [ rad − seg ] 

M = Iω momento angular [ Joules − seg / rad ] 

Multiplicando la expresión (5) por la 

velocidad angular ? , tendremos la potencia. 

Entonces: 

τ ω = Pa = Iωα = Mα 

[ watts] 

2 

θ 

Pa = Mα 

= M d 2 [ watts] (6) 

dt 

(6) representa el valor de la expresión (3), 

por lo que reescribiendo 

Pa = M α = P mec − Peléc 

[ watts] (7) 

θ es en grados geométricos, la posición 

que guarda el polo al estar girando con 

2 

Figura 3. Determinación del ángulo δ 

Derivando dos veces 

dθ dδ 

= ω 

s 

+ 

dt dt 

2 2 

d θ d δ 

= = α 

2 2 

dt d t 

Entonces podemos escribir (7) 

2 

M d δ 

Pa Pmec Pelé c watts 

2 = = − [ ] (8) 

dt 

Que es la ecuación diferencial que representa 

al generador síncrono para un estudio 

de estabilidad. 

Para diferenciarlos entre varios generadores, 

al momento angular o constante de 



inercia M, hay que definirla con las características 

individuales de los generadores. 

como 

H = 

energía almacenadaa vel. 

sín crona 

poten cia nominal 

1 

Iω 

Energía cinética 

H = = 

2 

S 

S 

N 

S N H = 1 Mω 

2 

momento cinético en donde ωs es la velocidad 

síncrona, despejando 

M = 2 H S 

ω 

S 

N 

Sustituyendo en (8) 

S 

N 

mega Joules 

[ 

] 

rads. 

mec 

2 

2H d δ Pa 

1 

2 = = ( Pmec 

− Pe léc ) [ pu ] 

ω dt S S 

S 

finalmente si 

y 

M 

entonces 

N 

N 

ωS = 2 πf = 3 60 ° f [ ° Eléc] 

= 2H ωS 

2 

mega Joules − seg 

en [ ] 

° Eléctricos 

H d δ 

P P watts 

2 = mec − eléc [ ] (7) 

180 f dt 

2 

El presente trabajo muestra la solución de 

la ecuación de oscilación de un generador 

síncrono en un sistema de dos líneas conectadas 

en paralelo, a una carga que demanda 

la energía que envía el generador, 

como se muestra en la figura 5. Apoyándose 

en el programa Matlab, se muestra como 

resultado la trayectoria del ángulo δ a la 

aplicación de una falla sostenida. Traducido a 

lenguaje de computadora el algoritmo de 

solución paso-a-paso, se pueden realizar 

numerosos ensayos en donde se pueden 

cambiar los valores de los parámetros involucrados 

como la potencia que se transfiere 

en el momento de la falla, características del 

generador, características de las líneas y 

transformadores, tiempos de apertura de los 

interruptores que limpian la falla, parámetros 

de la carga, etc. 

En el estudio de la dinámica del rotor, la 

potencia mecánica es considerada constante, 

puesto que es la potencia real aplicada al 

rotor proveniente de la máquina impulsora y 

que éste transforma en energía eléctrica por 

medio de la excitación principal y el campo 

magnético giratorio. Durante el tiempo de 

respuesta del sistema de control de la máquina 

impulsora, el rotor del generador se 

desliza a valores peligrosos, y es aquí donde 

entran en juego las características del sistema 

eléctrico en su totalidad. 

Una disminución en el par electromagnético, 

el par acelerante aumenta. En el tiempo 

que tardan los mecanismos de control para 

ajustar a la velocidad síncrona, el rotor se 

desliza de su posición hacia valores mayores 

y alcanzará valores que ponen en crisis la 

estabilidad del sistema eléctrico. La solución 

de la ecuación dinámica del generador, consiste 

en calcular el ángulo δ en función del 

tiempo, durante un período suficiente para 

determinar si δ crecerá sin límite o alcanza un 

máximo y tiende a regresar. 



Análisis del método 

En el método de integración paso-a-paso para 

resolver la ecuación diferencial, que es un 

método entre varios existentes, se declara el 

más práctico y de buena exactitud, el cual 

manifiesta las siguientes suposiciones: 

1. La potencia acelerante P a 

calculada 

al principio de un intervalo es constante 

desde la mitad del intervalo anterior hasta la 

mitad del intervalo en estudio. 

2. La velocidad angular ω, es constante 

durante cualquier intervalo calculado a 

la mitad del intervalo. 

Naturalmente, estas suposiciones no se 

cumplen, puesto que δ cambia continuamente, 

y por lo tanto, también lo hacen P a 

y 

?. Si embargo, si los tiempos son lo suficientemente 

pequeños, estas consideraciones 

son bastante aceptables (Figura 4). 

La potencia acelerante es calculada para 

los puntos 3, 2 y 1 que son los fines de los 

intervalos n-1, n, n+1. La curva de P a 

, 

representa la suposición de que P a 

es constante 

en puntos medios de los intervalos 

(Figura 4a). 

De manera semejante, ? que representa el 

exceso de velocidad síncrona ?s, se muestra 

como un escalón que es constante durante el 

intervalo con valor determinado a la mitad 

del mismo. Entre las ordenadas n–3/2 y n–1/2 

existe un cambio de velocidad causada por el 

valor constante de P a (Figura 4b). 

El cambio de δ en cualquier intervalo, es el 

producto de ω por el intervalo y el tiempo de 

duración del mismo. 

El cambio de δ durante el intervalo n-1 

(Figura 4c) es 

∆δn − 1 = ∆δ n −1 − ∆ δn − 2 = ωsn−3 / 2 ∆t 

Pa( n− 

1 ) 2 

∆δn 

= ∆δn 

− 1 + ( ∆t) (8) 

M 

La expresión (8) calcula el cambio de d 

durante un intervalo si se conoce su valor en 

el intervalo anterior, y la potencia acelerante 

en el intervalo precedente. Así, la potencia 

acelerante debe calcularse al principio de 

cada intervalo para obtener suficientes puntos 

de la curva de oscilación. 

Estas instrucciones se repiten durante el 

proceso de cálculo acomodando la instrucción 

correspondiente, según sea el tiempo de 

abertura de dos interruptores a la vez o de 

dos con diferentes tiempos de operación. 

El programa anexo, desarrolla los cálculos 

y presenta la respuesta en forma gráfica de 

un generador síncrono aportando su potencia 

a una carga conectada al final de dos líneas 

paralelas, como se muestra la figura 5. 

El cambio de velocidad es igual al 

producto de la potencia acelerante por el 

valor del intervalo. Así 

ω' 

2 

d δ Pa n− 

− ω' 

n− 

= ∆t 

= 

2 

dt M 

n−1 / 2 3/ 

2 

( 1 ) 

∆ t 



Pa(n-2) 

3 

calculada 

Pa(n-1) 

2 

s upuesta 

Pa(n) 

1 

P a 

n-2 n-1 n 

t 

a 

calc ulada 

ω (n-1/2) (n-1/2) 

ω (n-3/2) (n-3/2) 

ω (n-1/2) (n-3/2) -ω(n-3/2) 

supuesta 

ω 

n-3/2 

∆t 

t 

n-1/2 

∆t 

t 

b 

t 

δ 

∆δn ∈n 

∆δn-1 ∈n-1 

n-2 n-1 

n 

Figura 4. Valores reales y supuestos de de ω, δ y Pa 

c 

t 



T1 

P 

T2 

A 

B 

Xr 

G X’d 

C 

D 

T3 

F 

T4 

Figura 5. Diagrama unifilar del Sistema Eléctrico de Potencia 

Cada una de las líneas tiene un transformador 

elevador y uno reductor en cada 

extremo, así como un interruptor que separa 

a cada línea de la carga y del generador. Los 

parámetros por conveniencia están dados por 

unidad, como todos, en base al generador. 

Conclusiones 

El problema de estabilidad de un generador 

síncrono, implica entre varios objetivos, el 

análisis del comportamiento de los elementos 

físicos que componen una red eléctrica, como 

cables que transmiten potencia eléctrica, transformadores 

de potencia, características de la 

carga eléctrica, así como la cantidad de potencia 

transferida del generador a la carga en 

el instante de la falla. Por otro lado, la observación 

y determinación del ángulo de 

potencia que alcanza el rotor, debido a la falla 

que determina si el generador pierde sincronismo, 

y por tal razón, se desconecta del 

sistema. El análisis del deslizamiento del ángulo 

delta versus tiempo, determina la velocidad 

de respuesta del equipo de control de la 

máquina impulsora, así como de los relevadores 

de protección de los interruptores de 

las líneas y los del generador. Por último, se 

genera la intención de dar a conocer un algoritmo 

a los interesados en estudios de dinámica. 

Información del sistema 

El sistema consiste de un generador conectado 

a una carga por el extremo de dos líneas 

paralelas. Es decir, las líneas son conectadas 

en sus extremos por dos barras de donde se 

unen, por un lado, el generador y por el 

extremo opuesto una carga que demanda la 

energía de éste. 

Las líneas como protección, cuentan con 

un interruptor en sus extremos que las separa 

con sus respectivos transformadores de las 

barras, en el caso de una falla en ellas. 

El generador transfiere, por la diferencia 

de potenciales entre la barra del transmisor y 

la barra del receptor, un porcentaje de su 

potencia, pudiendo ser también el 100%. 

En cierto instante, una de las líneas sufre 

un desperfecto en el punto F y durante el corto 

tiempo que el dispositivo censor instruye 

al mecanismo de control de la máquina 

impulsora, tal como compuertas o válvulas, 

el rotor no tiene freno, que es en sí, la propia 

carga eléctrica, por lo que se sale de sincronismo. 

La falla es de las llamadas sostenidas, de 

tal manera que la malla eléctrica se ve 

modificada por la reestructuración que se 

dio al aislar la falla y la sobrante continúa 

activa sin aislar al generador. La falla 

ocurre a la mitad de la línea que une los 

interruptores C y D. 

El problema que se presenta es un ejemplo 

de muchos, en donde los parámetros son 



tales que el rotor no se desliza, sino que 

retoma en cierto tiempo su posición original. 

El interesado puede variar los parámetros 

sugeridos en este trabajo y comprobar por su 

cuenta, con datos propios. 

Datos del problema 

S: potencia aparente nominal del generador: 

100000000 VA 

V: tensión nominal del generador:13800 

volts. 

X´d: reactancia transitoria del generador: 

0.476 pu 

fp: factor de potencia: 0.9 

f: frecuencia: 60 Hertz 

H: constante de inercia: 7.0 mega-Jouls 

/MVA 

p: potencia transferida: 0.95 pu 

XL: reactancias de las líneas: 0.3465 pu 

XT: reactancias de los transformadores: 

0.293 pu 

%V: tensión en por ciento del nodo de la 

carga: 0.9 pu 

Xr: reactancia en el nodo de carga: 0.476 pu 

t1: 1er tiempo de abertura:0.08 seg 

t2: 2º tiempo de abertura: 0.12 seg 

tf: tiempo de duración :0.20 seg 

Curva de oscilación del rotor de 

un generador de polos lisos como 

respuesta a una falla de un 

sistema eléctrico de potencia 

Con la información solicitada por el programa 

y ya aplicado “enter” en la pantalla de 

trabajo, aparecen en el orden siguiente los 

valores calculados de: Vn, In, Ia, fp, Xe1, Eac, 

delta y P11, tensión nominal, corriente nominal, 

corriente de armadura, factor de 

potencia, reactancia equivalente antes de la 

falla, tensión inducida, ángulo de fase y 

potencia eléctrica antes de la falla. Xe2 y P22 

reactancia equivalente y potencia eléctrica 

durante la falla y Xe3 y P33, reactancia y 

potencia eléctrica después de la falla. Los 

tiempos de apertura de los interruptores 

deben ser mayores a 0.01 y además múltiplos 

a éste. Se estima que el valor final del estudio 

es suficiente (Gráfica 1). 

Gráfica 1 



Programa de cómputo 



Referencias 

Luthe A., Olivera A., Schutz F. (1985). 

Métodos numéricos. Limusa, México, 

pp. 215-220. 

Stevenson W.D. Jr. (1982). Elements of 

Power System Anal ysis. Inter na tional 

Student Edition, México, pp. 409-416. 

Enriquez H.G.(1982). Sistemas eléctricos de 

potencia. Limusa, México, pp. 184-191. 

Semblanza del autor 

Hugo Alfredo Grajales-Román. Obtuvo la licenciatura en ingeniería mecánica eléctrica en la Facultad de Ingeniería 

de la UNAM. Realizó estudios de posgrado en la Universidad de Houston Texas, EE.UU. y en la entonces 

División de Estudios Superiores de la FI, UNAM. En México, dentro de la Comisión Federal de Electricidad 

laboró como ingeniero de puestas en servicio de plantas, así como asesor en la adquisición de equipo para 

plantas. Fue investigador comisionado en el Instituto de Ingeniería, UNAM con la realización de un proyecto 

para Centro Nacional de Control de Energía, CENACE. Fue gerente de operación y planeación de plantas en 

Tabacos Mexicanos. Ha sido profesor durante 31 años en la Facultad de Ingeniería, UNAM. 




Imaginología por resonancia magnética y la 

determinación de cloruro y sodio en mortero 

de cemento Pórtland 

P.F. de J. Cano-Barrita 1 , B. J. Balcom 2 y T.W. Bremner 3 

1 

CIIDIR-Oaxaca, Instituto Politécnico Nacional de México, Oaxaca. 

2 

2MRI Centre, Physics Department, University of New Brunswick, Fredericton, NB, Canada 

3 Civil Engineering Department, University of New Brunswick, Fredericton, NB, Canada 

E-mails: pcano@ipn.mx, bjb@unb.ca y bremnert@unb.ca 

(Recibido: marzo de 2006; aceptado: diciembre de 2006) 

Resumen 

La corrosión del acero de refuerzo es una de las causas principales del deterioro 

de estructuras de concreto. La penetración de cloruros a través de difusión o 

absorción capilar o una combinación de ambos, contribuye de manera importante 

en la corrosión del acero de refuerzo. En países con clima frío, las sales 

descongelantes usadas en invierno son un factor importante en el deterioro de 

estructuras, y en muchos países, los cloruros del agua de mar exacerban el 

proceso de deterioro. Para evaluar la distribución de cloruros en concreto, 

normalmente se utilizan métodos destructivos, cuya resolución espacial es baja y 

consumen una cantidad consid er able de tiempo. Una alternativa no destructiva 

es el uso de la técnica SPRITE de resonancia magnética, la cual ha demostrado ser 

conveniente para determinar la distribución de diferentes especies en materiales 

basados en cemento Pórt land. En este artículo se demostrará la habilidad de la 

técnica SPRITE para determinar la distribución de cloruros y sodio en mortero, 

durante absorción capilar y difusión. Además, los experimentos preliminares 

indican que la técnica puede ser utilizada para determinar la distribución de 

cloruros en mortero y concreto, conteniendo cemento ordinario. Esto abre la 

posibilidad de estudiar la distribución de cloruros en corazones de concreto 

extraídos de estructuras reales. 

Descriptores: Resonancia magnética, cloruros, no destructivo, difusión, absorción 

capilar, mortero. 

Abstract 

Cor ro sion of the re in force ment is one of the main causes of de te ri o ra tion of con crete 

struc tures. Chlo ride pen e tra tion into con crete due to ei ther dif fu sion or ab sorp tion is an 

im por tant con trib u tor to the cor ro sion of em bed ded steel in con crete. In north ern coun - 

tries, deicing salts are a ma jor fac tor in the de te ri o ra tion of high ways and in all coun - 

tries, chlo rides from sea wa ter ex ac er bate the de te ri o ra tion pro cess. In or der to as sess the 

chlo ride pen e tra tion, de struc tive, low spa tial res o lu tion and time con sum ing meth ods 

are rou tinely used. The SPRITE Mag netic Res o nance Im aging is a non-destructive 

tech nique that has dem on strated to be suit able to im age ma te ri als pos sess ing short life - 

time sig nals in clud ing Pórt land ce ment based ma te ri als. This pa per will dem on strate 

the abil ity of SPRITE MRI to de ter mine the dis tri bu tion of chlo rides in mor tar dur ing 

NaCl so lu tion cap il lary ab sorp tion or dif fu sion. In ad di tion, pre lim i nary ex per i ments

Imaginología por resonancia magnética y la determinación de cloruro y sodio en mortero de ... 

in di cate that the tech nique can be used to im age the dis tri bu tion of chlo rides in con - 

crete/mor tar con tain ing nor mal Port land ce ment, which makes it pos si ble to study 

the pen e tra tion of chlo rides in cores taken from field con crete. 

Key words: Mag netic res o nance, chlo rides, non-destructive, dif fu sion, cap il lary ab - 

sorp tion, mor tar. 

Intro duc ción 

La determinación de la profundidad de penetración 

y distribución de cloruros en 

materiales basados en cemento Pórtland, es 

importante desde el punto de vista de durabilidad 

de estructuras de concreto reforzado. 

El ingreso de cloruros, a través de procesos 

de difusión y absorción capilar, puede depasivar 

la capa protectora sobre el acero de 

refuerzo y causar corrosión del mismo. 

La manera usual de determinar la profundidad 

de penetración o la distribución de 

cloruros en concreto, implica destruir el espécimen. 

Las técnicas comunes requieren obtener 

muestras de polvo a diferentes profundidades 

y mediante procedimientos de 

titulación química se determina la concentración 

de cloruros. Otra prueba sólo requiere 

aplicar una solución (por ejemplo, nitrato de 

plata) sobre un espécimen recién fracturado 

para determinar la profundidad de penetración 

de cloruro (Otsuki et al., 1992). El primer 

procedimiento proporciona un perfil con 

resolución espacial baja y es inherentemente 

destructivo. Sin embargo, con dispositivos 

adecuados es posible aumentar la resolución 

al obtener muestras de polvo a distancias de 

unos cuantos milímetros, aunque el problema 

de destruir el espécimen persiste. El 

segundo procedimiento sólo proporciona la 

profundidad de penetración de los cloruros y 

el perfil de concentración se desconoce. 

La resonancia magnética ha sido utilizada 

con éxito para determinar en forma no destructiva 

la distribución de agua, cloruros y 

sodio en materiales de construcción. Pel et al. 

(2000), realizaron un estudio de la penetración 

de solución de NaCl en ladrillo de silicato 

de calcio; sin embargo, la técnica tradicional 

de resonancia magnética utilizada 

tiene limitaciones en cuanto a la vida de la 

señal, T2 * , y sólo pudieron obtenerse perfiles 

de sodio y agua. Cano et al . (2002) obtuvieron 

los primeros perfiles de cloruros, sodio y 

agua en mortero de cemento portland blanco 

durante absorción capilar de una solución de 

NaCl. En esta investigación se utilizó cemento 

Pórtland blanco, debido a su bajo contenido 

de hierro, lo cual era necesario para 

determinar la distribución de agua, pero normalmente 

el utilizado en la práctica contiene 

cemento Pórtland ordinario y adiciones 

minerales (ceniza volante, humo de sílice, 

escoria de alto horno, etc.) que incrementan 

sustancialmente la cantidad de impurezas 

paramagnéticas en la muestra. 

Este artículo presentará los resultados del 

uso de la técnica de resonancia magnética 

SPRITE para determinar la distribución de 

cloruros y sodio en mortero que contiene 

cemento Pórtland ordinario durante absorción 

capilar de una solución de NaCl. 

También se determinó la distribución de 

cloruro y sodio durante difusión. Es importante 

mencionar que el uso de materiales 

con bajo contenido de hierro no es necesario 

en el caso de 35 Cl y 23 Na, como en la determinación 

de la distribución de 1 H del 

agua. Esto significa que en concreto el fabricado 

con varios tipos de cemento Pórtland, la 

mayoría de los tipos de agregados pueden ser 

utilizados. 


P.F. de J. Cano-Barrita, B. J. Balcom y T.W. Bremner 

Técnica Sprite (Single Point 

Ramped Imaging With T1 

Enhance ment) 

Detalles de la técnica SPRITE pueden obtenerse 

en Balcom et al. (1996). La intensidad de 

la señal, S, en cualquier punto de una imagen 

uni-dimensional (perfil), se relaciona con la 

densidad de núcleos local, por medio de la 

ecuación (1). 

T R 

tp ⎛ 

− 

− 

T1 

T ⎜ 

2 * 1 − e 

S= ρ ⋅ e ⋅ 

⎜ 

⎝ 1 −cosα 

⋅e 

− 

TR 

T1 

⎞ 

⎟ 

⋅sin α (1) 

⎟ 

⎠ 

donde tp es el tiempo de codificación de la 

fase, T2 * es el tiempo de relajación “spinspin”, 

TR es el tiempo de la repetición de los 

pulsos de radio frecuencia, α es el ángulo de 

rotación de la magnetización y T1 es el tiempo 

de relajación “spin-lattice”. En la ecuación (1) 

el término entre paréntesis representa el 

estado constante de la magnetización longitudinal 

establecido después de varios pulsos 

de radio frecuencia y es válido sólo para el 

hidrógeno del agua que tiene “spin” I=1/2. 

Este término tendrá una representación más 

compleja para el sodio y núcleos del cloro que 

tienen “spin” I=3/2 (Mitrovic et al., 2001). Esta 

técnica se representa esquemáticamente en la 

figura 1. 

Procedimiento exper i mental 

En la preparación de morteros con relación 

a/c=0.60 se utilizó agregado de cuarzo, cemento 

Pórtland blanco y ordinario Tipo I. En 

el cuadro 1 se proporcionan las propiedades 

físicas y químicas de los cementos usados. Se 

fabricaron cilindros de 30 mm de diámetro y 

se curaron en húmedo durante tres días a 

38 o C. Después, los especimenes se cortaron a 

una longitud de 30 mm y se secaron en horno 

a 105 o C hasta masa constante. Finalmente, en 

la superficie cilíndrica se aplicó resina epóxica 

para hacer la penetración de la solución de 

NaCl uniaxial (Figura 2). 

Figura 1. La técnica SPRITE uni-dimensional. El gradiante del campo magnético es cambiado en 64 

pasos. Solo un punto es adquirido en cada cambio del gradiante a un tiempo tp después de la aplicación de 

cada pulso de radio de frecuencia de radio, con ángulo α. El tiempo de repetición, TR, es el tiempo entre 

la aplicación de pulsos de radio frecuencia en cada cambio de gradiente 



Cuadro 1. Propiedades físicas y químicas del cemento ordinario y blanco 

Figura 2. Arreglo utilizado para la prueba de absorción uniaxial de solución de NaCl y difusión en 

especimenes de mortero. Los experimentos de absorción capilar se llevan a cabo a la temperatura ambiente 

y los especimenes usados para difusión se mantuvieron dentro de una cámara ambiental a 38°C 

Se realizaron experimentos para determinar 

los tiempos de relajación T2 * y T1 de 1 H, 23 Na 

y 35 Cl en los especimenes estudiados. Los 

perfiles de distribución se obtuvieron con la 

técnica SPRITE utilizando un magneto superconductor 

Nalorac (Martinez, CA) de 2.4 

Tesla, 32 cm de diámetro interior, con un 

micro-gradiente de 8 cm de diámetro interior 

enfriado con agua. Se utilizó un emisor/receptor 

de radio frecuencia tipo jaula (Morris 

Instruments, Ottawa) para la determinación 

de 1 H, así como un nuevo diseño para el caso 

de 23 Na y 35 Cl. La consola del espectrómetro 

fue una Tecmag (Houston, TX) Apolo. El amplificador 

de radio frecuencia fue el modelo 

3445 (Brea, CA) de 2 Kw de potencia. 

Los especimenes usados para la absorción 

capilar de solución de NaCl se colocaron en 

un recipiente poco profundo y se permitió 

absorber la solución en un extremo. La 

concentración de NaCl en el recipiente fue de 

200 g/L, la cual es aproximadamente seis 

veces el de NaCl en agua de mar. Se 



realizaron mediciones con la técnica SPRITE 

para observar la penetración de 23 Na (Na + ), y 

35 Cl (Cl - ). Debe mencionarse que 37 Cl no 

contribuyen a la señal porque su frecuencia 

de resonancia es diferente de la de 35 Cl. La 

abundancia natural de cada uno es 24.47% y 

75.53%, respectivamente. 

Un arreglo similar al mostrado en figura 2 

fue usado para los experimentos de difusión 

de Na + y Cl - en especimenes de mortero de 

cemento Pórtland blanco. Dos especimenes 

idénticos saturados con agua fueron puestos 

en contacto con una solución de NaCl al 20%. 

Las medidas de SPRITE uni-dimensionales se 

realizaron semanalmente por un período de 

seis semanas. 

En cada experimento, una referencia 

conteniendo solución de NaCl se colocó sobre 

el espécimen para permitir escalar los perfiles 

y compensar por variaciones pequeñas en la 

sensibilidad del instrumento (Figura 2). 

Resultados y discusión 

Tiempos de relajación 

Los tiempos de relajación T1 y T2 * para 1 H, 

23Na y 35 Cl en mortero a 72 horas de iniciado 

el experimento, se muestran en el cuadro 2. 

Ambos tiempos son menores de 5 ms, lo que 

hace a SPRITE una técnica requerida para 

obtener imágenes de estas especies. Los 

tiempos de relajación T1 y T2 * son exponencial 

simple, salvo los T2 * para el sodio y cloruro 

que tienen dos componentes. Note que los 

tiempos de relajación en mortero que contiene 

cemento ordinario son del mismo orden 

de magnitud comparado a los especimenes 

que contienen cemento blanco. Esto indica 

que los mecanismos de relajación dominantes 

en 23 Na y 35 Cl son diferentes a los que se 

tienen en la relajación de 1 H del agua, cuya 

relajación es rápida y no puede observarse 

fácilmente con el equipo disponible en el 

laboratorio. 

Cuadro 2. Tiempos de relajación T 1 

y T 2 

* para 1H, 23Na y 35Cl en especimenes de mortero fabricado con 

cemento Pórtland blanco y ordinario 



Difusión de 23 Na y 35 Cl en mortero de 

cemento Pórtland blanco 

Las figuras 3 y 4 muestran la distribución de 

Cl - y Na + , respectivamente, obtenida en dos 

especimenes idénticos preparados con cemento 

Pórtland blanco. Nótese que los resultados 

en ambas figuras son muy similares, 

como es de esperarse. En éstas figuras puede 

observarse que la concentración en la cara en 

contacto con la solución de NaCl aumenta 

durante la primera semana de exposición. 

Después de este período, la concentración en 

la cara permanece casi constante y sólo la 

profundidad de penetración aumenta con el 

tiempo. 

Los coeficientes de difusión efectivos 

fueron estimados ajustando los datos que 

corresponden a los perfiles obtenidos después 

de tres semanas, mostrados en figuras 3 

y 4 a la ecuación 2, que es la solución a la 

segunda ley de difusión de Fick (Cranck, 

1975). Normalmente, se ajustan perfiles de 

concentración del cloruro a esta ecuación 

para encontrar los C0 y los Deff (Crack, 1975, 

Andrade et al., 2000). 

Figura 3. Distribución de 35 C1 en dos especimenes idénticos de mortero blanco w/c=0.60 a 1 semana ( Ο ), 2 

semanas ( ¨), 3 semanas (r), 4 semanas (¯ ) y 6 semanas ( s). Los parámetros usados para la técnica SPRITE 

fueron: FOV=200 mm, resolución nominal=1.6 mm, Gmax=25.6 G/cm, TR=2 ms, el t p=150 µ s, ángulo α=44°, 

scans=8192 y tiempo de adquisición=20.7 minutos 

Figura 4. Distribución de 23 Na en dos especimenes de mortero blanco w/c=0.60 a 1 semana ( ) Ο , 2 

semanas ( ¨), 3 semanas ( r), 4 semanas (¯) y 6 semanas (s ). Los parámetros usados para la técnica 

SPRITE fueron: FOV=200 mm, resolución nominal=1.6 mm, Gmax=9.5 G/cm, TR=2 ms, el tp=150 µs, 

ángulo α=49°, scans=2048 y tiempo de adquisición=7.4 minutos 



C( x, t ) ⎛ 

= 1 − erf ⎜ 

C ⎜ 

0 

⎝ 

x 

4 D 

eff 

⎞ 

⎟ 

t ⎟ 

⎠ 

(2) 

El resultado fue Deff = 1.7x10 -11 m 2 /s para 

ambos especimenes. El coeficiente de difusión 

correspondiente para sodio fue Deff = 

1.5x10 -11 m 2 /s. De la literatura, el coeficiente 

de difusión de cloruro para concreto con 

relación a/c=0.60 y curado en húmedo durante 

28 días es aproximadamente 1.8x10 -12 

m 2 /s (Nilsson et al ., 2000), y para concreto con 

relación a/c=0.58 y curado en húmedo durante 

28 días es aproximadamente 5.2x10 -11 

m 2 /s (Bamforth, 1993). Los valores de estos 

autores sólo sirven para ilustrar el orden de 

magnitud, porque los especimenes usados 

para resonancia magnética se hicieron de 

mortero y las condiciones de curado también 

fueron diferentes. 

Absorción capilar de una solución 

de NaCl en mortero de cemento 

Pórtland ordinario 

Las figuras 5 y 6 muestran los perfiles de 

cloruro y sodio, respectivamente, obtenidos 

en especimenes de mortero elaborado con 

cemento ordinario durante absorción capilar 

de solución de NaCl. Este es un resultado 

muy importante de los experimentos, ya que 

es posible obtener perfiles del cloruro libre y 

distribución de sodio en mortero que contiene 

cemento ordinario 

Esto hace de la resonancia magnética una 

poderosa herramienta para determinar la 

distribución de cloruros y la profundidad de 

penetración en concreto ordinario en laboratorio 

y en corazones extraídos de estructuras 

en campo. Además, su naturaleza no 

destructiva permite monitorear el mismo 

espécimen sin perturbar los procesos que 

ocurren dentro del mismo. 

Otra área importante de aplicación de esta 

técnica podrá ser la validación de modelos 

matemáticos que predicen el ingreso de cloruros 

en concreto (Mangat, 1994, Marchand, 

2001). Aunque no se probaron especimenes de 

concreto que contienen aditivos minerales, no 

representará un problema, dado que la cantidad 

de hierro no es tan importante cuando los 

cloruros son los núcleos de interés. 

Figura 5. Distribución de 35 C1 en mortero elaborado con cemento ordinario a/c=0.60 a 3h (◦), 9h (¨), 2 

días ( s) y 5 días ( ¯). Los parámetros usados para la técnica SPRITE fueron: FOV=100 mm, resolución 

nominal=1.6 mm, G max=25.6 G/cm, TR=2 ms, el tp=300 µs, ángulo α=44°, scans=8192 y tiempo de 

adquisición=20.7 minutos 



Figura 6. Distribución de 23 Na en mortero elaborado con cemento ordinario a/c=0.60 a 2.5h (◦), 8h (¨), 

2 días (s) y 5 días (¯). Los parámetros usados para la técnica SPRITE fueron: FOV=100 mm, 

resolución nominal=1.6 mm, Gmax=9.5 G/cm, TR=2 ms, el tp=300 µ s, ángulo α=49°, scans=2048 y 

tiempo de adquisición=7.4 minutos 

Conclusiones 

La técnica SPRITE desarrollada en el Centro 

de Resonancia Magnética de UNB puede 

utilizarse para determinar la distribución de 

cloruros, sodio, y otros núcleos de interés en 

investigación relacionada con materiales basados 

en cemento. La determinación no-destructiva 

de la distribución del cloruro libre en 

mortero que contenga no sólo cemento blanco, 

sino también cemento ordinario, es posible. 

Los resultados obtenidos con cemento 

del Pórtland ordinario indican que el contenido 

de hierro no es un factor limitante para 

determinar perfiles de cloruros, por lo tanto, 

pueden utilizarse también especimenes de 

concreto extraído en campo. 

Mejoras en el equipo y en las técnicas tienen 

lugar en el Centro de Resonancia Magnética 

de la Universidad de New Brunswick, 

lo cual permitirá aumentar la sensibilidad de 

las mediciones y probablemente se podrán 

utilizar concentraciones de las solución de 

NaCl similar a las del agua de mar (aproximadamente 

3.5%). 

Debe mencionarse que aun cuando la determinación 

de la distribución de cloruros es 

no-destructiva, existe la necesidad de extraer 

una muestra de la estructura. 

Trabajo futuro será necesario para establecer 

una correlación de las medidas realizada 

usando resonancia magnética y la cantidad 

de cloruros determinadas por métodos 

estándar de la ASTM. 

Agradecimientos 

Balcom B.J. agradece los apoyos de NSERC 

para operación y equipo, así como de la 

NSERC Steacie Fellowship 2000-2002. También 

agradece al programa Canadá Chair. 

Cano-Barrita P.F. de J., agradece el apoyo 

financiero recibido del Instituto Politécnico 

Nacional de México y el CONACyT México. 

Referencias 

Andrade C., Sagrera J.L. and Sanjuan 

M.A. (2000). Several Years Study on 

Chlo ride Ion Pene tra tion into Concrete 



Exposed to Atlantic. Proceed ings of 

the 2 nd Inter na tional RILEM Work shop 

on Testing and Modeling the Chlo ride 

Ingress into Concrete, Paris, France, 

pp. 121-133. 

Balcom B.J., MacGregor R.P., Beyea S.D., 

Green D.P., Armstrong R.L. and 

Bremner T.W. (1996). Single Point 

Ramped Imaging with T1 Enhance - 

ment (SPRITE). Journal of Magnetic 

Reso nance, Series A 123, pp. 131-134. 

Bamforth P. (1993). Concrete Clas si fi ca tion 

for R.C. Struc tures Exposed to Marine 

and Other Salt-Laden Envi ron ments. 

Struc tural Faults and Repair-93, 

Edinburg. 

Cano F. de J., Bremner T.W., McGregor 

R.P. and Balcom B.J. (2002). Magnetic 

Reso nance Imaging of 1 H, 23 Na, and 

35 Cl Pene tra tion in Port land Cement 

Mortar. Cement and Concrete Research , 

32 (7), pp. 1067-1070. 

Crank J. (1975). The Math e matics of Diffu - 

sion. 2nd Edn (Clar endon, Oxford). 

Marchand J. (2001). Modeling the Behavior 

of Unsat u rated Cement Systems 

Exposed to Aggres sive Chem ical Environments. 

Mate rials and Struc tures, 34, 

pp. 195-200. 

Mitrovic V.F., Sigmund E.E. and Halperin 

W.P. (2001). Progres sive Satu ra tion 

NMR Relax ation. Phys ical Review B , 64, 

pp. 1-7. 

Nilsson L., Andersen A., Luping T. and 

Utgenannt P. (2000). Chlorides Ingress 

Data from Field Expo sure in a Swedish 

Road Envi ron ment. Proceed ings of the 

2 nd Inter na tional RILEM Work shop on 

Testing and Modeling the Chlo ride 

Ingress into Concrete, Paris, France, 

pp. 69-83. 

Otsuki N., Nagataki S. and Nakashita K. 

(1992). Eval u a tion of AgNO 3 Solu tion 

Spray Method for Measure ment of 

Chlo ride Pene tra tion into Hardened 

Cementitious Matrix Mate rials. ACI 

Mate rials, 89 (3), pp. 587-592. 

Pel L., Kopinga K. and Kaasschieter E.F. 

(2000). Saline Absorp tion in Calcium- 

Sili cate Brick Observed by NMR Scanning. 

Journal of Physics D; Applied 

Physics, 33, pp. 1380-1385. 

Semblanza de los autores 

P. Felipe de Jesus Cano-Barrita. Es miembro del Amer ican Concrete Insti tute (ACI) y del Instituto Mexicano del 

Cemento y del Concreto (IMCYC). En 2003, obtuvo su doctorado en ingeniería civil en la Universidad de New 

Bruns wick, Canadá. Actualmente es investigador en el CIIDIR Oaxaca del Instituto Politécnico Nacional de 

México y miembro del SNI nivel 1. Su investigación se relaciona con el uso y durabilidad del concreto ordinario 

y de alto desempeño en climas cálidos, uso de polímeros naturales, puzolanas artificiales, concreto 

autoconsolidante, así como desarrollo y aplicación de ferrocemento en el diseño y construcción de estructuras 

prefabricadas ligeras. 

Theo dore W. Bremner. Es miembro del ACI, así como profesor investigador honorario de ingeniería civil en la 

Universidad de New Bruns wick, Canada. Fue pres i dente del Capítulo Atlántico del ACI. Recibió la medalla 

ACI Cedric Willson por su investigación en concreto ligero y fue pres i dente de los comités ACI 

213-Lightweight Aggre gate Concrete y ACI 122-Energy Conser va tion. 

B.J. Balcom. Es profesor investigador del departamento de física y director del Centro de Resonancia Magnética de 

la Universidad de New Bruns wick. Recibió una NSERC Steacie Fellow ship (2000-2002) y Canada Research 

Chair in MRI of Mate rials. Sus principales intereses en investigación son el desarrollo de técnicas de 

imaginología por resonancia magnética y su aplicación a ciencia de materiales. 




Descripción del nuevo estándar de video H.264 

y comparación de su eficiencia de codificación 

con otros estándares 

H.de J. Ochoa-Domínguez, J.Mireles-García, J. de D. Cota-Ruíz 

Departamento de Ingeniería Eléctrica y Computación 

Instituto de Ingeniería y Tecnología de la Universidad Autónoma de Ciudad Juárez 

E-mail: hochoa@uacj.mx 

(Recibido: septiembre de 2005; aceptado: diciembre de 2006) 

Resumen 

Los estándares de video han sido desarrollados con el fin de satisfacer una 

amplia gama de aplicaciones, como son: el almacenamiento digital, transmisión 

y recepción de multi media, CATV, DVD, video conferencia, indexado de multi - 

media, cinema digital, entre otras. Los estándares de video logran una alta 

compresión utilizando varios métodos que explotan las redundancias temporal 

y espacial. El nuevo estándar de video H.264/MPEG-4 parte 10, no sólo es 

eficiente para el almacenamiento de video, sino que también proporciona un 

alto rendimiento en compresión y es más robusto a errores de transmisión que 

sus antecesores MPEG-2, H.263 y MPEG-4 parte 2. El presente artículo describe 

al estándar H.264/MPEG-4 parte 10. Primero se describe el algoritmo de 

codificación y posteriormente se compara su eficiencia de la codificación contra 

otros estándares anteriores existentes. Las comparaciones demuestran que el 

H.264 tiene una eficiencia de codificación de aproximadamente 1.5 veces mayor, 

en cada secuencia de prueba, con relación a otros estándares. 

Descriptores: Codificación de video, CAVLC, CABAC, H.264, MPEG4 parte 10, 

NAL, predicción intra cuadro, predicción ínter cuadro, filtro de desbloqueo. 

Abstract 

Video stan dards have been de vel oped to ful fill a wide range of ap pli ca tions such as dig i - 

tal stor age, mul ti me dia trans mis sion and re cep tion, CATV, DVD, video conferencing, 

mul ti me dia in dex ing, dig i tal cin ema among oth ers. Video stan dards de velop high com - 

pres sion ra tios us ing sev eral meth ods to re duce tem po ral and spa tial re dun dan cies. The 

new video stan dard, H.264 / MPEG-4 part 10, not only is ef fi cient to store video but 

also to ob tain a higher cod ing ef fi ciency and er ror re sil ience than the pre vi ous sim i lar 

stan dards MPEG-2, H.263 and MPEG-4 part 2. In this ar ti cle, we de scribe the new 

video stan dard H.264/MPEG-4 part 10. First, we de scribe the cod ing al go rithm, and 

then we com pare its cod ing ef fi ciency ver sus the pre vi ous ex ist ing stan dards. Com par i - 

sons show that the new stan dard has a cod ing ef fi ciency of about 1.5 times, in each test 

se quence, as com pared to the other stan dards. 

Key words: Video cod ing, H.264, Intra cod ing, inter cod ing, CAVLC, CABAC, 

MPEG4 part 10, NAL, deblocking fil ter.

Descripción del nuevo estándar de video H.264 y comparación de su eficiencia de ... 


Desde principios de los 90’s, el grupo de 

expertos en codificación de video (VCEG , 

Video Coding Expert Group) de la Unión Internacional 

de Telecomunicaciones – Sector 

Telecomunicaciones (ITU-T, International 

Telecommunication Union- Telecommunication 

sector ) y el grupo de expertos para imágenes 

en movimiento (MPEG, Moving Picture Expert 

Group ) de la ISO/IEC, enfocaron sus investigaciones 

en las diferentes técnicas de codificación 

de video para diversas aplicaciones. 

En un inicio, la ITU-T desarrolló el estándar 

H.261 (ITU-T H261, 1993) para aplicaciones 

de video conferencia; por otra parte, MPEG 

procesó el MPEG-1 (ISO/IEC 11172-2:1993, 

1993), cuya intensión inicial era para el almacenamiento 

de video en disco compacto 

(CD). Posteriormente, el grupo MPEG desarrolló 

el estándar MPEG-2 como una extensión 

del MPEG-1, cuya aplicación inicial era 

televisión digital estándar (SDT) y televisión 

de alta definición (HDTV) (ISO/IEC JTC1/ 

SC29/WG11, 1994). Al mismo tiempo, la 

ITU-T lo adoptó como el estándar H.262 

(ITU-T H.262, 2000). Estos estándares basan 

su operación por la división en rebanadas de 

los cuadros de video de entrada. A su vez, 

estas rebanadas de video se subdividen en 

macrobloques, que por último se dividen en 

bloques. Debido a la necesidad de cubrir un 

mayor rango de aplicaciones, la ISO/IEC desarrolló 

el estándar MPEG-4 parte 2, que 

puede operar de dos formas, la primera se 

basa en la división de los cuadros de entrada 

en porciones de video llamadas rebanadas de 

video, y la segunda, en la segmentación de 

objetos de video para que el usuario pueda 

interactuar con ellos o, simplemente para 

codificar cada objeto por separado (ISO/IEC 

JTCI/SC29/WG11, 2000). Este estándar consta 

de varios perfiles que manejan diferentes 

velocidades binarias compatibles con diferentes 

aplicaciones. A la par del surgimiento 

del MPEG-4 parte 2, y para obtener mayor 

compresión que en el H.261, la ITU-T 

desarrolló el estándar H.263 para aplicación 

en video teléfonos y compatible con el 

MPEG-4 parte 2 perfil avanzado. 

El grupo de expertos de la ITU-T y el 

grupo de expertos de la ISO/IEC, se unieron 

para conformar el equipo conjunto de video 

(JVT, Joint Video Team) y trabajar en el desarrollo 

de un nuevo estándar, con un mejor 

desempeño, tanto en la calidad de video 

como en la eficiencia de codificación. El nombre 

del nuevo estándar es el H.264 o MPEG-4 

parte 10 (ITU-T H.264, 2003) y cuenta además 

con especificaciones simples de su sintaxis, 

lo cual proporciona una mejor integración 

con todos los protocolos actuales y arquitecturas 

múltiples. Esto permite incluir otras 

aplicaciones, tales como la transmisión de 

video y video conferencia en redes fijas e 

inalámbricas y en diferentes protocolos de 

transporte. 

El grupo de expertos de la ITU-T y el 

grupo de expertos de la ISO/IEC, se unieron 

para conformar el equipo conjunto de video 

(JVT, Joint Video Team) y trabajar en el desarrollo 

de un nuevo estándar, con un mejor 

desempeño, tanto en la calidad de video 

como en la eficiencia de codificación. El 

nombre del nuevo estándar es el H.264 o 

MPEG-4 parte 10 (ITU-T H.264, 2003) y 

cuenta además con especificaciones simples 

de su sintaxis, lo cual proporciona una mejor 

integración con todos los protocolos actuales 

y arquitecturas múltiples. Esto permite incluir 

otras aplicaciones tales como la transmisión 

de video y video conferencia en redes 

fijas e inalámbricas y en diferentes protocolos 

de transporte. 

El H.264 cuenta con los mismos elementos 

o bloques funcionales que sus antecesores, ya 

que también adopta un algoritmo hibrido de 

predicción y transformación para la reducción 

de la correlación espacial y de la señal 



residual, control de la velocidad binaria o bit 

rate, predicción por compensación de movimiento 

para reducir la redundancia temporal, 

así como la codificación de la entropía 

para reducir la correlación estadística. Sin 

embargo, lo que hace que este estándar 

proporcione mayor eficiencia de codificación, 

es la manera en que opera cada bloque 

funcional. Por ejemplo, el H.264 incluye 

predicción intra cuadro (INTRA), característica 

única de este estándar (Huang, 2005); 

transformación por bloques de 4x4 muestras, 

cuyos coeficientes transformados resultan 

enteros (Wien, 2003), anteriormente, se incluía 

transformación de 8x8 muestras, referencia 

múltiple para predicción temporal, 

tamaño variable de los macrobloques a comprimir, 

precisión de un cuarto de píxel para la 

compensación de movimiento, filtro de desbloqueo 

(List, 2993), codificador de entropía 

mejorado. Todas estas mejoras vienen acompañadas 

de un aumento en la complejidad de 

la implementación. 

Los canales inalámbricos suelen agregar 

mucho ruido a la señal original y no se puede 

llevar a cabo la recepción perfecta de la 

misma; cualquier error en la decodificación 

de un bit puede propagarse a bloques subsecuentes 

o incluso a cuadros subsecuentes, 

degradando la calidad subjetiva de la imagen. 

El H.264 utiliza métodos para incrementar 

la resistencia a errores. Por ejemplo, 

utiliza el ordenamiento flexible de macrobloques 

(FMO), la transmisión de rebanadas 

redundantes de cuadros de video e incluye el 

particionamiento de datos, que también es 

utilizado en los estándares previos. 

En el H.264, al igual que en sus antecesores, 

se definen diferentes perfiles y niveles 

dentro de cada uno, los cuales especifican 

restricciones en el tren de bits o 

bitstream. Cada perfil especifica un conjunto 

de características y los límites del decodificador, 

aunque los codificadores no requieren 

de ningún conjunto particular de características 

de un perfil. Los niveles especifican 

los límites de los valores que deben 

tomar los elementos de la sintaxis de la 

recomendación o estándar. En cada perfil se 

utiliza la misma definición de niveles, pero 

las aplicaciones individuales sólo pueden 

utilizar un nivel diferente en cada uno. Por lo 

general, la carga de procesamiento del decodificador 

y la capacidad de memoria para 

un perfil dado se desprende de los diferentes 

niveles. 

En la primera versión del H.264 existen 

tres perfiles, el línea base o baseline, el principal 

o main y el extendido o extended. El perfil 

línea base se aplica a los servicios de conversación 

en tiempo real, como video conferencia 

y video teléfono. El perfil principal 

es para aplicaciones de almacenamiento digital 

de video y datos, así como de transmisión 

de televisión. El perfil extendido es 

aplicable también a servicios de multimedia 

en Internet. La figura 1 muestra la relación 

que existe entre estos perfiles. La última 

versión del H.264, define cuatro perfiles altos 

o superiores, detallados como extensiones del 

rango de fidelidad (fidelity range extensions) 

para aplicaciones de distribución de contenido 

(Sullivan, 2004), así como para edición 

y post procesamiento (High, High 10, High 

4:2:2 y High 4:4:4 ). El perfil alto, se desarrolló 

para procesar video de 8 bits con formato de 

muestreo de la crominancia de 4:2:0 y para 

aplicaciones que utilizan alta resolución. El 

perfil high 10, se desarrolló para procesar 

video de hasta 10 bits con formato de muestreo 

4:2:0 de los cuadros de entrada, para 

aplicaciones que utilizan alta resolución y 

mayor exactitud. El perfil high 4:2:2, soporta 

el formato de muestreo de los cuadros de 

crominancia de 4:2:2 y hasta 10 bits por 

muestra de exactitud. El perfil 4:4:4 soporta el 

formato de muestreo de los cuadros de crominancia 

4:4:4 y hasta 12 bits por muestra de 

exactitud, así como transformación residual 



Perfiles altos (High ) 

PerfilExtendido (Extended) 

Matric esde cuantización escaladas 

Trasformación por bloques de tamaño adaptivo 

Perfiles Principales (main) 

Partición de datos 

Rebanadastipo SI 

Rebanadas tipo SP 

Rebanadastipo B 

Predicción conpeso 

Rebanadas tipo I 

Rebanadas tipoP 

CAVL 

C 

Ordenamiento arbitrario derebanadas 

Ordenamiento flexible de macrobloques 

Rebanada redundante 

CABAC 

Perfil Línea Base (Baseline) 

Figura 1. Partes comunes y partes específicas de cada perfil del estándar H.264 

entera de los cuadros de color para codificar 

señales RGB. Las relaciones entre perfiles se 

describen a continuación: 

Partes comunes a todos los perfiles 

- Rebanadas tipo I (Rebanadas codificadas 

utilizando predicción INTRA): 

Rebanada codificada utilizando la predicción 

de las muestras decodificadas 

dentro de la misma rebanada. 

- Rebanadas tipo P (Rebanadas codificadas 

utilizando codificación predictiva 

en un solo sentido): Rebanada 

codificada utilizando predicción inter 

cuadro (INTER). Se utilizan como referencia 

los cuadros previamente decodificados 

con un vector de movimiento 

y un índice de referencia para predecir 

los valores de las muestras de cada 

bloque. 

- Utiliza el codificador CAVLC (Context-based 

Adap tive Vari able Length Coding) 

para la codificación de la entropía. 

Perfil línea base (Base line) 

- Ordenamiento flex ible de macrobloques: 

Los macrobloques no necesariamente 

se ordenan horizontalmente y 

de izquierda a derecha (raster scan). 

Existe un mapa que asigna los macrobloques 

a un determinado grupo de 

rebanadas. 

- Ordenamiento arbitrario de rebanadas: 

La dirección del primer macrobloque 

de una rebanada puede ser menor 

que la dirección del primer macrobloque 

de alguna rebanada ante rior 

dentro del mismo cuadro codificado. 

- Rebanada redundante: Esta rebanada 

pertenece a datos redundantes ya 

codificados con igual o diferente velocidad 

binaria en comparación con los 

mismos datos codificados pertenecientes 

a la misma rebanada. 



Perfil prin cipal (Main) 

- Rebanadas tipo B (Rebanadas codificadas 

utilizando codificación predictiva 

bidireccional): Rebanada codificada 

utilizando predicción INTER con referencia 

de un cuadro previamente decodificado 

y utilizando a lo más, dos vectores 

de movimiento e índices de referencia 

para predecir los valores de las 

muestras de cada bloque. 

- Predicción con peso: Esta es una 

operación de escalamiento, en la cual se 

aplica un factor de peso a las muestras 

resultantes de la compensación de movimiento 

en rebanadas tipo P o B. 

- Utiliza el codificador CABAC (Context-based 

Adap tive Binary Arith metic 

Coding) para codificación de la entropía. 

Perfil extendido 

- Se incluyen todas las partes del 

perfil línea base. 

- Rebanadas tipo SP: Es un tipo de 

rebanada espe cial, codificada para cambiar 

eficientemente de resoluciones entre 

tramas de video (escalabilidad – capa 

de bits básicos + capa de ensanchamiento), 

es similar a la codificación de 

una rebanada tipo P. 

- Rebanadas tipo SI: Igual que el 

ante rior, pero es similar a codificar una 

rebanada tipo I. 

- Particionamiento de datos: Los datos 

codificados se colocan en particiones 

separadas en capas diferentes. Se utiliza 

para reducir errores durante la transmisión 

y para el empaquetamiento efectivo 

de los datos. 

- Rebanadas tipo B: Se utiliza para 

predicción bidireccional, incrementa la 

calidad del video y la velocidad binaria. 

- Predicción con peso. 

Perfil alto (High) 

- Incluye todas las partes del perfil 

prin cipal (Main). 

- Transformación por bloques de tamaño 

adoptivo: DCT de 4x4 y transformación 

DCT entera para los bloques 

de luminancia. El tamaño del bloque a 

codificar dentro de un macrobloque 

puede ser diferente. 

- Matrices de cuantización escaladas: 

Se utilizan diferentes escalas de 

acuerdo con frecuencias específicas asociadas 

con los coeficientes transformados 

para optimizar la calidad subjetiva 

del video. 

La tabla 1 lista a los perfiles del H.264 y del 

MPEG-4 parte 2 (video), así como los requerimientos 

más importantes para cada aplicación. 

Los niveles de cada perfil se muestran en 

la tabla 2. Cada nivel soporta diferentes tamaños 

de los cuadros de entrada ( QCIF, CIF, 

ITU-R 601 (SDTV), HDTV, S-HDTV, Cinema 

digital (Richardson, 2003)). Cada nivel ajusta 

los límites de las velocidades binarias, tamaño 

de la memoria para almacenar cuadros 

de referencia, etc. La tabla 3 muestra los 

parámetros límite de cada nivel. 



Tabla 1. Tabla 1. Requerimientos por aplicación (Rich ardson, 2003) (SP, ASP, ARTS, FGS, Estudio de 

perfiles: Simple, avanzado simple, avanzado simple en tiempo real, escalabilidad gran ular 

fina y perfiles de estudio) 

Aplicación Requerimientos Perfiles H.264 Perfiles MPEG-4/2 

Transmisión de TV 

Video por cable o Internet 

Almacenamiento y 

reproducción de video 

Videoconferencia 

Video a través de redes 

inalámbricas 

Distribución de video 

(Estudio) 

Eficiencia en la codificación, 

confiabilidad en canales de 

distribución controlados, 

transmisión entrelazada de 

los campos de cada cuadro 

de video, decodificador de 

baja complejidad. 


confiabilidad en canales no 

controlados para redes 

basadas en paquetes de 

distribución y escalabilidad. 


transmisión entrelazada de 

los campos de cada cuadro 

de video, decodificador de 

baja complejidad. 


confiabilidad, baja 

complejidad del codificador 

y del decodificador. 


confiabilidad, baja 

complejidad del codificador 

y del decodificador, bajo 

consumo de potencia. 

Características de 

compresión sin pérdidas o 

cercanas, transmisión 

entrelazada de los campos 

de cada cuadro de video, 

transcodificación efectiva. 

Principal 

Extendido 

Principal 

Básico 

Básico 

Principal Alto 

Perfil Simple Avanzado 

(ASP, Advanced Simple 

Profile) 

ARTS o FGS 

ASP 

Perfil Simple (SP) 

SP 

Estudio 

Tabla 2. Niveles, tipos y velocidades de cuadros (SHDTV: Super HDTV, HHR: Alta resolución hori - 

zontal, p: progresivo, i: entrelazado) 

Niveles 

1 QCIF @ 15fps ( frames per second) 

1.1 QCIF @ 30fps 

1.2 CIF @ 15fps 

1.3 CIF @ 30fps 

2 CIF @ 30fps 

2.1 HHR @15 or 30fps 

2.2 SDTV @ 15fps 

Tipo de cuadros y velocidad de cuadros 

3 SDTV: 720x480x30i,720x576x25i 10Mbps(max) 

3.1 1280x720x30p 

3.2 1280x720x60p 

4 HDTV: 1920x1080x30i, 1280x720x60p, 2Kx1Kx30p 20Mbps(max) 

(continúa...) 



Tabla 2. Niveles, tipos y velocidades de cuadros (SHDTV: Super HDTV, HHR: Alta resolución hori - 

zontal, p: progresivo, i: entrelazado) (...continuación) 

Niveles 

Tipo de cuadros y velocidad de cuadros 

4.1 HDTV: 1920x1080x30i, 1280x720x60p, 2Kx1Kx30p 50Mbps(max) 

4.2 HDTV: 1920x1080x60i, 2Kx1Kx60p 

5 SHDTV/Cinema digital: 2.5Kx2Kx30p 

5.1 SHDTV/Cinema digital: 4Kx2Kx30p 

Tabla 3. Límite de los parámetros de cada nivel (los números de nivel no entero se refieren a los niveles 

intermedios. Los guiones denotan ausencia del límite correspondiente) 

Vel. max. de 

procesamien 

to d el 

macrobloque 

(MB/s) 

Tamaño 

max. del 

cuadro 

(MBs) 

Tamañ o max. 

de la 

memori a para 

el cuad ro 

d ecodificado 

(1024 by tes) 

Max. 

v elocidad 

b inaria 

(1 000 b its/ s 

or 1200 

bits/s ) 

Max 

C PB si ze 

(1000 bits or 

1 200 b its) 

Ran go de la 

comp onente 

vertical del 

v ecto r de 

movi miento 

(muestras de 

l umi nancia) 

R elació n d e 

compresi ón 

mínima 

Número max. dev ecto res de 

movimient o por cadad os MB s 

co nsecutiv os 

Nivel 

1 1 485 99 148 .5 64 1 75 [-64 ,+63.75 ] 2 - 

1.1 3 000 396 337 .5 1 92 5 00 [-128 ,+127.7 5] 2 - 

1.2 6 000 396 891 .0 3 84 1 000 [-128 ,+127.7 5] 2 - 

1.3 11 880 396 891 .0 7 68 2 000 [-128 ,+127.7 5] 2 - 

2 11 880 396 891 .0 2 000 2 000 [-128 ,+127.7 5] 2 - 

2.1 19 800 792 1 782.0 4 000 4 000 [-256 ,+255.7 5] 2 - 

2.2 20 250 1 620 3 037.5 4 000 4 000 [-256 ,+255.7 5] 2 - 

3 40 500 1 620 3 037.5 1 0 0 00 1 0 0 00 [-256 ,+255.7 5] 2 32 

3.1 1 08 000 3 600 6 750.0 1 4 0 00 1 4 0 00 [-512 ,+511.7 5] 4 16 

3.2 2 16 000 5 120 7 680.0 2 0 0 00 2 0 0 00 [-512 ,+511.7 5] 4 16 

4 2 45 760 8 192 12 288 .0 2 0 0 00 2 5 0 00 [-512 ,+511.7 5] 4 16 

4.1 2 45 760 8 192 12 288 .0 5 0 0 00 6 2 5 00 [-512 ,+511.7 5] 2 16 

4.2 4 91 520 8 192 12 288 .0 5 0 0 00 6 2 5 00 [-512 ,+511.7 5] 2 16 

5 5 89 824 22 0 80 41 310 .0 135 000 135 000 [-512 ,+511.7 5] 2 16 

5.1 9 83 040 36 8 64 69 120 .0 240 000 240 000 [-512 ,+511.7 5] 2 16 

Estructura de las capas del H.264 

El H.264 se compone de dos capas, la capa de 

la red de abstracción (NAL, Network Abstraction 

Layer) y la capa de codificación del 

video (VCL, Video Coding Layer ). NAL abstrae 

los datos para hacer compatible al tren de bits 

de salida del codificador con casi todos los 

canales de comunicación o medios de almacenamiento. 

Esta unidad de red, especifica 

los datos en un formato de bytes (byte-stream) 

o de paquetes. El formato de bytes define 

patrones de bytes o de bits utilizados en el 

estándar H.320 o en el MPEG-2. El formato de 

paquetes, define paquetes de datos identificables 

por protocolos de transporte para 

aplicaciones de RTP/UDP/IP (Wenger, 2003). 

La capa VCL constituye el núcleo de los 

datos codificados. Ésta consiste en la secuencia 

de video a codificar, cuadros o campos 

dentro de la secuencia de video con tres 

arreglos de muestras (luminancia, crominancia 

o RGB), rebanadas dentro de cada 



cuadro y macrobloques dentro de cada 

rebanada, así como bloques dentro de cada 

macrobloque. También, el H.264 soporta búsqueda 

(escaneo) progresiva y entrelazada, la 

cual puede mezclarse dentro de la misma 

secuencia. El perfil línea base se limita únicamente 

a búsqueda progresiva. Los cuadros se 

dividen en rebanadas. Una rebanada de 

video es una secuencia de macrobloques que 

pueden tener distintos tamaños (tamaños 

flexibles). En el caso de grupos de rebanadas, 

la posición de un macrobloque se determina 

por medio de un mapa que representa al 

grupo de rebanadas. El mapa indica a cuál 

grupo de rebanadas pertenece el macrobloque 

(Ghanbari, 2003). 

Algoritmo de codificacion de video 

La figura 2 muestra el diagrama a bloques del 

algoritmo de codificación del H.264. El codificador 

debe seleccionar entre codificación 

INTRA o INTER. En codificación INTRA se 

utilizan varios modos de predicción para 

reducir la redundancia espacial de un solo 

cuadro. La codificación INTER es más eficiente 

y se utiliza en la codificación tipo P o B 

(predictiva o bidireccional) de cada bloque de 

Entrada de video 

+ 

Transformac ión y 

Cuan tización 

Codific ación 

d eentropía 

Salida del 

bitstream 

- 

Cu antización inversa y 

trans-formación inversa 

Selección del 

m odo Intra/Inter 

+ 

+ 

Compensación 

de Movim iento 

Predicción 

In tracuadro 

(a)Codificador 

Estimación d e 

Movimiento 

Memoria para 

cuadrosd eref. 

Filtrado para remover 

artefactos de cuantización 

Entra da del 

bit stream 

D ecodificado r 

de entro pía 

Cua ntiza ción inversa y 

Tran sformación inversa 

+ 

+ 

Filtrado parar emover 

artefactos de 

cuan tización 

Salida del 

video 

S elección del 

mo do Int ra/Int er 

Mem oria para 

cuadros de ref. 

Predicción 

Int racuadro 

(b) Decodificad or 

Compensación de 

Movimiento 

Figura 2. Diagrama a bloques del CODEC del H.264, (a) codificador, (b) decodificador 



muestras. En esta codificación se utilizan como 

referencia los cuadros decodificados 

previamente. La codificación INTER utiliza 

vectores de movimiento para reducir la redundancia 

temporal entre cuadros. La predicción 

se obtiene después de filtrar el bloque 

anterior reconstruido. El filtro reduce los 

artefactos o distorsiones introducidos en las 

orillas de un bloque, debido a la cuantización. 

Los vectores de movimiento y el modo de 

predicción INTRA pueden tener varias especificaciones, 

dependiendo del tamaño de los 

bloques a codificar. Antes de ser cuantizado, 

el error o predicción residual se comprime 

aún más utilizando una transformada, la cual 

remueve la correlación espacial del bloque. 

Finalmente, los vectores de movimiento y los 

coeficientes cuantizados se codifican utilizando 

codificadores de entropía tales como el 

CAVLC (Context-Adaptive Variable Length 

Codes) o el CABAC (Context-Adaptive Binary 

Arithmetic Codes) (Marpe, 2003). 

Predicción intracuadro (modo 

INTRA) 

Los estándares anteriores llevan a cabo la 

predicción INTRA, codificando independientemente 

cada macrobloque (MB), como si se 

tratara de la codificación de una imagen 

(Ochoa, 2006), ya que se necesita que tengan 

la menor distorsión posible para que sirvan 

de referencia a la codificación INTER. La 

codificación INTRA, también se aplica dentro 

M A B C D E F G H 

I 

J 

K 

L 

a b c d 

e f g h 

i j k l 

m n o p 

modo 1 

modo 6 

modo 8 

de rebanadas codificadas en modo INTRA o 

en macrobloques que contienen una corrección 

temporal inaceptable, aunque se haya 

utilizando compensación de movimiento (macrobloques 

INTER con una distorsión por 

encima de un nivel de referencia específico). 

Este efecto provoca que se incremente el 

número de bits en el modo INTRA, haciendo 

imposible reducir la velocidad binaria. 

El H.264 utiliza el concepto de predicción 

INTRA para codificar bloques o macrobloques 

de referencia y reducir la cantidad de 

bits codificados. Para codificar un bloque o 

macrobloque en modo INTRA, se forma un 

bloque de predicción basado en un bloque 

reconstruido previamente dentro del mismo 

cuadro y sin filtrar. Posteriormente, se codifica 

la señal residual (error) entre el bloque 

actual y la predicción, disminuyendo considerablemente 

la cantidad de bits que representan 

al bloque actual. El bloque de luminancia 

bajo predicción, puede formarse 

por subbloques de 4x4 muestras o por todo el 

bloque de 16x16 muestras. Para cada bloque 

de luminancia de 4x4, se selecciona un modo 

de predicción de nueve modos existentes. 

Existen cuatro modos de predicción para bloques 

de luminancia de 16x16 muestras. Solo 

existe un modo de predicción para cada bloque 

de crominancia de 4x4 muestras. 

La figura 3 muestra la predicción de un 

bloque de luminancia de 4x4 muestras. [a, b, 

M A B C D E F G H 

I 

J 

K 

L 

a b c d 

e f g h 

i j k l 

m n o p 

modo 0 modo 5 modo 4 modo 3 

modo 7 

Figura 3. Direcciones de los modos de predicción INTRA 4 x 4 (Vertical: 0, hori zontal: 1, DC: 2, 

diagonal izquierda y hacia abajo: 3, diag onal derecha hacia abajo: 4, vertical derecha: 5, hori zontal hacia 

abajo: 6, vertical izquierda: 7, hori zontal hacia arriba: 8) 



…, p] son las muestras bajo predicción del 

bloque actual y [A, B, …, M] las muestras del 

bloque previamente reconstruido. Las muestras 

se utilizan de acuerdo con las direcciones 

de predicción de cada modo, las flechas indican 

la dirección de predicción (ITU-T 

H.264, 2003). 

En el modo 0 (vertical) y el modo 1 

(horizontal), las muestras predecidas se forman 

por extrapolación de las muestras 

superiores [A, B, C, D] y de las muestras de la 

izquierda [I, J, K, L] respectivamente. En el 

modo 2 (DC), todas las muestras predecidas 

se forman por medio de las muestras [A, B, C, 

D, I, J, K, L]. En el modo 3 (diagonal izquierda 

y hacia abajo), modo 4 (diagonal derecha 

hacia abajo), modo 5 (vertical derecha), modo 

6 (horizontal hacia abajo), modo 7 (vertical 

izquierda) y modo 8 (horizontal hacia arriba), 

las muestras predecidas se forman dando 

cierto peso al promedio de las muestras A-M. 

Por ejemplo, las muestras ‘a’ y ‘d’ son predecidas 

redondeando el resultado round(I/4 

+ M/2 + A/4) y round(B/4 + C/2 + D/4) en el 

modo 4. También, por medio de round(I/2 + 

J/2) y round(J/4 + K/2 + L/4) en el modo 8. El 

modo seleccionado por el codificador será 

aquel que minimice el error o residuo entre el 

bloque a codificar y su predicción (ITU-T 

H.264, 2003). 

Existen únicamente 4 modos para la 

predicción de los componentes de luma de 

un bloque de 16x16. Para los modos 0 

(vertical), 1 (horizontal) y 2 (DC) las predicciones 

son similares a los casos de 4x4. Para el 

modo 4 (plano), se utiliza una función lineal 

que se ajusta a las muestras superior e izquierda. 

Cada bloque de 8x8 muestras de la componente 

de crominancia, en un macrobloque, 

se predice de las muestras de los bloques 

superior o izquierdo previamente codificados 

y reconstruidos. Los cuatro modos de 

predicción son similares a los modos de 

predicción de los bloques de 16x6 de luminancia, 

excepto que el orden de los modos 

es diferente, modo 0 (DC), modo 1 (horizontal), 

modo 2 (vertical) y modo 3 (plano). 

Predicción intercuadro (modo 

INTER) 

La predicción INTER, la estimación del movimiento 

y la compensación del movimiento 

son tres factores que ayudan a reducir la redundancia 

o correlación temporal. En el 

H.264, el cuadro actual puede particionarse 

en macrobloques o bloques más pequeños. 

La compensación de movimiento realizada 

con bloques más pequeños, incrementa la 

ganancia de la codificación, a costa de incrementar 

el número de datos necesarios para 

representar la compensación. En el proceso 

de codificación INTER, se pueden procesar 

bloques de hasta 4x4 muestras de luminancia, 

utilizando una exactitud en los vectores de 

movimiento de hasta un cuarto de muestra. 

El proceso de predicción INTER de un bloque, 

involucra la selección de cuadros reconstruidos 

previamente, los cuales están 

almacenados en la memoria del sistema. Los 

vectores de movimientos se codifican utilizando 

una técnica diferencial. A diferencia 

de otros estándares, en el H.264 las rebanadas 

codificadas bidireccionalmente se 

pueden utilizar como referencia para la 

codificación INTER de otros cuadros (ITU-T 

H.264, 2003). 

Predicción en tamaños vari ables de 

bloques 

Un macrobloque de luminancia de 16x16 

muestras, puede dividirse en pequeños bloques 

de hasta 4x4, como se muestra en la 

figura 4. Existen cuatro casos: 16x16, 16,8, 

8x16 y 8x8 para los macrobloques de 16x16. 

También existen cuatro casos para un macrobloque 

de luminancia de 8x8: 8x8, 8x4, 4x8, 



16*1 6 luma samp les 

1 6*8 luma samples 8 *1 6 luma samp les 

8*8l uma samples 

Macrobloc k 

pa rtitions 

0 

0 

1 

0 1 

0 1 

2 3 

8*8 luma samp les 8 *4 luma samples 4*8 luma samples 

4*4l uma samples 

Sub-mac robloc k 

pa rtitions 

0 

0 

0 1 

0 

1 

1 

2 

3 

Figura 4. Particiones de macrobloques y sub macrobloque 

4x4. Entre más pequeño sea el bloque bajo 

predicción, mayor será el número de bits 

para representar los vectores de movimiento 

y otros datos tales como el tipo de partición; 

sin embargo, si se utilizan particiones pequeñas 

se puede reducir considerablemente 

el error o residuo resultante de la compensación 

de movimiento. La selección del 

tamaño de la partición depende de las 

características del video de entrada. En general, 

una partición grande es beneficiosa 

cuando las muestras del bloque son homogéneas 

y una partición pequeña cuando no 

existe homogeneidad (detalles) (Wien, 2003). 

Interpolación para la predicción 

fraccional o sub muestra (Sub-pel, 

Sub Picture Element) 

La predicción en modo INTER de cada 

partición de un macrobloque codificado, se 

lleva a cabo en un área del mismo tamaño del 

cuadro de referencia. En este caso, la compensación 

de movimiento se hace con respecto 

a muestras enteras. En ocasiones, el 

movimiento no se lleva a cabo en muestras 

enteras sino fraccionales, por lo que hay que 

interpolar el área de referencia. El desplazamiento 

u offset entre las dos áreas (vectores 

de movimiento) tiene una resolución en 

fraccional (sub muestras), tanto para la luminancia 

como para la crominancia (Figura 5). 

Si el proceso de interpolación elegido incrementa 

la resolución del área de referencia 

(área de búsqueda) al doble, se dice que se 

tiene una compensación de movimiento con 

exactitud de ½ muestra, y si se aumenta cuatro 

veces, se dice que se tiene una compensación 

de movimiento con exactitud de ¼ de 

muestra. En el H.264 la compensación de movimiento 

puede realizarse con una exactitud 

de hasta ¼ de muestra (ITU-T H.264, 2003). 

La compensación de movimiento fraccional 

( ½ , ¼) resulta en una mayor compresión y 

mejor calidad de la imagen que la compensación 

de movimiento entera, a expensas del 

incremento de la complejidad en el codificador. 

En aplicaciones para velocidades binarias 

altas, así como altas resoluciones, se ha 

comprobado que la predicción fraccional de 

¼ de muestra es mucho más eficiente que la 

de ½ muestra, en cuanto a compresión y 

calidad de la imagen se refiere. 



Entr ada de video 

+ 

- 

Cuantización y 

tra nsforma ción 

C odificación 

de la entropía 

Bitstrea m de 

salida 

Cuantiza cióninversa y 

transformación inver sa 

Selecc ión del modo 

I NTRA/INTER 

+ 

+ 

Compensa ción de 

movimiento 

Estimación de 

movimiento 

Intra16x16 16x8 8x16 8x8 

Prediction 0 

0 1 

MB 0 

0 1 

1 

2 3 

Picture8x8 8x4 Deblock 4 x8 ing 

4x4 

Sub Buffering Filtering 

0 

0 

0 1 

0 1 

MB 

1 

2 3 

Figura 5. Diagrama a bloques de codificador enfatizando la estimación del movimiento y la 

compensación de movimiento 

En las muestras de luminancia, la exactitud 

de ½ muestra se genera filtrando las muestras 

vecinas con un filtro FIR, cuyos coeficientes 

son (1, -5, 20, 20, -5, 1)/32. Esto significa que 

cada muestra intermedia se obtiene de la 

suma de 6 muestras vecinas enteras, cada 

muestra con su correspondiente peso. Por 

ejemplo, en la figura 6, la muestra intermedia 

‘b’ se calcula de la muestras E, F, G, H, I y J 

utilizando la formula 1. 

b = round(( E − 5F + 20G + 20H − 51 + J) / 32 ) (1) 

Similarmente, la muestra h se puede 

calcular de las muestras verticales A, C, G, M, 

R y T. Una vez calculadas las muestras con 

exactitud de ½, se calculan las muestras con 

exactitud de ¼ por medio de interpolación 

bilineal entre muestras de exactitud entera y 

de ½. Por ejemplo, la muestra ‘a’, con exactitud 

de ¼ de muestra, se puede calcular de la 

muestra entera G, la muestra ‘b’ con exactitud 

½, se calcula utilizando la ecuación 2. 

a = round (( G + b ) / 2 ) (2) 

En el caso del formato de video 4:2:0, se 

requiere una exactitud de 1/8 de muestra en 

las componentes de crominancia (correspondientes 

a ¼ de muestra en luminancia). Las 

muestras a 1/8 de exactitud se interpolan 

utilizando interpolación bilineal entre muestras 

enteras de los cuadros de crominancia 

(ITU-T H.264, 2003). 

Filtro de desbloqueo (remueve la 

distorsión debida a la cuantización 

en los bordes de los bloques) 

El proceso de codificación involucra macrobloques 

con distintas características, algunos 

con mayor correlación que otros. Para mantener 

una cierta velocidad binaria, los bloques 

INTRA o INTER se cuantizan utilizando 

diferentes cuantizadores, los cuales introducen 

distorsión o artefactos indeseables alrededor 

de los bloques reconstruidos. En estándares 

anteriores, el filtro de desbloqueo era 

sólo una recomendación (opcional) del estándar, 

en el H.264, el filtro de desbloqueo es 

parte obligatoria del mismo. El filtro u tilizado 



A 

aa 

B 

C 

bb 

D 

E F G a b c H 

I J 

d 

cc dd h i j k m 

ee ff 

n 

e 

p 

f 

q 

K L M s N 

P Q 

g 

r 

R 

gg 

S 

T 

hh 

U 

Figura 6. Muestras enteras (bloques sombreados con letras mayúsculas) y posiciones fraccionales 

(bloques blancos con letras minúsculas) para interpolación de un cuarto de muestra 

en el H.264 reduce la distorsión en los bordes 

del bloque y evita que el ruido acumulado 

debido a la codificación se propague. El 

MPEG-1 y MPEG-2 no utilizan este filtro, 

debido a la complejidad de su implementación. 

Por otra parte, la distorsión en estos estándares 

se reduce utilizando compensación de movimiento 

con exactitud de ½ muestra. 

En el H.264, el filtrado se aplica a los 

bordes de bloques de 4x4 muestras de un 

macrobloque como se muestra en la figura 7. 

El filtro procesa por separado los bloques de 

luminancia y crominancia. El proceso de filtrado 

para bloques de luminancia se lleva a 

cabo en cuatro bordes de 16 muestras cada 

uno y el proceso de filtrado de luma en dos 

bordes de 8 muestras. La figura 7 (a) muestra 

el proceso de filtrado horizontal (afecta bordes 

verticales) y la figura 7(b) el proceso de 

filtrado vertical (afecta bordes horizontales). 

El filtro se aplica adaptivamente en viarios 

niveles: 

- A nivel rebanada: El filtrado se 

puede ajustar a las características individuales 

de la secuencia de video. 

- A nivel de borde de bloque: El 

filtrado se vuelve independiente de la 

decisión INTRA/INTER de las diferencias 

de movimiento y de la presencia de 

residuos codificados en los dos bloques 

participantes en el filtrado. 

- A nivel muestra: El efecto de filtrado 

se puede anular dependiendo de 

los valores de las muestras y de los 

umbrales del cuantizador. 



Macro bloqu ede 1 6 x16 

Macrobloque de 1 6 x16 

Bor des h orizo ntales 

(luma) 

Bordes horizontales 

(croma) 

Bordes vert icales 

(luma) 

(a) 

Bordes verticales 

(cr oma) 

Figura 7. Bordes del macrobloque a filtrarse (los bordes de luminancia se muestran con líneas sólidas y 

las de crominancia con líneas entre cortadas o guiones) 

(b) 

Transformación y cuantización 

El H.264 se basa en la codificación de macrobloques, 

utiliza transformadas para remover 

la redundancia espacial (Ochoa, 2006). Los 

cuadros de entrada al codificador, así como 

los residuos, resultado de la predicción, contienen 

una correlación o redundancia espacial 

alta. Después de la predicción INTER 

cuadro, o predicción espacial basada en las 

muestras de cuadros previamente decodificados 

con respecto al cuadro actual (bajo 

predicción), el residuo o predicción resultante 

se divide en bloques de 4x4 u 8x8 

muestras, los cuales se convierten al domino 

de la frecuencia y los coeficientes resultantes 

se cuantizan. 

El H.264 utiliza una transformada de 

tamaño adaptivo de 4x4 y de 8x8 (perfiles 

altos); los estándares anteriores utilizaban 

únicamente la transformada DCT de 8x8. 

Una transformada de 4x4 es mucho menos 

compleja, ya que necesita menos multiplicaciones 

para llevar a cabo una transformación. 

También, si el codificador decide 

procesar un bloque de menor tamaño, las 

distorsiones en los bordes del mismo bloqueo 

se reduce significativamente. 

Para mejorar la eficiencia de la compresión, 

el H.264 emplea una estructura de 

transformación jerárquica, esto es, los coeficientes 

de DC de bloques vecinos de 4x4 de 

luminancia se agrupan en bloques de 4x4 y se 

aplica de nuevo la transformada Hadamard. 

Existe una alta correlación entre coeficientes 

transformados de DC de bloques vecinos, 

cuyas muestras son muy similares. Por lo 

tanto, el estándar especifica la transformada 

Hadamard para los coeficientes de DC de 

bloques transformados de luma de 16x16, y la 

transformada Hadamard de 2x2 para los 

coeficientes de DC de bloques transformados 

de crominancia. 

En algunas aplicaciones se requiere 

reducir el tamaño de los pasos de los cuantizadores 

para aumentar la relación señal a 

ruido pico (PSNR, Peak Signal to Noise Ratio) a 

niveles que se consideran visualmente sin 



pérdidas. Para logra esto, el H.264 extiende el 

rango de los pasos de cuantización (QP) en 

dos octavas, teniendo que redefinir las tablas 

de cuantización y permitiendo que QP pueda 

variar de 0 a 51. 

En general, la transformación y la cuantización 

requieren de varias multiplicaciones, 

esto eleva la complejidad de su implementación. 

Por lo tanto, para lograr una implementación 

más simple, el proceso de transformación 

exacta se modifica para reducir el 

número de multiplicaciones, resultando en 

una transformada entera, la cual integra en 

proceso de transformación, cuantización y 

escalamiento. Este proceso se llama trasformación 

entera con post escalamiento 

A continuación se describen los pasos para 

lograr la transformada directa DCT entera, 

post-escalamiento, así como la transformada 

inversa. 

Proceso de codificación 

Paso 1. Transformada entera directa 

Para la transformación DCT exacta de un 

bloque de luminancia F de 4x4, utilizamos 

X 

= HFH T 

(3) 

Donde H es la siguiente matriz 

⎡a a a a ⎤ 

⎢ 

b c −c −b 

⎥ 

H = ⎢ 

⎥ 

⎢a −a −a a ⎥ 

⎢ 

⎣c −b b −c 

⎥ 

⎦ 

(4) 

Las variables a, b, c y d tienen los siguientes 

valores. 

1 1 ⎛ π ⎞ 1 ⎛ 3π 

⎞ 

a = , b = cos ⎜ ⎟ , c= 

cos⎜ 

⎟ 

2 2 ⎝ 8 ⎠ 2 ⎝ 8 ⎠ 

(5) 

A fin de facilitar la implementación de (5), c 

se aproxima a 0.5 y b se modifica para asegurar 

ortogonalidad, quedando como sigue: 

1 2 1 

a = , b = , c = 

(6) 

2 5 2 

Se pueden evitar algunas multiplicaciones 

en el proceso de transformación integrando el 

proceso de cuantización. Por lo tanto, la 

ecuación (1) se puede modificar antes de 

cuantizar de la siguiente forma: 

donde 

T 

X = HFH ⊗ SF 

(7) 

⎡1 1 1 1 ⎤ 

⎢2 1 −1 −2 

⎥ 

H = ⎢ 

⎥ 

⎢1 −1 −1 1 ⎥ 

⎢ 

⎣1 −2 2 −1 

⎥ 

⎦ 

2 2 

⎡ a ab / 2 a ab / 2 ⎤ 

⎢ 

2 2 ⎥ 

ab b ab b 

SF = ⎢ 

/ 2 / 4 / 2 / 4 

⎥ 

2 2 

⎢ a ab / 2 a ab / 2 ⎥ 

⎢ 

2 

2 ⎥ 

⎣ab 

/ 2 b /4 ab / 2 b / 4 ⎦ 

(8) 

(9) 

El símbolo ⊗ denota multiplicación elemento 

por elemento de las matrices correspondientes. 

Paso 2. Post escalamiento y 

cuantización 

A la matriz SF se le aplica una cuantización, 

utilizando un cuantizador (Qstep), para después 

obtener una nueva matriz Y de la siguiente 

forma: 

⎛ 

Y X round SF ij ⎞ 

ij 

= ⎜ ⎟ 

ij 

(10) 

⎜ 

⎝ 

Q ⎟ 

step 

⎠ 

El H.264 define un total de 52 valores para 

Qstep. 



Proceso de decodificación 

Paso 1. Cuantización inversa y 

preescalamiento 

La señal Y recibida en el decodificador se 

escala utilizando el valor de Q step y se utiliza 

SF -1 como parte de la cuantización y transformación 

inversas de la siguiente forma: 

−1 

ij ij step ij 

X' = Y • Q • SF 

(11) 

Paso 2. Transformación inversa entera 

Recuperamos la señal F’ de la siguiente 

forma: 

T 

F' 

= H v X' 

Hv 

(12) 

Donde la matriz de transformación inversa 

es: 

Hv = 

⎡ 1 1 1 1 ⎤ 

⎢ 

⎢ 

1 1 / 2 −1 / 2 −1 

⎥ 

⎥ 

⎢ 1 −1 −1 1 ⎥ 

⎢ 

⎥ 

⎣1 / 2 −1 1 −1 / 2 ⎦ 

(13) 

Posteriormente se aplica a bloques de 4x4 

de coeficientes de DC de luminancia la 

transformada Hadamard de la ecuación 12. 

Esto constituye una transformación jerárquica. 

⎡1 1 1 1 ⎤ 

⎢ 

⎥ 

1 1 −1 −1 

$H = ⎢ 

⎥ 

⎢1 −1 −1 1 ⎥ 

⎢ 

⎥ 

⎣1 −1 1 −1 

⎦ 

(14) 

A los coeficientes de DC de los bloques de 

crominancia (formato 4:2:0), se les aplica la 

siguiente transformada. 

⎡1 1 ⎤ 

$H = ⎢ 

⎣1 −1 

⎥ 

⎦ 

(15) 

Para los coeficientes de DC de los bloques de 

crominancia en los formatos 4:2:2 y 4:4:4 

también se utiliza la transformada Hadamard 

adaptada. 

La siguiente matriz de la DCT entera se 

utiliza únicamente en perfiles altos. 

⎡ 8 8 8 8 8 8 8 8 ⎤ 

⎢ 

12 

⎢ 

10 6 3 −3 −6 −10 −12 

⎥ 

⎥ 

⎢ 8 4 −4 −8 −8 −4 4 8 ⎥ 

⎢ 

⎥ 

10 −3 −12 −6 6 12 3 10 

H = ⎢ 

− 

⎥ 

⎢ 8 −8 −8 8 8 −8 −8 8 ⎥ 

⎢ 

⎥ 

⎢ 6 −12 3 10 −10 −3 12 −6 

⎥ 

⎢ 4 −8 8 −4 −4 8 −8 4 ⎥ 

⎢ 

⎥ 

⎣ 3 −6 10 −12 12 −10 6 −3 

⎦ 

Codificación en entropía 

(16) 

En estándares anteriores (MPEG-1, 2, 4, 

H.261 y H.263), la codificación de la entropía 

se basa en tablas previamente definidas, las 

cuales contienen los códigos de longitud 

variable (VLCs, variable length code) (Flierl, 

2003), donde el conjunto de palabras de 

código en las tablas se basa en distribuciones 

de probabilidad de datos obtenidos en secuencias 

de video genérico, en lugar de utilizar 

la codificación Huffman o arimética 

exacta para la codificar la secuencia en 

cuestión. 

El H.264 utiliza diferentes VLCs a fin de 

igualar el símbolo que representa un dato de 

video, con un código basado en las 

características del contexto en el que se 

encuentra el símbolo. Todos los elementos de 

la sintaxis se codifican utilizando el código 

Exp-Golomb, excepto los datos residuales 

(Golomb, 1966). A fin de leer los datos 

residuales (coeficientes transformados y 

cuantizados) se utiliza una búsqueda en 

zigzag o una búsqueda alternada (campos de 



cuadros de video no entrelazados). Para 

codificar los datos residuales, se utiliza un 

método más sofisticado llamado código de 

longitud variable adaptivo basado en el 

contexto (CAVLC, Context Based Adaptive 

Variable Length Code). En los perfiles principal 

y alto, también se utiliza otro método 

llamado CABAC, pero es más complejo que 

el CAVLC. 

Código adaptivo de longitud 

variable basado en el contexto 

(CAVLC) 

Después de la transformación y la cuantización, 

la probabilidad de que el valor de un 

coeficiente sea cero o +/- 1 es muy alta. Por lo 

tanto, se codifica el número total de ceros y 

+/-1 que ocurren. Para los demás coeficientes 

sólo se codifica su nivel. 

Por ejemplo, suponiendo que los siguientes 

coeficientes se van a codificar utilizando 

CAVLC 

orden 0 1 2 3 4 5 6 7 8 9... 16 

coef c0, c1, c2, 1, 1, 0, 0, -1, 0, 0,..., 0 

Las reglas que utilizaría el CAVLC son: 

- Paso 1: Se utiliza una palabra de 

código de una tabla para expresar el 

número de coeficientes diferentes de 

cero, 6 (orden 0, 1, 2, 4, 5, 7) con 

magnitud uno, 3 (orden 4, 5, 7). 

- Paso 2: Se forma una palabra de 

código para indicar los signos de los unos 

en orden inverso de la siguiente forma, - 

(orden 7), + (orden 5) y +(orden 4). 


código para cada nivel de los coeficientes 

restantes en orden inverso, esto 

es, una palabra de código para c2 (orden 

2), c1, y c0. 


código para indicar en número de ceros, 

2 (orden 3, 6) 

- Paso 5: Las palabras de código resultantes 

se codifican utilizando runlength 

en orden inverso, esto es, una 

palabra de código para 1 (orden 6-5), 0 

(orden 4), 1 (orden 3-2). 

Código aritmético binario adaptivo 

basado en el contexto (CABAC) 

CABAC utiliza la codificación aritmética a fin 

de obtener una buena compresión. El modelo 

de probabilidad se actualiza con cada símbolo 

como se muestra en la figura 7 (Marpe, 

2003). 

Paso 1. Binarización. Proceso por el cual un 

símbolo no binario (coeficiente transformado, 

vector de movimiento, etc.) se mapea a 

una secuencia binaria única antes de aplicar 

la codificación aritmética. 

Paso 2. Modelado del contexto. Un modelo 

de un contexto es un modelo de probabilidades 

para uno o más elementos de un 

símbolo binarizado. El modelo de probabi- 

Actualizació n 

Binariza ción 

Modelado d el 

contexto 

Estimación de 

la p ro babilidad 

Codific ador 

Codi ficador ari tmét ico binario adapti vo 

Figura 8. Diagrama a bloques del CABAC 



lidad se selecciona de tal forma, que dicha 

selección depende sólo de elementos de la 

sintaxis previamente codificados. 

Paso 3. Codificación binaria aritmética. Se 

utiliza el código aritmético para codificar cada 

elemento de acuerdo con la selección del 

modelo de probabilidad. 

Rebanadas de video tipo B 

La predicción bidireccional contribuye a reducir 

la correlación temporal, ya que utiliza 

como referencia más cuadros almacenados en 

memoria. Los estándares que manejan cuadros 

tipo B, utilizan el modo bidireccional, lo 

cual sólo permite la combinación de una 

señal predecida previamente con la predicción 

subsiguiente. Una señal predecida, se 

forma por la señal subsiguiente, codificada 

como INTER, una señal perteneciente a un 

cuadro anterior y otra señal que se forma 

tomando el promedio lineal de dos señales 

predecidas en donde se utiliza la compensación 

de movimiento. 

El H.264 incluye no sólo predicción hacia 

adelante/atrás, sino también la predicción 

adelante/adelante y atrás/atrás (Flierl, 2003). 

Se pueden utilizar dos cuadros anteriores 

para la predicción de una región de video, 

justo antes de que la escena cambie y dos 

referencias posteriores justo después de que 

la escena cambió. A diferencia de los estándares 

previos, en el H.264, las rebanadas 

predecidas bidireccionalmente pueden utilizarse 

como referencia de otros cuadros que se 

codificarán en modo INTER. También, se 

agrega la predicción con peso cuando existen 

transiciones entre las diferentes escenas del 

video. 

Predicción con peso 

Los estándares anteriores consideran con 

igual peso a todos los cuadros o imágenes 

que sirven como referencia para la predicción. 

Por ejemplo, una señal bajo predicción 

se obtiene promediando con igual peso las 

señales de referencia. Sin embargo, la predicción 

de las señales en transición gradual 

de escena a escena, precisa de diferentes pesos. 

La transición gradual es muy popular en 

cines, trancisiones de difuminadas hacia el 

color negro (las muestras de luminancia de la 

escena difuminan gradualmente aproximándose 

a cero y las de crominancia se aproximan 

a 128) o desde el color negro. 

El H.264 utiliza el método de predicción 

con pesos para los macrobloques de una 

rebanada tipo P o tipo B. Una señal de 

predicción p para una rebanada tipo B, se 

obtiene de dos señales de referencia (r1 y r2 ) 

utilizando diferentes pesos. 

p = w1 × r1 + w2 × r2 (17) 

Donde w1 y w2 son los pesos. 

Los pesos se determinan en el codificador 

de dos maneras diferentes, implícitamente y 

explícitamente. En la determinación implícita, 

los pesos los calcula el decodificador 

basado en la distancia temporal entre cuadros 

de referencia. Si la distancia temporal 

entre la referencia y el cuadro actual es cercana, 

los pesos son pequeños, y si la distancia 

temporal es grande, los pesos son más 

grandes. En la determinación explicita los 

pesos se envían al decodificador en el encabezado. 

Slices tipo SP y SI 

En los estándares de codificación de video 

anteriores, el cambio entre trenes de bits es 

posible, únicamente en cuadros tipo I, reconstruyendo 

cuadros I a intervalos fijos, lo que 

permite el acceso aleatorio de los cuadros 

para reproducción rápida del video (fast 

forward/backward ). Sin embargo, el problema 



de usar cuadros I es que se requiere de un 

número de bits mucho mayor y no se 

explotan las redundancias temporales. 

En el H.264 se utilizan rebanadas de video 

tipo SP y SI para cambiar el tren de bits 

(Ghanbari, 2003). La figura 9 muestra cómo 

utilizar los cuadros SP para cambiar entre 

diferentes trenes de bits. Suponiendo que 

existen dos trenes de bits, P(1,k) y P(2,k), 

correspondientes a la misma secuencia de 

video pero con diferentes velocidades binarias. 

Dentro del tren de bits codificado, los 

cuadros SP se colocan en una posición a la 

cual se permita un cambio de tren de bits. 

En caso de cambiar del tren de bits 

superior P(1,3) al inferior P(2,3), se genera el 

cuadro SP S(3) que permite producir un cuadro 

decodificado P(2,3) utilizando P(1,2) de 

otro tren de bits, aun cuando haya compensación 

de movimiento. 

También se puede utilizar una rebanada 

de video tipo SI de manera similar al SP, 

pero la predicción se formaría utilizando el 

modo de predicción INTRA de 4x4 (Karczewicz, 

2003). 

Resistencia a errores 

El particionamiento de los datos es un 

método muy popular para incrementar la 

resistencia a errores del sistema. Los datos 

son particionados de acuerdo con su significancia 

dentro del tren de bits. Posteriormente, 

se transmiten primero los datos con 

mayor prioridad para reducir el error medio 

cuadrático de la secuencia a un mínimo, posteriormente 

se transmiten los datos menos 

significativos. También, la codificación en 

capas (escalable) aumenta la resistencia a 

errores (transmisión de bits más significativos 

primero). Durante la codificación 

escalable espacial o temporal se pueden recuperar 

datos perdidos en otras capas. 

Este nuevo estándar incrementa la resistencia 

a errores de transmisión por medio de 

la contribución de rebanadas tipo S, el ajuste 

de los parámetros de codificación, el ordenamiento 

flexible de los macrobloques y el 

uso de rebanadas redundantes (Wenger, 

2003). 

P(1,1) P(1,2) P(1,3) P(1,4 ) P(1,5) 

S(3) 

P(2,1) P(2,2) P (2 ,3) P(2 ,4) P(2,5) 

Figura 9. Cambio en la velocidad del tren de bits utilizando cuadros tipo SP 



Comparación del esquema de 

codificación del H.264 con otros 

esquemas 

La tabla 8 muestra en análisis comparativo de 

los algoritmos de codificación de video 

MPEG-2 y MPEG-4 parte 2 contra el H.264 

(ISO/IEC JTC1/SC29/WG11 Verification Tests 

on AVC, 2003). 

Tabla 8. Comparación de los estándares MPEG-2, MPEG-4 parte 2 y H.264 / MPEG-4 parte 10 

Característica MPEG-2 MPEG-4 part 2 MPEG-4 part 10/H.264 

Tamaño del 

Macrobloque 

Tamaño de 

bloques 

16x16 (Modo cuadro) 

16x8 (Modo campo) 

8x8 

16x16 

16x16, 16x8, 8x8 

16x16 

16x16, 8x16, 16x8, 8x8, 

4x8, 8x4, 4x4 

Predicción INTRA No Dominio de la transformada Dominio espacial 

Transformada 

Cuantización 

DCT de tamaño 8x8 

Cuantización escalar con 

tamaño constante entre 

pasos del cuantizador 

DCT-Wavelet de tamaño 

8x8 

Cuantización vectorial 

8x8, 4x4 DCT entera 

4x4, 2x2 Hadamard 

Cuantización escalar con 

tamaño entre pasos de 

12.5% de la velocidad 

binaria 

Codificación de la entropía VLC VLC VLC, CAVLC, CABAC 

Exactitud de las muestras de 

la imagen 

1 2 muestra 1 4 muestra 1 4 muestra 

Cuadros de referencia 1 cuadro 1 cuadro Múltiples cuadros 

Modo de predicción 

bidireccional 

adelante / atrás 



atrás / atrás 

backward / backward 

Predicción con peso No No Si 

Filtro de desbloqueo No No Si 

Tipo de cuadros I, P, B I, P, B I, P, B, SI, SP 

Perfiles 5 perfiles 8 perfiles 7 perfiles 

Acceso aleatorio Si Si Si 

Resistencia a errores 

Particionamiento de datos, 

FEC para transmisión de 

paquetes por importancia 

Sincronización, 

particionamiento de datos, 

extensión de encabezados, 

VLCs reversibles 

Particionamiento de datos, 

ajuste de parámetros, orden 

flexible de macrobloques, 

rebanadas redundantes, 

rebanadas tipo SP y SI 

Velocidad de transmisión 2-15 Mbps 64kbps - 2Mbps 64kbps - 150Mbps 

Complejidad del codificador Mediana Mediana Alta 

Compatibilidad con 

estándares previos 

Si Si No 



Eficiencia de codificación 

La tabla 9 muestra las comparaciones del 

H.264 perfil Línea Base (BP) del H.264 

contra el Perfil Simple del MPEG-4 parte 2 

(SP) para secuencias con definición de 

multimedia (MD). Los números en las 

tablas indican la mejora en la eficiencia de 

la codificación. Por ejemplo, > 2x significa 

que la eficiencia del H.264 fue más de dos 

veces la eficiencia del MPEG-4 parte 2 Perfil 

Simple (ISO/IEC JTCI/SC29/WG11, 2000) y 

para la velocidad binaria de la secuencia 

indicada. La letra T significa que el H.264 

fue transparente en la velocidad binaria 

para la secuencia dada. Estadísticamente el 

H.264 BP tuvo una mejora en la eficiencia 

de la codificación de 2 veces o más, en 14 de 

18 casos probados. 

La tabla 10 muestra la comparación del 

H.264 Perfil Principal (MP) y el MPEG-4 

Parte 2 Perfil Simple Avanzado (ASP) para 

secuencias MD (ITU-T H.264, 2003). Estadísticamente 

el H.264 BP tuvo una eficiencia de 

codificación de 2 veces o más que el MPEG-4 

parte 2 ASP, en 18 de 25 casos probados. 

La tabla 11 muestra la comparación entre 

el H.264 Perfil Principal (MP) y el MPEG-2 

para definición estándar (SD) (ITU-T and 

ISO/IEC, 1994). Estadísticamente el H.264 

MP, tuvo una eficiencia de codificación de 1.5 

veces o más que el MPEG-2HiQ, en 8 de 12 

casos probados, de los cuales, en 3 casos el 

H.264 mostró una mejora en la eficiencia de la 

codificación de 2 veces o más y en 1 caso 

mostró una mejora de 4 veces mayor. 

Cuando se comparó contra el modelo de 

prueba 5 del MPEG-2 (MEPG-2 TM5), 

estadísticamente, el H.264 Perfil Principal 

tuvo una eficiencia de codificación de 1.8 

veces o más en 9 de 12 casos probados, de los 

cuales, en 2 casos mostró una mejora de 4 

veces mayor. 

Tabla 9. Comparación del H.264 Perfil Línea Base y el MPEG-4 Parte 2 Perfil Simple para secuencia con 

definición MD 

Secuencia Velocidad bin aria [kbps] para QCIF Velocidad bina ria [kbps] pa ra CI F 

24 48 9 6 192 96 192 3 84 7 68 

Forema n > 1 x 2x 2x T 2x > 2x T T 

Paris > 1 x 2x 2x 2x 2x T, 2x T 

Head > 2x 2x 2x T T 

Zoom > 1 x 1x 2x 2x 

Tabla 10. Comparación del H.264 Perfil Prin cipal y el MPEG-4 Parte 2 Perfil Simple Avanzado para 

secuencias con definición MD 

Secuencia 

Velocidad binaria [kbps] pa ra QCIF 

Velocidad binaria [kbps] para CIF 

24 48 96 192 96 192 384 768 

Footba ll 2x / 1 x 2x 2x > 1x > 1x 1x > 1x 

Mobile 2x / 1 x 2x 2x > 2x 4x > 2x T 

Husky 2x 2x > 1x 2x 2x 2x 

Tempete 2x 2x > 2x T 2x 2x T,2x T 



Secuencia 

Tabla 11. Comparación del H.264 MP contra el MPEG-2 para definición estándar (SD) 

Velocidad binaria [Mbps] p ara el MPEG-2 

HiQ 

Velocidad binaria [Mbps] pa ra MPEG-2 

TM5 

1.5 2.25 3 4 6 1.5 2.25 3 4 6 

Footba ll > 1.5x > 1.3x 1.3x 1 .5x 2x 1 .8x 1. 3x 1.5x 

Mobile 4x 2.7x 2x T T > 4x > 2. 7x > 2x T T 

Husky > 1.5x 1.3x 1 x /1.3x 1 .5x 2.7x / 2x 1 .8x 2x > 1.5x 

Tempete T, 2 x T T T T T, 4x T T T T 

La tabla 12 muestra la comparación entre el 

H.264 Perfil Principal y el MPEG-2 para alta 

definición (HD). Estadísticamente, el H.264 

Perfil Principal tuvo una eficiencia de codificación 

de 1.7 veces mayor que el MPEG-2 en 

7 de 9 casos probados, de los cuales, en 3 

casos mostró mejoras de hasta 2 veces y en 1 

caso de hasta 3.3 veces. 

Cuando se comparó el modelo de prueba 5 

del MPEG-2 (MEPG-2 TM5), estadísticamente, 

el H.264 Perfil Principal, tuvo una 

eficiencia de codificación 1.7 veces o mayor 

en 8 de 9 casos, de los cuales, en 4 casos 

mostró una mejora de 2 veces mayor. 

Codificador de audio 

El H.264/MPEG-4 parte 10, está siendo adoptado 

por muchas compañías de video tales 

como Phillips, Polycom, Ligos, Broadcom, 

Netvideo, Motorota, STMicroelectronics entre 

otras. El estándar se refiere únicamente a la 

codificación de video, dejando la libertad a 

las compañías de elegir sus propios codificadores 

de audio. Por ejemplo, la empresa 

europea DVB está considerando adoptar AAC- 

SBR (Advanced Audio Coding - Spectral Band 

Replication) llamado formalmente AAC plus, 

mientras que la empresa americana ASTC utilizará 

AC-3 plus de los laboratorios Dolby Labs. 

Además del H.264, China ha desarrollado 

su propio estándar de video llamado AVS 

(Audio Video Standard de China), el cual es 

un algoritmo similar, con algunas diferencias 

en los tamaños de las transformadas, codificadores 

de entropía, filtros de desbloqueo, 

filtros de interpolación para la compensación 

de movimiento, etc. 

Secu encia 

Tabla 12. Comparación del H.264 MP y el MPEG-2 para HD 

Velocidad binaria [Mbps] para 

el MPEG-2 HiQ 

V elocidad bi naria [Mbps] par a el 

MP EG-2 TM5 

6 10 20 6 10 20 

720 Crew 1.7x 2x T 1.7x 2x T 

(60p) Harbour T, 3.3x T T T, 1.7x T T 

Stockh olm 

1x 

2x 

1080 

(30i) 

Pan 

New Mobile 

T, 2x T T, 2x T 

& Ca lenda r 

1080 River Bed > 1.7x > 1x T > 1.7 x > 1x T 

(25p) Vinta ge Ca r 1.7x T, 2x T 1.7x T, 2x T 



Conclusiones 

El presente artículo describe al nuevo estándar 

de compresión de video H.264/MPEG-4 

parte 10, el cual supera a los estándares de 

video anteriores. Las principales diferencias 

se encuentran en la estructura de los bloques 

funcionales del algoritmo. Por ejemplo, compensación 

de movimiento en bloques de 

tamaño variable, interpolación para exactitud 

fraccional, filtro de desbloqueo adaptivo, 

rebanadas tipo SI y SP, mayor resistencia a 

los errores que los estándares anteriores, 

trasformada de 4×4, predicción con carga, 

CABC, CAVLC y predicción direccional para 

codificación INTRA. 

La tendencia actual de las empresas dedicadas 

al video se está moviendo a favor de la 

implementación del nuevo estándar para las 

diferentes aplicaciones como son, cámaras 

digitales, transmisión de video sobre redes 

IP, teléfonos celulares, transmisión de video 

satelital, entre otras. 

El siguiente paso que está dando el grupo 

de expertos, es coordinar los términos de las 

licencias para que las compañías manufactureras 

paguen las regalías correspondientes 

por el codificador-decodificador y los términos 

de las licencias. 

Referencias 

Flierl M. and Girod B. (2003). Gener al ized 

B Picture and the Draft H.264/AVC 

Video-Compression Stan dard. IEEE 

Trans ac tions on Circuits and Systems for 

Video Tech nology, Vol. 13, pp. 587-597, 

Julio. 

Ghanbari M. (2003). Stan dard Codecs: 

Image Compres sion to Advanced Video 

Coding. Hertz, UK: IEE. 

Golomb S.W. (1966). Run-Length Encoding. 

IEEE Trans. on Infor ma tion Theory, 

IT-12, pp. 399-401, Dic. 

Huang Y.W. (2005). Anal ysis, Fast Algo - 

rithm, and VLSI Archi tec ture Design 

for H.264/AVC Intra Frame Coding. 

IEEE Trans ac tions on Circuits and Systems 

for Video Tech nology, Vol. 15, pp. 

378-401, Marzo. 

ISO/IEC 11172-2:1993 (1993). Infor ma tion 

Tech nology, Coding of Moving Pictures 

and Associated Audio for Digital 

Storage Media at Up to About 1,5 

Mbit/s-Part 2: Video. 

ISO/IEC JTC1/SC29/WG11, “ISO/IEC 

13818-2: (1994). Infor ma tion Technology-Generic 

Coding of Moving Pictures 

and Asso ci ated Audio Infor ma - 

tion: Video, ISO/IEC. 

ISO/IEC JTC1/SC29/WG11 (2003). Report 

of the Formal Veri fi ca tion Tests on 

AVC (ISO/IEC14496-10 | ITU-T Rec. 

H.264)”, MPEG2003/N6231, diciembre. 

ISO/IEC JTCI/SC29/WG11, ISO/IEC 14 

496:2000-2: (2000). Infor ma tion on 

Technology-Coding of Audio-Visual 

Objects-Part 2: Visual, ISO/IEC. 

ITU-T H.262 (2000). Inter na tional Tele - 

com mu ni ca tion Union, Recom men da - 

tion: Generic Coding of Moving 

Pictures and Asso ci ated Audio Infor - 

ma tion: Video, ITU-T. 

ITU-T H.264 (2003). Inter na tional Tele - 

com mu ni ca tion Union, Recom men da - 

tion: Advanced Video Coding for 

Generic Audio vi sual Services, ITU-T. 

ITU-T H261 (1993). Inter na tional Tele com - 

mu ni ca tion Union, Recom men da tion 

ITU-T H.261: Video Codec for Audio vi - 

sual Service at px64 kbits,” ITU-T. 

Karczewicz M. and Kurceren R., (2003). 

The SP- and SI Frames Design for 

H.264/AVC. IEEE Trans ac tions on Circuits 

and Systems for Video Tech nology, 

Vol. 13, pp. 537-544, Julio. 

List P. (2003). Adap tive Deblocking 

Filter. IEEE Trans ac tions on Circuits and 

Systems for Video Tech nology, Vol. 13, 

pp. 614-619, Julio. 



Marpe D. (2003). Context-Based Binary 

Arith metic Coding in the H.264/AVC 

Video Compres sion Stan dard. IEEE Transactions 

on Circuits and Systems for Video 

Tech nology, Vol. 13, pp. 620-635, Julio. 

Ochoa H. and Rao K.R. (2005). A New 

Modified Hybrid DCT-SVD Coding 

System for Color Images. WSEAS Transaction 

on Circuits and Systems, Vol. 4, pp. 

1246-1253, Octubre. 

Ochoa H. and Rao K.R. (2006). A New 

Modified Version of the HDWTSVD 

Coding System for Mono chro matic 

Images. WSEAS Trans ac tion on Systems, 

Vol. 5, pp. 1190 – 1195, Mayo. 

Rich ardson I. E.G. (2003). H.264 and 

MPEG-4 Video Compres sion: Video Coding 

for Next-generation Multi media, Wiley. 

Sullivan G., Topiwala P. and Luthra A. 

(2004). The H.264/AVC Advanced 

Video Coding Stan dard: Over view and 

Intro duc tion to the Fidelity Range 

Exten sions. SPIE Confer ence on Appli - 

ca tions of Digital Image Processing 

XXVII, Vol. 5558, pp. 53-74, agosto. 

Wenger A. (2003). H.264/AVC Over IP. 

IEEE Trans ac tions on Circuits and Systems 

for Video Tech nology, Vol. 13, pp. 

645-656, julio. 

Wien M. (2003). Vari able Block-Size 

Trans form for H.264/AVC. IEEE Transactions 

on Circuits and Systems for Video 

Tech nology, Vol. 13, pp. 604-613, julio. 




Humberto de J. Ochoa-Domínguez. Estudió su licenciatura en el Instituto Tecnológico de Veracruz, su maestría en el 

Instituto Tecnológico de Chihuahua y su doctorado en la Universidad de Texas en Arlíngton, apoyado por 

Fulbright y PROMEP. Trabajó en el grupo de investigaciones de multi media de Nokia, en Irving Texas, y 

actualmente es profesor investigador en la Universidad Autónoma de Ciudad Juárez. Ha impartido diversos 

cursos tutoriales de codificación de video y procesamiento de señales en Singapur, Tailandia, Estados Unidos y 

la República de Malta. En 1998, recibió el premio Chihuahua por el trabajo “Sistema para la Clasificación de 

Mamografías Digitales en Normales y Anormales Mediante el Análisis de Textura y Detección de Micro 

calcificaciones. Ha ofrecido conferencias en diversos foros de multi media y procesamiento de señales en varias 

partes del mundo y ha publicado en diferentes Jour nals y revistas arbitradas de reconocimiento nacional e 

internacional. Asimismo, es miembro de la Sociedad de Procesamiento de Señales del al IEEE . 

José Mireles-García. Estudió su licenciatura en ingeniería indus trial con especialidad en electrónica, así como su 

maestría en electrónica en el Instituto Tecnológico de Chihuahua. Obtuvo su doctorado en ingeniería eléctrica 

en la Universidad de Texas en Arlington (UTA), apoyado por PROMEP. Actualmente es profesor investigador 

en la Universidad Autónoma de Ciudad Juárez y profesor de investigación adjunto de las Universidades de 

Texas en Arlington y de El Paso. Es miembro del Sistema Nacional de Investigadores (SNI,) de la Sociedad de 

Control y de la SMC de la IEEE. Asimismo, ha sido integrado en la lista de Strathsmore’s Who’s Who los años 

2002 y 2003. Fue visitante en la UTA de Agosto 2002 a Julio 2003, en cuyo período también trabajó en el Instituto 

de Robótica de UTA en Fort Worth TX como asistente de investigación, y participó en la recepción de fondos 

binacionales NSF-CONACyT para desarrollo de trabajo en sistemas de eventos discretos. Sus áreas de interés 

son el diseño, fabricación y prueba de los Sistemas Microelectromecánicos (MEMS,) robotización y 

automatización y sistemas de eventos discretos. Ha impartido conferencias en diversos foros de robótica, 

automatización y MEMS en varias partes del mundo y ha publicado en diferentes Jour nals y revistas arbitradas 

de reconocimiento nacional e internacional, así también ha participado en la organización de diversos foros 

nacionales e internacionales. 

Juan de Dios Cota-Ruíz. Estudió su licenciatura en el Instituto Tecnológico de Sonora y su maestría en el Instituto 

Tecnológico de Chihuahua. Trabajó en el área de diseño de equipo de prueba para la empresa SMTC de 

Chihuahua y RCA Thomson. Actualmente trabaja como profesor investigador en el Departamento de 

Ingeniería Eléctrica y Computación de la Universidad Autónoma de Ciudad Juárez en el área de 

Instrumentación y Procesamiento de Señales. Ha publicado en diferentes revistas arbitradas del país. 




El clima, la ecología y el caos desde la 

perspectiva de la teoría general de sistemas 

N. Sánchez-Santillán y R. Garduño-López 

Departamento El Hombre y su Ambiente, UAM-Xochimilco y 

Centro de Ciencias de la Atmósfera, UNAM, México 

E-mails: santilla@correo.xoc.uam.mx y rene@atmosfera.unam.mx 

(Recibido: noviembre de 2005; aceptado: diciembre de 2006) 

Resumen 

La ciencia clásica determinista afronta dificultades para abordar y explicar 

fenómenos complejos, como son aquellos que conciernen al estudio del clima, la 

ecología o las sociedades humanas. Un nuevo paradigma científico, como la 

visión holística, ha ido llenando gradualmente los huecos dejados por el viejo 

enfoque mecanicista y ha incorporado, entre otras, además del mecanicismo de 

Newton, la teoría de la información, la cibernética, la teoría del caos y la teoría 

general de sistemas. Se analizan éstas dos últimas teorías con una somera 

aproximación a problemas de climatología y ecología. 

Descriptores: Sistemas, caos, clima, ecología, modelos. 

Abstract 

Clas sic de ter min is tic sci ence con fronts dif fi cul ties to ap proach and ex plain com plex 

phe nom ena, like those con cern ing the study of cli mate, ecol ogy or hu man so ci et ies. A 

new sci en tific par a digm, the ho lis tic vi sion, has been grad u ally fill ing the gaps left by 

the old mechanicist ap proach, and along with New ton’s mechanicism, has in cor po rated 

In for ma tion the ory, cybernetics, chaos theory and, general systems theory, among oth - 

ers. These last two the o ries are an a lyzed with a su per fi cial ap proach to cli ma tol ogy and 

ecol ogy is sues. 

Key words: Sys tems, chaos, cli mate, ecol ogy, mod els. 


Existe una gran expectativa respecto al calentamiento 

climático y sus efectos sobre el planeta. 

La población en general espera que la 

comunidad científica responda a sus innumerables 

preguntas y ofrezca una solución 

viable a los problemas que se presentan en 

muchos lugares de la Tierra. Las lluvias 

torrenciales, las inundaciones, las olas de calor 

y los períodos de sequía, por mencionar algunos 

ejemplos, inciden de manera directa en 

el rendimiento de las cosechas, los volúmenes 

pesqueros y la salud humana, generando 

efectos importantes en las economías locales y 

regionales de los sitios donde se producen 

(Bakun, 1996; Chambers, 1993). Entre los investigadores 

de todo el mundo especializados 

en problemas climáticos y ecológicos, prevalecen 

grandes incertidumbres sobre la mayoría 

de los temas que atañen a sus áreas de 

estudio y, a pesar de que se ha buscado y logrado 

una importante coordinación interdisciplinaria 

en esta comunidad, los resultados 

obtenidos hasta ahora no poseen la contundencia 

que de ellos se espera. ¿A que se debe esto?

El clima, la ecología y el caos desde la perspectiva de la teoría general de sistemas 

Las causas se encuentran en la manera lineal 

en que se abordan problemas multidimensionales, 

cuya complejidad desborda por completo 

los métodos de la ciencia clásica determinista. 

Ejemplos claros de sus limitaciones, 

son las dificultades que enfrenta este 

enfoque cuando trata de elaborar pronósticos 

sobre la evolución de sistemas complejos, 

como el clima, la ecología o las sociedades 

humanas. 

Con el fin de apuntalar la necesidad del 

cambio de paradigma científico que trascienda 

las restricciones deterministas, en este 

trabajo se analizarán de forma breve, los 

elementos que han conducido hacia la visión 

holística, con la cual, paulatinamente se han 

encontrado las respuestas que el mecanicismo 

newtoniano no había podido proporcionar. 

Estos elementos van, desde la 

indivisibilidad de lo simple y lo complejo, del 

todo y sus partes, y del orden y el desorden, 

hasta la teoría del caos y la teoría general de 

sistemas. 

Hacia la teoría del caos 

La ciencia ha seguido dos caminos a través de 

su historia; por un lado, la visión mecanicista 

del mundo, desarrollada principalmente 

por Galileo, Descartes, Bacon y Newton, 

entre otros, la cual se basó en la división 

fundamental de dos reinos separados e independientes 

entre sí: el espíritu y la materia. 

El universo material, donde se incluía el 

organismo humano, era una máquina que, en 

principio, podía entenderse con sólo analizar 

por separado sus partes más pe- queñas 

(Capra, 1991; Ritter et al., 2002). El segundo 

camino comenzó con Heráclito en el siglo VII 

a C., quien planteó que el universo presenta 

armonía en la desarmonía y viceversa. Esta 

otra visión del conocimiento, vislumbraba lo 

que después dio pie a la complejidad de la 

relación orden-desorden-organización, la 

cual surgió cuando se constató empíricamente 

que los fenómenos desordenados del 

universo son necesarios en ciertas condiciones 

(Bouald and Marcel, 1988; Balandier, 

1989). 

Con un ligero vistazo a nuestro alrededor, 

se advierte una tendencia general al desorden: 

un ciclón provoca lluvias torrenciales, 

un tornado genera corrientes de viento 

intempestivas, una ola de calor desencadena 

muerte… nunca al revés; pero, contrariamente 

a lo que se piensa, este desorden no 

implica confusión. Así entonces, surgió la 

búsqueda de una explicación de los fenómenos 

naturales, cuya complejidad los volvía 

prácticamente irresolubles mediante la aplicación 

de algoritmos lineales; esto dio pie a 

un nuevo paradigma: la teoría del caos. El 

caos es al mismo tiempo muerte-nacimiento, 

destrucción-creación y tiene que ver con 

aquello que no podemos saber con certeza; 

representa a la naturaleza en su creatividad 

expresada en un vasto campo de conductas y 

está vinculado con el modo en que ésta crea 

nuevas formas y estructuras (caos autoorganizado), 

con su impredictibilidad y su lógica 

difusa. Los sistemas caóticos se caracterizan 

por su adaptación al cambio, y en consecuencia, 

por su estabilidad (Thom, 1972). Si 

tiramos una piedra a un río, su cauce no se ve 

afectado, ya que la corriente buscará nuevos 

caminos; no sucedería lo mismo si el río fuera 

un sistema ordenado en el que cada molécula 

de agua tuviera una trayectoria fija. 

Las leyes del caos ofrecen una explicación 

para la mayoría de los fenómenos naturales 

—desde el origen del Universo, la propagación 

de un incendio o la evolución de una 

sociedad— a los cuales es prácticamente 

imposible predeterminarles un comportamiento 

con una certidumbre absoluta. Aquí 

surge la pregunta, ¿por qué lleva la humanidad 

tantos siglos sumida en el engaño 

del orden? El problema parte del concepto 

clásico de ciencia, que exige la capacidad 



para pronosticar, de forma precisa, la 

evolución de un objeto de estudio dado 

(Chalmers, 1989). Descartes aseguraba que si 

se fabricara una máquina tan potente que 

conociera la posición de todas las partículas y 

utilizara las leyes de Newton para conocer su 

evolución futura, se podría predecir cualquier 

cosa del Universo (Garber, 1978). Esta 

afirmación ilustra la práctica de la ciencia 

mecanicista a lo largo de su historia; sin 

embargo, este hito científico que impuso el 

orden, el determinismo y la predicción en la 

investigación, acotando igualmente la enseñanza 

y la divulgación científica, también 

limitó los estudios a aquellos fenómenos que 

coincidieran con un patrón previo. Todo lo 

que evidenciara turbulencia, irregularidad o 

variabilidad, quedó relegado a la categoría de 

ruido y cuando éste abarcaba la mayoría de lo 

observable, los científicos de todas las disciplinas 

intentaron descomponer a los sistemas 

en sus partes para tratar de corregir y 

cuadrar los elementos azarosos y no se 

afectara el resultado global; no obstante, nada 

estaba más lejos de la realidad (Koestler and 

Smythies, 1970). 

La condición de cualquier forma de 

vida es la incertidumbre y la contingencia; 

la teoría del caos nos invita a cuestionar 

nuestras creencias y a formular nuevas 

preguntas acerca de la realidad. Los principales 

postulados de la teoría del caos 

son: 

• El caos se encuentra en todas partes 

y se observa un orden dentro de él. 

• En la dinámica de los sistemas 

caóticos, existe una dependencia crítica 

de las condiciones iniciales en que se 

producen. 

• No existen fronteras disciplinarias 

que delimiten el estudio y aplicación 

de la teoría del caos. 

Teoría del caos 

En el desarrollo de la teoría del caos, se 

sucedieron tres pasos fundamentales. El primero 

de ellos ocurrió hacia finales del siglo 

XIX, cuando el físico-matemático Henri Poincaré 

introdujo el concepto de no linealidad, 

que contradecía el ideal clásico de los sistemas 

lineales en los que causa y efecto se 

identifican plenamente, y la resultante de un 

fenómeno es igual a la suma de sus partes. La 

no linealidad implica divergencia entre 

resultado y origen, y la simple adición de las 

partes de un hecho no corresponde al producto 

final, por lo que los algoritmos lineales 

poco pueden hacer para explicar su dinámica. 

El problema no era menor, si se 

considera que un 90% de los procesos de la 

naturaleza son de carácter no lineal. 

El meteorólogo Edward Lorenz, sin proponérselo, 

dio en 1960 el segundo paso en el 

avance de la teoría del caos. Al estar realizando 

un día simulaciones a partir del 

comportamiento de los parámetros meteorológicos 

elementales, copió por error los 

números de la impresión anterior de sus 

registros y los introdujo en la computadora; 

observó que el resultado de las condiciones 

atmosféricas, a escaso tiempo del punto de 

partida, divergía parcialmente del obtenido 

con anterioridad, pero al cabo de pocos meses 

–ficticios, puesto que eran simulaciones– las 

pautas perdían la semejanza por completo. 

Lorenz descubrió que el problema se hallaba 

en los decimales: el programa guardaba seis, 

pero para ahorrar espacio él sólo había introducido 

tres, convencido de que el resultado 

apenas se resentiría (Lorenz, 1963). 

Este incidente aparentemente inocuo, 

marcó el fin de los pronósticos a largo plazo; 

Leith (1974) y Lorenz (1993) establecen que la 

condición inicial se vuelve crítica en pronósticos 

meteorológicos que van más allá de 

dos semanas. Este descubrimiento puso de 



manifiesto la extremada sensibilidad de los 

sistemas no lineales, la cual se ilustra con el 

concepto denominado efecto mariposa o 

“dependencia crítica de las condiciones iniciales”, 

donde se resalta la influencia que 

ejerce la más mínima perturbación en el 

estado en que se origina el sistema sobre el 

estado final del mismo. El escritor James 

Gleick (1987) parafrasea: “si una mariposa 

agita hoy con su aleteo el aire de Pekin, puede 

modificar los sistemas climáticos de Nueva 

York el mes que viene”. Se establece entonces 

que cualquier variación, ya sea de una milésima 

o de una millonésima en alguna variable, 

forma una pequeña muesca que modificará 

el sistema hasta el punto de hacerlo 

imprevisible. 

Finalmente, el tercer paso se lo imprimió 

el carácter no lineal e iterativo de los sistemas 

en la naturaleza, que con instrucciones muy 

sencillas origina estructuras sumamente complejas. 

La mayor parte de la materia va de la 

abundancia de lo sencillo a la escasez de lo 

complejo, con una distribución piramidal 

(Ashby, 1972). Aquí, la palabra complejidad 

indica la cantidad de elementos de un 

sistema (estructura), sus interacciones potenciales 

(función) y el número de estados posibles 

en que se traducen a través de sus 

relaciones (organización). De esta manera, la 

complejidad sistémica está en proporción 

directa con su variedad y variabilidad y es, 

por lo tanto, una medida comparativa 

(Forrester, 1971). 

Estas características también se observan 

en los lenguajes escritos, los cuales parten de 

las letras y pasan luego por las palabras, 

frases, párrafos, capítulos y libros, con la peculiaridad 

de que las letras solas no tienen 

nada que ver con el significado de las palabras, 

ni tampoco estas últimas aisladas 

determinan lo que una frase quiere decir, y 

así sucesivamente. La letra “h” no está emparentada 

con el concepto huracán y la 

palabra “con” puede acompañar igual a una 

frase de amor o de odio. Esto significa que 

cuanto más de cerca se mire un problema en 

la naturaleza, tanto más borrosa se vuelve su 

solución. Las estructuras más complejas o 

altas en la pirámide tienen propiedades 

ajenas y diferentes a las de niveles inferiores, 

situación que le genera un problema importante 

a la ciencia, al perder ésta su 

capacidad de predicción; a dichas propiedades 

se les conoce como propiedades emergentes 

(Morin, 1994). Sin embargo, si la 

precisión difumina aún más el objeto de 

estudio, ¿qué estrategia debe emplearse para 

estudiar los sistemas complejos? Aquí interviene 

la teoría de la totalidad , que concibe el 

mundo como un todo orgánico, fluido e 

interconectado; si algo falla no debe buscarse 

la porción dañada, sino más bien hay que 

revisar el sistema completo, ya que se trata de 

una unidad indisoluble (Morin, 1994). 

Resulta incompleto tratar de observar la 

naturaleza de modo fragmentado y explicarlo 

todo mediante la suma de sus partes, 

ignorando dos aspectos primordiales: la 

imposibilidad de “meter la totalidad en una 

bolsa”, porque ésta también forma parte de 

aquella, y la dependencia que existe entre el 

observador, lo observado y el proceso de 

observación: dado que el hombre forma parte 

de la totalidad, su percepción y su mera 

presencia altera el objeto de estudio. El caos 

se debe interpretar desde el punto de vista 

global para salvar las fronteras de las 

diferentes disciplinas y aceptar la paradoja 

que convierte lo simple y lo complejo, el 

orden y el caos en elementos inseparables, 

donde la palabra “elementos” define a las 

partes o componentes de un sistema que 

pueden organizarse en un modelo. Ejemplo 

de esta paradoja es el denominado fractal de 

Mandelbrot (1983), una de las concepciones 

más complejas que ha imaginado el hombre, 

el cual se creó a partir de una ecuación 

iterativa muy simple. Desde esta visión, el 



caos se convierte en una inagotable fuente de 

creatividad de la que también puede surgir el 

orden, proceso que puede revertirse, generándose 

entonces caos a partir de la 

armonía. Las civilizaciones antiguas creían 

en la armonía entre el caos y el orden, y 

definían al primero como “una suerte de 

orden implícito”; quizá sea el momento de 

reflexionar y retomar el concepto. 

Teoría general de sistemas 

La reflexión de las relaciones entre lo simple 

y lo complejo, el todo y sus partes, el orden 

y el desorden, conduce directamente a la 

teoría general de sistemas, paradigma fundamental 

para abordar un sistema complejo 

como lo es, por ejemplo, el clima, cuyo 

estudio era, hasta no hace mucho tiempo, una 

subdisciplina o subsistema de la Geografía, 

entendiendo como subsistema, al conjunto de 

elementos y relaciones que responde a estructuras 

y funciones especializadas dentro de un 

sistema mayor. En términos generales, los 

subsistemas tienen las mismas propiedades 

que los sistemas y su posición es relativa a la 

del observador. Desde este punto de vista se 

puede hablar de subsistemas, sistemas o 

supersistemas. 

Ludwing Von Bertalanffy, fue alrededor 

de 1930, uno de los pioneros de esta innovadora 

teoría, seguido por Ronald Ashby y 

Gregory Bateson en las siguientes dos 

décadas. Las propuestas maduraron hasta 

convertirse en la base de la teoría general de 

sistemas, cuya construcción teórica trata de 

los principios y leyes que les conciernen a 

éstos, sin importar la rama científica de la que 

provengan y donde se busca una formalización 

matemática entre las relaciones de 

sus componentes y sus funciones isomorfas. 

Estas últimas se refieren a las características 

del mundo material e inmaterial que afectan 

a los sistemas (Bertalanffy, 1973). Varios elementos 

que contribuyeron en la elaboración 

de este nuevo paradigma fueron aportados 

por la teoría de las organizaciones, la cibernética 

y la teoría de juegos (Ashby, 1972; 

1984). 

La teoría general de sistemas surge en 

contraposición a la corriente mecanicista y 

determinista (Grun, 1995), cuya visión o paradigma 

estaba fundamentado en dos principios: 

1) que es posible entender completamente 

el mundo y 2) que dicho entendimiento 

se podía lograr mediante el método 

analítico. Ambos principios se basaban en el 

reduccionismo (Popper, 1983), el cual implica 

dividir todo hasta sus últimos elementos, a 

partir de los cuales se explica luego el resto; 

los átomos en la física o la célula en la 

biología son ejemplos de esto. No obstante, 

con los conocimientos actuales en ambos 

campos se ha encontrado que estos elementos 

también se pueden dividir. El método analítico 

consiste en desarmar en partes discretas 

aquello que se pretende entender, tratar de 

explicar el comportamiento de las partes 

separadas, y luego amalgamar el entendimiento 

de éstas en una comprensión de la 

totalidad. Un postulado determinista crucial 

es la consideración de que todos los fenómenos 

se pueden explicar a través de relaciones 

causa-efecto (Popper, 1983). El problema 

surge cuando se intenta explicar un efecto 

excluyendo varios factores, pasando de lado 

el hecho de que en todo fenómeno inciden 

una multiplicidad de causas y no sólo es 

producto de una de ellas. 

Esta línea de pensamiento ha creado 

problemas prácticamente irresolubles, los 

más importantes, derivados de lo que se 

denomina la antinomia del determinismo, 

donde el libre albedrío y las dificultades de 

verificar leyes sobre la base de la causalidad 

implican crear condiciones ideales (Popper, 

1983). Uno de los ejemplos clásicos es el estudio 

de la gravedad a través de la simulación 

de la caída de los cuerpos en el vacío 



absoluto, dentro del laboratorio. Otros dos 

ejemplos comunes en el campo de la meteorología, 

son el estudio de los tornados y los 

huracanes, en los que el enfoque principal se 

da al comportamiento de la presión barométrica 

y la temperatura, dejando de lado la 

circulación zonal, las celdas anticiclónicas y 

las corrientes marinas. Hacia finales de la 

segunda guerra mundial, parte de la comunidad 

científica reconoció que algo andaba 

mal. Comenzó a verse que al analizar un 

sistema, sus propiedades esenciales se perdían; 

por ejemplo, un automóvil desarmado 

no transportaba a una persona “desarmada”; 

advirtieron que era necesario un pensamiento 

holístico, (del griego holos = total), es 

decir, que abordara los problemas como un 

todo para explicar las cosas. Así, se buscaba 

revelar cómo es que el sistema está estructurado, 

por qué funciona de cierta manera y 

para qué lo hace. Es importante señalar que 

ésta concepción abarcó al método analítico, 

por lo cual análisis y síntesis son complementarios, 

y el pensamiento sistémico incluye 

a ambos. 

Los principales objetivos de la teoría 

general de sistemas son: 

- Investigar las analogías, paralelismos, 

semejanzas, correlaciones e isomorfías 

de los conceptos, leyes y modelos en 

las diversas ciencias. Isomorfía se define 

como la fórmula, pauta, estructura, proceso 

o interacción que demuestra ser la 

misma, sólo en términos gener ales, en 

diversas disciplinas y escalas de magni - 

tudes dentro de los sistemas reales y 

cambia en función del sistema que se 

analice. 

- Fomentar la transferencia de conocimientos 

entre las diversas ciencias. 

- Estimular el desarrollo y formulación 

de modelos teóricos en aquellos 

campos que carecen de ellos, o en los 

cuales los mismos son rudimentarios e 

imperfectos. 

- Promover la unidad de las ciencias 

y tratar de obtener la uniformidad 

del lenguaje científico. 

De manera paralela, la cibernética se ocupa 

del estudio del mando, el control, las regulaciones 

y el gobierno de los sistemas, por lo 

que constituye una parte inseparable de la 

teoría general de sistemas; sus conceptos 

resultan extremadamente útiles para entender 

el funcionamiento de los sistemas complejos 

como el clima, los ecosistemas o el 

derecho, por mencionar algunos. Dentro de 

este paradigma, el sistema es una entidad 

autónoma dotada de una cierta permanencia, 

que está constituida por elementos que se 

conforman como subsistemas, estructural y 

funcionalmente interrelacionados, y cuya transformación 

ocurre dentro de ciertos límites de 

estabilidad, gracias a autorregulaciones que le 

permiten adaptarse a las variaciones de un 

entorno específico (Thom, 1972). Así, la teoría 

general de sistemas, estudia a éstos con todas 

sus conexiones internas (estructura primaria), 

y externas (hipoestructura) (Lugo y 

Morris, 1982). Sus elementos no se pueden 

separar sin alterar la esencia del sistema, es 

decir, su unidad, pues una de las ideas 

básicas de esta teoría es que el todo es más 

que la suma de sus partes, porque las 

características del todo no son explicables a 

partir de las características de las partes 

aisladas. La entidad de nivel superior tiene 

otras propiedades o atributos diferentes a las 

de los niveles inferiores (Peters, 1985). 

Uno de los requerimientos de todo sistema 

es el de constituir una entidad aislada, aunque 

su aislamiento no es absoluto, pero sí lo 

suficiente para poder distinguirlo de su entorno, 

clara y permanentemente. De acuerdo 

con Grun (1995), un sistema biológico está 



rodeado por un límite o membrana que lo 

aísla relativamente y separa el endomundo del 

exomundo. Las membranas son siempre permeables 

y selectivas, y juegan un papel 

fundamental en la organización de los intercambios 

entre el sistema y su entorno (o, 

eventualmente, en los que operan entre subsistemas, 

limitados ellos mismos, por membranas). 

Los sistemas metavivientes también 

desarrollan membranas en sentido amplio: 

las fronteras políticas, los recintos de las 

empresas y organizaciones –en el caso de las 

sociedades humanas– o los límites de las 

termiteras –para las sociedades animales– 

constituyen membranas en el sentido antes 

definido, es decir, son funcionalmente homólogas 

a las membranas biológicas (Rodríguez 

y Arnold, 1991). 

Margalef (1980), señala que un sistema es 

algo factible de ser disecado, o sea, que se 

pueden reconocer partes separables actuando 

unas sobre otras; cambia con el transcurso 

del tiempo, pero conserva algunas propiedades 

invariantes y casi todo lo existente 

puede definirse con este concepto. Un 

sistema se concibe entonces conformado por 

elementos (estructura), e interacciones (función), 

que vinculan a estos componentes. Las 

relaciones pueden ser recíprocas (principio 

de circularidad) o unidireccionales. El resultado 

de estas interacciones es la organización 

del sistema, que cuando persiste, genera 

posibles escenarios que no son completamente 

indeterminados o regidos por el 

azar. Es factible por lo tanto, aportar una 

descripción suficiente de un sistema completo 

en una forma abreviada o corta. Un 

aspecto fundamental de los sistemas es la 

existencia de restricciones, que limitan el 

ámbito dentro del que se sitúan sus estados 

futuros (Bohm and Peat, 1987). 

Cuando un elemento o un subsistema se 

combina con otros en el interior de un 

sistema, aparece cierta convergencia de 

comportamiento, en el sentido de que cada 

elemento influye sobre las posibles variaciones 

de los demás y, como consecuencia, el 

número de posibilidades que a priori podría 

parecer muy grande, queda más o menos 

limitado (Peters, 1985). Un sistema tiende a 

converger o a cerrarse sobre sí mismo; en caso 

contrario diverge, con posibilidades de extinguirse. 

Puesto que cada acción depende de 

la conformación de las influencias precedentes, 

las posibilidades de variación se 

reducen y la actividad del sistema parece 

estar guiada o regulada. En un sentido amplio, 

se comporta en forma cibernética en su 

regulación y control (Ashby, 1972). Un sistema 

se caracteriza por la convergencia en el 

comportamiento de sus diversas partes. En 

consecuencia, el conjunto de los estados del 

sistema es menor que el de los posibles, 

emanados de no conocer las interacciones 

entre las partes. La propiedad básica de 

todo sistema consiste en la restricción del 

número de estados o configuraciones realizables, 

por lo tanto, todo sistema contiene 

información, con el significado que la teoría 

de la comunicación le da a esta palabra 

(Ashby, 1984). 

Memoria de los sistemas y principio 

de asimilación del más débil 

Las fronteras e interfases son muy importantes 

por su capacidad de acumular 

información, la cual se refleja en la riqueza de 

límites reconocibles; constituyen los contornos 

que separan a los sistemas y en todos los 

casos es el observador quien define lo que 

pertenece y lo que queda fuera de ellos 

(Margalef, 1980). La información de los sistemas 

siempre está asociada a la historia de 

su desarrollo y en un mundo que ya posea 

cierta estructura, cualquier interacción entre 

la materia y la energía modifica esta disposición 

y hace a los cambios futuros más 

predecibles con respecto a su momento 

anterior. La cantidad de información que 



contiene el sistema es igual a la que ya existe, 

más la que entra, produciéndose una agregación 

neta en esta entrada, ya que la salida 

de energía no elimina información de él 

(Johansen, 1975). Toda la energía que se 

incorpora a los sistemas obedece la ley de la 

conservación de ella, es decir, la cantidad que 

permanece en un sistema es igual a la suma 

de la energía importada –de un nivel a otro– 

menos la suma de la energía exportada, 

denominada negentropía (Ashby, 1984). 

Asimismo, Margalef (1980) señala que la 

información que está presente en las estructuras 

actuales sirve para reconstruir el 

pasado y refleja verazmente la energía usada 

y degradada con anterioridad. Esta energía 

no se ha perdido por completo, puesto que 

las estructuras que se formaron guardan la 

información para canalizar cambios futuros 

o, dicho de otra manera, hace que determinados 

estados futuros sean más probables 

que otros. Es posible descubrir o interpretar 

la utilidad de dicha información, dado que 

las estructuras acumuladas hacen más eficiente 

la degradación de la energía. 

Así, la acumulación de información significa 

cambios de energía y, por lo tanto, un 

aumento de la entropía, parámetro que mide 

el grado de desorden del sistema (Cesarman, 

1984). Sin embargo, la información conseguida 

persiste en forma de estructura y 

puede orientar en uno u otro sentido el uso 

futuro de la energía, de una manera que se 

puede juzgar como más eficiente; esto 

implica que cuando la información sube de 

categoría o de estrato se adquiere una mayor 

cantidad de ella, que se traduce en otras 

posibilidades de organización de canales y 

códigos, y la información resultante que 

ingresa al sistema adquiere un nuevo sentido. 

Al proceso de introducción de nuevos resultados 

al sistema en forma de retroalimentación 

se le denomina recursividad (Bertalanffy, 

1973). Si se aplicara lo anterior al contexto de 

las sociedades humanas, significaría que la 

acumulación de información que realizan las 

sociedades tecnológicamente más avanzadas 

es mayor a las de menor avance; la misma 

situación se da en la naturaleza entre los 

ecosistemas, de acuerdo a su grado de 

desarrollo. 

Este efecto resulta particularmente importante 

en el estudio de intercambios entre 

sistemas. El sistema que es mayor, en términos 

de organización adquirida, puede 

hacer siempre un mejor uso de la información, 

es decir, la asimila y la multiplica. 

Según Margalef (1957), tal asimetría en el 

intercambio de información se percibe como 

injusta, puesto que el participante con más 

información, recibe aún más; esta constatación 

se le designa como el principio de San 

Marcos, por la relación que guarda con el 

evangelio según San Marcos (versículo 4:25), 

que dice: al que tiene se le dará más y al que 

no tiene, aún lo poco que tiene se le quitará. 

En conclusión, cuando dos sistemas con 

diferente complejidad interactúan, el aumento 

de la información es mayor en el más 

complejo, pues parece alimentarse del más 

simple e, incluso, puede asimilarlo. 

Estructura más funcionamiento 

igual a organización. La fuerza 

estabilizadora 

En el terreno de la ecología o de la climatología, 

analizadas desde la teoría general 

de sistemas, el principio de San Marcos resulta 

extraordinariamente valioso al aumentar 

todos los gradientes de las variables 

portadoras de información, propiedad que 

puede contribuir a la división progresiva 

del espacio. 

Dichos efectos son particularmente importantes 

en la creación de bloques discontinuos 

que funcionan como piezas en los 

sistemas abiertos y se encuentran lejos de una 



situación de equilibrio. Lo anterior ejemplifica 

cómo la estructura puede crecer 

alimentándose de la función. Sin embargo, 

los estados de equilibrio sistémico, denominados 

equifinalidad y multifinalidad, pueden 

alcanzarse en los sistemas abiertos por una 

diversidad de caminos; la permanencia de 

dichos estados implica, de manera necesaria, 

la importación de recursos provenientes del 

ambiente. Los recursos pueden consistir en 

flujos energéticos, materiales o informativos 

(Asbhy, 1984). 

La realidad se presenta bajo dos aspectos 

complementarios e inseparables: 

1) lo estructural-estático y 

2) lo funcional-dinámico, en donde 

cada elemento se halla situado en la 

estructura de acuerdo con la función 

que le compete (Ashby, 1984). Estructura 

y función son dos formas complementarias 

de una misma realidad y 

ninguna describe, aisladamente y en 

forma total, al sistema objeto de estudio. 

Sin estructura, la función desaparecería. 

En un sistema con enfoque diacrónico se 

resalta la función, mientras que en uno sincrónico, 

la estructura; no obstante, un modelo 

estructural-funcional reconoce que los dos 

aspectos deben integrarse adecuadamente. 

Así, ningún modelo sistémico puede ser 

estático, porque ningún sistema lo es, salvo 

quizás en el instante en que deja de ser un 

sistema y empieza a descomponerse en sus 

elementos (Margalef, 1980). En todos los 

casos, los modelos son construcciones diseñadas 

por un observador que persigue 

identificar y mensurar las relaciones sistémicas 

complejas; asimismo, todo sistema real 

puede ser representado por más de un 

modelo, cuya expresión depende tanto de los 

objetivos del modelador, como de su capacidad 

para distinguir las relaciones 

relevantes enfocadas a tales objetivos; de 

cualquier manera, la esencia de los modelos 

sistémicos es la simplificación (Ísita, 2002). 

De la cibernética proviene el concepto de 

retroalimentación, el cual implica que todos los 

elementos, componentes o subsistemas de un 

sistema se comunican entre sí para desarrollar 

interrelaciones coherentes, es decir, 

que favorezcan la permanencia del sistema 

en el tiempo y en el espacio (Margalef, 1980). 

La retroalimentación es negativa cuando su 

función consiste en contener o amortiguar el 

cambio y se le denomina fuerza estabilizadora, 

aunque no siempre es una fuerza en el 

sentido físico de la palabra. La retroalimentación 

es positiva si amplifica o multiplica 

el cambio en una dirección determinada 

(Ashby, 1984). 

Existe una conexión de la información y su 

forma específica de procesarla en la meteorología, 

la climatología, la ecología, la biología 

social e incluso, en el derecho, donde no 

es admisible proponer jerarquías científicas 

sino, más bien, una interdependencia entre 

cada una de las ciencias mencionadas para 

dar paso a una visión sistémica y holística 

que transformaría la perspectiva analítica, 

determinista y reduccionista por el simple 

hecho de incluir la retroalimentación como 

parte del proceso. Este es el enfoque más 

adecuado para estudiar el calentamiento 

climático global, dado que el análisis sistémico 

permite visualizar de manera integral 

los aspectos sociales, económicos, políticos, 

jurídicos, ecológicos y climáticos, al contemplar 

la realidad desde distintos puntos de 

vista y poder trabajar inter y transdiciplinariamente 

(Lovelock et al., 1992). 

El analizar los problemas bajo la óptica de 

los sistemas complejos, sean humanos, 

sociales, físicos o ecológicos, implica elaborar 

o modificar sus formas con el objeto de 

conservar viable el sistema a través de 



retroalimentaciones positivas o negativas. En 

estas condiciones, los procesos apuntan al 

desarrollo, la estructura, al crecimiento o 

cambio de forma, así como al estado general 

del sistema. En términos cibernéticos, los procesos 

causales mutuos que se refieren a la 

circularidad o retroalimentación, se denominan 

morfogenéticos. Estos procesos activan 

y potencian la posibilidad de adaptación de 

los sistemas a ambientes en transición. 

Por otro lado, la morfostasis se refiere a los 

procesos de intercambio que se generan con el 

ambiente y tienden a mantener un estado ya 

existente con una retroalimentación negativa; 

un ejemplo de éstos, son los sistemas vivos 

(Lovelock and Margulis, 1973). Lovelock et al. 

(1992), proponen un sistema jurídico global que 

abarque el sistema ecológico del planeta y dan 

a este concepto el nombre de Gaia. Consideran 

al hombre y a los ecosistemas como un solo 

organismo viviente, por lo que resulta imprescindible 

diseñar una legislación, establecer 

una jurisprudencia y elaborar una doctrina 

que considere esta unidad (Lovelock and 

Margulis, 1973). Con esta visión, derecho y 

ecología se retroalimentan a través de redes 

complejas, de una forma quizá más bien 

caótica, pero mucho más creativa de lo que 

parece a simple vista, siempre bajo los límites 

flexibles sugeridos por la termodinámica y la 

teoría de juegos. 

Sistemas y modelos 

Los sistemas pueden agruparse en reales, 

ideales y modelos. Los primeros tienen una 

existencia independiente del observador, 

quien los puede descubrir; los segundos son 

construcciones simbólicas; al tercer tipo 

corresponden las abstracciones de la realidad 

que combinan lo conceptual con las características 

de los objetos. 

es la conceptualización, organización y 

comunicación de un fenómeno. Si bien los 

modelos simplifican los fenómenos reales, 

conservan los atributos funcionales del 

sistema (Hall and Day, 1977). 

Los tres pasos básicos para la elaboración 

de un modelo determinista son: crear un 

mapa conceptual, trazar un esquema diagramático 

que lo represente y desarrollar su 

expresión matemática. En el mapa conceptual 

se utilizan los paradigmas científicos 

vigentes, se toman en cuenta los componentes, 

las interacciones y los mecanismos 

que creemos relevantes para que opere el 

sistema y, de manera particular, el fenómeno 

que se quiere estudiar. El esquema diagramático 

se hace a través de la construcción de 

com- partimentos o cajas que representan las 

variables de estado del sistema, y de flechas, 

que señalan los flujos de materia y energía 

(Shoemaker, 1977). 

Las expresiones matemáticas pueden incluir 

relaciones lineales o no lineales, discretas 

o continuas, y determinísticas o estocásticas. 

La mayoría de los modelos se 

conceptualizan por medio de ecuaciones 

diferenciales. En el caso de los modelos lineales, 

la elección entre las variables es arbitraria, 

porque uno puede trasladar la materia 

o energía de una variable a otra; en el caso de 

los no lineales, las traslaciones no son unidireccionales. 

Las ecuaciones de los modelos 

determinísticos incorporan tasas de 

cambio en el tiempo, lo que permite realizar 

predicciones (Shannon and Weaver, 1969); 

sin embargo, si se cambian las condiciones 

iniciales, aunque sea por una cantidad ínfima, 

tenderá a modificarse la predicción, ya 

que el error se amplifica en el tiempo a un 

ritmo exponencial (Lorenz, 1963). 

Un modelo es cualquier abstracción o 

simplificación de un sistema, cuyo propósito 



La creatividad y la teoría general de 

sistemas 

El mundo confuso y desordenado, con estilos 

de vida prosaicos y estériles, así como 

empleos que a veces inspiran poco, nos 

conduce al caos; sin embargo, esto se puede 

traducir en grandes oportunidades, pues la 

visión sistémica nos da la posibilidad de 

proyectar y adaptar un futuro nuevo. La 

creatividad con enfoque sistémico es un estilo 

de vida que incide en el pensamiento, la 

conducta, las actitudes, los valores, la comunicación, 

la investigación, la enseñanza y 

la divulgación, entre otros aspectos. Consiste 

en ver las cosas con un nuevo enfoque y hace 

del proceso de aprendizaje algo permanente; 

en otras palabras, nos convierte en aprendices 

vitalicios. Involucra transformaciones 

en las que las verdades eternas dejan de ser 

inamovibles, a menos que tengan significado 

para cada situación innovadora; en resumen, 

se convierte en un medio para lograr algo 

mejor y más maduro. Esta creatividad tiene 

como característica principal la de ser 

permanentemente constructiva, al fundir 

pensamientos y acciones en una configuración 

novedosa y relevante; permite 

percibir los problemas, deficiencias y faltas 

de armonía y encuentra relaciones nuevas 

con la información existente. Se convierte en 

una herramienta que identifica los elementos 

ausentes para encontrar soluciones, partiendo 

de hipótesis perfectibles. Genera 

pensamientos y acciones innovadoras que 

están en función del conocimiento, la 

imaginación y la evaluación –donde el 

proceso es tan importante como el producto 

resultante– a la vez que facilita comunicar 

resultados eficientemente. En el hombre 

moderno, la mente finita no alcanza a 

comprender la complejidad y la verdad 

infinitas; le gustan las ideas o fórmulas 

sencillas, congruentes y uniformes; le desagradan 

la tensión, la ambigüedad y la 

oposición; en fin, es un ser agobiado, un tanto 

marchito por las preocupaciones que oscurecen 

todo lo que le rodea. 

Si los esfuerzos de investigación, enseñanza 

y divulgación científicas se fortalecen 

con ideas creativas, se conjuran, en 

gran medida, las empresas estériles y condenadas 

al fracaso. Ser del mismo sentir, no 

significa necesariamente tener la misma opinión, 

pues el objetivo es desarrollar, deliberada 

y conscientemente la conducta creativa 

y el potencial humano, además de identificar 

lo que no se puede cambiar y lo que sí 

se debería, permitiendo abrir el horizonte 

hacia alternativas innovadoras. La capacidad 

de deducción, a partir de las leyes de la lógica 

y las matemáticas, crea pensadores disciplinados, 

aunque no forzosamente mentes 

imaginativas; de ahí que las personas más 

inteligentes, no son necesariamente las de 

mayor inventiva. Algunas sociedades promueven 

la creatividad, mientras que otras la 

inhiben. La educación es un proceso sin fin y 

aquél que deja de aprender no sólo se 

marchita, sino que ahoga a quienes lo rodean. 

A medida que la sociedad experimenta 

cambios profundos, rápidos y significativos, 

los métodos de enseñanza y divulgación 

también deben ser diferentes; una persona 

creativa debe abrazar lo nuevo e inexplorado 

por ser ésta una oportunidad de crecimiento 

(Ritter y Klimek, 1997) y se le debiera alentar 

en la difusión de sus propuestas. 

Referencias 

Ashby W.R. (1972). Introducción a la cibernética. 

Edito rial Nueva Visión, Buenos 

Aires. 

Ashby W.R. (1984). Sistemas y sus 

medidas de información. En: Tendencias 

en la teoría General de 

Sistemas (Bertalanffy L. Von, Ashby 

R.W., Wein berg G.M.), 3a ed, Ed. 

Alianza, Madrid. 



Bakun A. (1996). Patterns in the Ocean: 

Ocean Processes and Marine Popu la tion 

Dynamics. Ed. Cali fornia Sea Grant 

College System, National Oceanic and 

Atmo spheric Admin is tra tion, en cooperación 

con el Centro de Investigaciones 

Biológicas del Noroeste, La 

Paz, Baja Cali fornia Sur. 

Balandier G. (1989). El desorden. La teoría 

del caos y las ciencias sociales. Elogio de la 

fecundidad del movimiento. Ed. Gedisa, 

Barce lona. 

Bertalanffy L.V. (1973). General System 

Theory: Foun da tions, Devel op ment, Applications. 

Alan Lane. Ed. George Braziller, 

New York. 

Bohm D. and Peat D. (1987). Science, 

Order and Creativity. Ed. Bantam 

Books, Toronto. 

Bouald-Ayoub J. and Marcel H. (1988). 

Culture, Signes, Critique. Séries: 

Cahiers Recherches et Théories- 

Collec tion Symbolique et Idéologie; 

S16. Montreal: Dep. de Philosophie 

(UQAM). 

Capra F. (1991). El nuevo paradigma 

ecológico. Ed. Nueva Conciencia . Inte - 

gral, Barce lona. 

Cesarman E. (1984). Hombre y entropía. 

Ed. Pax-México, México. 

Chalmers A.F. (1989). ¿Qué es esa cosa 

llamada ciencia?: Una valoración de la 

naturaleza y el estatuto de la ciencia y sus 

métodos. 8 va ed. Ed. Siglo XXI, México. 

Cham bers F.M. (1993). Climate Change and 

Human Impact on the Land scape: Studies 

in Palaecology and Envi ron mental Archaeology. 

Ed. Chapman and Hall, 

London. 

Forrester J.W. (1971). World Dynamics. 

Ed. Wright-Allen Press. Cambridge 

Mass. 

Garber D. (1978). Science and Certainly. 

In: Descartes: Crit ical and inter pre ta - 

tive essays (Hooker M), Ed. Johns 

Hopkins Univer sity Press, Balti more. 

Gleick J. (1987). Chaos: Making a New 

Science. Ed. Penguin Books, New York. 

Grun E. (1995). Una visión sistémica y 

cibernética del derecho. Ed. Albedo 

Perrot, Argen tina. 

Hall A.S. and Day W.J. (1977). System and 

Models: Terms and Basic Principles. 

In: Ecosystem Modeling in Theory and 

Prac tice: An Intro duc tion with Case 

Histories (Hall A.S. and Day W.J.), Ed. 

John Wiley and Sons, New York. 

Ísita R. (2002). Divulgación persuasiva de 

la ciencia. En: Antología de la 

divulgación de la ciencia en México 

(Tonda J., Sánchez A., Chávez N.), 

colección: Divulgación para Divulgadores. 

Dirección General de Divulgación 

de la Ciencia, UNAM, México. 

Johansen B.O. (1975). Las comunicaciones y 

la conducta de la organización. Ed. 

Diana, México. 

Koestler A. and Smythies J.R. (1970). Das 

neue menschenbild: Die Revolutionierung 

der Wissenschaften Vom Leben, Ein Intenationales 

Symposion. Verlag Fritz Molden, 

München. 

Leith C.E. (1974). Theo ret ical Skill of 

Monte Carlo Fore casts. Monthly Weather 

Review, 102, pp. 409-418. 

Lorenz E.N. (1963). Deter min istic 

Nonperiodic Flow. Journal of the Atmospheric 

Science, 20, pp. 130-141. 

Lorenz E.N. (1993). The Essence of Chaos. 

Univer sity of Wash ington Press, 

Seattle. 

Love lock J.E. and Margulis L. (1973). 

Atmo spheric Homeo stasis by and for 

the Biosphere: The Gaia Hypoth esis. 

Tellus, 26, pp. 2-23. 

Love lock J.E., Clarke J. y Orive B. (1992). 

Gaia: una ciencia para curar el planeta. 

Ed. Inte gral. Serie: Los libros de Inte - 

gral. No. 51, Barce lona. 

Lugo A.E. y Morris G.L. (1982). Conceptos 

del análisis de sistemas. En: Los sistemas 

ecológicos y la humanidad. 



Secretaría General de la OEA. Programa 

Regional de Desarrollo Científico y 

Tecnológico. Wash ington, D.C. EUA. 

Serie Biología. Monografía, N° 23. p. 82. 

Mandelbrot B.B. (1983). The Fractal Geometry 

of Nature. Ed. W.H. Freeman, San 

Fran cisco. 

Margalef R. (1957). La teoría de la 

información en ecología. Memorias de la 

Real Academia de Ciencias y Artes. Tercera 

Época, Barce lona, 32(3), pp. 373-445. 

Margalef R. (1980). La biosfera: entre la 

termodinámica y el juego. Ed. Omega, 

Barce lona. 

Morin E. (1994). Introducción al pensamiento 

complejo. Ed. Gedisa, Barce lona. 

Peters R.H. (1985). Predic tion and Under - 

standing Alter na tive Goal in Science. 

Conferencia ofrecida en el Simposium 

Reductionism versus Holism. Universidad 

de Ottawa. 

Popper K. (1983). Conjeturas y refutaciones: 

el desarrollo del conocimiento 

científico. Ed. Paidós, Barce lona. 

Ritter W. y Klimek G.R. (1997). La 

relación ciencia-educación y la búsqueda 

de un nuevo perfil académico. 

Ciencia y Mar, 1(1), pp. 31-35. 

Ritter W., Guzmán S., Sánchez-Santillán 

N., Suárez J., Corona-Muñoz C., 

Ramos A., Rodríguez R. y Pérez T. 

(2002). El clima como sistema complejo 

adaptativo en coevolución. Ciencia y 

Mar, VI (17), pp. 23-25. 

Rodríguez D. y Arnold M. (1991). Sociedad 

y teoría de sistemas. Ed. Universitaria, 

Santiago de Chile. 

Shannon C.E. and Weaver W. (1969). The 

Math e mat ical Theory of Commu ni ca tion. 

Univer sity of Illi nois Press, Illi nois. 

Shoe maker C.A. (1977). Math e mat ical 

Construc tion of Ecolog ical Models. In: 

Ecosystem Modeling in Theory and 

Prac tice: An intro duc tion with case 

histo ries (Hall A.S., Day W.J.), Ed. 

John Wiley & Sons. New York. 

Thom R. (1972). Stabilité Structurelle et 

Morphogenèse: Essai d’une Théorie 

Générale des Modèles. W.A. Benjamin. 

Ed. Reading, Massa chu setts. 


Norma Sánchez-Santillán. Realizó sus estudios en hidrobiología en la Universidad Autónoma Metropolitana, 

plantel Iztapalapa. Obtuvo el grado de maestra en ciencias (Biología), orientada en aspectos de climatología en 

la Facultad de Ciencias de la UNAM en 1994. Posteriormente, alcanzó el grado de doctora, siguiendo la línea de 

aplicación climática en aspectos de ecología (1999). Cuenta con un diplomado en divulgación de la ciencia, por 

parte de la Dirección General de Divulgación de la Ciencia, UNAM (2004). Es autora de 70 trabajos publicados 

en revistas con arbitraje; así como 55 artículos de divulgación en revistas arbitradas. Pertenece al Sistema 

Nacional de Investigadores desde el año 2002. Actualmente se desarrolla como investigadora en la 

UAM-Xochimilco, como responsable del Laboratorio de Climatología, así como profesora dentro del plantel. 

René Garduño-López. Obtuvo la licenciatura en física y el posgrado en geofísica por la Facultad de Ciencias de la 

UNAM, en donde es profesor desde 1976. Es investigador titular del Centro de Ciencias de Atmósfera (CCA) de 

la UNAM. Ha publicado 24 artículos de investigación en revistas arbitradas y siete capítulos en libros. Es editor 

asociado de la revista Atmósfera (incluída en Science Cita tion Index). Es autor de los libros El veleidoso clima y 

Pormenores terrestres, del Fondo de Cultura Económica. En el CCA ha sido secretario académico y actualmente 

es jefe de departamento. 




Practical Design of Digital Filters Using the 

Pascal Matrix 

B. P enika 1 , F. García-Ugalde 2 and V.F. Ruiz 3 

1 Department of Telecommunications, 

2 Department of Digital Signal Processing, Facultad de Ingeniería, UNAM and 

3 Department of Cybernetics, The University of Reading, Reading RG6 6AY, UK. 

E-mails: pseboh@servidor.unam.mx, fgarciau@servidor.unam.mx, v.f.ruiz@reading.ac.uk 

(Recibido: julio de 2006; aceptado: abril de 2007) 

Abstract 

In the con text of the de sign of dig i tal fil ters many re search has been done to fa cil i tate 

their com pu ta tion. The Pascal ma trix re cently de fined in (Biolkova and Biolek, 

1999) has proved its util ity in this field. In this pa per we sum ma rize the di rect 

trans form from the lowpass con tin u ous-time trans fer func tion H(s) to the dis - 

crete-time H(z) of the fol low ing main tree types of dig i tal fil ters: lowpass, highpass 

and bandpass. An al ter na tive rep re sen ta tion of the orig i nal bandpass Pascal ma trix 

is de vel oped in this pa per that per mits to con vert sys tem at i cally the lowpass 

continuous-time pro to type to the dis crete-time bandpass trans fer func tion. We also 

con sider the in verse trans for ma tion from the dis crete-time do main to the con tin u - 

ous one and we show that the in verse trans for ma tion is eas ily ob tained as the de ter - 

mi nant of the sys tem need not to be com puted. Sev eral nu mer i cal ex am ples il lus - 

trate the prac ti cal uti li za tion of this tech nique. 

Key words: Fil ter de sign, s-z trans for ma tion, Pascal ma trix, dig i tal fil ter de sign tools. 

Resumen 

En el contexto del diseño de filtros digitales se ha desarrollado mucha 

investigación para facilitar su cálculo. La matriz de Pascal definida recientemente 

(Biolkova and Biolek, 1999) ha probado su utilidad en este campo. 

En este artículo se hace una síntesis de la transformación directa a partir de la 

función de transferencia pasa-bajas en tiempo continuo H(s) para obtener la de 

tiempo discreto H(z) de cada uno de los tres tipos principales de filtros 

digitales: pasa-bajas, pasa-altas y pasa-banda. También se desarrolla una 

representación alternativa de la matriz de Pascal pasa-banda orig inal, que 

permite la conversión sistemática de un prototipo pasa-bajas en tiempo 

continuo a la función de transferencia pasa-banda en tiempo discreto. Adicionalmente 

se considera la transformación inversa a partir del dominio de 

tiempo discreto, al de tiempo continuo y se demuestra que esta transformación 

inversa es fácil de calcular, dado que no es necesario obtener el 

determinante del sistema. Varios ejemplos numéricos ilustran la utilización 

práctica de esta técnica. 

Descriptores: Diseño de filtros, transformaciones s-z, matriz de Pascal, 

herramientas para el diseño de filtros digitales.

Prac tical Design of Digital Filters Using the Pascal Matrix 

Intro duc tion 

A large number of procedures are available 

for designing digital filters (Parks and 

Burrus, 1987); (Antoniou, 1993). Many of 

them transform a given analog filter into an 

equivalent digital filter. The digital filter 

design process begins with the synthesis or 

specification of the filter transfer function. A 

signal x(t) presented to a filter characterized 

by its impulse response h(t) produces an 

output y(t) given by the convolution y(t)=x(t) 

*h(t) or, if using the continuous-time transforms 

of the signals, by Y(s)=X(s)H(s). Then 

the continuous-time circuit of a filter is 

completely described by the transfer function: 

A0 + A1s + A2 

s + ... + Am 

s 

H( s) 

= 

(1) 

2 m 

B + B s + B s + ... + B s 

0 1 2 

From this equation the vectors A and B 

representing respectively the coefficients of 

the numerator and denominator can be 

defined as: 

A = ( A0 , A1 , A2 

,..., A m ) 

B = ( B0 , B1 , B2 

, ..., B m ) 

where, A i and B i are real coefficients. 

2 

m 

m 

(2) 

In the discrete-time domain the z 

transforms of the signals are used, and a 

digital filter is characterized by the transfer 

function: 

−1 

−2 

−n 

a0 + a 1z + a 2 z + ... + anz 

H( z) 

= 

(3) 

−1 

−2 

b0 + b1z + b2z + ... + bnz − n 

With real coefficients a i and b i . 

The problem of the systematic conversion 

from the continuous-time prototype transfer 

function H(s) to its discrete-time version H(z) 

is addressed in this paper considering three 

types of conversions: lowpass-to-lowpass, lowpass-to-highpass 

and lowpass-to-bandpass. The 

original Pascal matrix (Biolkova and Biolek, 

1999) is used to achieve this systematization, 

and an alternative representation of the original 

Pascal matrix is developed in this paper 

to rich the lowpass-to-bandpass conversion. 

The remainder of this paper is organized 

as follows. Section II describes the lowpassto-lowpass 

conversion. Section III adapts the 

previous development to the lowpass-tohighpass 

case. Section IV main contribution of 

this paper, develops an alternative representation 

of the original bandpass Pascal matrix 

which allows the lowpass-to-bandpass conversion. 

Section V presents the inverse 

conversion from the discrete-time domain to 

the continuous-time. In Section VI we give 

examples to illustrate all the cases. 

Lowpass-to-lowpass Transformation 

For lowpass filters the digital transfer 

function H(z) can be obtained from the 

continuous-time prototype (1) using the 

bilinear s-z transformation (Parks and 

Burrus, 1987): 

where 

s c z −1 

= 

z + 1 

f 

c = co t π 1 

f s 

(4) 

(5) 

and the constants f1 and f s represent the 

lowpass corner and sampling frequencies, 

respectively. 

From the transfer function (3), we define 

the vectors a and b whose elements are 

respectively the coefficients of the numerator 

and denominator (Klein, 1976): 


B. P enika, F. García-Ugalde and V.F. Ruiz 

a = ( a0 , a1 , a 2,. .., a n ) 

b = ( b0 , b1 , b2 

,..., b n ) 

(6) 

In order to express the numerator vectors 

a in terms of A and denominator vectors b in 

terms of B, we replace the variable s in (1) by 

(4) then comparing the numerators and the 

denominators of the resulting transfer functions 

in z, we can identify the coefficients by 

equating the coefficients of the like powers in z. 

Thus, for n=2 and m=2 we obtain the 

following expression: 

−1 

H z 

a0 ( ) = 

+ a 1z + a 2z 

−1 

b + b z + b z 

0 1 

−2 

−2 

2 

2 −1 

2 

A0 + A1 c+ A2c + z ( 2A0 − 2A2c 

) + 

= 

2 −1 

2 

B + B c+ B c + z 2B − 2 B c ) + 

0 1 2 

−2 

= 

( 0 2 

+ z ( A0 − A1c + A 2c 

) 

−2 

2 

+ z ( B − B c + B c ) 

0 1 2 

2 

(7) 

From the numerators the coefficients, a i 

, 

i=0,1,2 are easily identified and re-written in 

acquire the following matrix equation 

⎡a 

⎢ 

a 

⎢ 

⎣⎢ 

a 

0 

1 

2 

⎤ ⎡1 1 1 ⎤ ⎡ A0 

⎤ 

⎥ 

= 

⎢ 

2 0 −2 

⎥ 

× 

⎢ 

A1c 

⎥ 

⎥ ⎢ ⎥ ⎢ ⎥ 

2 

⎦⎥ 

⎣⎢ 

1 −1 1 

⎦⎥ 

⎣⎢ 

A2c 

⎦⎥ 

(8) 

In a similar manner, a matrix equation can 

be obtained for the coefficients, bi,i=0,1,2 of the 

denominator vector b. 

Using a more compact representation both 

equations can be written as follows: 

( n) 

a = P LP × A' 

( n) 

b = P LP × B' 

(9) 

( n) 

where P LP is the lowpass Pascal matrix 

defined in (P enika et al., 2002) and the 

vectors A', 

B' are represented by 

2 

m 

A' ( A , A c, A c ,..., A c ) 

= 

0 1 2 

2 

m 

B' = ( B 0 

, B 1 

c, B 2 

c ,..., B c ) 

m 

m 

(10) 

As demonstrated in (P enika et al., 2002) 

( n ) 

the computation of the PLP matrix can be 

done in a systematic form. For this we 

consider the classical Pascal Triangle 

1 

1 

(11) 

Obs 

erve, that the coefficients of base n=2 create 

the last column in the lowpass Pascal matrix of 

(8) with the exception of the elements in the 

even rows which have negative values. We 

have concluded that the lowpass Pascal matrix 

can be formed by taking into account the 

following rules (Biolkova and Biolek, 1999); 

(Pham and Psenicka, 1985). 

- In the first row of the Pascal 

matrix all the elements must be equal to 

one. 

- The elements of the last column 

can be computed using: 

where 

1 

5 

1 

4 

1 

3 

10 

1 

2 

6 

Pi , n+ 

1 

= ( −1 

) 

i −1 

1 

3 

10 

1 

4 

1 

5 

1 

n! 

( n − i + 1)!( i −1)! 

i=1,2,...,n+1 

1 

n= 

0 

n= 

1 

n= 

2 

n= 

3 

n= 

4 

n= 

5 

(12) 



The remaining elements P i, j of the lowpass 

Pascal matrix can be determined using the 

following equation: 

where 

P = P + P + P 

i, j i−1 , j i − 1, j + 1 i, 

j+ 

1 

i = 2 , 3, 4 ,..., n, 

n + 1 

j = n , n −1 , n − 2, ..., 2 , 1 

(13) 

Without lost of generality, using letters of 

the alphabet in the order shown below we 

can identify the elements of the lowpass Pascal 

matrix for n=4: 

⎡a = 1 b = 1 c= 1 d = 1 e = 1 ⎤ 

⎢ j i h g f = −4 

⎥ 

⎢ 

⎥ 

⎢ ? ? ? ? k = 6 ⎥ 

⎢ ? ? ? ? l = −4 

⎥ 

⎢ 

⎥ 

⎣⎢ 

? ? ? ? p = 1 ⎦⎥ 

(14) 

where the elements denoted g, h, i, and j can 

be obtained using the next set of equations: 

highpass transfer function H(z), we substitute 

the variable s by 1/s in (4). Thus, 

with 

s = k z + 1 

z −1 

fc 

k = tan π (17) 

f 

where f c 

represents the cut-off frequency of 

the highpass and f s the sampling frequency. 

Following the same process, substituting (17) 

into (1) and comparing the numerator with 

(3) for n=3 and m=3, we can obtain: 

1 2 

a + a z + a z + a z 

0 1 

s 

− − − 3 

= 

2 

3 

A + A k + A k + A k + 

0 1 2 

2 

−1 

2 

3 

+ z ( −3A − A k + A k + 3A k ) + (18) 

−2 

0 1 2 

+ z ( 3A − A k − A k + 3 A k ) + 

−3 

0 1 2 

+ z ( − A + A k − A k + A k ) 

0 1 2 

2 

2 

3 

3 

3 

3 

3 

3 

3 

g = d + e + f = − 2 ; h = c + d + g = 0 

i = b + c + h = 2 ; j = a + b + i = 4 

(15) 

Again, equating the coefficients of the like 

powers in z, we obtain the following matrix 

equation 

Then the lowpass Pascal matrix for the 

particular case of n=4 is finally given by: 

( 4 ) 

PLP 

⎡1 1 1 1 1 ⎤ 

⎢4 2 0 −2 −4 

⎥ 

⎢ 

⎥ 

= ⎢6 0 −2 0 6 ⎥ 

⎢4 −2 0 2 −4 

⎥ 

⎣⎢ 

1 −1 1 −1 1 ⎦⎥ 

Lowpass-to-highpass 

Transformation 

(16) 

In this second case, in order to transform the 

lowpass transfer function to the discrete 

⎡a 

⎢ 

a 

⎢ 

⎣⎢ 

a 

⎡ 1 1 1 1⎤ 

⎡ A0 

⎤ 

⎤ ⎢ 

⎥ 

3 1 1 3 

= − − ⎥ ⎢ A ⎥ 

1k 

⎢ 

⎥ × ⎢ ⎥ 

2 

⎥ ⎢ 3 −1 −1 3⎥ 

⎢A2 

k ⎥ 

⎦⎥ 

⎢ 

⎣−1 1 −1 1⎥ 

⎢ 3 ⎥ 

⎦ ⎣A3 

k ⎦ 

0 

1 

2 

(19) 

This equation can be written in the 

compact form 

( 3) 

a = P HP × A'' 

(20) 

( 3) 

where P HP is a variant of a Pascal matrix 

which corresponds to the highpass filter in 

which the first row elements are all equal to 

one, and the elements of the first column can 



be obtained using (12). The remaining elements 

P i, j 

can be determined using the 

following expression (P enika et al., 2002): 

a( a 0 , a1 , a 2 ,..., a n ) 

b( b0 , b1 , b2 

, ..., b n ) 

(24) 

P = P + P + P 

i , j i, j− 1 i−1, j−1 i−1, 

j 

Where i = 2 , 3, ..., n + 1 

(21) 

j = 2 , 3, ..., n + 1 

A similar development can be done for the 

denominator vector b . 

Lowpass-to-bandpass 

Transformation 

The latest case considered in this paper 

shows how to obtain a discrete bandpass 

filter (Konopacki, 2005) characterized by the 

discrete-time transfer function H(z) 

In order to obtain the coefficients a i and b i 

( i = 0, 1 ,..., n ) knowing the continuous time 

representation vectors A and B , we must first 

substitute (23) into (1) then compare the 

numerator and denominator of the resulting 

transfer function with the corresponding 

ones in (22). 

For example without lost of generalization 

we take m=1 in (1), due to the high order 

terms appearing in the transformation (23), a 

n=2 must taken in (22) resulting in: 

−1 

Az ( ) a 0 + a1 

z + a2 

z 

H( z) 

= = 

−1 

Bz ( ) b + b z + b z 

0 1 

2 

−2 

−2 

= 

−1 

−2 

−n 

a0 + a 

1z + a 

2 

z + ... + anz 

H( z) 

= 

(22) 

−1 

−2 

b + b z + b z + ... + b z − n 

0 1 

which also has real coefficients a i and b i . As 

previously this transfer function can be 

obtained from the continuous one (1) by s-z 

transformation. The bandpass filter can be 

seen as a superposition of a lowpass filter and 

a highpass filter (Rabiner and Gold, 1975). 

Thus, the s-z transformation that applies is 

(Bose, 1985): 

2 

n 

−1 

A0 + A1 c + A1 

k + z ( 2 A1 k − 2 A1c 

) + 

−1 

B + B c + B k + z ( 2 B k − 2 B c) + 

0 1 1 

−2 

1 1 

+ z ( − A + A c + A k) 

−2 

0 1 1 

+ z ( − B + B c + B k) 

0 1 1 

and the following matrix equation: 

⎡a 

⎢ 

a 

⎢ 

⎣⎢ 

a 

0 

1 

2 

⎤⎡ 

1 1 1 ⎤ ⎡A1c 

⎤ 

⎥⎢ 

−2 0 2 

⎥ 

× 

⎢ 

A 

⎥ 

0 

⎥⎢ 

⎥ ⎢ ⎥ 

⎦⎥ 

⎣⎢ 

1 −1 1 ⎦⎥ 

⎣⎢ 

A1k 

⎦⎥ 

(25) 

(26) 

s = c z − 1 

k z 

z+ + + 1 

1 z − 1 

f 

f− 

where c = cot( π 

1 ) k = ta n( π 

1 ) 

f 

f 

s 

s 

(23) 

f 1 

and f −1 

represent the upper and lower 

frequencies of the bandpass filter respectively, 

and f s 

the sampling frequency. 

In a similar manner from (22), we define 

the coefficient vectors a and b: 

A similar equation is obtained for the 

denominator vector b. Both equations can be 

represented in the following compact form: 

n 

BP 

a = P × A''' 

n 

b = P BP × B''' 

(27) 

n 

where P BP is the so called bandpass Pascal 

matrix. This matrix transforms the normalized 

lowpass to bandpass transfer function. 

We have named this matrix the bandpass 



Pascal matrix (Psenicka and García-Ugalde, 

2004) because the matrices of all orders have 

in the first column the coefficients of the base 

of a Pascal triangle (11) with the exception of 

elements in even rows, which have negative 

signs. In this example the vectors A ''' and B ''' 

are represented respectively by 

A''' = ( A1c, A0 , A1k 

) 

B''' = ( B 1 c, B 0 , B 1 k ) 

(28) 

In order to achieve an alternative representation 

of the original bandpass Pascal 

matrix, without lost of generality let us 

consider the case of order m=2 and again 

because of the high order terms appearing in 

the transformation (23), a n=4 must taken. 

n 

The matrix representation of a = P BP × A 

''' is 

given by 

⎡a 

⎢a 

⎢ 

⎢a 

⎢a 

⎢ 

⎣⎢ 

a 

0 

1 

2 

3 

4 

⎡A2 

c ⎤ 

⎤ ⎡ 1 1 1 1 1 1 ⎤ ⎢ 

⎥ ⎢ 

−4 −2 0 2 4 0 

⎥ 

A c 

⎥ 

⎢ 1 ⎥ 

⎥ ⎢ 

⎥ ⎢A0 

⎥ 

⎥ = ⎢ 6 0 −2 0 6 −2 

⎥× 

⎢ 

⎥ ⎢ 

1 

−4 2 0 −2 4 0 ⎥ 

A k 

⎥ 

⎢ ⎥ 

2 

⎥ 

⎦⎥ 

1 −1 1 −1 1 1 

⎢A2 

k ⎥ 

⎣⎢ 

⎦⎥ 

⎢ 

⎣2 

A 2 ck 

⎥ 

⎦ 

(29) 

Note from this latest example that the 

matrix is rectangular and it will be the 

general case in a lowpass-to-bandpass transformation 

for values of m=2 or higher. In 

order to use the same rules as in the previous 

section for the lowpass-to-highpass transformation 

(which always has a square matrix) 

we decompose this rectangular matrix into 

the concatenation of two matrices as shown 

in the following equation 

n 

n 

⎡P BP ⎤ S BP R 

⎣⎢ ⎦⎥ = ⎡ ⎣⎢ 

n 

BP 

⎤ 

⎦⎥ 

2 

(30) 

n 

In this equation the matrix S BP is square and 

its computation is exactly the same as that 

used in the lowpass-to-highpass transformation, 

which means: all the terms in the first 

column can be obtained using (12) and the 

remaining elements S ij 

can be established 

using the following expression (P enika et 

al., 2002): 

S = S + S + S 

ij i, j −1 i−1 , j−1 i− 

1 , j 

Where i = 2 , 3,... , n + 1 

(31) 

j = 2 , 3 ,... , n + 1 

n 

On the other hand the matrix R BP in (30) is 

rectangular with n+1 rows. A priori the 

number of columns has to be computed by 

counting the number of elements different to 

1 included in the upper triangle from base m 

of the Pascal triangle (11). To illustrate these 

values we summarize in table 1 the number 

n 

of columns col of matrix RBP for different m 

and n parameter values. 

Table 1. Number of columns col in the matrix 

n 

R BP 

m n col 

2 4 1 

3 6 3 

4 8 6 

n 

Once the elements of matrix SB P are 

n 

known the columns of R BP can be derived 

directly. Let us consider the case m =2, the 

n 

lonely column of RB P is equal to the central 

n 

column of SB P (P enika and García-Ugalde, 

2004). In this paper we call this column the 

pivot because for m=2 there is only one 

element different to 1 in the upper triangle 

from base m in the Pascal triangle and its 

position corresponds to a central position in 

the triangle. For m=3, as shown in table 1, 



n 

there are three columns in R B P , one is also the 

pivot because again it is equal to the central 

n 

column of S BP and the two others are the 

columns on the right of the pivot and on the 

left of it. Also the reason is because for m=3 

there are three elements different to one in 

the upper triangle from base m and their 

positions correspond to a central position in 

the triangle plus its nearest neighbors (right 

and left). To illustrate the previous structure 

n 

we show the resulting P BP matrix for vector a 

and parameters m=3, n=6. 

⎡ ⎤ 

1 1 1 1 1 1 1 1 1 1 

⎢a 

⎥ 

⎡ 

⎤ 

0 

⎢a 

⎥ 

⎢ −6 −4 

−2 0 2 4 6 0 2 −2 

⎥ 

1 

⎢ ⎥ 

⎢ 15 5 −1 −3 −1 5 15 −3 −1 −1⎥ 

a2 

⎢ ⎥ 

⎢ 

⎥ 

= −20 0 4 0 −4 0 20 0 −4 4 

⎢a3 

⎥ 

⎢ 

⎥ 

15 −5 −1 3 −1 5 15 3 1 1 

⎢a4 

⎥ 

⎢ 

− − − 

⎥ 

6 4 2 0 2 4 6 0 2 2 

⎢a 

⎥ 

⎢ − − − − ⎥ 

5 

⎢ 

⎣a 

⎥ ⎣⎢ 

1 −1 1 −1 1 −1 1 −1 1 1 ⎦⎥ 

⎦ 

6 

3 

⎡A c ⎤ 

3 

⎢ 2 ⎥ 

⎢ 

A 2c 

⎥ 

⎢A c ⎥ 

1 

⎢ ⎥ 

⎢ 

A 0 

⎥ 

⎢A 1k 

⎥ 

× ⎢ 2 ⎥ 

⎢A 2k 

⎥ 

⎢ 

3 

A k ⎥ 

3 

⎢ ⎥ 

⎢2 

A2 

ck ⎥ 

⎢ 2 

3A3 

ck ⎥ 

⎢ ⎥ 

2 

⎣⎢ 

3A3 

c k⎦⎥ 

(32) 

A similar expression can be obtained for 

vector b. 

Inverse Trans for ma tion from H(z) 

to H(s) 

The inverse Pascal matrix is defined by the 

following equation (Klein, 1976): 

P 

−1 

n 

− n 

= 2 × Pn 

(33) 

In all cases using the inverse Pascal matrix 

the continuous-time transfer function H(s) 

can be obtained from the transfer matrix of 

the discrete-time structure H(z) . The advantage 

of using this equation is that to compute 

the inverse Pascal matrix the determinant of 

the system is not necessary. 

For example consider the lowpass case, let 

H(z) be the transfer function of the discrete 

structure that works at the corner frequency 

f = 3400[ Hz] 1 

and sampling frequency 

f = 16000 [ Hz]. 

s 

−1 −2 

0. 227 + 0. 45 4z 

+ 0 . 227z 

H( z) 

= 

(34) 

−1 −2 1 − 0. 276z 

+ 01 . 85z 

First it is necessary to calculate the constant 

c of the bilinear transform (1): 

⎛ π 3400 ⎞ 

c = cot ⎜ ⎟ = 126849 . 

(35) 

⎝ 16000 ⎠ 

Then the transfer function coefficients of 

the analog circuit will be calculated as 

follows: 

⎡A 

0 

⎢ 

A1c 

⎢ 

⎣⎢ 

A2c 

⎡B0 

⎢ 

B1 

c 

⎢ 

⎣⎢ 

B2 

c 

and 

2 

2 

⎤ ⎡1 1 1 ⎤ ⎡0. 

227⎤ 

⎥ 1 

= ⎢2 0 −2⎥ 

⎢0.454⎥ 

⎥ 4 ⎢ ⎥ ⎢ ⎥ 

⎦⎥ 

⎣⎢ 

1 −1 1 

⎦⎥ 

⎣⎢ 

0. 

227 

⎦⎥ 

⎡0. 

22 7⎤ 

= ⎢0. 

0 ⎥ 

⎢ ⎥ 

⎣⎢ 

0. 

0 

⎦⎥ 

⎤ ⎡1 1 1 ⎤⎡1 

⎤ ⎡0227 

. ⎤ 

⎥ 1 

= 

⎢ 

2 0 −2 

⎥⎢ 

− 0. 

276 

⎥ 

= 

⎢ 

0407 . 

⎥ 

⎥ 4 ⎢ ⎥⎢ 

⎥ ⎢ ⎥ 

⎦⎥ 

⎣⎢ 

1 −1 1 ⎦⎥ 

⎣⎢ 

0. 

185 ⎦⎥ 

⎣⎢ 

0365 . ⎦⎥ 

A0 = 022 . 7 A1 = 0. 0 A2 

= 00 . 

B = 0. 227 B = 0. 321 B = 0227 . 

0 1 2 

(36) 

(37) 



The transfer function of the corresponding 

analog filter is the Butterworth transfer 

function of the second order: 

0. 

227 

H ( s) 

= 

= 

2 

0. 227s 

+ 0. 321 s + 0. 

227 

= 

2 

s 

1 

+ 1 . 4142s 

+ 1 

Numer ical Exam ples 

In these examples we shall transform a 

lowpass transfer function H(s) to lowpass 

and highpass transfer functions H(z) using 

the features specified by: 

c = k = 1, f 

s 

= 800 0[ Hz], 

(38) 

2 

s + 515 . 3 

H( s) 

= 

3 2 

0. 929 s + 2. 781s + 4 . 344s 

+ 5. 

153 

Trans for ma tion LP-to-LP from s to 

the z domain 

The transfer function coefficients a 

i 

, bi, for 

i=0,1,2,3 can then be obtained using the 

equations: 

⎡a 

⎢a 

⎢ 

⎢a 

⎢ 

⎣ 

a 

0 

1 

⎤ ⎡1 1 1 1 ⎤ ⎡A0 

⎥ ⎢3 1 −1 −3 

⎥ ⎢A c 

1 

⎥ = ⎢ 

⎥ × ⎢ 

⎥ ⎢3 −1 −1 3 ⎥ ⎢A2c 

⎥ ⎢ 

⎦ ⎣ 

1 −1 1 −1 

⎥ ⎢ 

⎦ ⎣ 

A3c 

2 

3 

2 

3 

⎤ 

⎥ 

⎥ = 

⎥ 

⎥ 

⎦ 

given 

⎡b 

⎢b 

⎢ 

⎢b 

⎢ 

⎣b 

⎤ ⎡1 1 1 1 ⎤ ⎡B0 

⎤ 

⎥ ⎢3 1 −1 −3⎥ 

⎢B ⎥ 

1 

c 

⎥ = ⎢ 

⎥ × ⎢ ⎥ 

2 = 

⎥ ⎢3 −1 −1 3 ⎥ ⎢B2 

c ⎥ 

⎥ ⎢ 

⎦ ⎣1 −1 1 −1⎥ 

⎢ 3 ⎥ 

⎦ ⎣B3 

c ⎦ 

0 

1 

2 

3 

⎡1 1 1 1 ⎤ ⎡ 5153 . ⎤ 

⎢ 

3 1 −1 −3 

⎥ ⎢ 

4. 

344 

⎥ 

= ⎢ 

⎥ × ⎢ ⎥ 

⎢3 −1 −1 3 ⎥ ⎢2. 781⎥ 

⎢ 

⎣1 −1 1 −1⎥ 

⎢ 

⎦ ⎣0. 

929⎥ 

⎦ 

(40) 

a = 6153 . , a = 14. 459 , a = 14 . 459, a = 6. 

15 3 

0 1 2 3 

b = 13 . 207, b = 14. 235 , b = 11. 121, b = 2. 

66 1 

0 1 2 3 

The transfer function H(z) takes the form 

H( z) = 

−1 −2 −3 

0 . 4658+ 1. 0948z + 10948 . z + 0. 

4658 z 

= 

−1 

− 

1 + 1. 

0778z + 0. 842 2 − 

z + 0. 

2015z 

3 

(41) 

For this equation the corresponding magnitude 

and phase frequency responses of the 

digital lowpass filter are shown in Figure 1. 

(39) 

⎡1 1 1 1 ⎤ ⎡5. 

153⎤ 

⎢ 

3 1 −1 −3 

⎥ ⎢ 

0. 

0 

⎥ 

= ⎢ 

⎥ × ⎢ ⎥ 

⎢3 −1 −1 3 ⎥ ⎢1 . 0 ⎥ 

⎢ 

⎣1 −1 1 −1 

⎥ ⎢ 

⎦ ⎣0. 

0 

⎥ 

⎦ 



Figure 1. Magni tude and phase frequency responses of the lowpass filter 

Trans for ma tion LP-to-HP from s to the 

z domain 

( 3 ) 

Using the Pascal matrix PHP we can transform 

the lowpass transfer function (38) to the 

highpass transfer function H(z) using the 

following equations: 

⎡a 

⎢ 

a 

⎢ 

⎢a 

⎢ 

⎣a 

0 

1 

2 

3 

⎤ ⎡ 1 1 1 1 ⎤ ⎡A0 

⎥ ⎢ 

3 1 1 3 

⎥ = − − ⎥ ⎢ 

A1 

k 

⎢ 

⎥ × ⎢ 

⎥ ⎢ 3 −1 −1 3 ⎥ ⎢A2 

k 

⎥ ⎢ 

⎦ ⎣−1 1 −1 1 ⎥ ⎢ 

⎦ ⎣A3 

k 

2 

3 

⎤ 

⎥ 

⎥= 

⎥ 

⎥ 

⎦ 

⎡b 

⎢b 

⎢ 

⎢b 

⎢ 

⎣b 

0 

1 

2 

3 

⎤ ⎡ 1 1 1 1⎤ 

⎡B0 

⎥ ⎢ 3 1 1 3 

⎥ = − − ⎥ ⎢B 1k 

⎢ 

⎥ × ⎢ 

⎥ ⎢ 3 −1 −1 3⎥ 

⎢B k 

⎥ ⎢ 

⎦ ⎣−1 1 −1 1⎥ 

⎢ 

⎦ ⎣B3k 

⎡ 1 1 1 1⎤ 

⎡5. 

153⎤ 

⎢ 

= ⎢ 

− 3 − 1 1 3 

⎥ ⎢ 

4 . 344 

⎥ 

⎥ × ⎢ ⎥ 

⎢ 3 −1 −1 3⎥ 

⎢2 . 781⎥ 

⎢ 

⎣−1 1 −1 1⎥ 

⎢ 

⎦ ⎣0. 

929⎥ 

⎦ 

2 2 

3 

⎤ 

⎥ 

⎥ 

⎥ 

⎥ 

⎦ 

(43) 

⎡ 1 1 1 1⎤ 

⎡5. 

153⎤ 

⎢ 

= ⎢ 

− 3 − 1 1 3⎥ 

⎢0. 

0 ⎥ 

⎥ × ⎢ ⎥ 

⎢ 3 −1 −1 3⎥ 

⎢1 . 0 ⎥ 

⎢ 

⎣−1 1 −1 1⎥ 

⎢ 

⎦ ⎣0. 

0 ⎥ 

⎦ 

(42) 

The coefficients of the highpass transfer 

function are: 

a 

a 

b 

= 6153 . , a = −14 . 459 

0 1 

= 14 . 459, a = 615 . 3 

2 3 

= 13 . 207, b = −14. 

235 

0 1 



b 

= 11. 121, b =−2 . 661 

2 3 

and the highpass transfer function is given by 

(44). The magnitude and phase frequency 

responses of the digital highpass filter are 

shown in Figure 2. 

H( z) = 

−1 −2 −3 

0. 46 58 − 10 . 948z + 1. 0948 z −0 . 4658z 

= 

−1 

− 

1 − 1. 

0778z + 0. 842 2 − 

z − 0. 

2015 z 

3 

(44) 

Trans for ma tion LP-to-BP from s to the z 

domain 

In this example we transform a Butterworth 

lowpass transfer function H(s) to a bandpass 

transfer function H(z) using the features 

specified by: 

f = 3000 [ Hz], f = 10 00[ Hz] 

f 

1 −1 

s 

= 8000[ Hz] (45) 

H( s) = 

s 

2 

1 

+ 2s 

+ 1 

In order to transform the lowpass analog 

function (45) into the digital bandpass 

function, we must first determine the transfer 

function coefficients a 

1 

, b1 

for i = 0, 1,... , 4 

which can be obtained using the matrix 

equations for current values: 

⎛ π 3000 ⎞ 

c = co t ⎜ ⎟ = 0. 

4142 

⎝ 8000 ⎠ 

⎛ π1000 ⎞ 

k = tan ⎜ ⎟ = 0. 

4 142 

⎝ 8000 ⎠ 

Figure 2. Magni tude and phase frequency responses of the highpass filter 



⎡A2 

c ⎤ 

⎡a 

0 ⎤ ⎡ 1 1 1 1 1 1 ⎤ ⎢ 

⎢ 

a 

⎥ ⎢ 

1 −4 −2 0 2 4 0 

⎥ 

A1 

c 

⎥ 

⎢ ⎥ 

⎢ ⎥ ⎢ 

⎥ ⎢A0 

⎥ 

⎢a 

2 ⎥ = ⎢ 6 0 −2 0 6 −2 

⎥ × 

⎢ 

⎢a 

⎥ ⎢ 

1 

3 −4 2 0 −2 4 0 ⎥ 

A k 

⎥= 

⎢ ⎥ 

2 

⎢ ⎥ ⎢ 

⎥ 

⎣⎢ 

a 

⎢ 2 

4 ⎦⎥ 

⎣⎢ 

1 −1 1 −1 1 1 

A k ⎥ 

⎦⎥ 

⎢ 

⎣2 

A 2 

ck 

⎥ 

⎦ 

⎡b 

⎢b 

⎢ 

⎢b 

⎢b 

⎢ 

⎣⎢ 

b 

2 

(46) 

⎡0 

⎤ 

⎡ 1 1 1 1 1 1 ⎤ ⎢ ⎥ ⎡1 

⎤ 

⎢− 

− 

⎥ 

0 

4 2 0 2 4 0 ⎢ ⎥ ⎢0 

⎥ 

⎢ 

⎥ ⎢1 

⎥ ⎢ ⎥ 

= ⎢ 6 0 −2 0 6 − 2 ⎥ × 

⎢ ⎥ 

= ⎢−2 

⎥ 

⎢−4 2 0 −2 4 0 ⎥ 

0 

⎢ ⎥ ⎢0 

⎥ 

⎢ 

⎥ 

⎣⎢ 

1 −1 1 −1 1 1 

⎢0 

⎥ ⎢ ⎥ 

⎦⎥ 

⎢ ⎥ ⎣⎢ 

1 ⎦⎥ 

⎣0 

⎦ 

0 

1 

2 

3 

4 

⎡B2 

c ⎤ 

⎤ ⎡ 1 1 1 1 1 1 ⎤ ⎢ 

⎥ ⎢ 

−4 −2 0 2 4 0 

⎥ 

B1 

c 

⎥ 

⎢ ⎥ 

⎥ ⎢ 

⎥ ⎢B0 

⎥ 

⎥ = ⎢ 6 0 −2 0 6 −2 

⎥ × ⎢ 

⎥ ⎢ 

1 

−4 2 0 −2 4 0 ⎥ 

B k 

⎥= 

⎢ ⎥ 

2 

⎥ ⎢ 

⎥ ⎢ 2 

⎦⎥ 

⎣⎢ 

1 −1 1 −1 1 1 

B k ⎥ 

⎦⎥ 

⎢ 

⎣2 

B 2 

ck 

⎥ 

⎦ 

2 

(47) 

Finally, a more complicated example is presented, 

in which the lowpass transfer function 

H(s) contains two transfer functions 

H ( 1 

s ) and H s 2 

( ) and is transformed into the 

whole system bandpass transfer function H(z) 

for f = 3000[ Hz], f = 1000[ Hz ], f = 8000[ Hz ] 

1 −1 

H( s) = H ( s) × H ( s) 

= 

0. 

123 

× 

s + 0. 

3497 s 

2 

1 2 

s 

2 

s 

+ 02897 . 

+ 0 . 0492s 

+ 0. 

2492 

(49) 

In order to transform the lowpass analog 

function (49) into the digital bandpass 

function, we proceed the s-z transformation 

for each of these two transfer functions, we 

must first establish the coefficients a 

i 

, bi 

, for 

i = 0 , 1, 2 for the first function H1 ( z) and then 

the coefficients a 

i 

, bi 

, for i =0, 1 , 2,...,4 for the 

second one H2 ( z). This computation can be 

obtained using the matrix equations previously 

defined for current values: 

c = 

⎛ π 3000 

co t 

⎞ 

⎜ ⎟ = 0. 

4142 

⎝ 8000 ⎠ 

k = 

⎛ π1000 

tan 

⎞ 

⎜ ⎟ = 0. 

4 142 

⎝ 8000 ⎠ 

⎡0. 

1716 ⎤ 

⎡ 1 1 1 1 1 1 ⎤ ⎢ ⎥ ⎡2 . 8579⎤ 

⎢− 

− 

⎥ 

0. 

5858 

4 2 0 2 4 0 ⎢ ⎥ ⎢0 

⎥ 

⎢ 

⎥ 

= ⎢ 6 0 −2 0 6 −2 

⎥ × 

⎢1 

⎥ ⎢ ⎥ 

⎢0. 

5858 ⎥ 

= ⎢− 

0. 

627⎥ 

⎢−4 2 0 −2 4 0 ⎥ ⎢ ⎥ ⎢0 

⎥ 

⎣⎢ 

1 −1 1 −1 1 1 

⎢0. 

1716 ⎥ ⎢ ⎥ 

⎦⎥ 

⎢ 

⎣0. 

3431 ⎥ ⎣⎢ 

0. 

5147⎦⎥ 

⎦ 

The transfer function of the bandpass filter 

is given by 

⎡a 

⎢ 

a 

⎢ 

⎣⎢ 

a 

0 

1 

2 

⎤ ⎡ 1 1 1 ⎤ ⎡A1c 

⎤ 

⎥ 

= 

⎢ 

− 2 0 2 

⎥ 

× 

⎢ 

A 

⎥ 

0 = 

⎥ ⎢ ⎥ ⎢ ⎥ 

⎦⎥ 

⎣⎢ 

1 −1 1 ⎦⎥ 

⎣⎢ 

A1k⎦⎥ 

⎡ 1 1 1 ⎤ ⎡0 

⎤ ⎡0 . 123 ⎤ 

= 

⎢ 

−2 0 2 

⎥ 

× 

⎢ 

0123 . 

⎥ 

= 

⎢ 

0 

⎥ 

⎢ ⎥ ⎢ ⎥ ⎢ ⎥ 

⎣⎢ 

1 −1 1 ⎦⎥ 

⎣⎢ 

0 ⎦⎥ 

⎣⎢ 

− 0.123⎦⎥ 

(50) 

H( z) = 

− 

0. 3499 − 0. 6998 z + 0. 

3499 z 

= 

−2 −4 

1 − 0. 2194 z + 01 . 801z 

2 −4 

(48) 



⎡a 

⎢ 

a 

⎢ 

⎢a 

⎢a 

⎢ 

⎣⎢ 

a 

⎡b 

0 ⎤ ⎡ 1 1 1⎤ 

⎡B1 

c⎤ 

⎢b 

⎥ 

1 

= ⎢−2 0 2⎥ 

× ⎢B 

⎥ 

0 

= 

⎢ ⎥ ⎢ ⎥ ⎢ ⎥ 

⎣⎢ 

b2 

⎦⎥ 

⎣⎢ 

1 −1 1⎦⎥ 

⎣⎢ 

B1 

k⎦⎥ 

⎡ 1 1 1 ⎤ ⎡0 . 4142⎤ 

⎡11781 

. ⎤ 

= 

⎢ 

−2 0 2 

⎥ 

× 

⎢ 

0. 

3497 

⎥ 

= 

⎢ 

0 

⎥ 

⎢ ⎥ ⎢ ⎥ ⎢ ⎥ 

⎣⎢ 

1 −1 1 ⎦⎥ 

⎣⎢ 

0. 4142⎦⎥ 

⎣⎢ 

0. 

478 7⎦⎥ 

0 

1 

2 

3 

4 

(51) 

⎡A2 

c ⎤ 

⎤ ⎡ 1 1 1 1 1 1 ⎤ ⎢ 

⎥ 

1 

⎢−4 −2 0 2 4 0 ⎥ 

A c 

⎥ 

⎢ ⎥ 

⎥ ⎢ 

⎥ ⎢A0 

⎥ 

⎥ = ⎢ 6 0 −2 0 6 −2 

⎥ × ⎢ 

⎥ 

A1 

k 

⎥ 

= 

⎢−4 2 0 −2 4 0 ⎥ ⎢ ⎥ 

2 

⎥ 

⎢A2 

k ⎥ 

⎦⎥ 

⎣⎢ 

1 −1 1 −1 1 1 ⎦⎥ 

⎢ ⎥ 

⎣2 

A 2 

ck ⎦ 

⎡0 . 1716⎤ 

⎡ 1 1 1 1 1 1 ⎤ ⎢ 

⎢ 

− − 

⎥ 0 

⎥ 

4 2 0 2 4 0 ⎢ ⎥ 

⎢ 

⎥ ⎢0 . 2897⎥ 

= ⎢ 6 0 −2 0 6 −2 

⎥ × ⎢ ⎥ = 

⎢−4 2 0 −2 4 0 ⎥ 

0 

⎢ ⎥ 

⎣⎢ 

1 −1 1 −1 1 1 ⎦⎥ 

⎢0 . 1716⎥ 

⎢ ⎥ 

⎣0 . 3431⎦ 

2 

⎡ 1 1 1 1 1 1 

⎡01716 

. ⎤ 

⎤ ⎢ 

⎢− 

− 

⎥ 

00204 . ⎥ 

4 2 0 2 4 0 ⎢ ⎥ 

⎢ 

⎥ 

= ⎢ 6 0 −2 0 6 −2 

⎥ × 

⎢02492 

. ⎥ 

= 

⎢ 

⎢−4 2 0 −2 4 0 ⎥ 

00204 . ⎥ 

⎢ ⎥ 

⎢ 

⎥ 

⎣⎢ 

1 −1 1 −1 1 1 

⎢01716 

. ⎥ 

⎦⎥ 

⎣ 

⎢03431 

. ⎦ 

⎥ 

⎡0. 

97 63⎤ 

⎢ 

0 

⎥ 

⎢ ⎥ 

= ⎢0. 

87 46⎥ 

⎢0 

⎥ 

⎢ ⎥ 

⎣⎢ 

0. 

89 46⎦⎥ 

(53) 

The whole system transfer function in z of 

the bandpass filter is given in (54) and the 

corresponding magnitude and phase frequency 

responses are shown in Figure 3. 

H( z) = H ( z) × H ( z ) = 

1 2 

− 

0. 123 −0. 

123z 

= 

11 . 781 + 0. 

4787z 

2 

−2 

−2 −4 

× 

0. 976+ 0. 7936z 

+ 0. 

976z 

−2 

− 

0. 9763+ 0. 8746z + 0. 

8946z 4 

× 

(54) 

⎡0. 

976 ⎤ 

⎢0 

⎥ 

⎢ ⎥ 

= ⎢0. 

7936⎥ 

⎢0 

⎥ 

⎢ ⎥ 

⎣⎢ 

0. 

976 

⎦⎥ 

(52) 

⎡b 

⎢b 

⎢ 

⎢b 

⎢b 

⎢ 

⎣⎢ 

b 

0 

1 

2 

3 

4 

⎡B2 

c ⎤ 

⎤ ⎡ 1 1 1 1 1 1 ⎤ ⎢ 

⎥ ⎢ 

−4 −2 0 2 4 0 

⎥ 

B1 

c 

⎥ 

⎢ ⎥ 

⎥ ⎢ 

⎥ ⎢B0 

⎥ 

⎥ = ⎢ 6 0 −2 0 6 −2 

⎥ × ⎢ 

⎥ ⎢ 

1 

−4 2 0 −2 4 0 ⎥ 

B k 

⎥= 

⎢ ⎥ 

2 

⎥ 

⎢B2 

k ⎥ 

⎦⎥ 

⎣⎢ 

1 −1 1 −1 1 1 ⎦⎥ 

⎢ 

⎣2 

B 2 

ck 

⎥ 

⎦ 

2 



Figure 3. Magni tude and phase frequency responses of the Cauer bandpass filter. 

Conclu sions 

The Pascal matrix is very useful in the context 

of the design of digital filters. Transformations 

can easily be done from the analog 

prototype lowpass transfer function H(s) to 

the discrete transfer function H(z) to obtain 

one of the main three types of digital filters: 

lowpass, highpass and bandpass. The inverse 

transformation from discrete to analog is 

very easy to achieve as well because we do 

not need to compute the determinant of the 

system. In this paper we have summarized all 

types of direct transformations and illustrate 

their use with several numerical examples. 

An alternative representation of the original 

bandpass Pascal matrix has been presented 

for the systematic computation of the bandpass 

Pascal matrix. 

Acknowl edge ments 

This research was supported by CONACyT 

México, project 41069-Y and DGAPA-UNAM, 

project IN101305. 

Refer ences 

Antoniou A. (1993). Digital Filters: Analysis, 

Design, and Appli ca tions. McGraw- 

Hill, New York, USA. 

Biolkova V. and Biolek D. (1999). Generalized 

Pascal Matrix of First Order s-z. 

Trans forms. ICECS, Pafos, Cyprus, Vol. 

2, pp. 929-931, September. 

Bose N.K. (1985). Digital Filters Theory and 

Appli ca tions. Elsevier Science Publishing 

Co., Inc., Amsterdam, The 

Neth er lands. 

Klein W. (1976). Finite Systemtheorie. B.G. 

Teubner Studienbücher, Stuttgart. 

Konopacki J. (2005). The frequency Trans - 

for ma tion by Matrix Oper a tion ans its 

Appli ca tion in iir Filters Design. IEEE 

Signal Processing Letters, Vol. 12, No. 1, 

pp. 5-8, January. 

Parks T.W. and Burrus C. (1987). Digital 

Filter Design. John Willey and Sons, 

Inc., New York, USA. 

Pham Khac di and P enika B. (1985). 

Transfer Func tion Compu ta tion Using 

Pascal Matrix. Elec tronic Horizon– 

Praha, Vol 46-7, pp. 348-350. 

P enika B. and García-Ugalde F. (2004). 

Z-transform from Lowpass to 

Bandpass by Pascal Matrix. IEEE Signal 

Processing Letters, Vol. 11, No. 2, pp. 

282-284, February. 

P enika B., García-Ugalde F. and 

Herrera-Camacho A. (2002). Z-transfromation 

from Lowpass to Lowpass and 

Highpass Transfer Func tion. IEEE Signal 



Processing Letters , Vol. 9, No. 11, pp. 

368-370, November. 

Rabiner R. and Gold B. (1975). Theory and 

Appli ca tions of Digital Signal Processing. 

Prentice-Hall, New Jersey, USA. 

Suggesting Biography 

Bellanger M. (2000). Digital Processing of 

Signals, Theory and Prac tice. John 

Willey and Sons, Inc., Chichester, UK. 

Manolakis D.G. and Proakis J.G. (1996). 

Digital Signal Processing: Prin ci ples, 

Algo rithms, and Appli ca tions. Prentice- 

Hall, New Jersey, USA. 

Mitra S.K. and Kaiser J.F. (1993). Hand - 

book of Digital Signal Processing. John 

Willey and Sons, Inc., New York, USA. 

Oppenheim A.V. and Schafer R.W. (1975). 

Digital Signal Processing. Prentice-Hall, 

New Jersey, USA. 

Porat B. (2000). A Course in Digital Signal 

Processing. John Willey and Sons, Inc., 

New York, USA. 

Rorabaugh C.B. (1993). Digital Filter 

Designer’s Hand book. McGraw-Hill, 

New York, USA. 


Bohumil Pšenicka. Was born in Prague on April 15, 1933. He received the B.S. degree from Czech Tech nical Univer sity, 

Prague, in 1962, and the M.S. and Ph.D. degrees from Czech Tech nical Univer sity, Prague, in 1967 and 1972 

respec tively. In 1993 he joined the Universidad Nacional Autónoma de México, Facultad de Ingeniería, where he 

is currently a full-time professor in the Depart ment of Tele com mu ni ca tion Engi neering. His research inter ests are 

Digital Signal Processing, Analog and Digital Filter Theory, and Appli ca tions of Micro pro ces sors in 

Tele com mu ni ca tions. 

Fran cisco García-Ugalde. Obtained his Bach elor in 1977 in Commu ni ca tions, Elec tronics and Control Engi neering 

from Universidad Nacional Autónoma de México. His Diplôme d’Ingénieur in 1980 from SUPELEC France, 

and his PhD in 1982 in Infor ma tion Processing from Université de Rennes I, France. Since 1983 is a full-time 

professor at UNAM (Universidad Nacional Autónoma de México), Facultad de Ingeniería. He’s spent a sabbat - 

ical year at IRISA, France, in 1990, a second sabbat ical in 1996 at the HITLab in Univer sity of Wash ington, USA, 

and a third sabbat ical in 2003 in the depart ment of Cyber netics in Reading Univer sity, UK. His current interest 

fields are: Digital filter design tools, Anal ysis and design of digital filters, Image and video c oding, Image anal - 

ysis, Theory and appli ca tions of error control coding, Joint source-channel coding, Turbo coding, Appli ca tions 

of cryp tog raphy, Computer archi tec tures and Parallel processing. 

Virginie F. Ruiz. MIEEE, MIEE, received her BSc, MSc and PhD in signal processing from the Univer sity of Rouen, 

France. She has the honour of being a recip ient of the French Foreign Office, Lavoisier programme. Her 

research focuses on the theory and appli ca tion of nonlinear filtering for esti ma tion, detec tion, predic tion, 

anal ysis, recog ni tion. She is concerned with the devel op ment of funda mental prin ci ples of finding new ways 

of describing and processing signals to tackle the more general and chal lenging non-linear, non-Gaussian, 

non-stationary prob lems. She has a long track record in the appli ca tion of signal processing methods to 

medical signal and image processing, bioen gi neering, commu ni ca tions, synthetic aper ture radar, and mobile 

robotics. She has been with the Depart ment of Cyber netics at Univer sity of Reading since 1998. She is a senior 

lecturer in signal processing and chair of the Instru men ta tion and Signal Processing research group. Deputy 

Head of Cyber netics she is the Programme Director for several under grad uate programmes and is currently 

involved in a number of inter na tional research projects and indus trial projects. She is a member of many tech - 

nical programme commit tees for inter na tional confer ences and serves as reviewer for a number of Inter na - 

tional Jour nals.

C:\Documents and Settings\yuritzi\Mis documentos\01 REVISTA ...

Create successful ePaper yourself

Delete template?

Save as template?