C:\Documents and Settings\yuritzi\Mis documentos\01 REVISTA ...
C:\Documents and Settings\yuritzi\Mis documentos\01 REVISTA ...
C:\Documents and Settings\yuritzi\Mis documentos\01 REVISTA ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
INGENIERÍA Investigación y Tecnología VIII. 3. 123-133, 2007<br />
(artículo arbitrado)<br />
A Mixed distribution with EV1 <strong>and</strong> GEV<br />
components for analyzing<br />
heterogeneous samples<br />
C. Escalante-S<strong>and</strong>oval<br />
División de Ingeniería Civil y Geomática<br />
Facultad de Ingeniería, UNAM<br />
E-mail: caes@servidor.unam.mx<br />
(Recibido: agosto de 2006; aceptado: abril de 2007)<br />
Abstract<br />
Flood char ac ter is tics are re quired to solve sev eral wa ter-engineering prob lems. Tra di -<br />
tional flood fre quency anal y sis in volves the as sump tion of ho mo ge ne ity of the flood dis -<br />
tri bu tion. How ever, floods are of ten gen er ated by dis tri bu tions com posed of a mix ture of<br />
two or more pop u la tions. Dif fer ences be tween the pop u la tions may be the re sult, for in -<br />
stance, of the ENSO phe nom e non. If these phys i cal pro cesses are not con sid ered in con -<br />
ven tional flood fre quency anal y sis, the T-year flood es ti mate can be in ef fi cient for de -<br />
sign pur poses. In or der to model het er o ge neous sam ples, a mixed dis tri bu tion with Ex -<br />
treme Value Type I (EV1 or Gumbel) <strong>and</strong> Gen eral Ex treme Value (GEV) com po nents is<br />
pro posed. A re gion in North west ern Mex ico with 35 gaug ing sta tions has been se lected<br />
to ap ply the model <strong>and</strong> at-site quantiles were es ti mated based on the max i mum like li -<br />
hood pro ce dure. Re sults pro duced by fit ting the EV1-GEV dis tri bu tion were com pared<br />
through the use of a good ness-of-fit test with those ob tained by the mixed Gumbel <strong>and</strong><br />
mixed GEV dis tri bu tions. The EV1-GEV dis tri bu tion was the best op tion for the 40% of<br />
an a lyzed sam ples <strong>and</strong> thus it is sug gested its ap pli ca tion when mod el ing het er o ge neous<br />
se ries in flood fre quency anal y sis.<br />
Keywords: Het er o ge neous sam ples, flood fre quency anal y sis, mixed dis tri bu tions,<br />
max i mum like li hood pa ram e ter es ti ma tion.<br />
Resumen<br />
Muchos problemas en ingeniería hidráulica requieren conocer las características<br />
de una creciente. El análisis tradicional de frecuencias implica la consideración<br />
de homogeneidad de la serie. Sin embargo, en ocasiones los gastos máximos<br />
anuales son generados por distribuciones formadas por dos o más poblaciones.<br />
La diferencia entre poblaciones puede ser el resultado, entre otros, de la<br />
presencia del fenómeno ENSO. Si estos procesos físicos no se consideran en el<br />
análisis convencional, el evento estimado de cierto período de retorno puede ser<br />
ineficiente para propósitos de diseño. Con el fin de modelar muestras<br />
heterogéneas se propone la aplicación de una distribución mezclada, cuyas<br />
componentes son la distribución de Valores Extremos Tipo 1 (VE1 o Gumbel) y<br />
la General de Valores Extremos (GVE). Para aplicar el modelo se eligió una<br />
región del Noroeste de México que cuenta con 35 estaciones de aforos y se<br />
empleó la técnica de máxima verosimilitud para la estimación de los eventos de<br />
diseño. Los resultados de la distribución VE1-GVE, se compararon con aquellos<br />
obtenidos con las distribuciones Gumbel mixta y GVE mixta, a través de un
A Mixed distri bu tion with EV1 <strong>and</strong> GEV compo nents for analyzing heter o ge neous samples<br />
criterio de bondad de ajuste. La distribución EV1-GVE fue la de mejor ajuste<br />
en el 40% de las muestras analizadas, por lo que se sugiere su aplicación en el<br />
caso de requerir estimar eventos de diseño a partir de series no homogéneas.<br />
Descriptores: Muestras heterogéneas, análisis de frecuencias de crecientes,<br />
distribuciones mezcladas, estimación de parámetros por máxima verosimilitud.<br />
Intro duc tion<br />
The objective of flood frequency analysis is to<br />
estimate the flood magnitude corresponding<br />
to any return period of occurrence through<br />
the use of probability distributions, which are<br />
needed in many studies <strong>and</strong> projects such as<br />
flood plain delineation, flood protection works,<br />
river crossings, <strong>and</strong> channel improvements.<br />
Most flood studies have been analyzed<br />
through the use univariate distributions.<br />
Several efforts have been made to provide<br />
physical <strong>and</strong> statistical basics for selecting the<br />
type of probability distribution function that<br />
best fits the frequency distribution of the<br />
actual data. One common assumption in statistical<br />
analysis of flood frequency is the<br />
homogeneity of flood distributions. However,<br />
floods are often generated by distributions<br />
composed of a mixture of two or<br />
more populations. Differences between the<br />
populations may be the result of El Niño or<br />
La Niña oscillations. The occurrences of this<br />
phenomenon modify the normal precipitation<br />
patterns in Mexico (Cavazos <strong>and</strong> Hastenrath,<br />
1990; Magaña et al., 2003; Magaña<br />
<strong>and</strong> Ambrizzi, 2005). Its signal reflects in<br />
more intense winter precipitation in the<br />
Northern states, particularly in Northwestern<br />
Mexico. As mentioned by Alila <strong>and</strong> Mtiraoui<br />
(2002) if these physical processes are not<br />
considered in conventional flood frequency<br />
analysis, the T-year flood estimate can be<br />
inefficient for design purposes.<br />
The Mexican government has recognized<br />
that climate variability affects many of the its<br />
socio-economical activities <strong>and</strong> has begun to<br />
implement actions to diminish the negative<br />
effects of extreme climate conditions (floods<br />
<strong>and</strong> droughts). However, poverty has forced<br />
people to live almost on the water of rivers,<br />
situation that becomes an additional problem<br />
for the local governments. In order to protect<br />
their lives <strong>and</strong> goods is very important to<br />
account with an additional mathematical tool<br />
that might reduce the uncertainties in computing<br />
the design events for different return<br />
periods, which are needed in many studies<br />
<strong>and</strong> projects such as flood plain delineation.<br />
In order to estimate more efficient quantiles<br />
of short or heterogeneous samples, a<br />
mixed distribution with Extreme Value Type<br />
I (EV1 or Gumbel) <strong>and</strong> General Extreme<br />
Value (GEV) components for the maxima is<br />
proposed <strong>and</strong> it will be called EV1-GEV<br />
distribution.<br />
Mixed distri bu tions<br />
The use of a mixture of probability distributions<br />
functions for modeling samples of<br />
data coming from two populations have been<br />
proposed long time ago (Mood et al , 1974):<br />
Pr( X ≤ x ) = F( x) = pF ( x) + ( 1 − p ) F ( x)<br />
(1)<br />
1 2<br />
Where p is a factor used to weigh the<br />
relative contribution of each population<br />
(0
C. Escalante-S<strong>and</strong>oval<br />
Mixed Gumbel Distri bu tion<br />
If F ( 1<br />
x ) <strong>and</strong> F x 2<br />
( ) of equation (1) are Gumbel distributions (NERC, 1975) then the five-parameter<br />
mixture model of annual floods is (Raynal <strong>and</strong> Guevara, 1997):<br />
⎛ x−υ<br />
−<br />
1 ⎞<br />
− exp ⎜<br />
α1<br />
⎟<br />
⎝ ⎠<br />
F( x) = p exp + ( 1 − p)exp<br />
⎛ x − υ<br />
−<br />
2 ⎞<br />
⎜<br />
− exp ⎝ α2<br />
⎟<br />
⎠<br />
(2)<br />
where υ 1 , α 1 <strong>and</strong> υ 2 , α 2 are the location <strong>and</strong> scale parameters for the first <strong>and</strong> second population, respectively<br />
The corresponding probability density function is<br />
x −υ<br />
⎛ x−<br />
υ ⎞<br />
⎛ x −υ<br />
−<br />
⎛<br />
1 ⎞<br />
p<br />
⎝<br />
⎜<br />
⎠<br />
⎟<br />
−<br />
1<br />
α<br />
f ( x) = exp exp exp<br />
⎜ ⎟<br />
1 − ⎝ α1 − 2<br />
⎠ ( 1 − )<br />
⎜ ⎟<br />
−<br />
p ⎝ α 2 ⎠ −exp<br />
+ exp exp<br />
α 1<br />
α2<br />
⎞<br />
⎛ x − υ2<br />
⎞<br />
⎜<br />
⎝ α2<br />
⎟<br />
⎠<br />
(3)<br />
Mixed General Extreme Value Distri bu tion<br />
If F1 ( x) <strong>and</strong> F2( x) of equation (1) are GEV distributions (NERC, 1975) then the seven- parameter<br />
mixture model of annual floods is (Raynal <strong>and</strong> Santillan, 1986):<br />
⎧<br />
x<br />
F( x) = p exp<br />
⎪ ⎡ ⎛ − ω1<br />
⎞<br />
⎨−⎢1 −<br />
⎜<br />
⎟<br />
β<br />
⎩⎪ ⎣ ⎝ λ1<br />
⎠<br />
1<br />
⎤<br />
⎥<br />
⎦<br />
1 / β 1<br />
⎫<br />
⎪<br />
⎧<br />
2<br />
⎬ + ( 1 − )exp<br />
⎪ ⎡ ⎛ x − ω<br />
p ⎨ −⎢1 −<br />
⎜<br />
2<br />
⎭⎪<br />
⎩⎪ ⎣ ⎝ λ<br />
⎞<br />
⎟<br />
β<br />
⎠<br />
2<br />
⎤<br />
⎥<br />
⎦<br />
1 / β 2<br />
⎫<br />
⎪<br />
⎬<br />
⎭⎪<br />
(4)<br />
Where ω1 , λ1 , β1<br />
<strong>and</strong> ω2 , λ<br />
2<br />
, β2<br />
are the location, scale <strong>and</strong> shape parameters for the first <strong>and</strong><br />
second population, respectively.<br />
The corre sponding prob a bility density func tion is<br />
p ⎧<br />
⎪ ⎡ ⎛x<br />
− ω ⎞ ⎤<br />
1<br />
f ( x ) = exp⎨− ⎢1<br />
−<br />
⎜<br />
⎟<br />
β1<br />
⎥<br />
λ1<br />
⎩⎪ ⎣ ⎝ λ1<br />
⎠ ⎦<br />
1/<br />
β 1<br />
⎫<br />
⎪<br />
⎬<br />
⎭⎪<br />
⎡<br />
⎢<br />
⎣<br />
⎛ x − ω ⎞<br />
⎜<br />
⎟<br />
β<br />
⎝ λ1<br />
⎠<br />
1<br />
1 −<br />
1<br />
⎤<br />
⎥<br />
⎦<br />
1/<br />
β 1−1<br />
+<br />
/<br />
( 1 −p) ⎧<br />
⎪ ⎡ ⎛ x − ω<br />
exp<br />
2 ⎞ ⎤<br />
⎨−⎢1<br />
− ⎜ ⎟β<br />
2 ⎥<br />
λ2<br />
⎣ ⎝ λ 2<br />
⎩⎪<br />
⎠ ⎦<br />
1 β2<br />
⎫<br />
⎪ ⎡ ⎛x<br />
− ω2<br />
⎞<br />
⎬ ⎢1<br />
− ⎜ ⎟β<br />
2<br />
⎭⎪ ⎣ ⎝ λ ⎠<br />
2<br />
⎤<br />
⎥<br />
⎦<br />
1/β<br />
2 −1<br />
(5)<br />
EV1-GEV Distri bu tion<br />
Assuming that first <strong>and</strong> second populations behave as EV1 <strong>and</strong> GEV distributions, respectively,<br />
equation (1) yields to the six-parameter mixture model of annual floods:<br />
x<br />
F( x) = p exp ex p<br />
−<br />
⎛ −υ<br />
⎞<br />
1/<br />
β<br />
⎜ ⎟<br />
− ⎝ α ⎠<br />
⎧⎪<br />
⎡ −<br />
+ ( 1 − )exp − 1 −<br />
⎛ x ω ⎞ ⎤ ⎫⎪<br />
p ⎨ ⎢<br />
⎜ ⎟β<br />
⎣ ⎝ ⎠<br />
⎥ ⎬<br />
(6)<br />
⎩⎪ λ ⎦ ⎭⎪<br />
Where υ, α <strong>and</strong> ω, λ are the location <strong>and</strong> scale parameters for the first <strong>and</strong> second population,<br />
respectively; β is the shape parameter for the second population.<br />
Vol.VIII No.3 -julio-septiembre- 2007 125
A Mixed distri bu tion with EV1 <strong>and</strong> GEV compo nents for analyzing heter o ge neous samples<br />
The corresponding probability density function is<br />
⎛ x−<br />
υ⎞<br />
x −<br />
p<br />
− ⎜ ⎟<br />
⎝ ⎠ −<br />
f ( x) = exp exp exp<br />
−<br />
⎛ υ ⎞<br />
⎜ ⎟<br />
α<br />
⎝ ⎠<br />
+<br />
( )<br />
1/<br />
β−1<br />
1 − p α ⎡ −<br />
1 −<br />
⎛ x ω ⎞ ⎤<br />
⎧<br />
⎪ ⎡ −<br />
exp 1<br />
α<br />
⎜ ⎟<br />
⎣<br />
⎢ ⎝ ⎠ ⎦<br />
⎥<br />
− −<br />
⎛x<br />
ω⎞<br />
⎤<br />
β<br />
λ λ<br />
⎨ ⎜ ⎟<br />
⎣<br />
⎢<br />
β<br />
⎝ λ ⎠ ⎦<br />
⎥<br />
⎩⎪<br />
1/ β<br />
⎫<br />
⎪<br />
⎬<br />
⎭⎪<br />
(7)<br />
Esti ma tion of param e ters by maximum like li hood<br />
The likelihood function of n r<strong>and</strong>om variables is defined to be the joint density of n r<strong>and</strong>om<br />
variables <strong>and</strong> it is a function of the parameters. If X 1 ,X 2 , ..., Xn is a r<strong>and</strong>om sample of a univariate<br />
density function, the corresponding likelihood function is (Mood et al., 1974):<br />
L( x , θ ) = f ( x i<br />
, θ)<br />
n<br />
∏<br />
i=<br />
1<br />
(8)<br />
The logarithmic function will be used instead of the likelihood function because it is easier to<br />
h<strong>and</strong>le. So, equation (8) is transformed:<br />
InL ( x, θ) = In f ( x , θ )<br />
n<br />
∏<br />
i=<br />
1<br />
i<br />
(9)<br />
Where L is called the likelihood function, ln is the natural logarithm, θ is the set of parameters to be<br />
estimated <strong>and</strong> f ( x , θ ) is the EV1-GEV density function, thus<br />
In L( x , θ)<br />
=<br />
n<br />
∑<br />
i=<br />
1<br />
x υ<br />
x υ<br />
p<br />
−⎛<br />
−<br />
⎜<br />
⎞<br />
⎛ − ⎞<br />
⎧<br />
⎟<br />
α<br />
exp exp ex p<br />
− ⎜ ⎟<br />
α<br />
⎫<br />
⎝ ⎠ − ⎝ ⎠<br />
⎪<br />
⎪<br />
⎪<br />
α<br />
⎪<br />
In⎨<br />
+ − 1/<br />
β−1<br />
1/ β<br />
( 1 p)<br />
⎡ −<br />
−<br />
⎛ x ω ⎞ ⎤ ⎧⎪<br />
⎡ −<br />
⎢<br />
1 ⎜ ⎟ ⎥<br />
exp − 1 −<br />
⎛ x ω<br />
β<br />
⎞ ⎤ ⎫⎬<br />
(10)<br />
⎪<br />
⎪<br />
⎨ ⎜ ⎟β<br />
λ ⎣ ⎝ λ<br />
⎢<br />
⎠ ⎦ ⎣ ⎝ λ<br />
⎥ ⎬⎪<br />
⎩<br />
⎪<br />
⎩⎪<br />
⎠ ⎦ ⎭⎪<br />
⎭<br />
⎪<br />
And the corresponding first order partial derivatives of such function with respect to each of<br />
the parameters are<br />
x υ<br />
x−<br />
υ<br />
−<br />
⎛ − ⎞<br />
∂InL<br />
p<br />
α<br />
α<br />
= ∑<br />
n<br />
⎜ ⎟ −2<br />
⎛ ⎞<br />
1 ⎧<br />
− ⎝<br />
⎜ ⎟<br />
⎪ exp ⎠ ⎡<br />
⎝ ⎠<br />
exp exp − ⎛ x − υ ⎞<br />
⎤⎫<br />
⎪<br />
2 ⎨<br />
⎢<br />
⎜ ⎟⎥⎬<br />
∂υ α i=<br />
1 f ( x) ⎣⎢<br />
⎝ ⎠<br />
⎩<br />
⎪<br />
α<br />
⎦⎥<br />
⎭<br />
⎪<br />
(11)<br />
− ⎛ x − υ<br />
x−<br />
υ<br />
⎜<br />
⎞<br />
⎟ ⎛ ⎞<br />
⎛ x −υ<br />
∂InL<br />
p<br />
n<br />
1 ⎧<br />
⎞<br />
α −<br />
− ⎝ ⎠⎡<br />
⎝<br />
⎜<br />
α ⎠<br />
⎟ −2<br />
⎪ ex p<br />
⎝<br />
⎜<br />
⎠<br />
⎟ ⎤⎫<br />
α ⎪<br />
= − exp e xp + exp − ( − )<br />
2 ∑ ⎨<br />
⎢<br />
x υ ⎥⎬<br />
(12)<br />
∂α α i=<br />
1 f ( x)<br />
⎩⎪<br />
⎣⎢<br />
⎦⎥<br />
⎭⎪<br />
⎧<br />
⎧⎪<br />
⎡ x ω<br />
− −<br />
⎛ − ⎞ ⎤ ⎫⎪<br />
⎪ exp⎨<br />
⎢<br />
1 ⎜ ⎟β<br />
∂InL<br />
− p<br />
⎣ ⎝ λ ⎠<br />
⎥ ⎬<br />
n<br />
( 1 ) 1 ⎪<br />
⎦<br />
= −<br />
⎩<br />
⎪<br />
⎭<br />
⎪<br />
2<br />
∂ ω λ f ( x)<br />
⎨<br />
1/<br />
β−2<br />
i=<br />
1<br />
⎪<br />
⎧⎪<br />
⎡ −<br />
− −<br />
⎛ x ω⎞<br />
⎤ ⎡ −<br />
( 1 β)<br />
⎢<br />
1 ⎜ ⎟β<br />
⎥<br />
− 1 −<br />
⎛ x ω ⎞ ⎤<br />
⎜ ⎟β<br />
⎪ ⎨<br />
⎣ ⎝ λ<br />
⎢<br />
⎠ ⎦ ⎣ ⎝ λ<br />
⎥<br />
⎩ ⎩⎪<br />
⎠ ⎦<br />
1/<br />
β<br />
∑ 2/β<br />
− 2<br />
⎫<br />
⎪<br />
⎪<br />
⎫<br />
⎬<br />
⎪⎪<br />
⎬⎪<br />
⎭⎪<br />
⎭<br />
(13)<br />
126 INGENIERIA Investigación y Tecnología FI-UNAM
C. Escalante-S<strong>and</strong>oval<br />
1/<br />
β<br />
1/β−1<br />
⎧ ⎧<br />
−<br />
⎪<br />
−<br />
⎡<br />
−<br />
⎛ x − ω⎞<br />
⎜ β<br />
⎤ ⎫<br />
exp⎨<br />
⎢<br />
1<br />
⎪⎡<br />
⎟<br />
∂InL<br />
−p<br />
⎣ ⎝ λ ⎠<br />
⎥ ⎬ −<br />
⎛ − ⎞<br />
⎢<br />
1<br />
x ω ⎤<br />
⎪<br />
⎜ ⎟β<br />
( 1 ) 1<br />
⎦<br />
=<br />
⎩⎪<br />
⎭⎪ ⎣ ⎝ ⎠<br />
⎥<br />
+<br />
n<br />
⎪<br />
λ ⎦<br />
2 ∑ ⎨<br />
∂λ λ i=<br />
1 f( x ) ⎪ ⎧⎪<br />
⎡ x − ω<br />
ω<br />
( x −ω) f(x) ( 1 − β)<br />
1 −<br />
⎛ ⎞ ⎤<br />
⎢ ⎜ ⎟β<br />
β<br />
⎣ ⎝ λ ⎠ ⎦<br />
⎥ − ⎡<br />
− ⎛ x<br />
⎜<br />
− ⎞ ⎤<br />
⎨<br />
⎢<br />
1<br />
⎪<br />
⎟<br />
⎣ ⎝ λ ⎥<br />
⎩ ⎩⎪<br />
⎠ ⎦<br />
1 / β−<br />
1<br />
⎫<br />
⎪<br />
⎪<br />
⎬<br />
⎫⎪<br />
⎪<br />
⎬<br />
⎪<br />
⎭⎪<br />
⎭<br />
(14)<br />
⎧<br />
⎪<br />
⎪<br />
⎪<br />
∂InL<br />
( 1 −p<br />
)<br />
n<br />
1<br />
⎪ ⎧⎪<br />
⎡ ⎛ x − ω⎞<br />
⎤<br />
=<br />
exp ⎨ − 1 − ⎜ ⎟β<br />
2 ∑ ⎨<br />
∂β λ i=<br />
1 f( x ) ⎢<br />
⎣ ⎝ λ ⎠<br />
⎥<br />
⎪ ⎩⎪<br />
⎦<br />
⎪<br />
⎪<br />
⎪<br />
⎩⎪<br />
1 / β<br />
1/<br />
β−2<br />
⎧ 1 ⎛ x −ω<br />
⎞⎡<br />
⎜ ⎟ −<br />
⎛ x − ω⎞<br />
⎤<br />
⎪<br />
⎜ ⎟<br />
⎝ ⎠<br />
⎢<br />
1 β<br />
⎣ ⎝ ⎠<br />
⎥<br />
⎪<br />
β λ λ ⎦<br />
⎪ 1 ⎡ x −<br />
⎫ + In 1 −<br />
⎛ ω⎞<br />
⎤ ⎡ −<br />
⎪ 2 ⎜ ⎟<br />
β ⎢<br />
⎝ ⎠<br />
⎥<br />
−<br />
⎛x<br />
ω ⎞ ⎤<br />
β<br />
⎢<br />
1 ⎜ ⎟β<br />
⎪<br />
⎬<br />
⎣ λ ⎦ ⎣ ⎝ λ ⎠<br />
⎥<br />
⎨<br />
⎦<br />
⎭⎪ ⎪ −⎛<br />
x − ω⎞⎛<br />
1<br />
⎜ ⎟⎜<br />
−1 ⎞ ⎡<br />
⎟ −⎛<br />
− ⎞ ⎤<br />
⎜ ⎟<br />
⎝ λ ⎠<br />
⎢<br />
1<br />
x ω<br />
β<br />
⎪<br />
⎝ β ⎠ ⎣ ⎝ λ ⎠<br />
⎥<br />
⎦<br />
⎪<br />
⎪ −1 1 In<br />
⎡<br />
1 − ⎛ x −ω<br />
⎞<br />
2 ⎜ ⎟β<br />
⎤<br />
β<br />
⎢<br />
⎣ ⎝ λ ⎠<br />
⎥<br />
⎩⎪<br />
⎦<br />
1/<br />
β−1<br />
⎫⎫<br />
⎪⎪<br />
⎪⎪<br />
⎪⎪<br />
⎪<br />
⎪<br />
⎬⎬<br />
⎪⎪<br />
⎪⎪<br />
⎪⎪<br />
⎪⎪<br />
⎭⎪<br />
⎭⎪<br />
(15)<br />
⎛ x−<br />
υ ⎞<br />
x υ<br />
−<br />
−<br />
⎛ − ⎞<br />
n<br />
α<br />
∂InL<br />
⎜ ⎟<br />
⎜ ⎟<br />
1 1<br />
⎝ ⎠<br />
⎝ α ⎠ −<br />
= exp exp exp − 1 −<br />
x −<br />
β−<br />
⎧<br />
⎪<br />
⎧<br />
⎪<br />
⎡ ⎛ ω ⎞ ⎤ ⎧ ⎡<br />
⎜ ⎟<br />
x −<br />
∂p<br />
αλ f( x )<br />
⎢<br />
⎣ ⎝ ⎠<br />
⎥ − −<br />
⎛ ω⎞<br />
⎤<br />
∑ ⎨ ⎨<br />
β exp⎨<br />
⎪ ⎢1<br />
⎜ ⎟β<br />
λ ⎦ ⎣ ⎝ λ ⎠<br />
⎥<br />
i=<br />
1<br />
⎩⎪ ⎩⎪<br />
⎩ ⎪<br />
⎦<br />
1 / 1 1 / β<br />
⎫⎪<br />
⎫<br />
⎪<br />
⎫<br />
⎪ ⎬ ⎬⎬<br />
⎭⎪ ⎭⎪ ⎭⎪<br />
(16)<br />
The exact solution provided by the system of<br />
equations (11)-(16) is not known, so the maximum<br />
likelihood estimators of the parameters<br />
were obtained by the direct maximization<br />
of the log-likelihood function (eq.<br />
10), which is constrained to α > 0, λ> 0, 0 < p < 1,<br />
<strong>and</strong> x> 0. The suggested procedure is the<br />
constrained multivariable Rosenbrock method<br />
(Kuester <strong>and</strong> Mize, 1973).<br />
As it is known, in any of the multivariable<br />
constrained non-linear optimization techniques,<br />
global optimality is never assured. Therefore,<br />
care must be taken in order to avoid a local<br />
optimum. It is suggested to start always with<br />
values of the location, scale <strong>and</strong> shape<br />
parameters computed by considering the<br />
sample divided into two equal parts. If sample<br />
is sorted in decreasing order of magnitude,<br />
the first set of data is fitted to the<br />
univariate GEV distribution (Prescott <strong>and</strong><br />
Walden, 1980), <strong>and</strong> the second one to the univariate<br />
Gumbel distribution (NERC, 1975).<br />
The initial value of the association parameter<br />
p will be equal to 0.5.<br />
For the mixed Gumbel <strong>and</strong> the mixed GEV<br />
distributions parameters are estimated following<br />
the same optimization procedure.<br />
Case study<br />
A region located in Northwestern Mexico,<br />
with a total of 35 gauging stations was<br />
selected to apply the EV1-GEV distribution to<br />
flood frequency analysis. Table 1 shows<br />
statistical characteristics of data for each<br />
station in the region.<br />
In the area considered in this study, flood<br />
outliers correspond to observed rainfall values<br />
much higher than the other annual<br />
Vol.VIII No.3 -julio-septiembre- 2007 127
A Mixed distri bu tion with EV1 <strong>and</strong> GEV compo nents for analyzing heter o ge neous samples<br />
maxima. Such extremely heavy rainfall is due<br />
to special meteorological conditions in<br />
connection with ENSO events in the Pacific<br />
Ocean. In the analyzed area, 62% of the<br />
highest annual maximum discharges gauged<br />
were generated in an El Niño year <strong>and</strong> 38%<br />
for its counterpart, La Niña.<br />
Results provided by the EV1-GEV distribution<br />
were compared with those produced<br />
by the mixed Gumbel <strong>and</strong> mixed GEV<br />
distributions. For each station the best one<br />
was chosen according to the criterion of<br />
minimum st<strong>and</strong>ard error of fit (SE), as<br />
defined by Kite (1988):<br />
n<br />
SE =<br />
⎡<br />
2<br />
gi<br />
−h i<br />
n − q<br />
⎤<br />
⎣<br />
⎢∑( ) / ( )<br />
i=<br />
1<br />
⎦<br />
⎥<br />
1 / 2<br />
(17)<br />
Where gi, i =1 ,... n are the hi , i =1 , ... n<br />
recorded events; are the event magnitudes<br />
computed from the probability distribution<br />
at probabilities obtained from the sorted<br />
ranks of, g , i<br />
i = 1 ,..., n , n is the length of record,<br />
<strong>and</strong> q is the number of parameters<br />
estimated for the mixed distribution. For the<br />
mixed distributions, Gumbel, GEV <strong>and</strong> EV1-GEV<br />
q will be equal to 5, 7 <strong>and</strong> 6, respectively.<br />
that the hydraulic project might become<br />
economically unfeasible or unsafe.<br />
An additional problem is when a short<br />
record is used (less than 30 years), because<br />
there is an increased risk that the flood<br />
estimate will not provide adequate protection<br />
of designated uses. One way to reduce<br />
the bias or uncertainty in the flood estimate is<br />
to use a regional data set with observations<br />
from several sites.<br />
Mixed Gumbel, GEV <strong>and</strong> EV1-GEV distributions<br />
can be easily used to obtain regional<br />
at-site estimates of floods by using the<br />
station-year method in regions with heterogeneous<br />
sample data. The general procedure<br />
of this regional technique can be found<br />
in paper written by Cunnane (1988).<br />
This regional technique was not applied in<br />
the paper <strong>and</strong> it just was mentioned to be<br />
considered for users in their hydrological<br />
analyses.<br />
In table 2 is depicted the SE for all mixed<br />
distributions along with the best model for<br />
the sample of data considered.<br />
The final at-site design events Q (m 3 /s) for<br />
different return periods T(years) in each<br />
station are presented in Table 3.<br />
In some sites a comparison is made among<br />
different at-site design events (Table 4). For<br />
instance, in station Chinipas the computed SE<br />
are very similar, however, as return period<br />
increases, differences among flood estimates<br />
are more significant. A bad selection of the<br />
best distribution in the analyzed site can<br />
substantially modify the design event <strong>and</strong><br />
128 INGENIERIA Investigación y Tecnología FI-UNAM
C. Escalante-S<strong>and</strong>oval<br />
Table 1. Statis tical char ac ter is tics of flood data for each analyzed gauging station<br />
Years of Period o f Co efficient of Coefficiento f C oefficient of<br />
m Gauging Statio n r ecor d r ecor d Mean<br />
St<strong>and</strong>ard<br />
Deviation Skewness Kurtosis Var iation<br />
1 Acatitan 31 1955-1985 1031.6 864.5 2.63 12.79 0.84<br />
2 Alam os 22 1948-1969 247.6 178.8 0.83 3.60 0.72<br />
3 Badiraguato 27 1959-1985 957.9 1853.6 3.92 20.65 1.94<br />
4 Bami cori 32 1951-1982 194.5 176.7 1.39 4.46 0.91<br />
5 Cazanate 19 1967-1985 555.0 727.9 3.06 15.04 1.31<br />
6 Chini pas 21 1965-1985 1061.0 524.4 0.31 2.83 0.49<br />
7 Choix 29 1955-1983 392.9 336.5 2.59 11.84 0.86<br />
8 El Ble dal 48 1938-1985 286.0 273.4 2.83 13.92 0.96<br />
9 El Mahone 20 1966-1985 198.4 26.3 0.69 5.96 0.13<br />
10 El Naranjo 47 1939-1985 621.9 655.5 1.87 6.98 1.05<br />
11 El Queli te 26 1960-1985 468.5 445.2 1.72 6.27 0.95<br />
12 Guamuchil 36 1938-1973 605.9 630.4 3.09 16.22 1.04<br />
13 Guatenipa 21 1965-1985 1888.8 1393.2 0.84 3.27 0.74<br />
14 Huites 53 1941-1993 2942.0 3124.3 2.63 10.39 1.06<br />
15 Ixpali no 31 1953-1983 1317.8 1218.2 2.79 12.68 0.92<br />
16 Jaina 46 1941-1986 1197.4 1189.9 3.20 16.30 0.99<br />
17 La Huerta 17 1969-1985 934.2 574.3 0.29 2.43 0.61<br />
18 La Tina 24 1960-1983 106.5 152.3 4.00 22.39 1.43<br />
19 Las Cañas 24 1948-1971 2497.0 3194.2 1.60 4.84 1.28<br />
20 Palo Dulce 29 1957-1985 975.9 1195.7 4.40 25.89 1.23<br />
21 Palo s Bl ancos 47 1939-1985 1481.8 1726.4 1.92 7.85 1.17<br />
22 Peric os 26 1960-1985 201.0 95.1 0.14 2.56 0.47<br />
23 Pi axtl a 16 1958-1973 1419.8 1587.8 2.48 10.79 1.12<br />
24 Pte Sud Pacífic o 35 1924-1958 2961.0 2204.9 1.41 7.20 0.74<br />
25 Puente C añed o 22 1932-1953 1116.0 932.7 0.76 3.35 0.84<br />
26 San Franci sco 33 1941-1973 1724.6 1450.1 1.89 7.03 0.84<br />
27 San Ignac io 19 1967-1985 1622.4 813.4 1.70 7.38 0.50<br />
28 Sanalona 42 1944-1985 447.3 505.4 2.99 13.49 1.13<br />
29 Santa Cruz 43 1943-1985 1269.7 1216.5 2.94 14.86 0.96<br />
30 Tamazula 23 1962-1984 583.6 278.0 1.38 5.46 0.48<br />
31 Tecusiapa 17 1958-1974 975.7 792.7 1.66 6.49 0.81<br />
32 Toahayana 29 1957-1985 1048.9 629.7 0.67 3.19 0.60<br />
33 Urique 19 1967-1985 302.6 148.0 1.16 6.81 0.49<br />
34 Zapotitlán 22 1960-1981 624.6 645.4 2.03 9.09 1.03<br />
35 Zopilote 47 1939-1985 363.2 275.9 0.69 2.81 0.76<br />
Vol.VIII No.3 -julio-septiembre- 2007 129
A Mixed distri bu tion with EV1 <strong>and</strong> GEV compo nents for analyzing heter o ge neous samples<br />
Table 2. The computed SE (in m 3 /s) for each analyzed gauging station<br />
Gauging S tation EVI-GVE M ixed Gumbel Mixed GVE Best distribution<br />
Acati tan 308.9 337.0 386.3 EV1-GVE<br />
Alamos 25.9 28.4 25.8 Mixed GV E<br />
Badirag uato 769.5 921.3 * EV1-GVE<br />
Bamicori 30.1 46.5 30.8 EV1-GVE<br />
Cazanate 377.9 443.8 372.1 Mixed GV E<br />
Chinipas 89.2 81.6 91.2 Mixed Gumbel<br />
Choix 152.7 118.5 146.2 Mixed Gumbel<br />
El Bledal 74.7 69.4 86.3 Mixed Gumbel<br />
El Mahone 24.0 8.5 8.6 Mixed Gumbel<br />
El Naranjo 112.0 174.4 125.9 EV1-GVE<br />
El Quelite 126.1 143.1 116.3 Mixed GV E<br />
Guamuchil 241.9 263.2 352.1 EV1-GVE<br />
Guatenipa 225.1 355.9 337.0 EV1-GVE<br />
Huites 614.1 987.0 805.6 EV1-GVE<br />
Ixpal ino 390.3 370.8 * Mixed Gumbel<br />
Jai na 402.8 411.2 * EV1-GVE<br />
La Huerta 364.0 99.0 * Mixed Gumbel<br />
La Ti na 122.4 105.4 127.3 Mixed Gumbel<br />
Las Cañas * 2139.1 790.5 Mixed GV E<br />
Pal o Dulce 884.9 963.3 900.5 EV1-GVE<br />
Pal os Blancos 340.1 550.9 294.4 Mixed GV E<br />
Pericos 19.2 18.1 26.3 Mixed Gumbel<br />
Pi axtl a 641.0 502.5 828.6 Mixed Gumbel<br />
Pte SudPací fico 614.8 658.0 624.5 EV1-GVE<br />
Puente Cañedo 149.8 135.6 174.8 Mixed Gumbel<br />
San Franc isco 323.4 333.8 302.8 Mixed GV E<br />
San Ignacio 296.6 344.4 273.8 Mixed GV E<br />
Sanalo na 115.8 214.6 214.5 EV1-GVE<br />
Santa Cruz 390.9 341.4 * Mixed Gumbel<br />
Tamazula 93.5 77.2 * Mixed Gumbel<br />
Tecusiapa 278.5 211.9 308.8 Mixed Gumbel<br />
Toahay ana 104.6 106.6 101.8 Mixed GV E<br />
Urique 92.2 44.1 * Mixed Gumbel<br />
Zapotitl án 219.0 301.1 238.6 EV1-GVE<br />
Zopi lote 37.4 37.6 38.6 EV1-GVE<br />
* No conver gence was attained in the esti ma tion of param e ters<br />
130 INGENIERIA Investigación y Tecnología FI-UNAM
C. Escalante-S<strong>and</strong>oval<br />
Table 3. Design events Q(m 3 /s) for the best fitted distri bu tion in each analyzed gauging station<br />
Retu rn period Tr(y ears)<br />
Gauging S tation 2 5 10 20 50 100 500 1000<br />
Acati tan 693.2 1610.3 2175.5 2720.9 3502.6 4168.2 6049.8 7039.0<br />
Alamos 198.1 418.5 522.0 589.4 651.0 685.1 742.8 770.0<br />
Alamos 203.9 396.2 496.0 585.3 697.6 780.7 971.7 1053.6<br />
Badirag uato 415.0 686.5 2369.1 4770.6 7736.6 10461.1 19586.4 25268.6<br />
Bamicori 116.4 353.7 499.8 574.5 635.0 665.2 706.8 717.3<br />
Cazanate 304.9 728.5 1295.8 1944.6 2934.4 3824.0 6550.4 8097.6<br />
Chinipas 1050.5 1484.1 1751.1 2003.3 2327.4 2569.5 3128.1 3368.2<br />
Choix 299.7 500.4 713.5 1013.9 1419.1 1709.0 2359.6 2636.2<br />
El Bledal 209.0 375.9 572.8 830.2 1147.9 1373.2 1879.4 2094.8<br />
El Mahone 197.7 214.6 226.9 240.4 260.5 276.8 315.8 332.8<br />
El Naranjo 377.2 937.0 1647.7 2001.4 2450.2 2808.3 3753.9 4223.0<br />
El Quelite 307.1 749.0 1052.7 1384.2 1896.1 2357.1 3757.6 4543.1<br />
Guamuchil 431.4 830.3 1236.2 1728.5 2472.7 3114.0 4953.5 5935.7<br />
Guatenipa 1593.2 3211.7 3903.2 4451.4 5041.7 5414.1 6096.2 6327.7<br />
Huites 1865.7 3428.2 6929.2 9949.8 13232.7 15504.8 20439.9 22464.1<br />
Ixpal ino 963.7 1580.2 2334.1 3720.8 5550.2 6835.9 9716.7 10941.7<br />
Jai na 807.3 1576.7 2480.2 3401.5 4707.4 5809.4 8894.1 10502.4<br />
La Huerta 801.9 1474.2 1627.1 1764.4 1937.2 2065.3 2359.5 2485.7<br />
La Ti na 71.0 127.2 173.6 254.1 563.3 726.9 1051.5 1184.8<br />
Las Cañas 929.2 4382.3 7643.8 8899.5 9703.0 10022.1 10355.7 10416.1<br />
Pal o Dulce 676.4 1097.1 1518.3 2137.7 3160.1 4012.9 6300.9 7450.2<br />
Pal os Blancos 871.2 2682.6 3850.1 5076.2 6882.0 8432.5 12820.8 15123.2<br />
Pericos 199.4 274.6 319.7 362.0 416.2 456.7 550.0 590.1<br />
Pi axtl a 781.0 1490.9 3902.2 5156.8 6582.3 7602.4 9910.7 10895.7<br />
Pte SudPaci fico 2833.8 4573.0 5709.2 6866.1 8493.5 9824.7 13327.1 15039.5<br />
Puente Cañedo 894.5 1914.3 2424.0 2889.1 3478.1 3915.5 4921.8 5353.7<br />
San Franc isco 1149.8 2590.9 3717.4 4733.3 6042.8 7045.4 9475.7 10577.5<br />
San Ignacio 1509.3 2246.5 2754.5 3308.9 4156.9 4911.2 7156.5 8391.5<br />
Sanalo na 301.4 517.5 764.3 1651.6 2296.9 2512.4 2728.8 2768.1<br />
Santa Cruz 927.0 1667.6 2625.1 3833.9 5249.3 6245.8 8480.8 9431.4<br />
Tamazula 510.4 747.8 939.4 1136.9 1398.4 1595.2 2049.7 2245.0<br />
Tecusiapa 698.5 1400.1 2112.2 2732.2 3480.1 4023.9 5262.5 5792.2<br />
Toahay ana 926.5 1666.1 1977.3 2214.4 2462.4 2615.7 2895.6 2995.6<br />
Urique 294.5 354.2 480.4 602.6 757.5 872.6 1137.5 1251.2<br />
Zapotitl án 533.7 1099.7 1517.6 1969.9 2646.9 3233.8 4911.4 5798.8<br />
Zopi lote 316.2 610.6 748.6 858.5 977.0 1052.0 1189.8 1236.8<br />
Vol.VIII No.3 -julio-septiembre- 2007 131
A Mixed distri bu tion with EV1 <strong>and</strong> GEV compo nents for analyzing heter o ge neous samples<br />
Table 4. Compar ison of design events Q(m 3 /s) <strong>and</strong> SE (in m 3 /s) for some selected stations of case study<br />
Return perio d Tr (years)<br />
Gaug ing Statio n Distributio n 2 5 10 20 50 100 500 1000 S E<br />
Chinipas EV1-GVE 1040 1542 1752 1912 2079 2181 2359 2417 89.2<br />
Mi xe d GVE 1040 1551 1763 1925 2096 2203 2427 2573 91.2<br />
Mi xe d Gumbel* 1051 1484 1751 2003 2327 2569 3128 3368 81.6<br />
Palo Dulce EV1-GVE* 676 1097 1518 2138 3160 4013 6301 7450 884.9<br />
Mi xe d GVE 672 1114 1539 2137 3262 4321 7402 9039 900.5<br />
Mi xe d Gumbel 702 1094 1395 1776 2806 4097 6984 8191 963.3<br />
San Francisco EV1-GVE 1155 2524 3543 4626 6256 7687 11879 14151 323.4<br />
Mi xe d GVE* 1150 2591 3717 4733 6043 7045 9476 10578 302.8<br />
Mi xe d Gumbel 1141 2613 3676 4605 5760 6613 8566 9404 333.8<br />
* Best distri bu tion according to the minimum value of SE.<br />
Conclu sions<br />
Floods are often generated by heterogeneous<br />
distributions composed of a mixture of two<br />
populations. Differences between the populations<br />
may be the result of a number of<br />
factors such as the El Niño/La Niña oscillations.<br />
In the analyzed area 62% of the highest<br />
annual maximum discharges (outliers) were<br />
generated in an El Niño year. The magnitude<br />
of these events is very important <strong>and</strong> floods<br />
can seriously affect people. For this reason, it<br />
is necessary to account with an additional<br />
mathematical tool that be able to reduce the<br />
uncertainty in estimating of de- sign events,<br />
which are needed in many water-engineering<br />
studies <strong>and</strong> projects.<br />
In this paper a mixed distribution has been<br />
derived by considering different components<br />
in an opposite way as usually do. F ( x ) <strong>and</strong><br />
1<br />
F2 ( x) of equation (1) were the EV1 <strong>and</strong> the<br />
GEV distributions, respectively.<br />
Results shown that there exists a reduction<br />
in the st<strong>and</strong>ard error of fit when using the<br />
EV1-GEV distribution in comparison with<br />
the mixed Gumbel or mixed GEV distributions,<br />
<strong>and</strong> just in one out of the 35 analyzed<br />
cases, the proposed distribution could not<br />
reach convergence in the estimation of parameters<br />
process. By contrast, the Mixed GEV<br />
distribution had seven failures with the same<br />
estimation process.<br />
In 13 sample data the EV1-GEV distribution<br />
produced the least st<strong>and</strong>ard error of<br />
fit (40% of analyzed cases) <strong>and</strong> in other<br />
different cases it was very close to the mixed<br />
Gumbel <strong>and</strong> mixed GEV distributions, However,<br />
as it was shown, differences between<br />
at-site design events can be significant as<br />
return period increases. A bad selection of the<br />
best distribution in the analyzed site can<br />
substantially modify the design event <strong>and</strong><br />
also that the hydraulic project might become<br />
economically unfeasible or unsafe. Thus, by<br />
taking into consideration the mixed flood<br />
distributions a more accurate, physically<br />
based flood frequency analysis can be obtained<br />
<strong>and</strong> sensible savings in costs of<br />
construction of flood protection structures<br />
can be expected. This can also improve the<br />
setting of flood plain limits <strong>and</strong> the safety of<br />
control structures.<br />
132 INGENIERIA Investigación y Tecnología FI-UNAM
C. Escalante-S<strong>and</strong>oval<br />
Refer ences<br />
Alila Y. <strong>and</strong> Mtiraoui A. (2002). Implications<br />
of Heter o ge neous Flood-Frequency<br />
Distri bu tions on Tradi tional<br />
Stream-Discharge Predic tion Tech niques.<br />
Hydro log ical Processes, 16:1065-1084.<br />
Cavazos T. <strong>and</strong> Hastenrath S. (1990).<br />
Convec tion <strong>and</strong> Rain fall Over Mexico<br />
<strong>and</strong> their Modu la tion by the Southern<br />
Oscil la tion. Inter na tional Journal of<br />
Clima tology , 10: 377-386.<br />
Kite G.W. (1988). Frequency <strong>and</strong> Risk<br />
Analyses in Hydrology. Water Resources<br />
Publications, Littleton, Colo rado, USA.<br />
Kuester J.L. <strong>and</strong> Mize J.H. (1973). Opti mi -<br />
za tion Tech niques with FORTRAN .<br />
McGraw-Hill.<br />
Magaña V. <strong>and</strong> Ambrizzi T. (2005).<br />
Dynamics of Subtrop ical Vertical Motions<br />
Over the Amer icas During El<br />
Niño Boreal Winters. Atmósfera, 18(4):<br />
211-233.<br />
Magaña V., Vázquez J., Pérez J. <strong>and</strong> Pérez<br />
J.B. (2003). Impact of El Niño on<br />
Precip i ta tion in Mexico. Geofísica Internacional<br />
, 42(3): 313-330.<br />
Mood A., Graybill F. <strong>and</strong> Boes D. (1974).<br />
Intro duc tion to the Theory of Statis tics.<br />
Third Ed., McGraw-Hill.<br />
NERC (1975). Natural Envi ron ment Research<br />
Council. Flood Studies Report I, Hydrologic<br />
Studies. Whitefriars Press Ltd.,<br />
London, United Kingdom.<br />
Prescott P. <strong>and</strong> Walden A. (1980). Maximum<br />
Like li hood Esti ma tion of the<br />
Param e ters of the Gener al ized Extreme<br />
Value Distri bu tion. Biometrika, 67(3):<br />
723-724.<br />
Raynal J. <strong>and</strong> Guevara J. (1997). Maximum<br />
Like li hood Esti ma tors for the<br />
two Popu la tions Gumbel distri bu tion.<br />
Hydro log ical Science <strong>and</strong> Tech nology<br />
Journal, 13(1-4):47-56.<br />
Raynal J. <strong>and</strong> Santillan O. (1986). Maximum<br />
Like li hood Esti ma tors of the<br />
Param e ters of the Mixed GEV Distri bu -<br />
tion. IX Congreso Nacional de Hidráulica.<br />
AMH. Querétaro, Qro., Mex. pp.<br />
79-90. (In Spanish)<br />
Semblanza del autor<br />
Dr. Carlos Agustín Escalante-S<strong>and</strong>oval. Es doctor en ingeniería hidráulica por la Facultad de Ingeniería de la UNAM.<br />
Actualmente es profesor titular “C” de tiempo completo definitivo. Ha impartido 85 cursos en el Posgrado de<br />
la UNAM; dirigido 38 tesis de maestría y cinco de doctorado. Dentro de su producción académica se<br />
encuentran: 30 publicaciones en revistas con arbitraje, 45 en congresos nacionales e internacionales, 3 capítulos<br />
en libro, 2 libros como autor y otro como co-editor. Recibió la medalla Gabino Barreda por sus estudios de<br />
doctorado, el premio Distinción Universidad Nacional para Jóvenes Académicos en Docencia en Ciencias<br />
Exactas 1999 que otorga la UNAM y el Premio Nacional Enzo Levi “Investigación y Docencia en Hidráulica<br />
2002”, por parte de la Asociación Mexicana de Hidráulica. Es miembro del Sistema Nacional de Investigadores,<br />
Academia Mexicana de Ciencias, Academia de Ingeniería, Colegio de Ingenieros Civiles de México y la<br />
Asociación Mexicana de Hidráulica.<br />
Vol.VIII No.3 -julio-septiembre- 2007 133
INGENIERÍA Investigación y Tecnología VIII. 3. 135-146, 2007<br />
(artículo arbitrado)<br />
Aplicación del algoritmo de solución<br />
paso-a-paso de la ecuación que determina la<br />
estabilidad de un generador síncrono<br />
H.A. Grajales-Román<br />
División de Ingeniería Eléctrica y Departamento de Ingeniería Eléctrica de Potencia<br />
Facultad de Ingeniería, UNAM<br />
E-mail: alfhugo@gmail.com<br />
(Recibido: marzo de 2006; aceptado: septiembre de 2006)<br />
Resumen<br />
La solución de la ecuación diferencial de orden dos, que representa en<br />
forma matemámática la dinámica de máquinas generadoras de corriente<br />
alterna, requiere de un algoritmo para su solución. La traducción a<br />
lenguaje de computadora del método paso-a-paso para la solución de la<br />
ecuación de oscilación que representa la dinámica del generador, permite<br />
el análisis de redes eléctricas cu<strong>and</strong>o son sometidas a cambios repentinos<br />
que provocan oscilaciones de frecuencia, y por lo tanto, de tensión. El<br />
algoritmo se basa en la consideración del hecho que; se puede calcular un<br />
nuevo valor del ángulo δ , si se conoce su valor de cambio en el intervalo<br />
ante rior y se conoce la potencia acelerante en el nuevo intervalo de<br />
estudio. Con el apoyo del programa de computo llamado Matlab, se<br />
pueden realizar un sin número de corridas con valores diferentes de los<br />
parámetros del sistema, así como de los tiempos de apertura de los<br />
interruptores. Como resultado, el programa despliega la tendencia del<br />
rotor conocida como curva de oscilación.<br />
Descriptores: Ecuación diferencial, integración, lenguaje de computadora.<br />
Abstract<br />
The sec ond or der dif fer en tial equa tion so lu tion, which math e mat i cally rep re sents<br />
the dy namic of altern cur rent gen er at ing ma chines, re quires an al go rithm for its<br />
so lu tion. The com puter ma chine lan guage trans la tion of step-by-step method for<br />
the so lu tion of swing ing equa tion which rep re sents the dy namic gen er a tor, al lows<br />
the anal y sis of elec tri cal net works when are sub ject to sud den changes that mo tive<br />
os cil la tion of fre quency <strong>and</strong> there fore ten sion. The al go rithm is based on the fact of<br />
the pos si bil ity to ob tain a new value of the ä (delta) an gle, as long as its value is<br />
known in the pre ced ing in ter val <strong>and</strong> its ac cel er at ing power is known in the new<br />
study in ter val. With the sup port of Mathlab soft ware, it is pos si ble to ac com plish<br />
end less num ber of runs with many dif fer ent val ues <strong>and</strong> sys tem pa ram e ters, as well<br />
as time open ing of cir cuit break ers. As a re sult, the pro gram plots a curve that<br />
shows the os cil la tion ten dency.<br />
Keywords: Dif fer en tial equa tion, in te gral, com pu ta tion lan guage.
Aplicación del algoritmo de solución paso-a-paso de la ecuación que determina la estabilidad ...<br />
Introducción<br />
Los sistemas eléctricos de potencia están sujetos<br />
a cambios de cargas, algunas graduales<br />
y otras bruscas, unas por conexión de cargas<br />
ligeras y otras como fallas en las líneas de<br />
conducción, o en sus torres soportes, caus<strong>and</strong>o<br />
por lo tanto, que la estabilidad del<br />
sistema de transmisión de energía eléctrica<br />
entre en crisis.<br />
Se define como límite de estabilidad en<br />
estado permanente de un generador o de un<br />
sistema, a la máxima potencia que puede ser<br />
transmitida a cambios de carga que permitan<br />
ajustes de excitación suficientes como para<br />
que se recupere el valor normal de la tensión<br />
que se tenía antes del cambio.<br />
Si el ajuste de excitación se presenta con o<br />
inmediatamente después del cambio de carga,<br />
el limite de estabilidad en estas condiciones<br />
es llamado “límite dinámico del estado<br />
permante”.<br />
La bondad, flexibilidad o rigidez de un<br />
sistema eléctrico de potencia, dependerá de<br />
los elementos que lo conforman para este fin,<br />
como son, dispositivos de control, regulación,<br />
excitación, protección, elevación y reducción,<br />
por mencionarlos; de los cuales,<br />
algunos permanecen cens<strong>and</strong>o, otros envi<strong>and</strong>o<br />
información sobre el estado y otros oper<strong>and</strong>o<br />
para mantener el sistema dentro de los<br />
parámetros de seguridad.<br />
La base de los sistemas, el<br />
generador<br />
De estos sistemas, el más importante por su<br />
razón de ser, es el generador de corriente<br />
alterna, también conocido como generador<br />
síncrono.<br />
La expresión matemática de una fase del<br />
generador síncrono de polos lisos conforme a<br />
la ley de tensiones de Kirchhoff es:<br />
E = V + ( r + jX ) I [ v ] (1)<br />
AC A d A<br />
y su representación fasorial se muestra en la<br />
figura 1.<br />
En donde:<br />
E A C<br />
: tensión inducida en las bobinas de la<br />
armadura<br />
V: tensión en las terminales del generador<br />
I m<br />
E A C<br />
FM MC<br />
Xd IA<br />
ρ<br />
V<br />
r A I A<br />
R e<br />
I A<br />
FM M A<br />
Figura 1. Representación fasorial de un generador síncrono de polos lisos<br />
136 INGENIERIA Investigación y Tecnología FI-UNAM
H.A. Grajales-Román<br />
I A : corriente de armadura<br />
rA yX<br />
d<br />
: rA<br />
: valor de la resistencia de los<br />
conductores que conforman las bobinas de la<br />
armadura y X d : el valor de la característica de<br />
magnetización que genera la corriente de<br />
armadura en las laminaciones de acero en<br />
donde están alojadas las bobinas.<br />
Esta representación del generador es por<br />
fase, siendo los generadores trifásicos.<br />
El resultado de la expresión (1), E AC<br />
, es un<br />
vector que tiene una dirección determinada<br />
por el ángulo δ. Este ángulo representa en<br />
grados eléctricos la desviación que existe entre<br />
la tensión inducida en las bobinas de la<br />
armadura y la tensión en las terminales de la<br />
máquina.<br />
Por otro lado, del desarrollo de la potencia<br />
aparente se determina la potencia real o<br />
activa que el generador entrega en sus terminales<br />
al sistema eléctrico y que resulta ser<br />
P E V AC<br />
*<br />
= sen δ [ w/fase]<br />
(2)<br />
X<br />
d<br />
La potencia trifásica es la expresión (2)<br />
multiplicada por 3. Como lo muestra la<br />
expresión (2), la potencia que entrega un<br />
generador es directamente proporcional al<br />
producto de la tensión inducida en las<br />
bobinas de la armadura por la tensión en sus<br />
terminales e inversamente proporcional al<br />
valor de la reactancia que separa estas dos<br />
tensiones. La representación de la expresión<br />
(2) es una senoide como se muestra en la<br />
figura 2, y el valor de generación de potencia<br />
máxima se presenta precisamente cu<strong>and</strong>o el<br />
ángulo entre la tensión inducida y la tensión<br />
en el extremo final de la reactancia que las<br />
separa, que es la de las terminales, tiene un<br />
valor de 90°.<br />
Cu<strong>and</strong>o d = 90°<br />
P<br />
MAX<br />
EAC<br />
=<br />
* V<br />
X<br />
d<br />
[ w]<br />
El control que se tiene sobre los generadores<br />
conectados a un sistema o sistemas es<br />
entre otros, el de la velocidad de rotación. Si<br />
un generador aumenta o disminuye su velocidad,<br />
lo mismo lo hace la frecuencia de<br />
generación. La frecuencia en México es de 60<br />
Hertz y se mantiene en toda la red eléctrica.<br />
P n<br />
f = × Hertz<br />
2 60 [ ]<br />
En donde f es la frecuencia, P el número de<br />
polos del rotor y n las revoluciones por<br />
minuto del rotor. Como se mencionó anteriormente,<br />
la ocurrencia de algún tipo de<br />
falla, hace que todo el sistema interconectado<br />
actúe de forma que la sección que circunda la<br />
Figura 2. Curva Ángulo-Potencia de un generador síncrono de polos lisos<br />
Vol.VIII No.3 -julio-septiembre- 2007 137
Aplicación del algoritmo de solución paso-a-paso de la ecuación que determina la estabilidad ...<br />
falla pueda ser aislada eléctricamente. Lo<br />
anterior es de gran trascendencia, puesto que<br />
equivale afirmar que en el tiempo más corto<br />
posible después de ocurrida una falla en<br />
algún punto de la red de suministro, el<br />
sistema continúe activo, logr<strong>and</strong>o equilibrarse<br />
con las máquinas generadoras que continúan<br />
activas y aport<strong>and</strong>o la alimentación<br />
eléctrica lo más estable posible.<br />
Leyes de la dinámica del rotor<br />
Por la relación existente entre la frecuencia<br />
y las revoluciones de giro del rotor, continuamente<br />
se hacen ejercicios y pruebas a<br />
ciertas partes de los sistemas eléctricos. El<br />
más riguroso es precisamente la simulación<br />
de la estabilidad de los generadores interconectados.<br />
Con el apoyo de programas de<br />
computo se simula el comportamiento<br />
dinámico de los generadores, ya sea individualmente<br />
o interconectados, y se analizan<br />
sus resultados para posibles prevenciones.<br />
La transformación de la energía se realiza a<br />
través del rotor del generador. La máquina<br />
primaria aporta su potencia al rotor del<br />
generador y éste, en su rotación alrededor de<br />
las bobinas del estator, induce una tensión<br />
eléctrica que debe ser igual en unidades de<br />
potencia a la aplicada al rotor. La corriente que<br />
dem<strong>and</strong>a la carga es suministrada por el valor<br />
de la excitación de los polos del rotor y de la<br />
potencia de la máquina impulsora. Las tres<br />
corrientes monofásicas generan en el núcleo<br />
del estator un campo magnético giratorio.<br />
Al presentarse una falla en el sistema, la<br />
potencia eléctrica que aporta el generador<br />
sufre un cambio en el campo magnético giratorio<br />
y éste como se separa del eje del rotor,<br />
acciona a favor o en contra del par aplicado<br />
por la máquina impulsora, dependiendo de<br />
la característica de la falla.<br />
Durante el corto tiempo que dura la respuesta<br />
de control sobre el rotor, éste pierde<br />
sincronismo y se va separ<strong>and</strong>o del eje magnético<br />
del campo giratorio.<br />
La diferencia de potencia entre la entrada<br />
y la salida presenta un desequilibrio. Esta<br />
diferencia es, naturalmente, una potencia<br />
acelerante o desacelerante, según sea la magnitud<br />
de la potencia de salida. Así<br />
Pa = Pmec − P [ w ] (3)<br />
eléc<br />
Cu<strong>and</strong>o la potencia eléctrica es mayor a la<br />
mecánica, la potencia eléctrica está fren<strong>and</strong>o<br />
a la máquina impulsora, por lo tanto, es una<br />
potencia desacelerante. Lo contrario a lo<br />
anterior, es una potencia acelerante.<br />
La ecuación matemática que resuelve la<br />
expresión 3, se deriva de los principios de la<br />
cinemática. Sabemos que el trabajo es igual a<br />
fuerza por distancia o en fórmula para trabajo<br />
circular.<br />
T = F × r × θ [ Kg − m − rad]<br />
La diferencial en el tiempo del trabajo es<br />
d<br />
d( T) = τ θ = τω [ Joules]<br />
dt<br />
? es el desplazamiento circular del rotor.<br />
Por otro lado, la energía cinética de un<br />
cilindro macizo es<br />
1 m × r<br />
EC =<br />
2 g<br />
2<br />
2<br />
ω [ Joules]<br />
En donde m es la masa del cilindro en Kg.<br />
y r su radio en metros.<br />
Cu<strong>and</strong>o la velocidad angular aumenta en<br />
dω, el incremento de energ ía cinética es<br />
138 INGENIERIA Investigación y Tecnología FI-UNAM
H.A. Grajales-Román<br />
d( EC) =<br />
m × r<br />
2 ω<br />
d ω [ Joules]<br />
g dt<br />
Puesto que el trabajo realizado es igual al<br />
incremento de energía cinética, podemos<br />
escribir<br />
y<br />
d( T) = d( EC )<br />
τ dθ m × r<br />
2 d<br />
= ω ω<br />
(4)<br />
dt g dt<br />
d<br />
τ = Iω ω = Iα<br />
[ Newtons −m<br />
] (5)<br />
dθ<br />
respecto a una referencia en el estator. Estos<br />
grados irán en aumento a manera que transcurre<br />
el tiempo. Sin embargo, la corriente de<br />
armadura genera un campo magnético que<br />
gira en el estator y es estacionario con<br />
relación al rotor; sin embargo, siguen teniendo<br />
distintas referencias.<br />
Idealmente instalaremos una tercera referencia<br />
en la que las otras dos coincidan<br />
(Figura 3).<br />
θ = ωst<br />
+ δ [ grados ]<br />
En donde<br />
m r<br />
I =<br />
g<br />
× 2<br />
momento de inercia de la masa m[ Kg −m<br />
2<br />
]<br />
α = ω dθ dω<br />
aceleración angular [ rad − seg ]<br />
M = Iω momento angular [ Joules − seg / rad ]<br />
Multiplic<strong>and</strong>o la expresión (5) por la<br />
velocidad angular ? , tendremos la potencia.<br />
Entonces:<br />
τ ω = Pa = Iωα = Mα<br />
[ watts]<br />
2<br />
θ<br />
Pa = Mα<br />
= M d 2 [ watts] (6)<br />
dt<br />
(6) representa el valor de la expresión (3),<br />
por lo que reescribiendo<br />
Pa = M α = P mec − Peléc<br />
[ watts] (7)<br />
θ es en grados geométricos, la posición<br />
que guarda el polo al estar gir<strong>and</strong>o con<br />
2<br />
Figura 3. Determinación del ángulo δ<br />
Deriv<strong>and</strong>o dos veces<br />
dθ dδ<br />
= ω<br />
s<br />
+<br />
dt dt<br />
2 2<br />
d θ d δ<br />
= = α<br />
2 2<br />
dt d t<br />
Entonces podemos escribir (7)<br />
2<br />
M d δ<br />
Pa Pmec Pelé c watts<br />
2 = = − [ ] (8)<br />
dt<br />
Que es la ecuación diferencial que representa<br />
al generador síncrono para un estudio<br />
de estabilidad.<br />
Para diferenciarlos entre varios generadores,<br />
al momento angular o constante de<br />
Vol.VIII No.3 -julio-septiembre- 2007 139
Aplicación del algoritmo de solución paso-a-paso de la ecuación que determina la estabilidad ...<br />
inercia M, hay que definirla con las características<br />
individuales de los generadores.<br />
como<br />
H =<br />
energía almacenadaa vel.<br />
sín crona<br />
poten cia nominal<br />
1<br />
Iω<br />
Energía cinética<br />
H = =<br />
2<br />
S<br />
S<br />
N<br />
S N H = 1 Mω<br />
2<br />
momento cinético en donde ωs es la velocidad<br />
síncrona, despej<strong>and</strong>o<br />
M = 2 H S<br />
ω<br />
S<br />
N<br />
Sustituyendo en (8)<br />
S<br />
N<br />
mega Joules<br />
[<br />
]<br />
rads.<br />
mec<br />
2<br />
2H d δ Pa<br />
1<br />
2 = = ( Pmec<br />
− Pe léc ) [ pu ]<br />
ω dt S S<br />
S<br />
finalmente si<br />
y<br />
M<br />
entonces<br />
N<br />
N<br />
ωS = 2 πf = 3 60 ° f [ ° Eléc]<br />
= 2H ωS<br />
2<br />
mega Joules − seg<br />
en [ ]<br />
° Eléctricos<br />
H d δ<br />
P P watts<br />
2 = mec − eléc [ ] (7)<br />
180 f dt<br />
2<br />
El presente trabajo muestra la solución de<br />
la ecuación de oscilación de un generador<br />
síncrono en un sistema de dos líneas conectadas<br />
en paralelo, a una carga que dem<strong>and</strong>a<br />
la energía que envía el generador,<br />
como se muestra en la figura 5. Apoyándose<br />
en el programa Matlab, se muestra como<br />
resultado la trayectoria del ángulo δ a la<br />
aplicación de una falla sostenida. Traducido a<br />
lenguaje de computadora el algoritmo de<br />
solución paso-a-paso, se pueden realizar<br />
numerosos ensayos en donde se pueden<br />
cambiar los valores de los parámetros involucrados<br />
como la potencia que se transfiere<br />
en el momento de la falla, características del<br />
generador, características de las líneas y<br />
transformadores, tiempos de apertura de los<br />
interruptores que limpian la falla, parámetros<br />
de la carga, etc.<br />
En el estudio de la dinámica del rotor, la<br />
potencia mecánica es considerada constante,<br />
puesto que es la potencia real aplicada al<br />
rotor proveniente de la máquina impulsora y<br />
que éste transforma en energía eléctrica por<br />
medio de la excitación principal y el campo<br />
magnético giratorio. Durante el tiempo de<br />
respuesta del sistema de control de la máquina<br />
impulsora, el rotor del generador se<br />
desliza a valores peligrosos, y es aquí donde<br />
entran en juego las características del sistema<br />
eléctrico en su totalidad.<br />
Una disminución en el par electromagnético,<br />
el par acelerante aumenta. En el tiempo<br />
que tardan los mecanismos de control para<br />
ajustar a la velocidad síncrona, el rotor se<br />
desliza de su posición hacia valores mayores<br />
y alcanzará valores que ponen en crisis la<br />
estabilidad del sistema eléctrico. La solución<br />
de la ecuación dinámica del generador, consiste<br />
en calcular el ángulo δ en función del<br />
tiempo, durante un período suficiente para<br />
determinar si δ crecerá sin límite o alcanza un<br />
máximo y tiende a regresar.<br />
140 INGENIERIA Investigación y Tecnología FI-UNAM
H.A. Grajales-Román<br />
Análisis del método<br />
En el método de integración paso-a-paso para<br />
resolver la ecuación diferencial, que es un<br />
método entre varios existentes, se declara el<br />
más práctico y de buena exactitud, el cual<br />
manifiesta las siguientes suposiciones:<br />
1. La potencia acelerante P a<br />
calculada<br />
al principio de un intervalo es constante<br />
desde la mitad del intervalo anterior hasta la<br />
mitad del intervalo en estudio.<br />
2. La velocidad angular ω, es constante<br />
durante cualquier intervalo calculado a<br />
la mitad del intervalo.<br />
Naturalmente, estas suposiciones no se<br />
cumplen, puesto que δ cambia continuamente,<br />
y por lo tanto, también lo hacen P a<br />
y<br />
?. Si embargo, si los tiempos son lo suficientemente<br />
pequeños, estas consideraciones<br />
son bastante aceptables (Figura 4).<br />
La potencia acelerante es calculada para<br />
los puntos 3, 2 y 1 que son los fines de los<br />
intervalos n-1, n, n+1. La curva de P a<br />
,<br />
representa la suposición de que P a<br />
es constante<br />
en puntos medios de los intervalos<br />
(Figura 4a).<br />
De manera semejante, ? que representa el<br />
exceso de velocidad síncrona ?s, se muestra<br />
como un escalón que es constante durante el<br />
intervalo con valor determinado a la mitad<br />
del mismo. Entre las ordenadas n–3/2 y n–1/2<br />
existe un cambio de velocidad causada por el<br />
valor constante de P a (Figura 4b).<br />
El cambio de δ en cualquier intervalo, es el<br />
producto de ω por el intervalo y el tiempo de<br />
duración del mismo.<br />
El cambio de δ durante el intervalo n-1<br />
(Figura 4c) es<br />
∆δn − 1 = ∆δ n −1 − ∆ δn − 2 = ωsn−3 / 2 ∆t<br />
Pa( n−<br />
1 ) 2<br />
∆δn<br />
= ∆δn<br />
− 1 + ( ∆t) (8)<br />
M<br />
La expresión (8) calcula el cambio de d<br />
durante un intervalo si se conoce su valor en<br />
el intervalo anterior, y la potencia acelerante<br />
en el intervalo precedente. Así, la potencia<br />
acelerante debe calcularse al principio de<br />
cada intervalo para obtener suficientes puntos<br />
de la curva de oscilación.<br />
Estas instrucciones se repiten durante el<br />
proceso de cálculo acomod<strong>and</strong>o la instrucción<br />
correspondiente, según sea el tiempo de<br />
abertura de dos interruptores a la vez o de<br />
dos con diferentes tiempos de operación.<br />
El programa anexo, desarrolla los cálculos<br />
y presenta la respuesta en forma gráfica de<br />
un generador síncrono aport<strong>and</strong>o su potencia<br />
a una carga conectada al final de dos líneas<br />
paralelas, como se muestra la figura 5.<br />
El cambio de velocidad es igual al<br />
producto de la potencia acelerante por el<br />
valor del intervalo. Así<br />
ω'<br />
2<br />
d δ Pa n−<br />
− ω'<br />
n−<br />
= ∆t<br />
=<br />
2<br />
dt M<br />
n−1 / 2 3/<br />
2<br />
( 1 )<br />
∆ t<br />
Vol.VIII No.3 -julio-septiembre- 2007 141
Aplicación del algoritmo de solución paso-a-paso de la ecuación que determina la estabilidad ...<br />
Pa(n-2)<br />
3<br />
calculada<br />
Pa(n-1)<br />
2<br />
s upuesta<br />
Pa(n)<br />
1<br />
P a<br />
n-2 n-1 n<br />
t<br />
a<br />
calc ulada<br />
ω (n-1/2) (n-1/2)<br />
ω (n-3/2) (n-3/2)<br />
ω (n-1/2) (n-3/2) -ω(n-3/2)<br />
supuesta<br />
ω<br />
n-3/2<br />
∆t<br />
t<br />
n-1/2<br />
∆t<br />
t<br />
b<br />
t<br />
δ<br />
∆δn ∈n<br />
∆δn-1 ∈n-1<br />
n-2 n-1<br />
n<br />
Figura 4. Valores reales y supuestos de de ω, δ y Pa<br />
c<br />
t<br />
142 INGENIERIA Investigación y Tecnología FI-UNAM
H.A. Grajales-Román<br />
T1<br />
P<br />
T2<br />
A<br />
B<br />
Xr<br />
G X’d<br />
C<br />
D<br />
T3<br />
F<br />
T4<br />
Figura 5. Diagrama unifilar del Sistema Eléctrico de Potencia<br />
Cada una de las líneas tiene un transformador<br />
elevador y uno reductor en cada<br />
extremo, así como un interruptor que separa<br />
a cada línea de la carga y del generador. Los<br />
parámetros por conveniencia están dados por<br />
unidad, como todos, en base al generador.<br />
Conclusiones<br />
El problema de estabilidad de un generador<br />
síncrono, implica entre varios objetivos, el<br />
análisis del comportamiento de los elementos<br />
físicos que componen una red eléctrica, como<br />
cables que transmiten potencia eléctrica, transformadores<br />
de potencia, características de la<br />
carga eléctrica, así como la cantidad de potencia<br />
transferida del generador a la carga en<br />
el instante de la falla. Por otro lado, la observación<br />
y determinación del ángulo de<br />
potencia que alcanza el rotor, debido a la falla<br />
que determina si el generador pierde sincronismo,<br />
y por tal razón, se desconecta del<br />
sistema. El análisis del deslizamiento del ángulo<br />
delta versus tiempo, determina la velocidad<br />
de respuesta del equipo de control de la<br />
máquina impulsora, así como de los relevadores<br />
de protección de los interruptores de<br />
las líneas y los del generador. Por último, se<br />
genera la intención de dar a conocer un algoritmo<br />
a los interesados en estudios de dinámica.<br />
Información del sistema<br />
El sistema consiste de un generador conectado<br />
a una carga por el extremo de dos líneas<br />
paralelas. Es decir, las líneas son conectadas<br />
en sus extremos por dos barras de donde se<br />
unen, por un lado, el generador y por el<br />
extremo opuesto una carga que dem<strong>and</strong>a la<br />
energía de éste.<br />
Las líneas como protección, cuentan con<br />
un interruptor en sus extremos que las separa<br />
con sus respectivos transformadores de las<br />
barras, en el caso de una falla en ellas.<br />
El generador transfiere, por la diferencia<br />
de potenciales entre la barra del transmisor y<br />
la barra del receptor, un porcentaje de su<br />
potencia, pudiendo ser también el 100%.<br />
En cierto instante, una de las líneas sufre<br />
un desperfecto en el punto F y durante el corto<br />
tiempo que el dispositivo censor instruye<br />
al mecanismo de control de la máquina<br />
impulsora, tal como compuertas o válvulas,<br />
el rotor no tiene freno, que es en sí, la propia<br />
carga eléctrica, por lo que se sale de sincronismo.<br />
La falla es de las llamadas sostenidas, de<br />
tal manera que la malla eléctrica se ve<br />
modificada por la reestructuración que se<br />
dio al aislar la falla y la sobrante continúa<br />
activa sin aislar al generador. La falla<br />
ocurre a la mitad de la línea que une los<br />
interruptores C y D.<br />
El problema que se presenta es un ejemplo<br />
de muchos, en donde los parámetros son<br />
Vol.VIII No.3 -julio-septiembre- 2007 143
Aplicación del algoritmo de solución paso-a-paso de la ecuación que determina la estabilidad ...<br />
tales que el rotor no se desliza, sino que<br />
retoma en cierto tiempo su posición original.<br />
El interesado puede variar los parámetros<br />
sugeridos en este trabajo y comprobar por su<br />
cuenta, con datos propios.<br />
Datos del problema<br />
S: potencia aparente nominal del generador:<br />
100000000 VA<br />
V: tensión nominal del generador:13800<br />
volts.<br />
X´d: reactancia transitoria del generador:<br />
0.476 pu<br />
fp: factor de potencia: 0.9<br />
f: frecuencia: 60 Hertz<br />
H: constante de inercia: 7.0 mega-Jouls<br />
/MVA<br />
p: potencia transferida: 0.95 pu<br />
XL: reactancias de las líneas: 0.3465 pu<br />
XT: reactancias de los transformadores:<br />
0.293 pu<br />
%V: tensión en por ciento del nodo de la<br />
carga: 0.9 pu<br />
Xr: reactancia en el nodo de carga: 0.476 pu<br />
t1: 1er tiempo de abertura:0.08 seg<br />
t2: 2º tiempo de abertura: 0.12 seg<br />
tf: tiempo de duración :0.20 seg<br />
Curva de oscilación del rotor de<br />
un generador de polos lisos como<br />
respuesta a una falla de un<br />
sistema eléctrico de potencia<br />
Con la información solicitada por el programa<br />
y ya aplicado “enter” en la pantalla de<br />
trabajo, aparecen en el orden siguiente los<br />
valores calculados de: Vn, In, Ia, fp, Xe1, Eac,<br />
delta y P11, tensión nominal, corriente nominal,<br />
corriente de armadura, factor de<br />
potencia, reactancia equivalente antes de la<br />
falla, tensión inducida, ángulo de fase y<br />
potencia eléctrica antes de la falla. Xe2 y P22<br />
reactancia equivalente y potencia eléctrica<br />
durante la falla y Xe3 y P33, reactancia y<br />
potencia eléctrica después de la falla. Los<br />
tiempos de apertura de los interruptores<br />
deben ser mayores a 0.01 y además múltiplos<br />
a éste. Se estima que el valor final del estudio<br />
es suficiente (Gráfica 1).<br />
Gráfica 1<br />
144 INGENIERIA Investigación y Tecnología FI-UNAM
H.A. Grajales-Román<br />
Programa de cómputo<br />
Vol.VIII No.3 -julio-septiembre- 2007 145
Aplicación del algoritmo de solución paso-a-paso de la ecuación que determina la estabilidad ...<br />
Referencias<br />
Luthe A., Olivera A., Schutz F. (1985).<br />
Métodos numéricos. Limusa, México,<br />
pp. 215-220.<br />
Stevenson W.D. Jr. (1982). Elements of<br />
Power System Anal ysis. Inter na tional<br />
Student Edition, México, pp. 409-416.<br />
Enriquez H.G.(1982). Sistemas eléctricos de<br />
potencia. Limusa, México, pp. 184-191.<br />
Semblanza del autor<br />
Hugo Alfredo Grajales-Román. Obtuvo la licenciatura en ingeniería mecánica eléctrica en la Facultad de Ingeniería<br />
de la UNAM. Realizó estudios de posgrado en la Universidad de Houston Texas, EE.UU. y en la entonces<br />
División de Estudios Superiores de la FI, UNAM. En México, dentro de la Comisión Federal de Electricidad<br />
laboró como ingeniero de puestas en servicio de plantas, así como asesor en la adquisición de equipo para<br />
plantas. Fue investigador comisionado en el Instituto de Ingeniería, UNAM con la realización de un proyecto<br />
para Centro Nacional de Control de Energía, CENACE. Fue gerente de operación y planeación de plantas en<br />
Tabacos Mexicanos. Ha sido profesor durante 31 años en la Facultad de Ingeniería, UNAM.<br />
146 INGENIERIA Investigación y Tecnología FI-UNAM
INGENIERÍA Investigación y Tecnología VIII. 3. 147-155, 2007<br />
(artículo arbitrado)<br />
Imaginología por resonancia magnética y la<br />
determinación de cloruro y sodio en mortero<br />
de cemento Pórtl<strong>and</strong><br />
P.F. de J. Cano-Barrita 1 , B. J. Balcom 2 y T.W. Bremner 3<br />
1<br />
CIIDIR-Oaxaca, Instituto Politécnico Nacional de México, Oaxaca.<br />
2<br />
2MRI Centre, Physics Department, University of New Brunswick, Fredericton, NB, Canada<br />
3 Civil Engineering Department, University of New Brunswick, Fredericton, NB, Canada<br />
E-mails: pcano@ipn.mx, bjb@unb.ca y bremnert@unb.ca<br />
(Recibido: marzo de 2006; aceptado: diciembre de 2006)<br />
Resumen<br />
La corrosión del acero de refuerzo es una de las causas principales del deterioro<br />
de estructuras de concreto. La penetración de cloruros a través de difusión o<br />
absorción capilar o una combinación de ambos, contribuye de manera importante<br />
en la corrosión del acero de refuerzo. En países con clima frío, las sales<br />
descongelantes usadas en invierno son un factor importante en el deterioro de<br />
estructuras, y en muchos países, los cloruros del agua de mar exacerban el<br />
proceso de deterioro. Para evaluar la distribución de cloruros en concreto,<br />
normalmente se utilizan métodos destructivos, cuya resolución espacial es baja y<br />
consumen una cantidad consid er able de tiempo. Una alternativa no destructiva<br />
es el uso de la técnica SPRITE de resonancia magnética, la cual ha demostrado ser<br />
conveniente para determinar la distribución de diferentes especies en materiales<br />
basados en cemento Pórt l<strong>and</strong>. En este artículo se demostrará la habilidad de la<br />
técnica SPRITE para determinar la distribución de cloruros y sodio en mortero,<br />
durante absorción capilar y difusión. Además, los experimentos preliminares<br />
indican que la técnica puede ser utilizada para determinar la distribución de<br />
cloruros en mortero y concreto, conteniendo cemento ordinario. Esto abre la<br />
posibilidad de estudiar la distribución de cloruros en corazones de concreto<br />
extraídos de estructuras reales.<br />
Descriptores: Resonancia magnética, cloruros, no destructivo, difusión, absorción<br />
capilar, mortero.<br />
Abstract<br />
Cor ro sion of the re in force ment is one of the main causes of de te ri o ra tion of con crete<br />
struc tures. Chlo ride pen e tra tion into con crete due to ei ther dif fu sion or ab sorp tion is an<br />
im por tant con trib u tor to the cor ro sion of em bed ded steel in con crete. In north ern coun -<br />
tries, deicing salts are a ma jor fac tor in the de te ri o ra tion of high ways <strong>and</strong> in all coun -<br />
tries, chlo rides from sea wa ter ex ac er bate the de te ri o ra tion pro cess. In or der to as sess the<br />
chlo ride pen e tra tion, de struc tive, low spa tial res o lu tion <strong>and</strong> time con sum ing meth ods<br />
are rou tinely used. The SPRITE Mag netic Res o nance Im aging is a non-destructive<br />
tech nique that has dem on strated to be suit able to im age ma te ri als pos sess ing short life -<br />
time sig nals in clud ing Pórt l<strong>and</strong> ce ment based ma te ri als. This pa per will dem on strate<br />
the abil ity of SPRITE MRI to de ter mine the dis tri bu tion of chlo rides in mor tar dur ing<br />
NaCl so lu tion cap il lary ab sorp tion or dif fu sion. In ad di tion, pre lim i nary ex per i ments
Imaginología por resonancia magnética y la determinación de cloruro y sodio en mortero de ...<br />
in di cate that the tech nique can be used to im age the dis tri bu tion of chlo rides in con -<br />
crete/mor tar con tain ing nor mal Port l<strong>and</strong> ce ment, which makes it pos si ble to study<br />
the pen e tra tion of chlo rides in cores taken from field con crete.<br />
Key words: Mag netic res o nance, chlo rides, non-destructive, dif fu sion, cap il lary ab -<br />
sorp tion, mor tar.<br />
Intro duc ción<br />
La determinación de la profundidad de penetración<br />
y distribución de cloruros en<br />
materiales basados en cemento Pórtl<strong>and</strong>, es<br />
importante desde el punto de vista de durabilidad<br />
de estructuras de concreto reforzado.<br />
El ingreso de cloruros, a través de procesos<br />
de difusión y absorción capilar, puede depasivar<br />
la capa protectora sobre el acero de<br />
refuerzo y causar corrosión del mismo.<br />
La manera usual de determinar la profundidad<br />
de penetración o la distribución de<br />
cloruros en concreto, implica destruir el espécimen.<br />
Las técnicas comunes requieren obtener<br />
muestras de polvo a diferentes profundidades<br />
y mediante procedimientos de<br />
titulación química se determina la concentración<br />
de cloruros. Otra prueba sólo requiere<br />
aplicar una solución (por ejemplo, nitrato de<br />
plata) sobre un espécimen recién fracturado<br />
para determinar la profundidad de penetración<br />
de cloruro (Otsuki et al., 1992). El primer<br />
procedimiento proporciona un perfil con<br />
resolución espacial baja y es inherentemente<br />
destructivo. Sin embargo, con dispositivos<br />
adecuados es posible aumentar la resolución<br />
al obtener muestras de polvo a distancias de<br />
unos cuantos milímetros, aunque el problema<br />
de destruir el espécimen persiste. El<br />
segundo procedimiento sólo proporciona la<br />
profundidad de penetración de los cloruros y<br />
el perfil de concentración se desconoce.<br />
La resonancia magnética ha sido utilizada<br />
con éxito para determinar en forma no destructiva<br />
la distribución de agua, cloruros y<br />
sodio en materiales de construcción. Pel et al.<br />
(2000), realizaron un estudio de la penetración<br />
de solución de NaCl en ladrillo de silicato<br />
de calcio; sin embargo, la técnica tradicional<br />
de resonancia magnética utilizada<br />
tiene limitaciones en cuanto a la vida de la<br />
señal, T2 * , y sólo pudieron obtenerse perfiles<br />
de sodio y agua. Cano et al . (2002) obtuvieron<br />
los primeros perfiles de cloruros, sodio y<br />
agua en mortero de cemento portl<strong>and</strong> blanco<br />
durante absorción capilar de una solución de<br />
NaCl. En esta investigación se utilizó cemento<br />
Pórtl<strong>and</strong> blanco, debido a su bajo contenido<br />
de hierro, lo cual era necesario para<br />
determinar la distribución de agua, pero normalmente<br />
el utilizado en la práctica contiene<br />
cemento Pórtl<strong>and</strong> ordinario y adiciones<br />
minerales (ceniza volante, humo de sílice,<br />
escoria de alto horno, etc.) que incrementan<br />
sustancialmente la cantidad de impurezas<br />
paramagnéticas en la muestra.<br />
Este artículo presentará los resultados del<br />
uso de la técnica de resonancia magnética<br />
SPRITE para determinar la distribución de<br />
cloruros y sodio en mortero que contiene<br />
cemento Pórtl<strong>and</strong> ordinario durante absorción<br />
capilar de una solución de NaCl.<br />
También se determinó la distribución de<br />
cloruro y sodio durante difusión. Es importante<br />
mencionar que el uso de materiales<br />
con bajo contenido de hierro no es necesario<br />
en el caso de 35 Cl y 23 Na, como en la determinación<br />
de la distribución de 1 H del<br />
agua. Esto significa que en concreto el fabricado<br />
con varios tipos de cemento Pórtl<strong>and</strong>, la<br />
mayoría de los tipos de agregados pueden ser<br />
utilizados.<br />
148 INGENIERIA Investigación y Tecnología FI-UNAM
P.F. de J. Cano-Barrita, B. J. Balcom y T.W. Bremner<br />
Técnica Sprite (Single Point<br />
Ramped Imaging With T1<br />
Enhance ment)<br />
Detalles de la técnica SPRITE pueden obtenerse<br />
en Balcom et al. (1996). La intensidad de<br />
la señal, S, en cualquier punto de una imagen<br />
uni-dimensional (perfil), se relaciona con la<br />
densidad de núcleos local, por medio de la<br />
ecuación (1).<br />
T R<br />
tp ⎛<br />
−<br />
−<br />
T1<br />
T ⎜<br />
2 * 1 − e<br />
S= ρ ⋅ e ⋅<br />
⎜<br />
⎝ 1 −cosα<br />
⋅e<br />
−<br />
TR<br />
T1<br />
⎞<br />
⎟<br />
⋅sin α (1)<br />
⎟<br />
⎠<br />
donde tp es el tiempo de codificación de la<br />
fase, T2 * es el tiempo de relajación “spinspin”,<br />
TR es el tiempo de la repetición de los<br />
pulsos de radio frecuencia, α es el ángulo de<br />
rotación de la magnetización y T1 es el tiempo<br />
de relajación “spin-lattice”. En la ecuación (1)<br />
el término entre paréntesis representa el<br />
estado constante de la magnetización longitudinal<br />
establecido después de varios pulsos<br />
de radio frecuencia y es válido sólo para el<br />
hidrógeno del agua que tiene “spin” I=1/2.<br />
Este término tendrá una representación más<br />
compleja para el sodio y núcleos del cloro que<br />
tienen “spin” I=3/2 (Mitrovic et al., 2001). Esta<br />
técnica se representa esquemáticamente en la<br />
figura 1.<br />
Procedimiento exper i mental<br />
En la preparación de morteros con relación<br />
a/c=0.60 se utilizó agregado de cuarzo, cemento<br />
Pórtl<strong>and</strong> blanco y ordinario Tipo I. En<br />
el cuadro 1 se proporcionan las propiedades<br />
físicas y químicas de los cementos usados. Se<br />
fabricaron cilindros de 30 mm de diámetro y<br />
se curaron en húmedo durante tres días a<br />
38 o C. Después, los especimenes se cortaron a<br />
una longitud de 30 mm y se secaron en horno<br />
a 105 o C hasta masa constante. Finalmente, en<br />
la superficie cilíndrica se aplicó resina epóxica<br />
para hacer la penetración de la solución de<br />
NaCl uniaxial (Figura 2).<br />
Figura 1. La técnica SPRITE uni-dimensional. El gradiante del campo magnético es cambiado en 64<br />
pasos. Solo un punto es adquirido en cada cambio del gradiante a un tiempo tp después de la aplicación de<br />
cada pulso de radio de frecuencia de radio, con ángulo α. El tiempo de repetición, TR, es el tiempo entre<br />
la aplicación de pulsos de radio frecuencia en cada cambio de gradiente<br />
Vol.VIII No.3 -julio-septiembre- 2007 149
Imaginología por resonancia magnética y la determinación de cloruro y sodio en mortero de ...<br />
Cuadro 1. Propiedades físicas y químicas del cemento ordinario y blanco<br />
Figura 2. Arreglo utilizado para la prueba de absorción uniaxial de solución de NaCl y difusión en<br />
especimenes de mortero. Los experimentos de absorción capilar se llevan a cabo a la temperatura ambiente<br />
y los especimenes usados para difusión se mantuvieron dentro de una cámara ambiental a 38°C<br />
Se realizaron experimentos para determinar<br />
los tiempos de relajación T2 * y T1 de 1 H, 23 Na<br />
y 35 Cl en los especimenes estudiados. Los<br />
perfiles de distribución se obtuvieron con la<br />
técnica SPRITE utiliz<strong>and</strong>o un magneto superconductor<br />
Nalorac (Martinez, CA) de 2.4<br />
Tesla, 32 cm de diámetro interior, con un<br />
micro-gradiente de 8 cm de diámetro interior<br />
enfriado con agua. Se utilizó un emisor/receptor<br />
de radio frecuencia tipo jaula (Morris<br />
Instruments, Ottawa) para la determinación<br />
de 1 H, así como un nuevo diseño para el caso<br />
de 23 Na y 35 Cl. La consola del espectrómetro<br />
fue una Tecmag (Houston, TX) Apolo. El amplificador<br />
de radio frecuencia fue el modelo<br />
3445 (Brea, CA) de 2 Kw de potencia.<br />
Los especimenes usados para la absorción<br />
capilar de solución de NaCl se colocaron en<br />
un recipiente poco profundo y se permitió<br />
absorber la solución en un extremo. La<br />
concentración de NaCl en el recipiente fue de<br />
200 g/L, la cual es aproximadamente seis<br />
veces el de NaCl en agua de mar. Se<br />
150 INGENIERIA Investigación y Tecnología FI-UNAM
P.F. de J. Cano-Barrita, B. J. Balcom y T.W. Bremner<br />
realizaron mediciones con la técnica SPRITE<br />
para observar la penetración de 23 Na (Na + ), y<br />
35 Cl (Cl - ). Debe mencionarse que 37 Cl no<br />
contribuyen a la señal porque su frecuencia<br />
de resonancia es diferente de la de 35 Cl. La<br />
abundancia natural de cada uno es 24.47% y<br />
75.53%, respectivamente.<br />
Un arreglo similar al mostrado en figura 2<br />
fue usado para los experimentos de difusión<br />
de Na + y Cl - en especimenes de mortero de<br />
cemento Pórtl<strong>and</strong> blanco. Dos especimenes<br />
idénticos saturados con agua fueron puestos<br />
en contacto con una solución de NaCl al 20%.<br />
Las medidas de SPRITE uni-dimensionales se<br />
realizaron semanalmente por un período de<br />
seis semanas.<br />
En cada experimento, una referencia<br />
conteniendo solución de NaCl se colocó sobre<br />
el espécimen para permitir escalar los perfiles<br />
y compensar por variaciones pequeñas en la<br />
sensibilidad del instrumento (Figura 2).<br />
Resultados y discusión<br />
Tiempos de relajación<br />
Los tiempos de relajación T1 y T2 * para 1 H,<br />
23Na y 35 Cl en mortero a 72 horas de iniciado<br />
el experimento, se muestran en el cuadro 2.<br />
Ambos tiempos son menores de 5 ms, lo que<br />
hace a SPRITE una técnica requerida para<br />
obtener imágenes de estas especies. Los<br />
tiempos de relajación T1 y T2 * son exponencial<br />
simple, salvo los T2 * para el sodio y cloruro<br />
que tienen dos componentes. Note que los<br />
tiempos de relajación en mortero que contiene<br />
cemento ordinario son del mismo orden<br />
de magnitud comparado a los especimenes<br />
que contienen cemento blanco. Esto indica<br />
que los mecanismos de relajación dominantes<br />
en 23 Na y 35 Cl son diferentes a los que se<br />
tienen en la relajación de 1 H del agua, cuya<br />
relajación es rápida y no puede observarse<br />
fácilmente con el equipo disponible en el<br />
laboratorio.<br />
Cuadro 2. Tiempos de relajación T 1<br />
y T 2<br />
* para 1H, 23Na y 35Cl en especimenes de mortero fabricado con<br />
cemento Pórtl<strong>and</strong> blanco y ordinario<br />
Vol.VIII No.3 -julio-septiembre- 2007 151
Imaginología por resonancia magnética y la determinación de cloruro y sodio en mortero de ...<br />
Difusión de 23 Na y 35 Cl en mortero de<br />
cemento Pórtl<strong>and</strong> blanco<br />
Las figuras 3 y 4 muestran la distribución de<br />
Cl - y Na + , respectivamente, obtenida en dos<br />
especimenes idénticos preparados con cemento<br />
Pórtl<strong>and</strong> blanco. Nótese que los resultados<br />
en ambas figuras son muy similares,<br />
como es de esperarse. En éstas figuras puede<br />
observarse que la concentración en la cara en<br />
contacto con la solución de NaCl aumenta<br />
durante la primera semana de exposición.<br />
Después de este período, la concentración en<br />
la cara permanece casi constante y sólo la<br />
profundidad de penetración aumenta con el<br />
tiempo.<br />
Los coeficientes de difusión efectivos<br />
fueron estimados ajust<strong>and</strong>o los datos que<br />
corresponden a los perfiles obtenidos después<br />
de tres semanas, mostrados en figuras 3<br />
y 4 a la ecuación 2, que es la solución a la<br />
segunda ley de difusión de Fick (Cranck,<br />
1975). Normalmente, se ajustan perfiles de<br />
concentración del cloruro a esta ecuación<br />
para encontrar los C0 y los Deff (Crack, 1975,<br />
Andrade et al., 2000).<br />
Figura 3. Distribución de 35 C1 en dos especimenes idénticos de mortero blanco w/c=0.60 a 1 semana ( Ο ), 2<br />
semanas ( ¨), 3 semanas (r), 4 semanas (¯ ) y 6 semanas ( s). Los parámetros usados para la técnica SPRITE<br />
fueron: FOV=200 mm, resolución nominal=1.6 mm, Gmax=25.6 G/cm, TR=2 ms, el t p=150 µ s, ángulo α=44°,<br />
scans=8192 y tiempo de adquisición=20.7 minutos<br />
Figura 4. Distribución de 23 Na en dos especimenes de mortero blanco w/c=0.60 a 1 semana ( ) Ο , 2<br />
semanas ( ¨), 3 semanas ( r), 4 semanas (¯) y 6 semanas (s ). Los parámetros usados para la técnica<br />
SPRITE fueron: FOV=200 mm, resolución nominal=1.6 mm, Gmax=9.5 G/cm, TR=2 ms, el tp=150 µs,<br />
ángulo α=49°, scans=2048 y tiempo de adquisición=7.4 minutos<br />
152 INGENIERIA Investigación y Tecnología FI-UNAM
P.F. de J. Cano-Barrita, B. J. Balcom y T.W. Bremner<br />
C( x, t ) ⎛<br />
= 1 − erf ⎜<br />
C ⎜<br />
0<br />
⎝<br />
x<br />
4 D<br />
eff<br />
⎞<br />
⎟<br />
t ⎟<br />
⎠<br />
(2)<br />
El resultado fue Deff = 1.7x10 -11 m 2 /s para<br />
ambos especimenes. El coeficiente de difusión<br />
correspondiente para sodio fue Deff =<br />
1.5x10 -11 m 2 /s. De la literatura, el coeficiente<br />
de difusión de cloruro para concreto con<br />
relación a/c=0.60 y curado en húmedo durante<br />
28 días es aproximadamente 1.8x10 -12<br />
m 2 /s (Nilsson et al ., 2000), y para concreto con<br />
relación a/c=0.58 y curado en húmedo durante<br />
28 días es aproximadamente 5.2x10 -11<br />
m 2 /s (Bamforth, 1993). Los valores de estos<br />
autores sólo sirven para ilustrar el orden de<br />
magnitud, porque los especimenes usados<br />
para resonancia magnética se hicieron de<br />
mortero y las condiciones de curado también<br />
fueron diferentes.<br />
Absorción capilar de una solución<br />
de NaCl en mortero de cemento<br />
Pórtl<strong>and</strong> ordinario<br />
Las figuras 5 y 6 muestran los perfiles de<br />
cloruro y sodio, respectivamente, obtenidos<br />
en especimenes de mortero elaborado con<br />
cemento ordinario durante absorción capilar<br />
de solución de NaCl. Este es un resultado<br />
muy importante de los experimentos, ya que<br />
es posible obtener perfiles del cloruro libre y<br />
distribución de sodio en mortero que contiene<br />
cemento ordinario<br />
Esto hace de la resonancia magnética una<br />
poderosa herramienta para determinar la<br />
distribución de cloruros y la profundidad de<br />
penetración en concreto ordinario en laboratorio<br />
y en corazones extraídos de estructuras<br />
en campo. Además, su naturaleza no<br />
destructiva permite monitorear el mismo<br />
espécimen sin perturbar los procesos que<br />
ocurren dentro del mismo.<br />
Otra área importante de aplicación de esta<br />
técnica podrá ser la validación de modelos<br />
matemáticos que predicen el ingreso de cloruros<br />
en concreto (Mangat, 1994, March<strong>and</strong>,<br />
2001). Aunque no se probaron especimenes de<br />
concreto que contienen aditivos minerales, no<br />
representará un problema, dado que la cantidad<br />
de hierro no es tan importante cu<strong>and</strong>o los<br />
cloruros son los núcleos de interés.<br />
Figura 5. Distribución de 35 C1 en mortero elaborado con cemento ordinario a/c=0.60 a 3h (◦), 9h (¨), 2<br />
días ( s) y 5 días ( ¯). Los parámetros usados para la técnica SPRITE fueron: FOV=100 mm, resolución<br />
nominal=1.6 mm, G max=25.6 G/cm, TR=2 ms, el tp=300 µs, ángulo α=44°, scans=8192 y tiempo de<br />
adquisición=20.7 minutos<br />
Vol.VIII No.3 -julio-septiembre- 2007 153
Imaginología por resonancia magnética y la determinación de cloruro y sodio en mortero de ...<br />
Figura 6. Distribución de 23 Na en mortero elaborado con cemento ordinario a/c=0.60 a 2.5h (◦), 8h (¨),<br />
2 días (s) y 5 días (¯). Los parámetros usados para la técnica SPRITE fueron: FOV=100 mm,<br />
resolución nominal=1.6 mm, Gmax=9.5 G/cm, TR=2 ms, el tp=300 µ s, ángulo α=49°, scans=2048 y<br />
tiempo de adquisición=7.4 minutos<br />
Conclusiones<br />
La técnica SPRITE desarrollada en el Centro<br />
de Resonancia Magnética de UNB puede<br />
utilizarse para determinar la distribución de<br />
cloruros, sodio, y otros núcleos de interés en<br />
investigación relacionada con materiales basados<br />
en cemento. La determinación no-destructiva<br />
de la distribución del cloruro libre en<br />
mortero que contenga no sólo cemento blanco,<br />
sino también cemento ordinario, es posible.<br />
Los resultados obtenidos con cemento<br />
del Pórtl<strong>and</strong> ordinario indican que el contenido<br />
de hierro no es un factor limitante para<br />
determinar perfiles de cloruros, por lo tanto,<br />
pueden utilizarse también especimenes de<br />
concreto extraído en campo.<br />
Mejoras en el equipo y en las técnicas tienen<br />
lugar en el Centro de Resonancia Magnética<br />
de la Universidad de New Brunswick,<br />
lo cual permitirá aumentar la sensibilidad de<br />
las mediciones y probablemente se podrán<br />
utilizar concentraciones de las solución de<br />
NaCl similar a las del agua de mar (aproximadamente<br />
3.5%).<br />
Debe mencionarse que aun cu<strong>and</strong>o la determinación<br />
de la distribución de cloruros es<br />
no-destructiva, existe la necesidad de extraer<br />
una muestra de la estructura.<br />
Trabajo futuro será necesario para establecer<br />
una correlación de las medidas realizada<br />
us<strong>and</strong>o resonancia magnética y la cantidad<br />
de cloruros determinadas por métodos<br />
estándar de la ASTM.<br />
Agradecimientos<br />
Balcom B.J. agradece los apoyos de NSERC<br />
para operación y equipo, así como de la<br />
NSERC Steacie Fellowship 2000-2002. También<br />
agradece al programa Canadá Chair.<br />
Cano-Barrita P.F. de J., agradece el apoyo<br />
financiero recibido del Instituto Politécnico<br />
Nacional de México y el CONACyT México.<br />
Referencias<br />
Andrade C., Sagrera J.L. <strong>and</strong> Sanjuan<br />
M.A. (2000). Several Years Study on<br />
Chlo ride Ion Pene tra tion into Concrete<br />
154 INGENIERIA Investigación y Tecnología FI-UNAM
P.F. de J. Cano-Barrita, B. J. Balcom y T.W. Bremner<br />
Exposed to Atlantic. Proceed ings of<br />
the 2 nd Inter na tional RILEM Work shop<br />
on Testing <strong>and</strong> Modeling the Chlo ride<br />
Ingress into Concrete, Paris, France,<br />
pp. 121-133.<br />
Balcom B.J., MacGregor R.P., Beyea S.D.,<br />
Green D.P., Armstrong R.L. <strong>and</strong><br />
Bremner T.W. (1996). Single Point<br />
Ramped Imaging with T1 Enhance -<br />
ment (SPRITE). Journal of Magnetic<br />
Reso nance, Series A 123, pp. 131-134.<br />
Bamforth P. (1993). Concrete Clas si fi ca tion<br />
for R.C. Struc tures Exposed to Marine<br />
<strong>and</strong> Other Salt-Laden Envi ron ments.<br />
Struc tural Faults <strong>and</strong> Repair-93,<br />
Edinburg.<br />
Cano F. de J., Bremner T.W., McGregor<br />
R.P. <strong>and</strong> Balcom B.J. (2002). Magnetic<br />
Reso nance Imaging of 1 H, 23 Na, <strong>and</strong><br />
35 Cl Pene tra tion in Port l<strong>and</strong> Cement<br />
Mortar. Cement <strong>and</strong> Concrete Research ,<br />
32 (7), pp. 1067-1070.<br />
Crank J. (1975). The Math e matics of Diffu -<br />
sion. 2nd Edn (Clar endon, Oxford).<br />
March<strong>and</strong> J. (2001). Modeling the Behavior<br />
of Unsat u rated Cement Systems<br />
Exposed to Aggres sive Chem ical Environments.<br />
Mate rials <strong>and</strong> Struc tures, 34,<br />
pp. 195-200.<br />
Mitrovic V.F., Sigmund E.E. <strong>and</strong> Halperin<br />
W.P. (2001). Progres sive Satu ra tion<br />
NMR Relax ation. Phys ical Review B , 64,<br />
pp. 1-7.<br />
Nilsson L., Andersen A., Luping T. <strong>and</strong><br />
Utgenannt P. (2000). Chlorides Ingress<br />
Data from Field Expo sure in a Swedish<br />
Road Envi ron ment. Proceed ings of the<br />
2 nd Inter na tional RILEM Work shop on<br />
Testing <strong>and</strong> Modeling the Chlo ride<br />
Ingress into Concrete, Paris, France,<br />
pp. 69-83.<br />
Otsuki N., Nagataki S. <strong>and</strong> Nakashita K.<br />
(1992). Eval u a tion of AgNO 3 Solu tion<br />
Spray Method for Measure ment of<br />
Chlo ride Pene tra tion into Hardened<br />
Cementitious Matrix Mate rials. ACI<br />
Mate rials, 89 (3), pp. 587-592.<br />
Pel L., Kopinga K. <strong>and</strong> Kaasschieter E.F.<br />
(2000). Saline Absorp tion in Calcium-<br />
Sili cate Brick Observed by NMR Scanning.<br />
Journal of Physics D; Applied<br />
Physics, 33, pp. 1380-1385.<br />
Semblanza de los autores<br />
P. Felipe de Jesus Cano-Barrita. Es miembro del Amer ican Concrete Insti tute (ACI) y del Instituto Mexicano del<br />
Cemento y del Concreto (IMCYC). En 2003, obtuvo su doctorado en ingeniería civil en la Universidad de New<br />
Bruns wick, Canadá. Actualmente es investigador en el CIIDIR Oaxaca del Instituto Politécnico Nacional de<br />
México y miembro del SNI nivel 1. Su investigación se relaciona con el uso y durabilidad del concreto ordinario<br />
y de alto desempeño en climas cálidos, uso de polímeros naturales, puzolanas artificiales, concreto<br />
autoconsolidante, así como desarrollo y aplicación de ferrocemento en el diseño y construcción de estructuras<br />
prefabricadas ligeras.<br />
Theo dore W. Bremner. Es miembro del ACI, así como profesor investigador honorario de ingeniería civil en la<br />
Universidad de New Bruns wick, Canada. Fue pres i dente del Capítulo Atlántico del ACI. Recibió la medalla<br />
ACI Cedric Willson por su investigación en concreto ligero y fue pres i dente de los comités ACI<br />
213-Lightweight Aggre gate Concrete y ACI 122-Energy Conser va tion.<br />
B.J. Balcom. Es profesor investigador del departamento de física y director del Centro de Resonancia Magnética de<br />
la Universidad de New Bruns wick. Recibió una NSERC Steacie Fellow ship (2000-2002) y Canada Research<br />
Chair in MRI of Mate rials. Sus principales intereses en investigación son el desarrollo de técnicas de<br />
imaginología por resonancia magnética y su aplicación a ciencia de materiales.<br />
Vol.VIII No.3 -julio-septiembre- 2007 155
INGENIERÍA Investigación y Tecnología VIII. 3. 157-180, 2007<br />
(artículo arbitrado)<br />
Descripción del nuevo estándar de video H.264<br />
y comparación de su eficiencia de codificación<br />
con otros estándares<br />
H.de J. Ochoa-Domínguez, J.Mireles-García, J. de D. Cota-Ruíz<br />
Departamento de Ingeniería Eléctrica y Computación<br />
Instituto de Ingeniería y Tecnología de la Universidad Autónoma de Ciudad Juárez<br />
E-mail: hochoa@uacj.mx<br />
(Recibido: septiembre de 2005; aceptado: diciembre de 2006)<br />
Resumen<br />
Los estándares de video han sido desarrollados con el fin de satisfacer una<br />
amplia gama de aplicaciones, como son: el almacenamiento digital, transmisión<br />
y recepción de multi media, CATV, DVD, video conferencia, indexado de multi -<br />
media, cinema digital, entre otras. Los estándares de video logran una alta<br />
compresión utiliz<strong>and</strong>o varios métodos que explotan las redundancias temporal<br />
y espacial. El nuevo estándar de video H.264/MPEG-4 parte 10, no sólo es<br />
eficiente para el almacenamiento de video, sino que también proporciona un<br />
alto rendimiento en compresión y es más robusto a errores de transmisión que<br />
sus antecesores MPEG-2, H.263 y MPEG-4 parte 2. El presente artículo describe<br />
al estándar H.264/MPEG-4 parte 10. Primero se describe el algoritmo de<br />
codificación y posteriormente se compara su eficiencia de la codificación contra<br />
otros estándares anteriores existentes. Las comparaciones demuestran que el<br />
H.264 tiene una eficiencia de codificación de aproximadamente 1.5 veces mayor,<br />
en cada secuencia de prueba, con relación a otros estándares.<br />
Descriptores: Codificación de video, CAVLC, CABAC, H.264, MPEG4 parte 10,<br />
NAL, predicción intra cuadro, predicción ínter cuadro, filtro de desbloqueo.<br />
Abstract<br />
Video stan dards have been de vel oped to ful fill a wide range of ap pli ca tions such as dig i -<br />
tal stor age, mul ti me dia trans mis sion <strong>and</strong> re cep tion, CATV, DVD, video conferencing,<br />
mul ti me dia in dex ing, dig i tal cin ema among oth ers. Video stan dards de velop high com -<br />
pres sion ra tios us ing sev eral meth ods to re duce tem po ral <strong>and</strong> spa tial re dun dan cies. The<br />
new video stan dard, H.264 / MPEG-4 part 10, not only is ef fi cient to store video but<br />
also to ob tain a higher cod ing ef fi ciency <strong>and</strong> er ror re sil ience than the pre vi ous sim i lar<br />
stan dards MPEG-2, H.263 <strong>and</strong> MPEG-4 part 2. In this ar ti cle, we de scribe the new<br />
video stan dard H.264/MPEG-4 part 10. First, we de scribe the cod ing al go rithm, <strong>and</strong><br />
then we com pare its cod ing ef fi ciency ver sus the pre vi ous ex ist ing stan dards. Com par i -<br />
sons show that the new stan dard has a cod ing ef fi ciency of about 1.5 times, in each test<br />
se quence, as com pared to the other stan dards.<br />
Key words: Video cod ing, H.264, Intra cod ing, inter cod ing, CAVLC, CABAC,<br />
MPEG4 part 10, NAL, deblocking fil ter.
Descripción del nuevo estándar de video H.264 y comparación de su eficiencia de ...<br />
Intro duc ción<br />
Desde principios de los 90’s, el grupo de<br />
expertos en codificación de video (VCEG ,<br />
Video Coding Expert Group) de la Unión Internacional<br />
de Telecomunicaciones – Sector<br />
Telecomunicaciones (ITU-T, International<br />
Telecommunication Union- Telecommunication<br />
sector ) y el grupo de expertos para imágenes<br />
en movimiento (MPEG, Moving Picture Expert<br />
Group ) de la ISO/IEC, enfocaron sus investigaciones<br />
en las diferentes técnicas de codificación<br />
de video para diversas aplicaciones.<br />
En un inicio, la ITU-T desarrolló el estándar<br />
H.261 (ITU-T H261, 1993) para aplicaciones<br />
de video conferencia; por otra parte, MPEG<br />
procesó el MPEG-1 (ISO/IEC 11172-2:1993,<br />
1993), cuya intensión inicial era para el almacenamiento<br />
de video en disco compacto<br />
(CD). Posteriormente, el grupo MPEG desarrolló<br />
el estándar MPEG-2 como una extensión<br />
del MPEG-1, cuya aplicación inicial era<br />
televisión digital estándar (SDT) y televisión<br />
de alta definición (HDTV) (ISO/IEC JTC1/<br />
SC29/WG11, 1994). Al mismo tiempo, la<br />
ITU-T lo adoptó como el estándar H.262<br />
(ITU-T H.262, 2000). Estos estándares basan<br />
su operación por la división en rebanadas de<br />
los cuadros de video de entrada. A su vez,<br />
estas rebanadas de video se subdividen en<br />
macrobloques, que por último se dividen en<br />
bloques. Debido a la necesidad de cubrir un<br />
mayor rango de aplicaciones, la ISO/IEC desarrolló<br />
el estándar MPEG-4 parte 2, que<br />
puede operar de dos formas, la primera se<br />
basa en la división de los cuadros de entrada<br />
en porciones de video llamadas rebanadas de<br />
video, y la segunda, en la segmentación de<br />
objetos de video para que el usuario pueda<br />
interactuar con ellos o, simplemente para<br />
codificar cada objeto por separado (ISO/IEC<br />
JTCI/SC29/WG11, 2000). Este estándar consta<br />
de varios perfiles que manejan diferentes<br />
velocidades binarias compatibles con diferentes<br />
aplicaciones. A la par del surgimiento<br />
del MPEG-4 parte 2, y para obtener mayor<br />
compresión que en el H.261, la ITU-T<br />
desarrolló el estándar H.263 para aplicación<br />
en video teléfonos y compatible con el<br />
MPEG-4 parte 2 perfil avanzado.<br />
El grupo de expertos de la ITU-T y el<br />
grupo de expertos de la ISO/IEC, se unieron<br />
para conformar el equipo conjunto de video<br />
(JVT, Joint Video Team) y trabajar en el desarrollo<br />
de un nuevo estándar, con un mejor<br />
desempeño, tanto en la calidad de video<br />
como en la eficiencia de codificación. El nombre<br />
del nuevo estándar es el H.264 o MPEG-4<br />
parte 10 (ITU-T H.264, 2003) y cuenta además<br />
con especificaciones simples de su sintaxis,<br />
lo cual proporciona una mejor integración<br />
con todos los protocolos actuales y arquitecturas<br />
múltiples. Esto permite incluir otras<br />
aplicaciones, tales como la transmisión de<br />
video y video conferencia en redes fijas e<br />
inalámbricas y en diferentes protocolos de<br />
transporte.<br />
El grupo de expertos de la ITU-T y el<br />
grupo de expertos de la ISO/IEC, se unieron<br />
para conformar el equipo conjunto de video<br />
(JVT, Joint Video Team) y trabajar en el desarrollo<br />
de un nuevo estándar, con un mejor<br />
desempeño, tanto en la calidad de video<br />
como en la eficiencia de codificación. El<br />
nombre del nuevo estándar es el H.264 o<br />
MPEG-4 parte 10 (ITU-T H.264, 2003) y<br />
cuenta además con especificaciones simples<br />
de su sintaxis, lo cual proporciona una mejor<br />
integración con todos los protocolos actuales<br />
y arquitecturas múltiples. Esto permite incluir<br />
otras aplicaciones tales como la transmisión<br />
de video y video conferencia en redes<br />
fijas e inalámbricas y en diferentes protocolos<br />
de transporte.<br />
El H.264 cuenta con los mismos elementos<br />
o bloques funcionales que sus antecesores, ya<br />
que también adopta un algoritmo hibrido de<br />
predicción y transformación para la reducción<br />
de la correlación espacial y de la señal<br />
158 INGENIERIA Investigación y Tecnología FI-UNAM
H.de J. Ochoa-Domínguez, J.Mireles-García, J. de D. Cota-Ruíz<br />
residual, control de la velocidad binaria o bit<br />
rate, predicción por compensación de movimiento<br />
para reducir la redundancia temporal,<br />
así como la codificación de la entropía<br />
para reducir la correlación estadística. Sin<br />
embargo, lo que hace que este estándar<br />
proporcione mayor eficiencia de codificación,<br />
es la manera en que opera cada bloque<br />
funcional. Por ejemplo, el H.264 incluye<br />
predicción intra cuadro (INTRA), característica<br />
única de este estándar (Huang, 2005);<br />
transformación por bloques de 4x4 muestras,<br />
cuyos coeficientes transformados resultan<br />
enteros (Wien, 2003), anteriormente, se incluía<br />
transformación de 8x8 muestras, referencia<br />
múltiple para predicción temporal,<br />
tamaño variable de los macrobloques a comprimir,<br />
precisión de un cuarto de píxel para la<br />
compensación de movimiento, filtro de desbloqueo<br />
(List, 2993), codificador de entropía<br />
mejorado. Todas estas mejoras vienen acompañadas<br />
de un aumento en la complejidad de<br />
la implementación.<br />
Los canales inalámbricos suelen agregar<br />
mucho ruido a la señal original y no se puede<br />
llevar a cabo la recepción perfecta de la<br />
misma; cualquier error en la decodificación<br />
de un bit puede propagarse a bloques subsecuentes<br />
o incluso a cuadros subsecuentes,<br />
degrad<strong>and</strong>o la calidad subjetiva de la imagen.<br />
El H.264 utiliza métodos para incrementar<br />
la resistencia a errores. Por ejemplo,<br />
utiliza el ordenamiento flexible de macrobloques<br />
(FMO), la transmisión de rebanadas<br />
redundantes de cuadros de video e incluye el<br />
particionamiento de datos, que también es<br />
utilizado en los estándares previos.<br />
En el H.264, al igual que en sus antecesores,<br />
se definen diferentes perfiles y niveles<br />
dentro de cada uno, los cuales especifican<br />
restricciones en el tren de bits o<br />
bitstream. Cada perfil especifica un conjunto<br />
de características y los límites del decodificador,<br />
aunque los codificadores no requieren<br />
de ningún conjunto particular de características<br />
de un perfil. Los niveles especifican<br />
los límites de los valores que deben<br />
tomar los elementos de la sintaxis de la<br />
recomendación o estándar. En cada perfil se<br />
utiliza la misma definición de niveles, pero<br />
las aplicaciones individuales sólo pueden<br />
utilizar un nivel diferente en cada uno. Por lo<br />
general, la carga de procesamiento del decodificador<br />
y la capacidad de memoria para<br />
un perfil dado se desprende de los diferentes<br />
niveles.<br />
En la primera versión del H.264 existen<br />
tres perfiles, el línea base o baseline, el principal<br />
o main y el extendido o extended. El perfil<br />
línea base se aplica a los servicios de conversación<br />
en tiempo real, como video conferencia<br />
y video teléfono. El perfil principal<br />
es para aplicaciones de almacenamiento digital<br />
de video y datos, así como de transmisión<br />
de televisión. El perfil extendido es<br />
aplicable también a servicios de multimedia<br />
en Internet. La figura 1 muestra la relación<br />
que existe entre estos perfiles. La última<br />
versión del H.264, define cuatro perfiles altos<br />
o superiores, detallados como extensiones del<br />
rango de fidelidad (fidelity range extensions)<br />
para aplicaciones de distribución de contenido<br />
(Sullivan, 2004), así como para edición<br />
y post procesamiento (High, High 10, High<br />
4:2:2 y High 4:4:4 ). El perfil alto, se desarrolló<br />
para procesar video de 8 bits con formato de<br />
muestreo de la crominancia de 4:2:0 y para<br />
aplicaciones que utilizan alta resolución. El<br />
perfil high 10, se desarrolló para procesar<br />
video de hasta 10 bits con formato de muestreo<br />
4:2:0 de los cuadros de entrada, para<br />
aplicaciones que utilizan alta resolución y<br />
mayor exactitud. El perfil high 4:2:2, soporta<br />
el formato de muestreo de los cuadros de<br />
crominancia de 4:2:2 y hasta 10 bits por<br />
muestra de exactitud. El perfil 4:4:4 soporta el<br />
formato de muestreo de los cuadros de crominancia<br />
4:4:4 y hasta 12 bits por muestra de<br />
exactitud, así como transformación residual<br />
Vol.VIII No.3 -julio-septiembre- 2007 159
Descripción del nuevo estándar de video H.264 y comparación de su eficiencia de ...<br />
Perfiles altos (High )<br />
PerfilExtendido (Extended)<br />
Matric esde cuantización escaladas<br />
Trasformación por bloques de tamaño adaptivo<br />
Perfiles Principales (main)<br />
Partición de datos<br />
Rebanadastipo SI<br />
Rebanadas tipo SP<br />
Rebanadastipo B<br />
Predicción conpeso<br />
Rebanadas tipo I<br />
Rebanadas tipoP<br />
CAVL<br />
C<br />
Ordenamiento arbitrario derebanadas<br />
Ordenamiento flexible de macrobloques<br />
Rebanada redundante<br />
CABAC<br />
Perfil Línea Base (Baseline)<br />
Figura 1. Partes comunes y partes específicas de cada perfil del estándar H.264<br />
entera de los cuadros de color para codificar<br />
señales RGB. Las relaciones entre perfiles se<br />
describen a continuación:<br />
Partes comunes a todos los perfiles<br />
- Rebanadas tipo I (Rebanadas codificadas<br />
utiliz<strong>and</strong>o predicción INTRA):<br />
Rebanada codificada utiliz<strong>and</strong>o la predicción<br />
de las muestras decodificadas<br />
dentro de la misma rebanada.<br />
- Rebanadas tipo P (Rebanadas codificadas<br />
utiliz<strong>and</strong>o codificación predictiva<br />
en un solo sentido): Rebanada<br />
codificada utiliz<strong>and</strong>o predicción inter<br />
cuadro (INTER). Se utilizan como referencia<br />
los cuadros previamente decodificados<br />
con un vector de movimiento<br />
y un índice de referencia para predecir<br />
los valores de las muestras de cada<br />
bloque.<br />
- Utiliza el codificador CAVLC (Context-based<br />
Adap tive Vari able Length Coding)<br />
para la codificación de la entropía.<br />
Perfil línea base (Base line)<br />
- Ordenamiento flex ible de macrobloques:<br />
Los macrobloques no necesariamente<br />
se ordenan horizontalmente y<br />
de izquierda a derecha (raster scan).<br />
Existe un mapa que asigna los macrobloques<br />
a un determinado grupo de<br />
rebanadas.<br />
- Ordenamiento arbitrario de rebanadas:<br />
La dirección del primer macrobloque<br />
de una rebanada puede ser menor<br />
que la dirección del primer macrobloque<br />
de alguna rebanada ante rior<br />
dentro del mismo cuadro codificado.<br />
- Rebanada redundante: Esta rebanada<br />
pertenece a datos redundantes ya<br />
codificados con igual o diferente velocidad<br />
binaria en comparación con los<br />
mismos datos codificados pertenecientes<br />
a la misma rebanada.<br />
160 INGENIERIA Investigación y Tecnología FI-UNAM
H.de J. Ochoa-Domínguez, J.Mireles-García, J. de D. Cota-Ruíz<br />
Perfil prin cipal (Main)<br />
- Rebanadas tipo B (Rebanadas codificadas<br />
utiliz<strong>and</strong>o codificación predictiva<br />
bidireccional): Rebanada codificada<br />
utiliz<strong>and</strong>o predicción INTER con referencia<br />
de un cuadro previamente decodificado<br />
y utiliz<strong>and</strong>o a lo más, dos vectores<br />
de movimiento e índices de referencia<br />
para predecir los valores de las<br />
muestras de cada bloque.<br />
- Predicción con peso: Esta es una<br />
operación de escalamiento, en la cual se<br />
aplica un factor de peso a las muestras<br />
resultantes de la compensación de movimiento<br />
en rebanadas tipo P o B.<br />
- Utiliza el codificador CABAC (Context-based<br />
Adap tive Binary Arith metic<br />
Coding) para codificación de la entropía.<br />
Perfil extendido<br />
- Se incluyen todas las partes del<br />
perfil línea base.<br />
- Rebanadas tipo SP: Es un tipo de<br />
rebanada espe cial, codificada para cambiar<br />
eficientemente de resoluciones entre<br />
tramas de video (escalabilidad – capa<br />
de bits básicos + capa de ensanchamiento),<br />
es similar a la codificación de<br />
una rebanada tipo P.<br />
- Rebanadas tipo SI: Igual que el<br />
ante rior, pero es similar a codificar una<br />
rebanada tipo I.<br />
- Particionamiento de datos: Los datos<br />
codificados se colocan en particiones<br />
separadas en capas diferentes. Se utiliza<br />
para reducir errores durante la transmisión<br />
y para el empaquetamiento efectivo<br />
de los datos.<br />
- Rebanadas tipo B: Se utiliza para<br />
predicción bidireccional, incrementa la<br />
calidad del video y la velocidad binaria.<br />
- Predicción con peso.<br />
Perfil alto (High)<br />
- Incluye todas las partes del perfil<br />
prin cipal (Main).<br />
- Transformación por bloques de tamaño<br />
adoptivo: DCT de 4x4 y transformación<br />
DCT entera para los bloques<br />
de luminancia. El tamaño del bloque a<br />
codificar dentro de un macrobloque<br />
puede ser diferente.<br />
- Matrices de cuantización escaladas:<br />
Se utilizan diferentes escalas de<br />
acuerdo con frecuencias específicas asociadas<br />
con los coeficientes transformados<br />
para optimizar la calidad subjetiva<br />
del video.<br />
La tabla 1 lista a los perfiles del H.264 y del<br />
MPEG-4 parte 2 (video), así como los requerimientos<br />
más importantes para cada aplicación.<br />
Los niveles de cada perfil se muestran en<br />
la tabla 2. Cada nivel soporta diferentes tamaños<br />
de los cuadros de entrada ( QCIF, CIF,<br />
ITU-R 601 (SDTV), HDTV, S-HDTV, Cinema<br />
digital (Richardson, 2003)). Cada nivel ajusta<br />
los límites de las velocidades binarias, tamaño<br />
de la memoria para almacenar cuadros<br />
de referencia, etc. La tabla 3 muestra los<br />
parámetros límite de cada nivel.<br />
Vol.VIII No.3 -julio-septiembre- 2007 161
Descripción del nuevo estándar de video H.264 y comparación de su eficiencia de ...<br />
Tabla 1. Tabla 1. Requerimientos por aplicación (Rich ardson, 2003) (SP, ASP, ARTS, FGS, Estudio de<br />
perfiles: Simple, avanzado simple, avanzado simple en tiempo real, escalabilidad gran ular<br />
fina y perfiles de estudio)<br />
Aplicación Requerimientos Perfiles H.264 Perfiles MPEG-4/2<br />
Transmisión de TV<br />
Video por cable o Internet<br />
Almacenamiento y<br />
reproducción de video<br />
Videoconferencia<br />
Video a través de redes<br />
inalámbricas<br />
Distribución de video<br />
(Estudio)<br />
Eficiencia en la codificación,<br />
confiabilidad en canales de<br />
distribución controlados,<br />
transmisión entrelazada de<br />
los campos de cada cuadro<br />
de video, decodificador de<br />
baja complejidad.<br />
Eficiencia en la codificación,<br />
confiabilidad en canales no<br />
controlados para redes<br />
basadas en paquetes de<br />
distribución y escalabilidad.<br />
Eficiencia en la codificación,<br />
transmisión entrelazada de<br />
los campos de cada cuadro<br />
de video, decodificador de<br />
baja complejidad.<br />
Eficiencia en la codificación,<br />
confiabilidad, baja<br />
complejidad del codificador<br />
y del decodificador.<br />
Eficiencia en la codificación,<br />
confiabilidad, baja<br />
complejidad del codificador<br />
y del decodificador, bajo<br />
consumo de potencia.<br />
Características de<br />
compresión sin pérdidas o<br />
cercanas, transmisión<br />
entrelazada de los campos<br />
de cada cuadro de video,<br />
transcodificación efectiva.<br />
Principal<br />
Extendido<br />
Principal<br />
Básico<br />
Básico<br />
Principal Alto<br />
Perfil Simple Avanzado<br />
(ASP, Advanced Simple<br />
Profile)<br />
ARTS o FGS<br />
ASP<br />
Perfil Simple (SP)<br />
SP<br />
Estudio<br />
Tabla 2. Niveles, tipos y velocidades de cuadros (SHDTV: Super HDTV, HHR: Alta resolución hori -<br />
zontal, p: progresivo, i: entrelazado)<br />
Niveles<br />
1 QCIF @ 15fps ( frames per second)<br />
1.1 QCIF @ 30fps<br />
1.2 CIF @ 15fps<br />
1.3 CIF @ 30fps<br />
2 CIF @ 30fps<br />
2.1 HHR @15 or 30fps<br />
2.2 SDTV @ 15fps<br />
Tipo de cuadros y velocidad de cuadros<br />
3 SDTV: 720x480x30i,720x576x25i 10Mbps(max)<br />
3.1 1280x720x30p<br />
3.2 1280x720x60p<br />
4 HDTV: 1920x1080x30i, 1280x720x60p, 2Kx1Kx30p 20Mbps(max)<br />
(continúa...)<br />
162 INGENIERIA Investigación y Tecnología FI-UNAM
H.de J. Ochoa-Domínguez, J.Mireles-García, J. de D. Cota-Ruíz<br />
Tabla 2. Niveles, tipos y velocidades de cuadros (SHDTV: Super HDTV, HHR: Alta resolución hori -<br />
zontal, p: progresivo, i: entrelazado) (...continuación)<br />
Niveles<br />
Tipo de cuadros y velocidad de cuadros<br />
4.1 HDTV: 1920x1080x30i, 1280x720x60p, 2Kx1Kx30p 50Mbps(max)<br />
4.2 HDTV: 1920x1080x60i, 2Kx1Kx60p<br />
5 SHDTV/Cinema digital: 2.5Kx2Kx30p<br />
5.1 SHDTV/Cinema digital: 4Kx2Kx30p<br />
Tabla 3. Límite de los parámetros de cada nivel (los números de nivel no entero se refieren a los niveles<br />
intermedios. Los guiones denotan ausencia del límite correspondiente)<br />
Vel. max. de<br />
procesamien<br />
to d el<br />
macrobloque<br />
(MB/s)<br />
Tamaño<br />
max. del<br />
cuadro<br />
(MBs)<br />
Tamañ o max.<br />
de la<br />
memori a para<br />
el cuad ro<br />
d ecodificado<br />
(1024 by tes)<br />
Max.<br />
v elocidad<br />
b inaria<br />
(1 000 b its/ s<br />
or 1200<br />
bits/s )<br />
Max<br />
C PB si ze<br />
(1000 bits or<br />
1 200 b its)<br />
Ran go de la<br />
comp onente<br />
vertical del<br />
v ecto r de<br />
movi miento<br />
(muestras de<br />
l umi nancia)<br />
R elació n d e<br />
compresi ón<br />
mínima<br />
Número max. dev ecto res de<br />
movimient o por cadad os MB s<br />
co nsecutiv os<br />
Nivel<br />
1 1 485 99 148 .5 64 1 75 [-64 ,+63.75 ] 2 -<br />
1.1 3 000 396 337 .5 1 92 5 00 [-128 ,+127.7 5] 2 -<br />
1.2 6 000 396 891 .0 3 84 1 000 [-128 ,+127.7 5] 2 -<br />
1.3 11 880 396 891 .0 7 68 2 000 [-128 ,+127.7 5] 2 -<br />
2 11 880 396 891 .0 2 000 2 000 [-128 ,+127.7 5] 2 -<br />
2.1 19 800 792 1 782.0 4 000 4 000 [-256 ,+255.7 5] 2 -<br />
2.2 20 250 1 620 3 037.5 4 000 4 000 [-256 ,+255.7 5] 2 -<br />
3 40 500 1 620 3 037.5 1 0 0 00 1 0 0 00 [-256 ,+255.7 5] 2 32<br />
3.1 1 08 000 3 600 6 750.0 1 4 0 00 1 4 0 00 [-512 ,+511.7 5] 4 16<br />
3.2 2 16 000 5 120 7 680.0 2 0 0 00 2 0 0 00 [-512 ,+511.7 5] 4 16<br />
4 2 45 760 8 192 12 288 .0 2 0 0 00 2 5 0 00 [-512 ,+511.7 5] 4 16<br />
4.1 2 45 760 8 192 12 288 .0 5 0 0 00 6 2 5 00 [-512 ,+511.7 5] 2 16<br />
4.2 4 91 520 8 192 12 288 .0 5 0 0 00 6 2 5 00 [-512 ,+511.7 5] 2 16<br />
5 5 89 824 22 0 80 41 310 .0 135 000 135 000 [-512 ,+511.7 5] 2 16<br />
5.1 9 83 040 36 8 64 69 120 .0 240 000 240 000 [-512 ,+511.7 5] 2 16<br />
Estructura de las capas del H.264<br />
El H.264 se compone de dos capas, la capa de<br />
la red de abstracción (NAL, Network Abstraction<br />
Layer) y la capa de codificación del<br />
video (VCL, Video Coding Layer ). NAL abstrae<br />
los datos para hacer compatible al tren de bits<br />
de salida del codificador con casi todos los<br />
canales de comunicación o medios de almacenamiento.<br />
Esta unidad de red, especifica<br />
los datos en un formato de bytes (byte-stream)<br />
o de paquetes. El formato de bytes define<br />
patrones de bytes o de bits utilizados en el<br />
estándar H.320 o en el MPEG-2. El formato de<br />
paquetes, define paquetes de datos identificables<br />
por protocolos de transporte para<br />
aplicaciones de RTP/UDP/IP (Wenger, 2003).<br />
La capa VCL constituye el núcleo de los<br />
datos codificados. Ésta consiste en la secuencia<br />
de video a codificar, cuadros o campos<br />
dentro de la secuencia de video con tres<br />
arreglos de muestras (luminancia, crominancia<br />
o RGB), rebanadas dentro de cada<br />
Vol.VIII No.3 -julio-septiembre- 2007 163
Descripción del nuevo estándar de video H.264 y comparación de su eficiencia de ...<br />
cuadro y macrobloques dentro de cada<br />
rebanada, así como bloques dentro de cada<br />
macrobloque. También, el H.264 soporta búsqueda<br />
(escaneo) progresiva y entrelazada, la<br />
cual puede mezclarse dentro de la misma<br />
secuencia. El perfil línea base se limita únicamente<br />
a búsqueda progresiva. Los cuadros se<br />
dividen en rebanadas. Una rebanada de<br />
video es una secuencia de macrobloques que<br />
pueden tener distintos tamaños (tamaños<br />
flexibles). En el caso de grupos de rebanadas,<br />
la posición de un macrobloque se determina<br />
por medio de un mapa que representa al<br />
grupo de rebanadas. El mapa indica a cuál<br />
grupo de rebanadas pertenece el macrobloque<br />
(Ghanbari, 2003).<br />
Algoritmo de codificacion de video<br />
La figura 2 muestra el diagrama a bloques del<br />
algoritmo de codificación del H.264. El codificador<br />
debe seleccionar entre codificación<br />
INTRA o INTER. En codificación INTRA se<br />
utilizan varios modos de predicción para<br />
reducir la redundancia espacial de un solo<br />
cuadro. La codificación INTER es más eficiente<br />
y se utiliza en la codificación tipo P o B<br />
(predictiva o bidireccional) de cada bloque de<br />
Entrada de video<br />
+<br />
Transformac ión y<br />
Cuan tización<br />
Codific ación<br />
d eentropía<br />
Salida del<br />
bitstream<br />
-<br />
Cu antización inversa y<br />
trans-formación inversa<br />
Selección del<br />
m odo Intra/Inter<br />
+<br />
+<br />
Compensación<br />
de Movim iento<br />
Predicción<br />
In tracuadro<br />
(a)Codificador<br />
Estimación d e<br />
Movimiento<br />
Memoria para<br />
cuadrosd eref.<br />
Filtrado para remover<br />
artefactos de cuantización<br />
Entra da del<br />
bit stream<br />
D ecodificado r<br />
de entro pía<br />
Cua ntiza ción inversa y<br />
Tran sformación inversa<br />
+<br />
+<br />
Filtrado parar emover<br />
artefactos de<br />
cuan tización<br />
Salida del<br />
video<br />
S elección del<br />
mo do Int ra/Int er<br />
Mem oria para<br />
cuadros de ref.<br />
Predicción<br />
Int racuadro<br />
(b) Decodificad or<br />
Compensación de<br />
Movimiento<br />
Figura 2. Diagrama a bloques del CODEC del H.264, (a) codificador, (b) decodificador<br />
164 INGENIERIA Investigación y Tecnología FI-UNAM
H.de J. Ochoa-Domínguez, J.Mireles-García, J. de D. Cota-Ruíz<br />
muestras. En esta codificación se utilizan como<br />
referencia los cuadros decodificados<br />
previamente. La codificación INTER utiliza<br />
vectores de movimiento para reducir la redundancia<br />
temporal entre cuadros. La predicción<br />
se obtiene después de filtrar el bloque<br />
anterior reconstruido. El filtro reduce los<br />
artefactos o distorsiones introducidos en las<br />
orillas de un bloque, debido a la cuantización.<br />
Los vectores de movimiento y el modo de<br />
predicción INTRA pueden tener varias especificaciones,<br />
dependiendo del tamaño de los<br />
bloques a codificar. Antes de ser cuantizado,<br />
el error o predicción residual se comprime<br />
aún más utiliz<strong>and</strong>o una transformada, la cual<br />
remueve la correlación espacial del bloque.<br />
Finalmente, los vectores de movimiento y los<br />
coeficientes cuantizados se codifican utiliz<strong>and</strong>o<br />
codificadores de entropía tales como el<br />
CAVLC (Context-Adaptive Variable Length<br />
Codes) o el CABAC (Context-Adaptive Binary<br />
Arithmetic Codes) (Marpe, 2003).<br />
Predicción intracuadro (modo<br />
INTRA)<br />
Los estándares anteriores llevan a cabo la<br />
predicción INTRA, codific<strong>and</strong>o independientemente<br />
cada macrobloque (MB), como si se<br />
tratara de la codificación de una imagen<br />
(Ochoa, 2006), ya que se necesita que tengan<br />
la menor distorsión posible para que sirvan<br />
de referencia a la codificación INTER. La<br />
codificación INTRA, también se aplica dentro<br />
M A B C D E F G H<br />
I<br />
J<br />
K<br />
L<br />
a b c d<br />
e f g h<br />
i j k l<br />
m n o p<br />
modo 1<br />
modo 6<br />
modo 8<br />
de rebanadas codificadas en modo INTRA o<br />
en macrobloques que contienen una corrección<br />
temporal inaceptable, aunque se haya<br />
utiliz<strong>and</strong>o compensación de movimiento (macrobloques<br />
INTER con una distorsión por<br />
encima de un nivel de referencia específico).<br />
Este efecto provoca que se incremente el<br />
número de bits en el modo INTRA, haciendo<br />
imposible reducir la velocidad binaria.<br />
El H.264 utiliza el concepto de predicción<br />
INTRA para codificar bloques o macrobloques<br />
de referencia y reducir la cantidad de<br />
bits codificados. Para codificar un bloque o<br />
macrobloque en modo INTRA, se forma un<br />
bloque de predicción basado en un bloque<br />
reconstruido previamente dentro del mismo<br />
cuadro y sin filtrar. Posteriormente, se codifica<br />
la señal residual (error) entre el bloque<br />
actual y la predicción, disminuyendo considerablemente<br />
la cantidad de bits que representan<br />
al bloque actual. El bloque de luminancia<br />
bajo predicción, puede formarse<br />
por subbloques de 4x4 muestras o por todo el<br />
bloque de 16x16 muestras. Para cada bloque<br />
de luminancia de 4x4, se selecciona un modo<br />
de predicción de nueve modos existentes.<br />
Existen cuatro modos de predicción para bloques<br />
de luminancia de 16x16 muestras. Solo<br />
existe un modo de predicción para cada bloque<br />
de crominancia de 4x4 muestras.<br />
La figura 3 muestra la predicción de un<br />
bloque de luminancia de 4x4 muestras. [a, b,<br />
M A B C D E F G H<br />
I<br />
J<br />
K<br />
L<br />
a b c d<br />
e f g h<br />
i j k l<br />
m n o p<br />
modo 0 modo 5 modo 4 modo 3<br />
modo 7<br />
Figura 3. Direcciones de los modos de predicción INTRA 4 x 4 (Vertical: 0, hori zontal: 1, DC: 2,<br />
diagonal izquierda y hacia abajo: 3, diag onal derecha hacia abajo: 4, vertical derecha: 5, hori zontal hacia<br />
abajo: 6, vertical izquierda: 7, hori zontal hacia arriba: 8)<br />
Vol.VIII No.3 -julio-septiembre- 2007 165
Descripción del nuevo estándar de video H.264 y comparación de su eficiencia de ...<br />
…, p] son las muestras bajo predicción del<br />
bloque actual y [A, B, …, M] las muestras del<br />
bloque previamente reconstruido. Las muestras<br />
se utilizan de acuerdo con las direcciones<br />
de predicción de cada modo, las flechas indican<br />
la dirección de predicción (ITU-T<br />
H.264, 2003).<br />
En el modo 0 (vertical) y el modo 1<br />
(horizontal), las muestras predecidas se forman<br />
por extrapolación de las muestras<br />
superiores [A, B, C, D] y de las muestras de la<br />
izquierda [I, J, K, L] respectivamente. En el<br />
modo 2 (DC), todas las muestras predecidas<br />
se forman por medio de las muestras [A, B, C,<br />
D, I, J, K, L]. En el modo 3 (diagonal izquierda<br />
y hacia abajo), modo 4 (diagonal derecha<br />
hacia abajo), modo 5 (vertical derecha), modo<br />
6 (horizontal hacia abajo), modo 7 (vertical<br />
izquierda) y modo 8 (horizontal hacia arriba),<br />
las muestras predecidas se forman d<strong>and</strong>o<br />
cierto peso al promedio de las muestras A-M.<br />
Por ejemplo, las muestras ‘a’ y ‘d’ son predecidas<br />
redonde<strong>and</strong>o el resultado round(I/4<br />
+ M/2 + A/4) y round(B/4 + C/2 + D/4) en el<br />
modo 4. También, por medio de round(I/2 +<br />
J/2) y round(J/4 + K/2 + L/4) en el modo 8. El<br />
modo seleccionado por el codificador será<br />
aquel que minimice el error o residuo entre el<br />
bloque a codificar y su predicción (ITU-T<br />
H.264, 2003).<br />
Existen únicamente 4 modos para la<br />
predicción de los componentes de luma de<br />
un bloque de 16x16. Para los modos 0<br />
(vertical), 1 (horizontal) y 2 (DC) las predicciones<br />
son similares a los casos de 4x4. Para el<br />
modo 4 (plano), se utiliza una función lineal<br />
que se ajusta a las muestras superior e izquierda.<br />
Cada bloque de 8x8 muestras de la componente<br />
de crominancia, en un macrobloque,<br />
se predice de las muestras de los bloques<br />
superior o izquierdo previamente codificados<br />
y reconstruidos. Los cuatro modos de<br />
predicción son similares a los modos de<br />
predicción de los bloques de 16x6 de luminancia,<br />
excepto que el orden de los modos<br />
es diferente, modo 0 (DC), modo 1 (horizontal),<br />
modo 2 (vertical) y modo 3 (plano).<br />
Predicción intercuadro (modo<br />
INTER)<br />
La predicción INTER, la estimación del movimiento<br />
y la compensación del movimiento<br />
son tres factores que ayudan a reducir la redundancia<br />
o correlación temporal. En el<br />
H.264, el cuadro actual puede particionarse<br />
en macrobloques o bloques más pequeños.<br />
La compensación de movimiento realizada<br />
con bloques más pequeños, incrementa la<br />
ganancia de la codificación, a costa de incrementar<br />
el número de datos necesarios para<br />
representar la compensación. En el proceso<br />
de codificación INTER, se pueden procesar<br />
bloques de hasta 4x4 muestras de luminancia,<br />
utiliz<strong>and</strong>o una exactitud en los vectores de<br />
movimiento de hasta un cuarto de muestra.<br />
El proceso de predicción INTER de un bloque,<br />
involucra la selección de cuadros reconstruidos<br />
previamente, los cuales están<br />
almacenados en la memoria del sistema. Los<br />
vectores de movimientos se codifican utiliz<strong>and</strong>o<br />
una técnica diferencial. A diferencia<br />
de otros estándares, en el H.264 las rebanadas<br />
codificadas bidireccionalmente se<br />
pueden utilizar como referencia para la<br />
codificación INTER de otros cuadros (ITU-T<br />
H.264, 2003).<br />
Predicción en tamaños vari ables de<br />
bloques<br />
Un macrobloque de luminancia de 16x16<br />
muestras, puede dividirse en pequeños bloques<br />
de hasta 4x4, como se muestra en la<br />
figura 4. Existen cuatro casos: 16x16, 16,8,<br />
8x16 y 8x8 para los macrobloques de 16x16.<br />
También existen cuatro casos para un macrobloque<br />
de luminancia de 8x8: 8x8, 8x4, 4x8,<br />
166 INGENIERIA Investigación y Tecnología FI-UNAM
H.de J. Ochoa-Domínguez, J.Mireles-García, J. de D. Cota-Ruíz<br />
16*1 6 luma samp les<br />
1 6*8 luma samples 8 *1 6 luma samp les<br />
8*8l uma samples<br />
Macrobloc k<br />
pa rtitions<br />
0<br />
0<br />
1<br />
0 1<br />
0 1<br />
2 3<br />
8*8 luma samp les 8 *4 luma samples 4*8 luma samples<br />
4*4l uma samples<br />
Sub-mac robloc k<br />
pa rtitions<br />
0<br />
0<br />
0 1<br />
0<br />
1<br />
1<br />
2<br />
3<br />
Figura 4. Particiones de macrobloques y sub macrobloque<br />
4x4. Entre más pequeño sea el bloque bajo<br />
predicción, mayor será el número de bits<br />
para representar los vectores de movimiento<br />
y otros datos tales como el tipo de partición;<br />
sin embargo, si se utilizan particiones pequeñas<br />
se puede reducir considerablemente<br />
el error o residuo resultante de la compensación<br />
de movimiento. La selección del<br />
tamaño de la partición depende de las<br />
características del video de entrada. En general,<br />
una partición gr<strong>and</strong>e es beneficiosa<br />
cu<strong>and</strong>o las muestras del bloque son homogéneas<br />
y una partición pequeña cu<strong>and</strong>o no<br />
existe homogeneidad (detalles) (Wien, 2003).<br />
Interpolación para la predicción<br />
fraccional o sub muestra (Sub-pel,<br />
Sub Picture Element)<br />
La predicción en modo INTER de cada<br />
partición de un macrobloque codificado, se<br />
lleva a cabo en un área del mismo tamaño del<br />
cuadro de referencia. En este caso, la compensación<br />
de movimiento se hace con respecto<br />
a muestras enteras. En ocasiones, el<br />
movimiento no se lleva a cabo en muestras<br />
enteras sino fraccionales, por lo que hay que<br />
interpolar el área de referencia. El desplazamiento<br />
u offset entre las dos áreas (vectores<br />
de movimiento) tiene una resolución en<br />
fraccional (sub muestras), tanto para la luminancia<br />
como para la crominancia (Figura 5).<br />
Si el proceso de interpolación elegido incrementa<br />
la resolución del área de referencia<br />
(área de búsqueda) al doble, se dice que se<br />
tiene una compensación de movimiento con<br />
exactitud de ½ muestra, y si se aumenta cuatro<br />
veces, se dice que se tiene una compensación<br />
de movimiento con exactitud de ¼ de<br />
muestra. En el H.264 la compensación de movimiento<br />
puede realizarse con una exactitud<br />
de hasta ¼ de muestra (ITU-T H.264, 2003).<br />
La compensación de movimiento fraccional<br />
( ½ , ¼) resulta en una mayor compresión y<br />
mejor calidad de la imagen que la compensación<br />
de movimiento entera, a expensas del<br />
incremento de la complejidad en el codificador.<br />
En aplicaciones para velocidades binarias<br />
altas, así como altas resoluciones, se ha<br />
comprobado que la predicción fraccional de<br />
¼ de muestra es mucho más eficiente que la<br />
de ½ muestra, en cuanto a compresión y<br />
calidad de la imagen se refiere.<br />
Vol.VIII No.3 -julio-septiembre- 2007 167
Descripción del nuevo estándar de video H.264 y comparación de su eficiencia de ...<br />
Entr ada de video<br />
+<br />
-<br />
Cuantización y<br />
tra nsforma ción<br />
C odificación<br />
de la entropía<br />
Bitstrea m de<br />
salida<br />
Cuantiza cióninversa y<br />
transformación inver sa<br />
Selecc ión del modo<br />
I NTRA/INTER<br />
+<br />
+<br />
Compensa ción de<br />
movimiento<br />
Estimación de<br />
movimiento<br />
Intra16x16 16x8 8x16 8x8<br />
Prediction 0<br />
0 1<br />
MB 0<br />
0 1<br />
1<br />
2 3<br />
Picture8x8 8x4 Deblock 4 x8 ing<br />
4x4<br />
Sub Buffering Filtering<br />
0<br />
0<br />
0 1<br />
0 1<br />
MB<br />
1<br />
2 3<br />
Figura 5. Diagrama a bloques de codificador enfatiz<strong>and</strong>o la estimación del movimiento y la<br />
compensación de movimiento<br />
En las muestras de luminancia, la exactitud<br />
de ½ muestra se genera filtr<strong>and</strong>o las muestras<br />
vecinas con un filtro FIR, cuyos coeficientes<br />
son (1, -5, 20, 20, -5, 1)/32. Esto significa que<br />
cada muestra intermedia se obtiene de la<br />
suma de 6 muestras vecinas enteras, cada<br />
muestra con su correspondiente peso. Por<br />
ejemplo, en la figura 6, la muestra intermedia<br />
‘b’ se calcula de la muestras E, F, G, H, I y J<br />
utiliz<strong>and</strong>o la formula 1.<br />
b = round(( E − 5F + 20G + 20H − 51 + J) / 32 ) (1)<br />
Similarmente, la muestra h se puede<br />
calcular de las muestras verticales A, C, G, M,<br />
R y T. Una vez calculadas las muestras con<br />
exactitud de ½, se calculan las muestras con<br />
exactitud de ¼ por medio de interpolación<br />
bilineal entre muestras de exactitud entera y<br />
de ½. Por ejemplo, la muestra ‘a’, con exactitud<br />
de ¼ de muestra, se puede calcular de la<br />
muestra entera G, la muestra ‘b’ con exactitud<br />
½, se calcula utiliz<strong>and</strong>o la ecuación 2.<br />
a = round (( G + b ) / 2 ) (2)<br />
En el caso del formato de video 4:2:0, se<br />
requiere una exactitud de 1/8 de muestra en<br />
las componentes de crominancia (correspondientes<br />
a ¼ de muestra en luminancia). Las<br />
muestras a 1/8 de exactitud se interpolan<br />
utiliz<strong>and</strong>o interpolación bilineal entre muestras<br />
enteras de los cuadros de crominancia<br />
(ITU-T H.264, 2003).<br />
Filtro de desbloqueo (remueve la<br />
distorsión debida a la cuantización<br />
en los bordes de los bloques)<br />
El proceso de codificación involucra macrobloques<br />
con distintas características, algunos<br />
con mayor correlación que otros. Para mantener<br />
una cierta velocidad binaria, los bloques<br />
INTRA o INTER se cuantizan utiliz<strong>and</strong>o<br />
diferentes cuantizadores, los cuales introducen<br />
distorsión o artefactos indeseables alrededor<br />
de los bloques reconstruidos. En estándares<br />
anteriores, el filtro de desbloqueo era<br />
sólo una recomendación (opcional) del estándar,<br />
en el H.264, el filtro de desbloqueo es<br />
parte obligatoria del mismo. El filtro u tilizado<br />
168 INGENIERIA Investigación y Tecnología FI-UNAM
H.de J. Ochoa-Domínguez, J.Mireles-García, J. de D. Cota-Ruíz<br />
A<br />
aa<br />
B<br />
C<br />
bb<br />
D<br />
E F G a b c H<br />
I J<br />
d<br />
cc dd h i j k m<br />
ee ff<br />
n<br />
e<br />
p<br />
f<br />
q<br />
K L M s N<br />
P Q<br />
g<br />
r<br />
R<br />
gg<br />
S<br />
T<br />
hh<br />
U<br />
Figura 6. Muestras enteras (bloques sombreados con letras mayúsculas) y posiciones fraccionales<br />
(bloques blancos con letras minúsculas) para interpolación de un cuarto de muestra<br />
en el H.264 reduce la distorsión en los bordes<br />
del bloque y evita que el ruido acumulado<br />
debido a la codificación se propague. El<br />
MPEG-1 y MPEG-2 no utilizan este filtro,<br />
debido a la complejidad de su implementación.<br />
Por otra parte, la distorsión en estos estándares<br />
se reduce utiliz<strong>and</strong>o compensación de movimiento<br />
con exactitud de ½ muestra.<br />
En el H.264, el filtrado se aplica a los<br />
bordes de bloques de 4x4 muestras de un<br />
macrobloque como se muestra en la figura 7.<br />
El filtro procesa por separado los bloques de<br />
luminancia y crominancia. El proceso de filtrado<br />
para bloques de luminancia se lleva a<br />
cabo en cuatro bordes de 16 muestras cada<br />
uno y el proceso de filtrado de luma en dos<br />
bordes de 8 muestras. La figura 7 (a) muestra<br />
el proceso de filtrado horizontal (afecta bordes<br />
verticales) y la figura 7(b) el proceso de<br />
filtrado vertical (afecta bordes horizontales).<br />
El filtro se aplica adaptivamente en viarios<br />
niveles:<br />
- A nivel rebanada: El filtrado se<br />
puede ajustar a las características individuales<br />
de la secuencia de video.<br />
- A nivel de borde de bloque: El<br />
filtrado se vuelve independiente de la<br />
decisión INTRA/INTER de las diferencias<br />
de movimiento y de la presencia de<br />
residuos codificados en los dos bloques<br />
participantes en el filtrado.<br />
- A nivel muestra: El efecto de filtrado<br />
se puede anular dependiendo de<br />
los valores de las muestras y de los<br />
umbrales del cuantizador.<br />
Vol.VIII No.3 -julio-septiembre- 2007 169
Descripción del nuevo estándar de video H.264 y comparación de su eficiencia de ...<br />
Macro bloqu ede 1 6 x16<br />
Macrobloque de 1 6 x16<br />
Bor des h orizo ntales<br />
(luma)<br />
Bordes horizontales<br />
(croma)<br />
Bordes vert icales<br />
(luma)<br />
(a)<br />
Bordes verticales<br />
(cr oma)<br />
Figura 7. Bordes del macrobloque a filtrarse (los bordes de luminancia se muestran con líneas sólidas y<br />
las de crominancia con líneas entre cortadas o guiones)<br />
(b)<br />
Transformación y cuantización<br />
El H.264 se basa en la codificación de macrobloques,<br />
utiliza transformadas para remover<br />
la redundancia espacial (Ochoa, 2006). Los<br />
cuadros de entrada al codificador, así como<br />
los residuos, resultado de la predicción, contienen<br />
una correlación o redundancia espacial<br />
alta. Después de la predicción INTER<br />
cuadro, o predicción espacial basada en las<br />
muestras de cuadros previamente decodificados<br />
con respecto al cuadro actual (bajo<br />
predicción), el residuo o predicción resultante<br />
se divide en bloques de 4x4 u 8x8<br />
muestras, los cuales se convierten al domino<br />
de la frecuencia y los coeficientes resultantes<br />
se cuantizan.<br />
El H.264 utiliza una transformada de<br />
tamaño adaptivo de 4x4 y de 8x8 (perfiles<br />
altos); los estándares anteriores utilizaban<br />
únicamente la transformada DCT de 8x8.<br />
Una transformada de 4x4 es mucho menos<br />
compleja, ya que necesita menos multiplicaciones<br />
para llevar a cabo una transformación.<br />
También, si el codificador decide<br />
procesar un bloque de menor tamaño, las<br />
distorsiones en los bordes del mismo bloqueo<br />
se reduce significativamente.<br />
Para mejorar la eficiencia de la compresión,<br />
el H.264 emplea una estructura de<br />
transformación jerárquica, esto es, los coeficientes<br />
de DC de bloques vecinos de 4x4 de<br />
luminancia se agrupan en bloques de 4x4 y se<br />
aplica de nuevo la transformada Hadamard.<br />
Existe una alta correlación entre coeficientes<br />
transformados de DC de bloques vecinos,<br />
cuyas muestras son muy similares. Por lo<br />
tanto, el estándar especifica la transformada<br />
Hadamard para los coeficientes de DC de<br />
bloques transformados de luma de 16x16, y la<br />
transformada Hadamard de 2x2 para los<br />
coeficientes de DC de bloques transformados<br />
de crominancia.<br />
En algunas aplicaciones se requiere<br />
reducir el tamaño de los pasos de los cuantizadores<br />
para aumentar la relación señal a<br />
ruido pico (PSNR, Peak Signal to Noise Ratio) a<br />
niveles que se consideran visualmente sin<br />
170 INGENIERIA Investigación y Tecnología FI-UNAM
H.de J. Ochoa-Domínguez, J.Mireles-García, J. de D. Cota-Ruíz<br />
pérdidas. Para logra esto, el H.264 extiende el<br />
rango de los pasos de cuantización (QP) en<br />
dos octavas, teniendo que redefinir las tablas<br />
de cuantización y permitiendo que QP pueda<br />
variar de 0 a 51.<br />
En general, la transformación y la cuantización<br />
requieren de varias multiplicaciones,<br />
esto eleva la complejidad de su implementación.<br />
Por lo tanto, para lograr una implementación<br />
más simple, el proceso de transformación<br />
exacta se modifica para reducir el<br />
número de multiplicaciones, result<strong>and</strong>o en<br />
una transformada entera, la cual integra en<br />
proceso de transformación, cuantización y<br />
escalamiento. Este proceso se llama trasformación<br />
entera con post escalamiento<br />
A continuación se describen los pasos para<br />
lograr la transformada directa DCT entera,<br />
post-escalamiento, así como la transformada<br />
inversa.<br />
Proceso de codificación<br />
Paso 1. Transformada entera directa<br />
Para la transformación DCT exacta de un<br />
bloque de luminancia F de 4x4, utilizamos<br />
X<br />
= HFH T<br />
(3)<br />
Donde H es la siguiente matriz<br />
⎡a a a a ⎤<br />
⎢<br />
b c −c −b<br />
⎥<br />
H = ⎢<br />
⎥<br />
⎢a −a −a a ⎥<br />
⎢<br />
⎣c −b b −c<br />
⎥<br />
⎦<br />
(4)<br />
Las variables a, b, c y d tienen los siguientes<br />
valores.<br />
1 1 ⎛ π ⎞ 1 ⎛ 3π<br />
⎞<br />
a = , b = cos ⎜ ⎟ , c=<br />
cos⎜<br />
⎟<br />
2 2 ⎝ 8 ⎠ 2 ⎝ 8 ⎠<br />
(5)<br />
A fin de facilitar la implementación de (5), c<br />
se aproxima a 0.5 y b se modifica para asegurar<br />
ortogonalidad, qued<strong>and</strong>o como sigue:<br />
1 2 1<br />
a = , b = , c =<br />
(6)<br />
2 5 2<br />
Se pueden evitar algunas multiplicaciones<br />
en el proceso de transformación integr<strong>and</strong>o el<br />
proceso de cuantización. Por lo tanto, la<br />
ecuación (1) se puede modificar antes de<br />
cuantizar de la siguiente forma:<br />
donde<br />
T<br />
X = HFH ⊗ SF<br />
(7)<br />
⎡1 1 1 1 ⎤<br />
⎢2 1 −1 −2<br />
⎥<br />
H = ⎢<br />
⎥<br />
⎢1 −1 −1 1 ⎥<br />
⎢<br />
⎣1 −2 2 −1<br />
⎥<br />
⎦<br />
2 2<br />
⎡ a ab / 2 a ab / 2 ⎤<br />
⎢<br />
2 2 ⎥<br />
ab b ab b<br />
SF = ⎢<br />
/ 2 / 4 / 2 / 4<br />
⎥<br />
2 2<br />
⎢ a ab / 2 a ab / 2 ⎥<br />
⎢<br />
2<br />
2 ⎥<br />
⎣ab<br />
/ 2 b /4 ab / 2 b / 4 ⎦<br />
(8)<br />
(9)<br />
El símbolo ⊗ denota multiplicación elemento<br />
por elemento de las matrices correspondientes.<br />
Paso 2. Post escalamiento y<br />
cuantización<br />
A la matriz SF se le aplica una cuantización,<br />
utiliz<strong>and</strong>o un cuantizador (Qstep), para después<br />
obtener una nueva matriz Y de la siguiente<br />
forma:<br />
⎛<br />
Y X round SF ij ⎞<br />
ij<br />
= ⎜ ⎟<br />
ij<br />
(10)<br />
⎜<br />
⎝<br />
Q ⎟<br />
step<br />
⎠<br />
El H.264 define un total de 52 valores para<br />
Qstep.<br />
Vol.VIII No.3 -julio-septiembre- 2007 171
Descripción del nuevo estándar de video H.264 y comparación de su eficiencia de ...<br />
Proceso de decodificación<br />
Paso 1. Cuantización inversa y<br />
preescalamiento<br />
La señal Y recibida en el decodificador se<br />
escala utiliz<strong>and</strong>o el valor de Q step y se utiliza<br />
SF -1 como parte de la cuantización y transformación<br />
inversas de la siguiente forma:<br />
−1<br />
ij ij step ij<br />
X' = Y • Q • SF<br />
(11)<br />
Paso 2. Transformación inversa entera<br />
Recuperamos la señal F’ de la siguiente<br />
forma:<br />
T<br />
F'<br />
= H v X'<br />
Hv<br />
(12)<br />
Donde la matriz de transformación inversa<br />
es:<br />
Hv =<br />
⎡ 1 1 1 1 ⎤<br />
⎢<br />
⎢<br />
1 1 / 2 −1 / 2 −1<br />
⎥<br />
⎥<br />
⎢ 1 −1 −1 1 ⎥<br />
⎢<br />
⎥<br />
⎣1 / 2 −1 1 −1 / 2 ⎦<br />
(13)<br />
Posteriormente se aplica a bloques de 4x4<br />
de coeficientes de DC de luminancia la<br />
transformada Hadamard de la ecuación 12.<br />
Esto constituye una transformación jerárquica.<br />
⎡1 1 1 1 ⎤<br />
⎢<br />
⎥<br />
1 1 −1 −1<br />
$H = ⎢<br />
⎥<br />
⎢1 −1 −1 1 ⎥<br />
⎢<br />
⎥<br />
⎣1 −1 1 −1<br />
⎦<br />
(14)<br />
A los coeficientes de DC de los bloques de<br />
crominancia (formato 4:2:0), se les aplica la<br />
siguiente transformada.<br />
⎡1 1 ⎤<br />
$H = ⎢<br />
⎣1 −1<br />
⎥<br />
⎦<br />
(15)<br />
Para los coeficientes de DC de los bloques de<br />
crominancia en los formatos 4:2:2 y 4:4:4<br />
también se utiliza la transformada Hadamard<br />
adaptada.<br />
La siguiente matriz de la DCT entera se<br />
utiliza únicamente en perfiles altos.<br />
⎡ 8 8 8 8 8 8 8 8 ⎤<br />
⎢<br />
12<br />
⎢<br />
10 6 3 −3 −6 −10 −12<br />
⎥<br />
⎥<br />
⎢ 8 4 −4 −8 −8 −4 4 8 ⎥<br />
⎢<br />
⎥<br />
10 −3 −12 −6 6 12 3 10<br />
H = ⎢<br />
−<br />
⎥<br />
⎢ 8 −8 −8 8 8 −8 −8 8 ⎥<br />
⎢<br />
⎥<br />
⎢ 6 −12 3 10 −10 −3 12 −6<br />
⎥<br />
⎢ 4 −8 8 −4 −4 8 −8 4 ⎥<br />
⎢<br />
⎥<br />
⎣ 3 −6 10 −12 12 −10 6 −3<br />
⎦<br />
Codificación en entropía<br />
(16)<br />
En estándares anteriores (MPEG-1, 2, 4,<br />
H.261 y H.263), la codificación de la entropía<br />
se basa en tablas previamente definidas, las<br />
cuales contienen los códigos de longitud<br />
variable (VLCs, variable length code) (Flierl,<br />
2003), donde el conjunto de palabras de<br />
código en las tablas se basa en distribuciones<br />
de probabilidad de datos obtenidos en secuencias<br />
de video genérico, en lugar de utilizar<br />
la codificación Huffman o arimética<br />
exacta para la codificar la secuencia en<br />
cuestión.<br />
El H.264 utiliza diferentes VLCs a fin de<br />
igualar el símbolo que representa un dato de<br />
video, con un código basado en las<br />
características del contexto en el que se<br />
encuentra el símbolo. Todos los elementos de<br />
la sintaxis se codifican utiliz<strong>and</strong>o el código<br />
Exp-Golomb, excepto los datos residuales<br />
(Golomb, 1966). A fin de leer los datos<br />
residuales (coeficientes transformados y<br />
cuantizados) se utiliza una búsqueda en<br />
zigzag o una búsqueda alternada (campos de<br />
172 INGENIERIA Investigación y Tecnología FI-UNAM
H.de J. Ochoa-Domínguez, J.Mireles-García, J. de D. Cota-Ruíz<br />
cuadros de video no entrelazados). Para<br />
codificar los datos residuales, se utiliza un<br />
método más sofisticado llamado código de<br />
longitud variable adaptivo basado en el<br />
contexto (CAVLC, Context Based Adaptive<br />
Variable Length Code). En los perfiles principal<br />
y alto, también se utiliza otro método<br />
llamado CABAC, pero es más complejo que<br />
el CAVLC.<br />
Código adaptivo de longitud<br />
variable basado en el contexto<br />
(CAVLC)<br />
Después de la transformación y la cuantización,<br />
la probabilidad de que el valor de un<br />
coeficiente sea cero o +/- 1 es muy alta. Por lo<br />
tanto, se codifica el número total de ceros y<br />
+/-1 que ocurren. Para los demás coeficientes<br />
sólo se codifica su nivel.<br />
Por ejemplo, suponiendo que los siguientes<br />
coeficientes se van a codificar utiliz<strong>and</strong>o<br />
CAVLC<br />
orden 0 1 2 3 4 5 6 7 8 9... 16<br />
coef c0, c1, c2, 1, 1, 0, 0, -1, 0, 0,..., 0<br />
Las reglas que utilizaría el CAVLC son:<br />
- Paso 1: Se utiliza una palabra de<br />
código de una tabla para expresar el<br />
número de coeficientes diferentes de<br />
cero, 6 (orden 0, 1, 2, 4, 5, 7) con<br />
magnitud uno, 3 (orden 4, 5, 7).<br />
- Paso 2: Se forma una palabra de<br />
código para indicar los signos de los unos<br />
en orden inverso de la siguiente forma, -<br />
(orden 7), + (orden 5) y +(orden 4).<br />
- Paso 3: Se utiliza una palabra de<br />
código para cada nivel de los coeficientes<br />
restantes en orden inverso, esto<br />
es, una palabra de código para c2 (orden<br />
2), c1, y c0.<br />
- Paso 4: Se utiliza una palabra de<br />
código para indicar en número de ceros,<br />
2 (orden 3, 6)<br />
- Paso 5: Las palabras de código resultantes<br />
se codifican utiliz<strong>and</strong>o runlength<br />
en orden inverso, esto es, una<br />
palabra de código para 1 (orden 6-5), 0<br />
(orden 4), 1 (orden 3-2).<br />
Código aritmético binario adaptivo<br />
basado en el contexto (CABAC)<br />
CABAC utiliza la codificación aritmética a fin<br />
de obtener una buena compresión. El modelo<br />
de probabilidad se actualiza con cada símbolo<br />
como se muestra en la figura 7 (Marpe,<br />
2003).<br />
Paso 1. Binarización. Proceso por el cual un<br />
símbolo no binario (coeficiente transformado,<br />
vector de movimiento, etc.) se mapea a<br />
una secuencia binaria única antes de aplicar<br />
la codificación aritmética.<br />
Paso 2. Modelado del contexto. Un modelo<br />
de un contexto es un modelo de probabilidades<br />
para uno o más elementos de un<br />
símbolo binarizado. El modelo de probabi-<br />
Actualizació n<br />
Binariza ción<br />
Modelado d el<br />
contexto<br />
Estimación de<br />
la p ro babilidad<br />
Codific ador<br />
Codi ficador ari tmét ico binario adapti vo<br />
Figura 8. Diagrama a bloques del CABAC<br />
Vol.VIII No.3 -julio-septiembre- 2007 173
Descripción del nuevo estándar de video H.264 y comparación de su eficiencia de ...<br />
lidad se selecciona de tal forma, que dicha<br />
selección depende sólo de elementos de la<br />
sintaxis previamente codificados.<br />
Paso 3. Codificación binaria aritmética. Se<br />
utiliza el código aritmético para codificar cada<br />
elemento de acuerdo con la selección del<br />
modelo de probabilidad.<br />
Rebanadas de video tipo B<br />
La predicción bidireccional contribuye a reducir<br />
la correlación temporal, ya que utiliza<br />
como referencia más cuadros almacenados en<br />
memoria. Los estándares que manejan cuadros<br />
tipo B, utilizan el modo bidireccional, lo<br />
cual sólo permite la combinación de una<br />
señal predecida previamente con la predicción<br />
subsiguiente. Una señal predecida, se<br />
forma por la señal subsiguiente, codificada<br />
como INTER, una señal perteneciente a un<br />
cuadro anterior y otra señal que se forma<br />
tom<strong>and</strong>o el promedio lineal de dos señales<br />
predecidas en donde se utiliza la compensación<br />
de movimiento.<br />
El H.264 incluye no sólo predicción hacia<br />
adelante/atrás, sino también la predicción<br />
adelante/adelante y atrás/atrás (Flierl, 2003).<br />
Se pueden utilizar dos cuadros anteriores<br />
para la predicción de una región de video,<br />
justo antes de que la escena cambie y dos<br />
referencias posteriores justo después de que<br />
la escena cambió. A diferencia de los estándares<br />
previos, en el H.264, las rebanadas<br />
predecidas bidireccionalmente pueden utilizarse<br />
como referencia de otros cuadros que se<br />
codificarán en modo INTER. También, se<br />
agrega la predicción con peso cu<strong>and</strong>o existen<br />
transiciones entre las diferentes escenas del<br />
video.<br />
Predicción con peso<br />
Los estándares anteriores consideran con<br />
igual peso a todos los cuadros o imágenes<br />
que sirven como referencia para la predicción.<br />
Por ejemplo, una señal bajo predicción<br />
se obtiene promedi<strong>and</strong>o con igual peso las<br />
señales de referencia. Sin embargo, la predicción<br />
de las señales en transición gradual<br />
de escena a escena, precisa de diferentes pesos.<br />
La transición gradual es muy popular en<br />
cines, trancisiones de difuminadas hacia el<br />
color negro (las muestras de luminancia de la<br />
escena difuminan gradualmente aproximándose<br />
a cero y las de crominancia se aproximan<br />
a 128) o desde el color negro.<br />
El H.264 utiliza el método de predicción<br />
con pesos para los macrobloques de una<br />
rebanada tipo P o tipo B. Una señal de<br />
predicción p para una rebanada tipo B, se<br />
obtiene de dos señales de referencia (r1 y r2 )<br />
utiliz<strong>and</strong>o diferentes pesos.<br />
p = w1 × r1 + w2 × r2 (17)<br />
Donde w1 y w2 son los pesos.<br />
Los pesos se determinan en el codificador<br />
de dos maneras diferentes, implícitamente y<br />
explícitamente. En la determinación implícita,<br />
los pesos los calcula el decodificador<br />
basado en la distancia temporal entre cuadros<br />
de referencia. Si la distancia temporal<br />
entre la referencia y el cuadro actual es cercana,<br />
los pesos son pequeños, y si la distancia<br />
temporal es gr<strong>and</strong>e, los pesos son más<br />
gr<strong>and</strong>es. En la determinación explicita los<br />
pesos se envían al decodificador en el encabezado.<br />
Slices tipo SP y SI<br />
En los estándares de codificación de video<br />
anteriores, el cambio entre trenes de bits es<br />
posible, únicamente en cuadros tipo I, reconstruyendo<br />
cuadros I a intervalos fijos, lo que<br />
permite el acceso aleatorio de los cuadros<br />
para reproducción rápida del video (fast<br />
forward/backward ). Sin embargo, el problema<br />
174 INGENIERIA Investigación y Tecnología FI-UNAM
H.de J. Ochoa-Domínguez, J.Mireles-García, J. de D. Cota-Ruíz<br />
de usar cuadros I es que se requiere de un<br />
número de bits mucho mayor y no se<br />
explotan las redundancias temporales.<br />
En el H.264 se utilizan rebanadas de video<br />
tipo SP y SI para cambiar el tren de bits<br />
(Ghanbari, 2003). La figura 9 muestra cómo<br />
utilizar los cuadros SP para cambiar entre<br />
diferentes trenes de bits. Suponiendo que<br />
existen dos trenes de bits, P(1,k) y P(2,k),<br />
correspondientes a la misma secuencia de<br />
video pero con diferentes velocidades binarias.<br />
Dentro del tren de bits codificado, los<br />
cuadros SP se colocan en una posición a la<br />
cual se permita un cambio de tren de bits.<br />
En caso de cambiar del tren de bits<br />
superior P(1,3) al inferior P(2,3), se genera el<br />
cuadro SP S(3) que permite producir un cuadro<br />
decodificado P(2,3) utiliz<strong>and</strong>o P(1,2) de<br />
otro tren de bits, aun cu<strong>and</strong>o haya compensación<br />
de movimiento.<br />
También se puede utilizar una rebanada<br />
de video tipo SI de manera similar al SP,<br />
pero la predicción se formaría utiliz<strong>and</strong>o el<br />
modo de predicción INTRA de 4x4 (Karczewicz,<br />
2003).<br />
Resistencia a errores<br />
El particionamiento de los datos es un<br />
método muy popular para incrementar la<br />
resistencia a errores del sistema. Los datos<br />
son particionados de acuerdo con su significancia<br />
dentro del tren de bits. Posteriormente,<br />
se transmiten primero los datos con<br />
mayor prioridad para reducir el error medio<br />
cuadrático de la secuencia a un mínimo, posteriormente<br />
se transmiten los datos menos<br />
significativos. También, la codificación en<br />
capas (escalable) aumenta la resistencia a<br />
errores (transmisión de bits más significativos<br />
primero). Durante la codificación<br />
escalable espacial o temporal se pueden recuperar<br />
datos perdidos en otras capas.<br />
Este nuevo estándar incrementa la resistencia<br />
a errores de transmisión por medio de<br />
la contribución de rebanadas tipo S, el ajuste<br />
de los parámetros de codificación, el ordenamiento<br />
flexible de los macrobloques y el<br />
uso de rebanadas redundantes (Wenger,<br />
2003).<br />
P(1,1) P(1,2) P(1,3) P(1,4 ) P(1,5)<br />
S(3)<br />
P(2,1) P(2,2) P (2 ,3) P(2 ,4) P(2,5)<br />
Figura 9. Cambio en la velocidad del tren de bits utiliz<strong>and</strong>o cuadros tipo SP<br />
Vol.VIII No.3 -julio-septiembre- 2007 175
Descripción del nuevo estándar de video H.264 y comparación de su eficiencia de ...<br />
Comparación del esquema de<br />
codificación del H.264 con otros<br />
esquemas<br />
La tabla 8 muestra en análisis comparativo de<br />
los algoritmos de codificación de video<br />
MPEG-2 y MPEG-4 parte 2 contra el H.264<br />
(ISO/IEC JTC1/SC29/WG11 Verification Tests<br />
on AVC, 2003).<br />
Tabla 8. Comparación de los estándares MPEG-2, MPEG-4 parte 2 y H.264 / MPEG-4 parte 10<br />
Característica MPEG-2 MPEG-4 part 2 MPEG-4 part 10/H.264<br />
Tamaño del<br />
Macrobloque<br />
Tamaño de<br />
bloques<br />
16x16 (Modo cuadro)<br />
16x8 (Modo campo)<br />
8x8<br />
16x16<br />
16x16, 16x8, 8x8<br />
16x16<br />
16x16, 8x16, 16x8, 8x8,<br />
4x8, 8x4, 4x4<br />
Predicción INTRA No Dominio de la transformada Dominio espacial<br />
Transformada<br />
Cuantización<br />
DCT de tamaño 8x8<br />
Cuantización escalar con<br />
tamaño constante entre<br />
pasos del cuantizador<br />
DCT-Wavelet de tamaño<br />
8x8<br />
Cuantización vectorial<br />
8x8, 4x4 DCT entera<br />
4x4, 2x2 Hadamard<br />
Cuantización escalar con<br />
tamaño entre pasos de<br />
12.5% de la velocidad<br />
binaria<br />
Codificación de la entropía VLC VLC VLC, CAVLC, CABAC<br />
Exactitud de las muestras de<br />
la imagen<br />
1 2 muestra 1 4 muestra 1 4 muestra<br />
Cuadros de referencia 1 cuadro 1 cuadro Múltiples cuadros<br />
Modo de predicción<br />
bidireccional<br />
adelante / atrás<br />
adelante / atrás<br />
adelante / atrás<br />
atrás / atrás<br />
backward / backward<br />
Predicción con peso No No Si<br />
Filtro de desbloqueo No No Si<br />
Tipo de cuadros I, P, B I, P, B I, P, B, SI, SP<br />
Perfiles 5 perfiles 8 perfiles 7 perfiles<br />
Acceso aleatorio Si Si Si<br />
Resistencia a errores<br />
Particionamiento de datos,<br />
FEC para transmisión de<br />
paquetes por importancia<br />
Sincronización,<br />
particionamiento de datos,<br />
extensión de encabezados,<br />
VLCs reversibles<br />
Particionamiento de datos,<br />
ajuste de parámetros, orden<br />
flexible de macrobloques,<br />
rebanadas redundantes,<br />
rebanadas tipo SP y SI<br />
Velocidad de transmisión 2-15 Mbps 64kbps - 2Mbps 64kbps - 150Mbps<br />
Complejidad del codificador Mediana Mediana Alta<br />
Compatibilidad con<br />
estándares previos<br />
Si Si No<br />
176 INGENIERIA Investigación y Tecnología FI-UNAM
H.de J. Ochoa-Domínguez, J.Mireles-García, J. de D. Cota-Ruíz<br />
Eficiencia de codificación<br />
La tabla 9 muestra las comparaciones del<br />
H.264 perfil Línea Base (BP) del H.264<br />
contra el Perfil Simple del MPEG-4 parte 2<br />
(SP) para secuencias con definición de<br />
multimedia (MD). Los números en las<br />
tablas indican la mejora en la eficiencia de<br />
la codificación. Por ejemplo, > 2x significa<br />
que la eficiencia del H.264 fue más de dos<br />
veces la eficiencia del MPEG-4 parte 2 Perfil<br />
Simple (ISO/IEC JTCI/SC29/WG11, 2000) y<br />
para la velocidad binaria de la secuencia<br />
indicada. La letra T significa que el H.264<br />
fue transparente en la velocidad binaria<br />
para la secuencia dada. Estadísticamente el<br />
H.264 BP tuvo una mejora en la eficiencia<br />
de la codificación de 2 veces o más, en 14 de<br />
18 casos probados.<br />
La tabla 10 muestra la comparación del<br />
H.264 Perfil Principal (MP) y el MPEG-4<br />
Parte 2 Perfil Simple Avanzado (ASP) para<br />
secuencias MD (ITU-T H.264, 2003). Estadísticamente<br />
el H.264 BP tuvo una eficiencia de<br />
codificación de 2 veces o más que el MPEG-4<br />
parte 2 ASP, en 18 de 25 casos probados.<br />
La tabla 11 muestra la comparación entre<br />
el H.264 Perfil Principal (MP) y el MPEG-2<br />
para definición estándar (SD) (ITU-T <strong>and</strong><br />
ISO/IEC, 1994). Estadísticamente el H.264<br />
MP, tuvo una eficiencia de codificación de 1.5<br />
veces o más que el MPEG-2HiQ, en 8 de 12<br />
casos probados, de los cuales, en 3 casos el<br />
H.264 mostró una mejora en la eficiencia de la<br />
codificación de 2 veces o más y en 1 caso<br />
mostró una mejora de 4 veces mayor.<br />
Cu<strong>and</strong>o se comparó contra el modelo de<br />
prueba 5 del MPEG-2 (MEPG-2 TM5),<br />
estadísticamente, el H.264 Perfil Principal<br />
tuvo una eficiencia de codificación de 1.8<br />
veces o más en 9 de 12 casos probados, de los<br />
cuales, en 2 casos mostró una mejora de 4<br />
veces mayor.<br />
Tabla 9. Comparación del H.264 Perfil Línea Base y el MPEG-4 Parte 2 Perfil Simple para secuencia con<br />
definición MD<br />
Secuencia Velocidad bin aria [kbps] para QCIF Velocidad bina ria [kbps] pa ra CI F<br />
24 48 9 6 192 96 192 3 84 7 68<br />
Forema n > 1 x 2x 2x T 2x > 2x T T<br />
Paris > 1 x 2x 2x 2x 2x T, 2x T<br />
Head > 2x 2x 2x T T<br />
Zoom > 1 x 1x 2x 2x<br />
Tabla 10. Comparación del H.264 Perfil Prin cipal y el MPEG-4 Parte 2 Perfil Simple Avanzado para<br />
secuencias con definición MD<br />
Secuencia<br />
Velocidad binaria [kbps] pa ra QCIF<br />
Velocidad binaria [kbps] para CIF<br />
24 48 96 192 96 192 384 768<br />
Footba ll 2x / 1 x 2x 2x > 1x > 1x 1x > 1x<br />
Mobile 2x / 1 x 2x 2x > 2x 4x > 2x T<br />
Husky 2x 2x > 1x 2x 2x 2x<br />
Tempete 2x 2x > 2x T 2x 2x T,2x T<br />
Vol.VIII No.3 -julio-septiembre- 2007 177
Descripción del nuevo estándar de video H.264 y comparación de su eficiencia de ...<br />
Secuencia<br />
Tabla 11. Comparación del H.264 MP contra el MPEG-2 para definición estándar (SD)<br />
Velocidad binaria [Mbps] p ara el MPEG-2<br />
HiQ<br />
Velocidad binaria [Mbps] pa ra MPEG-2<br />
TM5<br />
1.5 2.25 3 4 6 1.5 2.25 3 4 6<br />
Footba ll > 1.5x > 1.3x 1.3x 1 .5x 2x 1 .8x 1. 3x 1.5x<br />
Mobile 4x 2.7x 2x T T > 4x > 2. 7x > 2x T T<br />
Husky > 1.5x 1.3x 1 x /1.3x 1 .5x 2.7x / 2x 1 .8x 2x > 1.5x<br />
Tempete T, 2 x T T T T T, 4x T T T T<br />
La tabla 12 muestra la comparación entre el<br />
H.264 Perfil Principal y el MPEG-2 para alta<br />
definición (HD). Estadísticamente, el H.264<br />
Perfil Principal tuvo una eficiencia de codificación<br />
de 1.7 veces mayor que el MPEG-2 en<br />
7 de 9 casos probados, de los cuales, en 3<br />
casos mostró mejoras de hasta 2 veces y en 1<br />
caso de hasta 3.3 veces.<br />
Cu<strong>and</strong>o se comparó el modelo de prueba 5<br />
del MPEG-2 (MEPG-2 TM5), estadísticamente,<br />
el H.264 Perfil Principal, tuvo una<br />
eficiencia de codificación 1.7 veces o mayor<br />
en 8 de 9 casos, de los cuales, en 4 casos<br />
mostró una mejora de 2 veces mayor.<br />
Codificador de audio<br />
El H.264/MPEG-4 parte 10, está siendo adoptado<br />
por muchas compañías de video tales<br />
como Phillips, Polycom, Ligos, Broadcom,<br />
Netvideo, Motorota, STMicroelectronics entre<br />
otras. El estándar se refiere únicamente a la<br />
codificación de video, dej<strong>and</strong>o la libertad a<br />
las compañías de elegir sus propios codificadores<br />
de audio. Por ejemplo, la empresa<br />
europea DVB está consider<strong>and</strong>o adoptar AAC-<br />
SBR (Advanced Audio Coding - Spectral B<strong>and</strong><br />
Replication) llamado formalmente AAC plus,<br />
mientras que la empresa americana ASTC utilizará<br />
AC-3 plus de los laboratorios Dolby Labs.<br />
Además del H.264, China ha desarrollado<br />
su propio estándar de video llamado AVS<br />
(Audio Video St<strong>and</strong>ard de China), el cual es<br />
un algoritmo similar, con algunas diferencias<br />
en los tamaños de las transformadas, codificadores<br />
de entropía, filtros de desbloqueo,<br />
filtros de interpolación para la compensación<br />
de movimiento, etc.<br />
Secu encia<br />
Tabla 12. Comparación del H.264 MP y el MPEG-2 para HD<br />
Velocidad binaria [Mbps] para<br />
el MPEG-2 HiQ<br />
V elocidad bi naria [Mbps] par a el<br />
MP EG-2 TM5<br />
6 10 20 6 10 20<br />
720 Crew 1.7x 2x T 1.7x 2x T<br />
(60p) Harbour T, 3.3x T T T, 1.7x T T<br />
Stockh olm<br />
1x<br />
2x<br />
1080<br />
(30i)<br />
Pan<br />
New Mobile<br />
T, 2x T T, 2x T<br />
& Ca lenda r<br />
1080 River Bed > 1.7x > 1x T > 1.7 x > 1x T<br />
(25p) Vinta ge Ca r 1.7x T, 2x T 1.7x T, 2x T<br />
178 INGENIERIA Investigación y Tecnología FI-UNAM
H.de J. Ochoa-Domínguez, J.Mireles-García, J. de D. Cota-Ruíz<br />
Conclusiones<br />
El presente artículo describe al nuevo estándar<br />
de compresión de video H.264/MPEG-4<br />
parte 10, el cual supera a los estándares de<br />
video anteriores. Las principales diferencias<br />
se encuentran en la estructura de los bloques<br />
funcionales del algoritmo. Por ejemplo, compensación<br />
de movimiento en bloques de<br />
tamaño variable, interpolación para exactitud<br />
fraccional, filtro de desbloqueo adaptivo,<br />
rebanadas tipo SI y SP, mayor resistencia a<br />
los errores que los estándares anteriores,<br />
trasformada de 4×4, predicción con carga,<br />
CABC, CAVLC y predicción direccional para<br />
codificación INTRA.<br />
La tendencia actual de las empresas dedicadas<br />
al video se está moviendo a favor de la<br />
implementación del nuevo estándar para las<br />
diferentes aplicaciones como son, cámaras<br />
digitales, transmisión de video sobre redes<br />
IP, teléfonos celulares, transmisión de video<br />
satelital, entre otras.<br />
El siguiente paso que está d<strong>and</strong>o el grupo<br />
de expertos, es coordinar los términos de las<br />
licencias para que las compañías manufactureras<br />
paguen las regalías correspondientes<br />
por el codificador-decodificador y los términos<br />
de las licencias.<br />
Referencias<br />
Flierl M. <strong>and</strong> Girod B. (2003). Gener al ized<br />
B Picture <strong>and</strong> the Draft H.264/AVC<br />
Video-Compression Stan dard. IEEE<br />
Trans ac tions on Circuits <strong>and</strong> Systems for<br />
Video Tech nology, Vol. 13, pp. 587-597,<br />
Julio.<br />
Ghanbari M. (2003). Stan dard Codecs:<br />
Image Compres sion to Advanced Video<br />
Coding. Hertz, UK: IEE.<br />
Golomb S.W. (1966). Run-Length Encoding.<br />
IEEE Trans. on Infor ma tion Theory,<br />
IT-12, pp. 399-401, Dic.<br />
Huang Y.W. (2005). Anal ysis, Fast Algo -<br />
rithm, <strong>and</strong> VLSI Archi tec ture Design<br />
for H.264/AVC Intra Frame Coding.<br />
IEEE Trans ac tions on Circuits <strong>and</strong> Systems<br />
for Video Tech nology, Vol. 15, pp.<br />
378-401, Marzo.<br />
ISO/IEC 11172-2:1993 (1993). Infor ma tion<br />
Tech nology, Coding of Moving Pictures<br />
<strong>and</strong> Associated Audio for Digital<br />
Storage Media at Up to About 1,5<br />
Mbit/s-Part 2: Video.<br />
ISO/IEC JTC1/SC29/WG11, “ISO/IEC<br />
13818-2: (1994). Infor ma tion Technology-Generic<br />
Coding of Moving Pictures<br />
<strong>and</strong> Asso ci ated Audio Infor ma -<br />
tion: Video, ISO/IEC.<br />
ISO/IEC JTC1/SC29/WG11 (2003). Report<br />
of the Formal Veri fi ca tion Tests on<br />
AVC (ISO/IEC14496-10 | ITU-T Rec.<br />
H.264)”, MPEG2003/N6231, diciembre.<br />
ISO/IEC JTCI/SC29/WG11, ISO/IEC 14<br />
496:2000-2: (2000). Infor ma tion on<br />
Technology-Coding of Audio-Visual<br />
Objects-Part 2: Visual, ISO/IEC.<br />
ITU-T H.262 (2000). Inter na tional Tele -<br />
com mu ni ca tion Union, Recom men da -<br />
tion: Generic Coding of Moving<br />
Pictures <strong>and</strong> Asso ci ated Audio Infor -<br />
ma tion: Video, ITU-T.<br />
ITU-T H.264 (2003). Inter na tional Tele -<br />
com mu ni ca tion Union, Recom men da -<br />
tion: Advanced Video Coding for<br />
Generic Audio vi sual Services, ITU-T.<br />
ITU-T H261 (1993). Inter na tional Tele com -<br />
mu ni ca tion Union, Recom men da tion<br />
ITU-T H.261: Video Codec for Audio vi -<br />
sual Service at px64 kbits,” ITU-T.<br />
Karczewicz M. <strong>and</strong> Kurceren R., (2003).<br />
The SP- <strong>and</strong> SI Frames Design for<br />
H.264/AVC. IEEE Trans ac tions on Circuits<br />
<strong>and</strong> Systems for Video Tech nology,<br />
Vol. 13, pp. 537-544, Julio.<br />
List P. (2003). Adap tive Deblocking<br />
Filter. IEEE Trans ac tions on Circuits <strong>and</strong><br />
Systems for Video Tech nology, Vol. 13,<br />
pp. 614-619, Julio.<br />
Vol.VIII No.3 -julio-septiembre- 2007 179
Descripción del nuevo estándar de video H.264 y comparación de su eficiencia de ...<br />
Marpe D. (2003). Context-Based Binary<br />
Arith metic Coding in the H.264/AVC<br />
Video Compres sion Stan dard. IEEE Transactions<br />
on Circuits <strong>and</strong> Systems for Video<br />
Tech nology, Vol. 13, pp. 620-635, Julio.<br />
Ochoa H. <strong>and</strong> Rao K.R. (2005). A New<br />
Modified Hybrid DCT-SVD Coding<br />
System for Color Images. WSEAS Transaction<br />
on Circuits <strong>and</strong> Systems, Vol. 4, pp.<br />
1246-1253, Octubre.<br />
Ochoa H. <strong>and</strong> Rao K.R. (2006). A New<br />
Modified Version of the HDWTSVD<br />
Coding System for Mono chro matic<br />
Images. WSEAS Trans ac tion on Systems,<br />
Vol. 5, pp. 1190 – 1195, Mayo.<br />
Rich ardson I. E.G. (2003). H.264 <strong>and</strong><br />
MPEG-4 Video Compres sion: Video Coding<br />
for Next-generation Multi media, Wiley.<br />
Sullivan G., Topiwala P. <strong>and</strong> Luthra A.<br />
(2004). The H.264/AVC Advanced<br />
Video Coding Stan dard: Over view <strong>and</strong><br />
Intro duc tion to the Fidelity Range<br />
Exten sions. SPIE Confer ence on Appli -<br />
ca tions of Digital Image Processing<br />
XXVII, Vol. 5558, pp. 53-74, agosto.<br />
Wenger A. (2003). H.264/AVC Over IP.<br />
IEEE Trans ac tions on Circuits <strong>and</strong> Systems<br />
for Video Tech nology, Vol. 13, pp.<br />
645-656, julio.<br />
Wien M. (2003). Vari able Block-Size<br />
Trans form for H.264/AVC. IEEE Transactions<br />
on Circuits <strong>and</strong> Systems for Video<br />
Tech nology, Vol. 13, pp. 604-613, julio.<br />
180 INGENIERIA Investigación y Tecnología FI-UNAM
H.de J. Ochoa-Domínguez, J.Mireles-García, J. de D. Cota-Ruíz<br />
Semblanza de los autores<br />
Humberto de J. Ochoa-Domínguez. Estudió su licenciatura en el Instituto Tecnológico de Veracruz, su maestría en el<br />
Instituto Tecnológico de Chihuahua y su doctorado en la Universidad de Texas en Arlíngton, apoyado por<br />
Fulbright y PROMEP. Trabajó en el grupo de investigaciones de multi media de Nokia, en Irving Texas, y<br />
actualmente es profesor investigador en la Universidad Autónoma de Ciudad Juárez. Ha impartido diversos<br />
cursos tutoriales de codificación de video y procesamiento de señales en Singapur, Tail<strong>and</strong>ia, Estados Unidos y<br />
la República de Malta. En 1998, recibió el premio Chihuahua por el trabajo “Sistema para la Clasificación de<br />
Mamografías Digitales en Normales y Anormales Mediante el Análisis de Textura y Detección de Micro<br />
calcificaciones. Ha ofrecido conferencias en diversos foros de multi media y procesamiento de señales en varias<br />
partes del mundo y ha publicado en diferentes Jour nals y revistas arbitradas de reconocimiento nacional e<br />
internacional. Asimismo, es miembro de la Sociedad de Procesamiento de Señales del al IEEE .<br />
José Mireles-García. Estudió su licenciatura en ingeniería indus trial con especialidad en electrónica, así como su<br />
maestría en electrónica en el Instituto Tecnológico de Chihuahua. Obtuvo su doctorado en ingeniería eléctrica<br />
en la Universidad de Texas en Arlington (UTA), apoyado por PROMEP. Actualmente es profesor investigador<br />
en la Universidad Autónoma de Ciudad Juárez y profesor de investigación adjunto de las Universidades de<br />
Texas en Arlington y de El Paso. Es miembro del Sistema Nacional de Investigadores (SNI,) de la Sociedad de<br />
Control y de la SMC de la IEEE. Asimismo, ha sido integrado en la lista de Strathsmore’s Who’s Who los años<br />
2002 y 2003. Fue visitante en la UTA de Agosto 2002 a Julio 2003, en cuyo período también trabajó en el Instituto<br />
de Robótica de UTA en Fort Worth TX como asistente de investigación, y participó en la recepción de fondos<br />
binacionales NSF-CONACyT para desarrollo de trabajo en sistemas de eventos discretos. Sus áreas de interés<br />
son el diseño, fabricación y prueba de los Sistemas Microelectromecánicos (MEMS,) robotización y<br />
automatización y sistemas de eventos discretos. Ha impartido conferencias en diversos foros de robótica,<br />
automatización y MEMS en varias partes del mundo y ha publicado en diferentes Jour nals y revistas arbitradas<br />
de reconocimiento nacional e internacional, así también ha participado en la organización de diversos foros<br />
nacionales e internacionales.<br />
Juan de Dios Cota-Ruíz. Estudió su licenciatura en el Instituto Tecnológico de Sonora y su maestría en el Instituto<br />
Tecnológico de Chihuahua. Trabajó en el área de diseño de equipo de prueba para la empresa SMTC de<br />
Chihuahua y RCA Thomson. Actualmente trabaja como profesor investigador en el Departamento de<br />
Ingeniería Eléctrica y Computación de la Universidad Autónoma de Ciudad Juárez en el área de<br />
Instrumentación y Procesamiento de Señales. Ha publicado en diferentes revistas arbitradas del país.<br />
Vol.VIII No.3 -julio-septiembre- 2007 181
INGENIERÍA Investigación y Tecnología VIII. 3. 183-195, 2007<br />
(artículo arbitrado)<br />
El clima, la ecología y el caos desde la<br />
perspectiva de la teoría general de sistemas<br />
N. Sánchez-Santillán y R. Garduño-López<br />
Departamento El Hombre y su Ambiente, UAM-Xochimilco y<br />
Centro de Ciencias de la Atmósfera, UNAM, México<br />
E-mails: santilla@correo.xoc.uam.mx y rene@atmosfera.unam.mx<br />
(Recibido: noviembre de 2005; aceptado: diciembre de 2006)<br />
Resumen<br />
La ciencia clásica determinista afronta dificultades para abordar y explicar<br />
fenómenos complejos, como son aquellos que conciernen al estudio del clima, la<br />
ecología o las sociedades humanas. Un nuevo paradigma científico, como la<br />
visión holística, ha ido llen<strong>and</strong>o gradualmente los huecos dejados por el viejo<br />
enfoque mecanicista y ha incorporado, entre otras, además del mecanicismo de<br />
Newton, la teoría de la información, la cibernética, la teoría del caos y la teoría<br />
general de sistemas. Se analizan éstas dos últimas teorías con una somera<br />
aproximación a problemas de climatología y ecología.<br />
Descriptores: Sistemas, caos, clima, ecología, modelos.<br />
Abstract<br />
Clas sic de ter min is tic sci ence con fronts dif fi cul ties to ap proach <strong>and</strong> ex plain com plex<br />
phe nom ena, like those con cern ing the study of cli mate, ecol ogy or hu man so ci et ies. A<br />
new sci en tific par a digm, the ho lis tic vi sion, has been grad u ally fill ing the gaps left by<br />
the old mechanicist ap proach, <strong>and</strong> along with New ton’s mechanicism, has in cor po rated<br />
In for ma tion the ory, cybernetics, chaos theory <strong>and</strong>, general systems theory, among oth -<br />
ers. These last two the o ries are an a lyzed with a su per fi cial ap proach to cli ma tol ogy <strong>and</strong><br />
ecol ogy is sues.<br />
Key words: Sys tems, chaos, cli mate, ecol ogy, mod els.<br />
Intro duc ción<br />
Existe una gran expectativa respecto al calentamiento<br />
climático y sus efectos sobre el planeta.<br />
La población en general espera que la<br />
comunidad científica responda a sus innumerables<br />
preguntas y ofrezca una solución<br />
viable a los problemas que se presentan en<br />
muchos lugares de la Tierra. Las lluvias<br />
torrenciales, las inundaciones, las olas de calor<br />
y los períodos de sequía, por mencionar algunos<br />
ejemplos, inciden de manera directa en<br />
el rendimiento de las cosechas, los volúmenes<br />
pesqueros y la salud humana, gener<strong>and</strong>o<br />
efectos importantes en las economías locales y<br />
regionales de los sitios donde se producen<br />
(Bakun, 1996; Chambers, 1993). Entre los investigadores<br />
de todo el mundo especializados<br />
en problemas climáticos y ecológicos, prevalecen<br />
gr<strong>and</strong>es incertidumbres sobre la mayoría<br />
de los temas que atañen a sus áreas de<br />
estudio y, a pesar de que se ha buscado y logrado<br />
una importante coordinación interdisciplinaria<br />
en esta comunidad, los resultados<br />
obtenidos hasta ahora no poseen la contundencia<br />
que de ellos se espera. ¿A que se debe esto?
El clima, la ecología y el caos desde la perspectiva de la teoría general de sistemas<br />
Las causas se encuentran en la manera lineal<br />
en que se abordan problemas multidimensionales,<br />
cuya complejidad desborda por completo<br />
los métodos de la ciencia clásica determinista.<br />
Ejemplos claros de sus limitaciones,<br />
son las dificultades que enfrenta este<br />
enfoque cu<strong>and</strong>o trata de elaborar pronósticos<br />
sobre la evolución de sistemas complejos,<br />
como el clima, la ecología o las sociedades<br />
humanas.<br />
Con el fin de apuntalar la necesidad del<br />
cambio de paradigma científico que trascienda<br />
las restricciones deterministas, en este<br />
trabajo se analizarán de forma breve, los<br />
elementos que han conducido hacia la visión<br />
holística, con la cual, paulatinamente se han<br />
encontrado las respuestas que el mecanicismo<br />
newtoniano no había podido proporcionar.<br />
Estos elementos van, desde la<br />
indivisibilidad de lo simple y lo complejo, del<br />
todo y sus partes, y del orden y el desorden,<br />
hasta la teoría del caos y la teoría general de<br />
sistemas.<br />
Hacia la teoría del caos<br />
La ciencia ha seguido dos caminos a través de<br />
su historia; por un lado, la visión mecanicista<br />
del mundo, desarrollada principalmente<br />
por Galileo, Descartes, Bacon y Newton,<br />
entre otros, la cual se basó en la división<br />
fundamental de dos reinos separados e independientes<br />
entre sí: el espíritu y la materia.<br />
El universo material, donde se incluía el<br />
organismo humano, era una máquina que, en<br />
principio, podía entenderse con sólo analizar<br />
por separado sus partes más pe- queñas<br />
(Capra, 1991; Ritter et al., 2002). El segundo<br />
camino comenzó con Heráclito en el siglo VII<br />
a C., quien planteó que el universo presenta<br />
armonía en la desarmonía y viceversa. Esta<br />
otra visión del conocimiento, vislumbraba lo<br />
que después dio pie a la complejidad de la<br />
relación orden-desorden-organización, la<br />
cual surgió cu<strong>and</strong>o se constató empíricamente<br />
que los fenómenos desordenados del<br />
universo son necesarios en ciertas condiciones<br />
(Bouald <strong>and</strong> Marcel, 1988; Bal<strong>and</strong>ier,<br />
1989).<br />
Con un ligero vistazo a nuestro alrededor,<br />
se advierte una tendencia general al desorden:<br />
un ciclón provoca lluvias torrenciales,<br />
un tornado genera corrientes de viento<br />
intempestivas, una ola de calor desencadena<br />
muerte… nunca al revés; pero, contrariamente<br />
a lo que se piensa, este desorden no<br />
implica confusión. Así entonces, surgió la<br />
búsqueda de una explicación de los fenómenos<br />
naturales, cuya complejidad los volvía<br />
prácticamente irresolubles mediante la aplicación<br />
de algoritmos lineales; esto dio pie a<br />
un nuevo paradigma: la teoría del caos. El<br />
caos es al mismo tiempo muerte-nacimiento,<br />
destrucción-creación y tiene que ver con<br />
aquello que no podemos saber con certeza;<br />
representa a la naturaleza en su creatividad<br />
expresada en un vasto campo de conductas y<br />
está vinculado con el modo en que ésta crea<br />
nuevas formas y estructuras (caos autoorganizado),<br />
con su impredictibilidad y su lógica<br />
difusa. Los sistemas caóticos se caracterizan<br />
por su adaptación al cambio, y en consecuencia,<br />
por su estabilidad (Thom, 1972). Si<br />
tiramos una piedra a un río, su cauce no se ve<br />
afectado, ya que la corriente buscará nuevos<br />
caminos; no sucedería lo mismo si el río fuera<br />
un sistema ordenado en el que cada molécula<br />
de agua tuviera una trayectoria fija.<br />
Las leyes del caos ofrecen una explicación<br />
para la mayoría de los fenómenos naturales<br />
—desde el origen del Universo, la propagación<br />
de un incendio o la evolución de una<br />
sociedad— a los cuales es prácticamente<br />
imposible predeterminarles un comportamiento<br />
con una certidumbre absoluta. Aquí<br />
surge la pregunta, ¿por qué lleva la humanidad<br />
tantos siglos sumida en el engaño<br />
del orden? El problema parte del concepto<br />
clásico de ciencia, que exige la capacidad<br />
184 INGENIERIA Investigación y Tecnología FI-UNAM
N. Sánchez-Santillán y R. Garduño-López<br />
para pronosticar, de forma precisa, la<br />
evolución de un objeto de estudio dado<br />
(Chalmers, 1989). Descartes aseguraba que si<br />
se fabricara una máquina tan potente que<br />
conociera la posición de todas las partículas y<br />
utilizara las leyes de Newton para conocer su<br />
evolución futura, se podría predecir cualquier<br />
cosa del Universo (Garber, 1978). Esta<br />
afirmación ilustra la práctica de la ciencia<br />
mecanicista a lo largo de su historia; sin<br />
embargo, este hito científico que impuso el<br />
orden, el determinismo y la predicción en la<br />
investigación, acot<strong>and</strong>o igualmente la enseñanza<br />
y la divulgación científica, también<br />
limitó los estudios a aquellos fenómenos que<br />
coincidieran con un patrón previo. Todo lo<br />
que evidenciara turbulencia, irregularidad o<br />
variabilidad, quedó relegado a la categoría de<br />
ruido y cu<strong>and</strong>o éste abarcaba la mayoría de lo<br />
observable, los científicos de todas las disciplinas<br />
intentaron descomponer a los sistemas<br />
en sus partes para tratar de corregir y<br />
cuadrar los elementos azarosos y no se<br />
afectara el resultado global; no obstante, nada<br />
estaba más lejos de la realidad (Koestler <strong>and</strong><br />
Smythies, 1970).<br />
La condición de cualquier forma de<br />
vida es la incertidumbre y la contingencia;<br />
la teoría del caos nos invita a cuestionar<br />
nuestras creencias y a formular nuevas<br />
preguntas acerca de la realidad. Los principales<br />
postulados de la teoría del caos<br />
son:<br />
• El caos se encuentra en todas partes<br />
y se observa un orden dentro de él.<br />
• En la dinámica de los sistemas<br />
caóticos, existe una dependencia crítica<br />
de las condiciones iniciales en que se<br />
producen.<br />
• No existen fronteras disciplinarias<br />
que delimiten el estudio y aplicación<br />
de la teoría del caos.<br />
Teoría del caos<br />
En el desarrollo de la teoría del caos, se<br />
sucedieron tres pasos fundamentales. El primero<br />
de ellos ocurrió hacia finales del siglo<br />
XIX, cu<strong>and</strong>o el físico-matemático Henri Poincaré<br />
introdujo el concepto de no linealidad,<br />
que contradecía el ideal clásico de los sistemas<br />
lineales en los que causa y efecto se<br />
identifican plenamente, y la resultante de un<br />
fenómeno es igual a la suma de sus partes. La<br />
no linealidad implica divergencia entre<br />
resultado y origen, y la simple adición de las<br />
partes de un hecho no corresponde al producto<br />
final, por lo que los algoritmos lineales<br />
poco pueden hacer para explicar su dinámica.<br />
El problema no era menor, si se<br />
considera que un 90% de los procesos de la<br />
naturaleza son de carácter no lineal.<br />
El meteorólogo Edward Lorenz, sin proponérselo,<br />
dio en 1960 el segundo paso en el<br />
avance de la teoría del caos. Al estar realiz<strong>and</strong>o<br />
un día simulaciones a partir del<br />
comportamiento de los parámetros meteorológicos<br />
elementales, copió por error los<br />
números de la impresión anterior de sus<br />
registros y los introdujo en la computadora;<br />
observó que el resultado de las condiciones<br />
atmosféricas, a escaso tiempo del punto de<br />
partida, divergía parcialmente del obtenido<br />
con anterioridad, pero al cabo de pocos meses<br />
–ficticios, puesto que eran simulaciones– las<br />
pautas perdían la semejanza por completo.<br />
Lorenz descubrió que el problema se hallaba<br />
en los decimales: el programa guardaba seis,<br />
pero para ahorrar espacio él sólo había introducido<br />
tres, convencido de que el resultado<br />
apenas se resentiría (Lorenz, 1963).<br />
Este incidente aparentemente inocuo,<br />
marcó el fin de los pronósticos a largo plazo;<br />
Leith (1974) y Lorenz (1993) establecen que la<br />
condición inicial se vuelve crítica en pronósticos<br />
meteorológicos que van más allá de<br />
dos semanas. Este descubrimiento puso de<br />
Vol.VIII No.3 -julio-septiembre- 2007 185
El clima, la ecología y el caos desde la perspectiva de la teoría general de sistemas<br />
manifiesto la extremada sensibilidad de los<br />
sistemas no lineales, la cual se ilustra con el<br />
concepto denominado efecto mariposa o<br />
“dependencia crítica de las condiciones iniciales”,<br />
donde se resalta la influencia que<br />
ejerce la más mínima perturbación en el<br />
estado en que se origina el sistema sobre el<br />
estado final del mismo. El escritor James<br />
Gleick (1987) parafrasea: “si una mariposa<br />
agita hoy con su aleteo el aire de Pekin, puede<br />
modificar los sistemas climáticos de Nueva<br />
York el mes que viene”. Se establece entonces<br />
que cualquier variación, ya sea de una milésima<br />
o de una millonésima en alguna variable,<br />
forma una pequeña muesca que modificará<br />
el sistema hasta el punto de hacerlo<br />
imprevisible.<br />
Finalmente, el tercer paso se lo imprimió<br />
el carácter no lineal e iterativo de los sistemas<br />
en la naturaleza, que con instrucciones muy<br />
sencillas origina estructuras sumamente complejas.<br />
La mayor parte de la materia va de la<br />
abundancia de lo sencillo a la escasez de lo<br />
complejo, con una distribución piramidal<br />
(Ashby, 1972). Aquí, la palabra complejidad<br />
indica la cantidad de elementos de un<br />
sistema (estructura), sus interacciones potenciales<br />
(función) y el número de estados posibles<br />
en que se traducen a través de sus<br />
relaciones (organización). De esta manera, la<br />
complejidad sistémica está en proporción<br />
directa con su variedad y variabilidad y es,<br />
por lo tanto, una medida comparativa<br />
(Forrester, 1971).<br />
Estas características también se observan<br />
en los lenguajes escritos, los cuales parten de<br />
las letras y pasan luego por las palabras,<br />
frases, párrafos, capítulos y libros, con la peculiaridad<br />
de que las letras solas no tienen<br />
nada que ver con el significado de las palabras,<br />
ni tampoco estas últimas aisladas<br />
determinan lo que una frase quiere decir, y<br />
así sucesivamente. La letra “h” no está emparentada<br />
con el concepto huracán y la<br />
palabra “con” puede acompañar igual a una<br />
frase de amor o de odio. Esto significa que<br />
cuanto más de cerca se mire un problema en<br />
la naturaleza, tanto más borrosa se vuelve su<br />
solución. Las estructuras más complejas o<br />
altas en la pirámide tienen propiedades<br />
ajenas y diferentes a las de niveles inferiores,<br />
situación que le genera un problema importante<br />
a la ciencia, al perder ésta su<br />
capacidad de predicción; a dichas propiedades<br />
se les conoce como propiedades emergentes<br />
(Morin, 1994). Sin embargo, si la<br />
precisión difumina aún más el objeto de<br />
estudio, ¿qué estrategia debe emplearse para<br />
estudiar los sistemas complejos? Aquí interviene<br />
la teoría de la totalidad , que concibe el<br />
mundo como un todo orgánico, fluido e<br />
interconectado; si algo falla no debe buscarse<br />
la porción dañada, sino más bien hay que<br />
revisar el sistema completo, ya que se trata de<br />
una unidad indisoluble (Morin, 1994).<br />
Resulta incompleto tratar de observar la<br />
naturaleza de modo fragmentado y explicarlo<br />
todo mediante la suma de sus partes,<br />
ignor<strong>and</strong>o dos aspectos primordiales: la<br />
imposibilidad de “meter la totalidad en una<br />
bolsa”, porque ésta también forma parte de<br />
aquella, y la dependencia que existe entre el<br />
observador, lo observado y el proceso de<br />
observación: dado que el hombre forma parte<br />
de la totalidad, su percepción y su mera<br />
presencia altera el objeto de estudio. El caos<br />
se debe interpretar desde el punto de vista<br />
global para salvar las fronteras de las<br />
diferentes disciplinas y aceptar la paradoja<br />
que convierte lo simple y lo complejo, el<br />
orden y el caos en elementos inseparables,<br />
donde la palabra “elementos” define a las<br />
partes o componentes de un sistema que<br />
pueden organizarse en un modelo. Ejemplo<br />
de esta paradoja es el denominado fractal de<br />
M<strong>and</strong>elbrot (1983), una de las concepciones<br />
más complejas que ha imaginado el hombre,<br />
el cual se creó a partir de una ecuación<br />
iterativa muy simple. Desde esta visión, el<br />
186 INGENIERIA Investigación y Tecnología FI-UNAM
N. Sánchez-Santillán y R. Garduño-López<br />
caos se convierte en una inagotable fuente de<br />
creatividad de la que también puede surgir el<br />
orden, proceso que puede revertirse, generándose<br />
entonces caos a partir de la<br />
armonía. Las civilizaciones antiguas creían<br />
en la armonía entre el caos y el orden, y<br />
definían al primero como “una suerte de<br />
orden implícito”; quizá sea el momento de<br />
reflexionar y retomar el concepto.<br />
Teoría general de sistemas<br />
La reflexión de las relaciones entre lo simple<br />
y lo complejo, el todo y sus partes, el orden<br />
y el desorden, conduce directamente a la<br />
teoría general de sistemas, paradigma fundamental<br />
para abordar un sistema complejo<br />
como lo es, por ejemplo, el clima, cuyo<br />
estudio era, hasta no hace mucho tiempo, una<br />
subdisciplina o subsistema de la Geografía,<br />
entendiendo como subsistema, al conjunto de<br />
elementos y relaciones que responde a estructuras<br />
y funciones especializadas dentro de un<br />
sistema mayor. En términos generales, los<br />
subsistemas tienen las mismas propiedades<br />
que los sistemas y su posición es relativa a la<br />
del observador. Desde este punto de vista se<br />
puede hablar de subsistemas, sistemas o<br />
supersistemas.<br />
Ludwing Von Bertalanffy, fue alrededor<br />
de 1930, uno de los pioneros de esta innovadora<br />
teoría, seguido por Ronald Ashby y<br />
Gregory Bateson en las siguientes dos<br />
décadas. Las propuestas maduraron hasta<br />
convertirse en la base de la teoría general de<br />
sistemas, cuya construcción teórica trata de<br />
los principios y leyes que les conciernen a<br />
éstos, sin importar la rama científica de la que<br />
provengan y donde se busca una formalización<br />
matemática entre las relaciones de<br />
sus componentes y sus funciones isomorfas.<br />
Estas últimas se refieren a las características<br />
del mundo material e inmaterial que afectan<br />
a los sistemas (Bertalanffy, 1973). Varios elementos<br />
que contribuyeron en la elaboración<br />
de este nuevo paradigma fueron aportados<br />
por la teoría de las organizaciones, la cibernética<br />
y la teoría de juegos (Ashby, 1972;<br />
1984).<br />
La teoría general de sistemas surge en<br />
contraposición a la corriente mecanicista y<br />
determinista (Grun, 1995), cuya visión o paradigma<br />
estaba fundamentado en dos principios:<br />
1) que es posible entender completamente<br />
el mundo y 2) que dicho entendimiento<br />
se podía lograr mediante el método<br />
analítico. Ambos principios se basaban en el<br />
reduccionismo (Popper, 1983), el cual implica<br />
dividir todo hasta sus últimos elementos, a<br />
partir de los cuales se explica luego el resto;<br />
los átomos en la física o la célula en la<br />
biología son ejemplos de esto. No obstante,<br />
con los conocimientos actuales en ambos<br />
campos se ha encontrado que estos elementos<br />
también se pueden dividir. El método analítico<br />
consiste en desarmar en partes discretas<br />
aquello que se pretende entender, tratar de<br />
explicar el comportamiento de las partes<br />
separadas, y luego amalgamar el entendimiento<br />
de éstas en una comprensión de la<br />
totalidad. Un postulado determinista crucial<br />
es la consideración de que todos los fenómenos<br />
se pueden explicar a través de relaciones<br />
causa-efecto (Popper, 1983). El problema<br />
surge cu<strong>and</strong>o se intenta explicar un efecto<br />
excluyendo varios factores, pas<strong>and</strong>o de lado<br />
el hecho de que en todo fenómeno inciden<br />
una multiplicidad de causas y no sólo es<br />
producto de una de ellas.<br />
Esta línea de pensamiento ha creado<br />
problemas prácticamente irresolubles, los<br />
más importantes, derivados de lo que se<br />
denomina la antinomia del determinismo,<br />
donde el libre albedrío y las dificultades de<br />
verificar leyes sobre la base de la causalidad<br />
implican crear condiciones ideales (Popper,<br />
1983). Uno de los ejemplos clásicos es el estudio<br />
de la gravedad a través de la simulación<br />
de la caída de los cuerpos en el vacío<br />
Vol.VIII No.3 -julio-septiembre- 2007 187
El clima, la ecología y el caos desde la perspectiva de la teoría general de sistemas<br />
absoluto, dentro del laboratorio. Otros dos<br />
ejemplos comunes en el campo de la meteorología,<br />
son el estudio de los tornados y los<br />
huracanes, en los que el enfoque principal se<br />
da al comportamiento de la presión barométrica<br />
y la temperatura, dej<strong>and</strong>o de lado la<br />
circulación zonal, las celdas anticiclónicas y<br />
las corrientes marinas. Hacia finales de la<br />
segunda guerra mundial, parte de la comunidad<br />
científica reconoció que algo <strong>and</strong>aba<br />
mal. Comenzó a verse que al analizar un<br />
sistema, sus propiedades esenciales se perdían;<br />
por ejemplo, un automóvil desarmado<br />
no transportaba a una persona “desarmada”;<br />
advirtieron que era necesario un pensamiento<br />
holístico, (del griego holos = total), es<br />
decir, que abordara los problemas como un<br />
todo para explicar las cosas. Así, se buscaba<br />
revelar cómo es que el sistema está estructurado,<br />
por qué funciona de cierta manera y<br />
para qué lo hace. Es importante señalar que<br />
ésta concepción abarcó al método analítico,<br />
por lo cual análisis y síntesis son complementarios,<br />
y el pensamiento sistémico incluye<br />
a ambos.<br />
Los principales objetivos de la teoría<br />
general de sistemas son:<br />
- Investigar las analogías, paralelismos,<br />
semejanzas, correlaciones e isomorfías<br />
de los conceptos, leyes y modelos en<br />
las diversas ciencias. Isomorfía se define<br />
como la fórmula, pauta, estructura, proceso<br />
o interacción que demuestra ser la<br />
misma, sólo en términos gener ales, en<br />
diversas disciplinas y escalas de magni -<br />
tudes dentro de los sistemas reales y<br />
cambia en función del sistema que se<br />
analice.<br />
- Fomentar la transferencia de conocimientos<br />
entre las diversas ciencias.<br />
- Estimular el desarrollo y formulación<br />
de modelos teóricos en aquellos<br />
campos que carecen de ellos, o en los<br />
cuales los mismos son rudimentarios e<br />
imperfectos.<br />
- Promover la unidad de las ciencias<br />
y tratar de obtener la uniformidad<br />
del lenguaje científico.<br />
De manera paralela, la cibernética se ocupa<br />
del estudio del m<strong>and</strong>o, el control, las regulaciones<br />
y el gobierno de los sistemas, por lo<br />
que constituye una parte inseparable de la<br />
teoría general de sistemas; sus conceptos<br />
resultan extremadamente útiles para entender<br />
el funcionamiento de los sistemas complejos<br />
como el clima, los ecosistemas o el<br />
derecho, por mencionar algunos. Dentro de<br />
este paradigma, el sistema es una entidad<br />
autónoma dotada de una cierta permanencia,<br />
que está constituida por elementos que se<br />
conforman como subsistemas, estructural y<br />
funcionalmente interrelacionados, y cuya transformación<br />
ocurre dentro de ciertos límites de<br />
estabilidad, gracias a autorregulaciones que le<br />
permiten adaptarse a las variaciones de un<br />
entorno específico (Thom, 1972). Así, la teoría<br />
general de sistemas, estudia a éstos con todas<br />
sus conexiones internas (estructura primaria),<br />
y externas (hipoestructura) (Lugo y<br />
Morris, 1982). Sus elementos no se pueden<br />
separar sin alterar la esencia del sistema, es<br />
decir, su unidad, pues una de las ideas<br />
básicas de esta teoría es que el todo es más<br />
que la suma de sus partes, porque las<br />
características del todo no son explicables a<br />
partir de las características de las partes<br />
aisladas. La entidad de nivel superior tiene<br />
otras propiedades o atributos diferentes a las<br />
de los niveles inferiores (Peters, 1985).<br />
Uno de los requerimientos de todo sistema<br />
es el de constituir una entidad aislada, aunque<br />
su aislamiento no es absoluto, pero sí lo<br />
suficiente para poder distinguirlo de su entorno,<br />
clara y permanentemente. De acuerdo<br />
con Grun (1995), un sistema biológico está<br />
188 INGENIERIA Investigación y Tecnología FI-UNAM
N. Sánchez-Santillán y R. Garduño-López<br />
rodeado por un límite o membrana que lo<br />
aísla relativamente y separa el endomundo del<br />
exomundo. Las membranas son siempre permeables<br />
y selectivas, y juegan un papel<br />
fundamental en la organización de los intercambios<br />
entre el sistema y su entorno (o,<br />
eventualmente, en los que operan entre subsistemas,<br />
limitados ellos mismos, por membranas).<br />
Los sistemas metavivientes también<br />
desarrollan membranas en sentido amplio:<br />
las fronteras políticas, los recintos de las<br />
empresas y organizaciones –en el caso de las<br />
sociedades humanas– o los límites de las<br />
termiteras –para las sociedades animales–<br />
constituyen membranas en el sentido antes<br />
definido, es decir, son funcionalmente homólogas<br />
a las membranas biológicas (Rodríguez<br />
y Arnold, 1991).<br />
Margalef (1980), señala que un sistema es<br />
algo factible de ser disecado, o sea, que se<br />
pueden reconocer partes separables actu<strong>and</strong>o<br />
unas sobre otras; cambia con el transcurso<br />
del tiempo, pero conserva algunas propiedades<br />
invariantes y casi todo lo existente<br />
puede definirse con este concepto. Un<br />
sistema se concibe entonces conformado por<br />
elementos (estructura), e interacciones (función),<br />
que vinculan a estos componentes. Las<br />
relaciones pueden ser recíprocas (principio<br />
de circularidad) o unidireccionales. El resultado<br />
de estas interacciones es la organización<br />
del sistema, que cu<strong>and</strong>o persiste, genera<br />
posibles escenarios que no son completamente<br />
indeterminados o regidos por el<br />
azar. Es factible por lo tanto, aportar una<br />
descripción suficiente de un sistema completo<br />
en una forma abreviada o corta. Un<br />
aspecto fundamental de los sistemas es la<br />
existencia de restricciones, que limitan el<br />
ámbito dentro del que se sitúan sus estados<br />
futuros (Bohm <strong>and</strong> Peat, 1987).<br />
Cu<strong>and</strong>o un elemento o un subsistema se<br />
combina con otros en el interior de un<br />
sistema, aparece cierta convergencia de<br />
comportamiento, en el sentido de que cada<br />
elemento influye sobre las posibles variaciones<br />
de los demás y, como consecuencia, el<br />
número de posibilidades que a priori podría<br />
parecer muy gr<strong>and</strong>e, queda más o menos<br />
limitado (Peters, 1985). Un sistema tiende a<br />
converger o a cerrarse sobre sí mismo; en caso<br />
contrario diverge, con posibilidades de extinguirse.<br />
Puesto que cada acción depende de<br />
la conformación de las influencias precedentes,<br />
las posibilidades de variación se<br />
reducen y la actividad del sistema parece<br />
estar guiada o regulada. En un sentido amplio,<br />
se comporta en forma cibernética en su<br />
regulación y control (Ashby, 1972). Un sistema<br />
se caracteriza por la convergencia en el<br />
comportamiento de sus diversas partes. En<br />
consecuencia, el conjunto de los estados del<br />
sistema es menor que el de los posibles,<br />
emanados de no conocer las interacciones<br />
entre las partes. La propiedad básica de<br />
todo sistema consiste en la restricción del<br />
número de estados o configuraciones realizables,<br />
por lo tanto, todo sistema contiene<br />
información, con el significado que la teoría<br />
de la comunicación le da a esta palabra<br />
(Ashby, 1984).<br />
Memoria de los sistemas y principio<br />
de asimilación del más débil<br />
Las fronteras e interfases son muy importantes<br />
por su capacidad de acumular<br />
información, la cual se refleja en la riqueza de<br />
límites reconocibles; constituyen los contornos<br />
que separan a los sistemas y en todos los<br />
casos es el observador quien define lo que<br />
pertenece y lo que queda fuera de ellos<br />
(Margalef, 1980). La información de los sistemas<br />
siempre está asociada a la historia de<br />
su desarrollo y en un mundo que ya posea<br />
cierta estructura, cualquier interacción entre<br />
la materia y la energía modifica esta disposición<br />
y hace a los cambios futuros más<br />
predecibles con respecto a su momento<br />
anterior. La cantidad de información que<br />
Vol.VIII No.3 -julio-septiembre- 2007 189
El clima, la ecología y el caos desde la perspectiva de la teoría general de sistemas<br />
contiene el sistema es igual a la que ya existe,<br />
más la que entra, produciéndose una agregación<br />
neta en esta entrada, ya que la salida<br />
de energía no elimina información de él<br />
(Johansen, 1975). Toda la energía que se<br />
incorpora a los sistemas obedece la ley de la<br />
conservación de ella, es decir, la cantidad que<br />
permanece en un sistema es igual a la suma<br />
de la energía importada –de un nivel a otro–<br />
menos la suma de la energía exportada,<br />
denominada negentropía (Ashby, 1984).<br />
Asimismo, Margalef (1980) señala que la<br />
información que está presente en las estructuras<br />
actuales sirve para reconstruir el<br />
pasado y refleja verazmente la energía usada<br />
y degradada con anterioridad. Esta energía<br />
no se ha perdido por completo, puesto que<br />
las estructuras que se formaron guardan la<br />
información para canalizar cambios futuros<br />
o, dicho de otra manera, hace que determinados<br />
estados futuros sean más probables<br />
que otros. Es posible descubrir o interpretar<br />
la utilidad de dicha información, dado que<br />
las estructuras acumuladas hacen más eficiente<br />
la degradación de la energía.<br />
Así, la acumulación de información significa<br />
cambios de energía y, por lo tanto, un<br />
aumento de la entropía, parámetro que mide<br />
el grado de desorden del sistema (Cesarman,<br />
1984). Sin embargo, la información conseguida<br />
persiste en forma de estructura y<br />
puede orientar en uno u otro sentido el uso<br />
futuro de la energía, de una manera que se<br />
puede juzgar como más eficiente; esto<br />
implica que cu<strong>and</strong>o la información sube de<br />
categoría o de estrato se adquiere una mayor<br />
cantidad de ella, que se traduce en otras<br />
posibilidades de organización de canales y<br />
códigos, y la información resultante que<br />
ingresa al sistema adquiere un nuevo sentido.<br />
Al proceso de introducción de nuevos resultados<br />
al sistema en forma de retroalimentación<br />
se le denomina recursividad (Bertalanffy,<br />
1973). Si se aplicara lo anterior al contexto de<br />
las sociedades humanas, significaría que la<br />
acumulación de información que realizan las<br />
sociedades tecnológicamente más avanzadas<br />
es mayor a las de menor avance; la misma<br />
situación se da en la naturaleza entre los<br />
ecosistemas, de acuerdo a su grado de<br />
desarrollo.<br />
Este efecto resulta particularmente importante<br />
en el estudio de intercambios entre<br />
sistemas. El sistema que es mayor, en términos<br />
de organización adquirida, puede<br />
hacer siempre un mejor uso de la información,<br />
es decir, la asimila y la multiplica.<br />
Según Margalef (1957), tal asimetría en el<br />
intercambio de información se percibe como<br />
injusta, puesto que el participante con más<br />
información, recibe aún más; esta constatación<br />
se le designa como el principio de San<br />
Marcos, por la relación que guarda con el<br />
evangelio según San Marcos (versículo 4:25),<br />
que dice: al que tiene se le dará más y al que<br />
no tiene, aún lo poco que tiene se le quitará.<br />
En conclusión, cu<strong>and</strong>o dos sistemas con<br />
diferente complejidad interactúan, el aumento<br />
de la información es mayor en el más<br />
complejo, pues parece alimentarse del más<br />
simple e, incluso, puede asimilarlo.<br />
Estructura más funcionamiento<br />
igual a organización. La fuerza<br />
estabilizadora<br />
En el terreno de la ecología o de la climatología,<br />
analizadas desde la teoría general<br />
de sistemas, el principio de San Marcos resulta<br />
extraordinariamente valioso al aumentar<br />
todos los gradientes de las variables<br />
portadoras de información, propiedad que<br />
puede contribuir a la división progresiva<br />
del espacio.<br />
Dichos efectos son particularmente importantes<br />
en la creación de bloques discontinuos<br />
que funcionan como piezas en los<br />
sistemas abiertos y se encuentran lejos de una<br />
190 INGENIERIA Investigación y Tecnología FI-UNAM
N. Sánchez-Santillán y R. Garduño-López<br />
situación de equilibrio. Lo anterior ejemplifica<br />
cómo la estructura puede crecer<br />
alimentándose de la función. Sin embargo,<br />
los estados de equilibrio sistémico, denominados<br />
equifinalidad y multifinalidad, pueden<br />
alcanzarse en los sistemas abiertos por una<br />
diversidad de caminos; la permanencia de<br />
dichos estados implica, de manera necesaria,<br />
la importación de recursos provenientes del<br />
ambiente. Los recursos pueden consistir en<br />
flujos energéticos, materiales o informativos<br />
(Asbhy, 1984).<br />
La realidad se presenta bajo dos aspectos<br />
complementarios e inseparables:<br />
1) lo estructural-estático y<br />
2) lo funcional-dinámico, en donde<br />
cada elemento se halla situado en la<br />
estructura de acuerdo con la función<br />
que le compete (Ashby, 1984). Estructura<br />
y función son dos formas complementarias<br />
de una misma realidad y<br />
ninguna describe, aisladamente y en<br />
forma total, al sistema objeto de estudio.<br />
Sin estructura, la función desaparecería.<br />
En un sistema con enfoque diacrónico se<br />
resalta la función, mientras que en uno sincrónico,<br />
la estructura; no obstante, un modelo<br />
estructural-funcional reconoce que los dos<br />
aspectos deben integrarse adecuadamente.<br />
Así, ningún modelo sistémico puede ser<br />
estático, porque ningún sistema lo es, salvo<br />
quizás en el instante en que deja de ser un<br />
sistema y empieza a descomponerse en sus<br />
elementos (Margalef, 1980). En todos los<br />
casos, los modelos son construcciones diseñadas<br />
por un observador que persigue<br />
identificar y mensurar las relaciones sistémicas<br />
complejas; asimismo, todo sistema real<br />
puede ser representado por más de un<br />
modelo, cuya expresión depende tanto de los<br />
objetivos del modelador, como de su capacidad<br />
para distinguir las relaciones<br />
relevantes enfocadas a tales objetivos; de<br />
cualquier manera, la esencia de los modelos<br />
sistémicos es la simplificación (Ísita, 2002).<br />
De la cibernética proviene el concepto de<br />
retroalimentación, el cual implica que todos los<br />
elementos, componentes o subsistemas de un<br />
sistema se comunican entre sí para desarrollar<br />
interrelaciones coherentes, es decir,<br />
que favorezcan la permanencia del sistema<br />
en el tiempo y en el espacio (Margalef, 1980).<br />
La retroalimentación es negativa cu<strong>and</strong>o su<br />
función consiste en contener o amortiguar el<br />
cambio y se le denomina fuerza estabilizadora,<br />
aunque no siempre es una fuerza en el<br />
sentido físico de la palabra. La retroalimentación<br />
es positiva si amplifica o multiplica<br />
el cambio en una dirección determinada<br />
(Ashby, 1984).<br />
Existe una conexión de la información y su<br />
forma específica de procesarla en la meteorología,<br />
la climatología, la ecología, la biología<br />
social e incluso, en el derecho, donde no<br />
es admisible proponer jerarquías científicas<br />
sino, más bien, una interdependencia entre<br />
cada una de las ciencias mencionadas para<br />
dar paso a una visión sistémica y holística<br />
que transformaría la perspectiva analítica,<br />
determinista y reduccionista por el simple<br />
hecho de incluir la retroalimentación como<br />
parte del proceso. Este es el enfoque más<br />
adecuado para estudiar el calentamiento<br />
climático global, dado que el análisis sistémico<br />
permite visualizar de manera integral<br />
los aspectos sociales, económicos, políticos,<br />
jurídicos, ecológicos y climáticos, al contemplar<br />
la realidad desde distintos puntos de<br />
vista y poder trabajar inter y transdiciplinariamente<br />
(Lovelock et al., 1992).<br />
El analizar los problemas bajo la óptica de<br />
los sistemas complejos, sean humanos,<br />
sociales, físicos o ecológicos, implica elaborar<br />
o modificar sus formas con el objeto de<br />
conservar viable el sistema a través de<br />
Vol.VIII No.3 -julio-septiembre- 2007 191
El clima, la ecología y el caos desde la perspectiva de la teoría general de sistemas<br />
retroalimentaciones positivas o negativas. En<br />
estas condiciones, los procesos apuntan al<br />
desarrollo, la estructura, al crecimiento o<br />
cambio de forma, así como al estado general<br />
del sistema. En términos cibernéticos, los procesos<br />
causales mutuos que se refieren a la<br />
circularidad o retroalimentación, se denominan<br />
morfogenéticos. Estos procesos activan<br />
y potencian la posibilidad de adaptación de<br />
los sistemas a ambientes en transición.<br />
Por otro lado, la morfostasis se refiere a los<br />
procesos de intercambio que se generan con el<br />
ambiente y tienden a mantener un estado ya<br />
existente con una retroalimentación negativa;<br />
un ejemplo de éstos, son los sistemas vivos<br />
(Lovelock <strong>and</strong> Margulis, 1973). Lovelock et al.<br />
(1992), proponen un sistema jurídico global que<br />
abarque el sistema ecológico del planeta y dan<br />
a este concepto el nombre de Gaia. Consideran<br />
al hombre y a los ecosistemas como un solo<br />
organismo viviente, por lo que resulta imprescindible<br />
diseñar una legislación, establecer<br />
una jurisprudencia y elaborar una doctrina<br />
que considere esta unidad (Lovelock <strong>and</strong><br />
Margulis, 1973). Con esta visión, derecho y<br />
ecología se retroalimentan a través de redes<br />
complejas, de una forma quizá más bien<br />
caótica, pero mucho más creativa de lo que<br />
parece a simple vista, siempre bajo los límites<br />
flexibles sugeridos por la termodinámica y la<br />
teoría de juegos.<br />
Sistemas y modelos<br />
Los sistemas pueden agruparse en reales,<br />
ideales y modelos. Los primeros tienen una<br />
existencia independiente del observador,<br />
quien los puede descubrir; los segundos son<br />
construcciones simbólicas; al tercer tipo<br />
corresponden las abstracciones de la realidad<br />
que combinan lo conceptual con las características<br />
de los objetos.<br />
es la conceptualización, organización y<br />
comunicación de un fenómeno. Si bien los<br />
modelos simplifican los fenómenos reales,<br />
conservan los atributos funcionales del<br />
sistema (Hall <strong>and</strong> Day, 1977).<br />
Los tres pasos básicos para la elaboración<br />
de un modelo determinista son: crear un<br />
mapa conceptual, trazar un esquema diagramático<br />
que lo represente y desarrollar su<br />
expresión matemática. En el mapa conceptual<br />
se utilizan los paradigmas científicos<br />
vigentes, se toman en cuenta los componentes,<br />
las interacciones y los mecanismos<br />
que creemos relevantes para que opere el<br />
sistema y, de manera particular, el fenómeno<br />
que se quiere estudiar. El esquema diagramático<br />
se hace a través de la construcción de<br />
com- partimentos o cajas que representan las<br />
variables de estado del sistema, y de flechas,<br />
que señalan los flujos de materia y energía<br />
(Shoemaker, 1977).<br />
Las expresiones matemáticas pueden incluir<br />
relaciones lineales o no lineales, discretas<br />
o continuas, y determinísticas o estocásticas.<br />
La mayoría de los modelos se<br />
conceptualizan por medio de ecuaciones<br />
diferenciales. En el caso de los modelos lineales,<br />
la elección entre las variables es arbitraria,<br />
porque uno puede trasladar la materia<br />
o energía de una variable a otra; en el caso de<br />
los no lineales, las traslaciones no son unidireccionales.<br />
Las ecuaciones de los modelos<br />
determinísticos incorporan tasas de<br />
cambio en el tiempo, lo que permite realizar<br />
predicciones (Shannon <strong>and</strong> Weaver, 1969);<br />
sin embargo, si se cambian las condiciones<br />
iniciales, aunque sea por una cantidad ínfima,<br />
tenderá a modificarse la predicción, ya<br />
que el error se amplifica en el tiempo a un<br />
ritmo exponencial (Lorenz, 1963).<br />
Un modelo es cualquier abstracción o<br />
simplificación de un sistema, cuyo propósito<br />
192 INGENIERIA Investigación y Tecnología FI-UNAM
N. Sánchez-Santillán y R. Garduño-López<br />
La creatividad y la teoría general de<br />
sistemas<br />
El mundo confuso y desordenado, con estilos<br />
de vida prosaicos y estériles, así como<br />
empleos que a veces inspiran poco, nos<br />
conduce al caos; sin embargo, esto se puede<br />
traducir en gr<strong>and</strong>es oportunidades, pues la<br />
visión sistémica nos da la posibilidad de<br />
proyectar y adaptar un futuro nuevo. La<br />
creatividad con enfoque sistémico es un estilo<br />
de vida que incide en el pensamiento, la<br />
conducta, las actitudes, los valores, la comunicación,<br />
la investigación, la enseñanza y<br />
la divulgación, entre otros aspectos. Consiste<br />
en ver las cosas con un nuevo enfoque y hace<br />
del proceso de aprendizaje algo permanente;<br />
en otras palabras, nos convierte en aprendices<br />
vitalicios. Involucra transformaciones<br />
en las que las verdades eternas dejan de ser<br />
inamovibles, a menos que tengan significado<br />
para cada situación innovadora; en resumen,<br />
se convierte en un medio para lograr algo<br />
mejor y más maduro. Esta creatividad tiene<br />
como característica principal la de ser<br />
permanentemente constructiva, al fundir<br />
pensamientos y acciones en una configuración<br />
novedosa y relevante; permite<br />
percibir los problemas, deficiencias y faltas<br />
de armonía y encuentra relaciones nuevas<br />
con la información existente. Se convierte en<br />
una herramienta que identifica los elementos<br />
ausentes para encontrar soluciones, partiendo<br />
de hipótesis perfectibles. Genera<br />
pensamientos y acciones innovadoras que<br />
están en función del conocimiento, la<br />
imaginación y la evaluación –donde el<br />
proceso es tan importante como el producto<br />
resultante– a la vez que facilita comunicar<br />
resultados eficientemente. En el hombre<br />
moderno, la mente finita no alcanza a<br />
comprender la complejidad y la verdad<br />
infinitas; le gustan las ideas o fórmulas<br />
sencillas, congruentes y uniformes; le desagradan<br />
la tensión, la ambigüedad y la<br />
oposición; en fin, es un ser agobiado, un tanto<br />
marchito por las preocupaciones que oscurecen<br />
todo lo que le rodea.<br />
Si los esfuerzos de investigación, enseñanza<br />
y divulgación científicas se fortalecen<br />
con ideas creativas, se conjuran, en<br />
gran medida, las empresas estériles y condenadas<br />
al fracaso. Ser del mismo sentir, no<br />
significa necesariamente tener la misma opinión,<br />
pues el objetivo es desarrollar, deliberada<br />
y conscientemente la conducta creativa<br />
y el potencial humano, además de identificar<br />
lo que no se puede cambiar y lo que sí<br />
se debería, permitiendo abrir el horizonte<br />
hacia alternativas innovadoras. La capacidad<br />
de deducción, a partir de las leyes de la lógica<br />
y las matemáticas, crea pensadores disciplinados,<br />
aunque no forzosamente mentes<br />
imaginativas; de ahí que las personas más<br />
inteligentes, no son necesariamente las de<br />
mayor inventiva. Algunas sociedades promueven<br />
la creatividad, mientras que otras la<br />
inhiben. La educación es un proceso sin fin y<br />
aquél que deja de aprender no sólo se<br />
marchita, sino que ahoga a quienes lo rodean.<br />
A medida que la sociedad experimenta<br />
cambios profundos, rápidos y significativos,<br />
los métodos de enseñanza y divulgación<br />
también deben ser diferentes; una persona<br />
creativa debe abrazar lo nuevo e inexplorado<br />
por ser ésta una oportunidad de crecimiento<br />
(Ritter y Klimek, 1997) y se le debiera alentar<br />
en la difusión de sus propuestas.<br />
Referencias<br />
Ashby W.R. (1972). Introducción a la cibernética.<br />
Edito rial Nueva Visión, Buenos<br />
Aires.<br />
Ashby W.R. (1984). Sistemas y sus<br />
medidas de información. En: Tendencias<br />
en la teoría General de<br />
Sistemas (Bertalanffy L. Von, Ashby<br />
R.W., Wein berg G.M.), 3a ed, Ed.<br />
Alianza, Madrid.<br />
Vol.VIII No.3 -julio-septiembre- 2007 193
El clima, la ecología y el caos desde la perspectiva de la teoría general de sistemas<br />
Bakun A. (1996). Patterns in the Ocean:<br />
Ocean Processes <strong>and</strong> Marine Popu la tion<br />
Dynamics. Ed. Cali fornia Sea Grant<br />
College System, National Oceanic <strong>and</strong><br />
Atmo spheric Admin is tra tion, en cooperación<br />
con el Centro de Investigaciones<br />
Biológicas del Noroeste, La<br />
Paz, Baja Cali fornia Sur.<br />
Bal<strong>and</strong>ier G. (1989). El desorden. La teoría<br />
del caos y las ciencias sociales. Elogio de la<br />
fecundidad del movimiento. Ed. Gedisa,<br />
Barce lona.<br />
Bertalanffy L.V. (1973). General System<br />
Theory: Foun da tions, Devel op ment, Applications.<br />
Alan Lane. Ed. George Braziller,<br />
New York.<br />
Bohm D. <strong>and</strong> Peat D. (1987). Science,<br />
Order <strong>and</strong> Creativity. Ed. Bantam<br />
Books, Toronto.<br />
Bouald-Ayoub J. <strong>and</strong> Marcel H. (1988).<br />
Culture, Signes, Critique. Séries:<br />
Cahiers Recherches et Théories-<br />
Collec tion Symbolique et Idéologie;<br />
S16. Montreal: Dep. de Philosophie<br />
(UQAM).<br />
Capra F. (1991). El nuevo paradigma<br />
ecológico. Ed. Nueva Conciencia . Inte -<br />
gral, Barce lona.<br />
Cesarman E. (1984). Hombre y entropía.<br />
Ed. Pax-México, México.<br />
Chalmers A.F. (1989). ¿Qué es esa cosa<br />
llamada ciencia?: Una valoración de la<br />
naturaleza y el estatuto de la ciencia y sus<br />
métodos. 8 va ed. Ed. Siglo XXI, México.<br />
Cham bers F.M. (1993). Climate Change <strong>and</strong><br />
Human Impact on the L<strong>and</strong> scape: Studies<br />
in Palaecology <strong>and</strong> Envi ron mental Archaeology.<br />
Ed. Chapman <strong>and</strong> Hall,<br />
London.<br />
Forrester J.W. (1971). World Dynamics.<br />
Ed. Wright-Allen Press. Cambridge<br />
Mass.<br />
Garber D. (1978). Science <strong>and</strong> Certainly.<br />
In: Descartes: Crit ical <strong>and</strong> inter pre ta -<br />
tive essays (Hooker M), Ed. Johns<br />
Hopkins Univer sity Press, Balti more.<br />
Gleick J. (1987). Chaos: Making a New<br />
Science. Ed. Penguin Books, New York.<br />
Grun E. (1995). Una visión sistémica y<br />
cibernética del derecho. Ed. Albedo<br />
Perrot, Argen tina.<br />
Hall A.S. <strong>and</strong> Day W.J. (1977). System <strong>and</strong><br />
Models: Terms <strong>and</strong> Basic Principles.<br />
In: Ecosystem Modeling in Theory <strong>and</strong><br />
Prac tice: An Intro duc tion with Case<br />
Histories (Hall A.S. <strong>and</strong> Day W.J.), Ed.<br />
John Wiley <strong>and</strong> Sons, New York.<br />
Ísita R. (2002). Divulgación persuasiva de<br />
la ciencia. En: Antología de la<br />
divulgación de la ciencia en México<br />
(Tonda J., Sánchez A., Chávez N.),<br />
colección: Divulgación para Divulgadores.<br />
Dirección General de Divulgación<br />
de la Ciencia, UNAM, México.<br />
Johansen B.O. (1975). Las comunicaciones y<br />
la conducta de la organización. Ed.<br />
Diana, México.<br />
Koestler A. <strong>and</strong> Smythies J.R. (1970). Das<br />
neue menschenbild: Die Revolutionierung<br />
der Wissenschaften Vom Leben, Ein Intenationales<br />
Symposion. Verlag Fritz Molden,<br />
München.<br />
Leith C.E. (1974). Theo ret ical Skill of<br />
Monte Carlo Fore casts. Monthly Weather<br />
Review, 102, pp. 409-418.<br />
Lorenz E.N. (1963). Deter min istic<br />
Nonperiodic Flow. Journal of the Atmospheric<br />
Science, 20, pp. 130-141.<br />
Lorenz E.N. (1993). The Essence of Chaos.<br />
Univer sity of Wash ington Press,<br />
Seattle.<br />
Love lock J.E. <strong>and</strong> Margulis L. (1973).<br />
Atmo spheric Homeo stasis by <strong>and</strong> for<br />
the Biosphere: The Gaia Hypoth esis.<br />
Tellus, 26, pp. 2-23.<br />
Love lock J.E., Clarke J. y Orive B. (1992).<br />
Gaia: una ciencia para curar el planeta.<br />
Ed. Inte gral. Serie: Los libros de Inte -<br />
gral. No. 51, Barce lona.<br />
Lugo A.E. y Morris G.L. (1982). Conceptos<br />
del análisis de sistemas. En: Los sistemas<br />
ecológicos y la humanidad.<br />
194 INGENIERIA Investigación y Tecnología FI-UNAM
N. Sánchez-Santillán y R. Garduño-López<br />
Secretaría General de la OEA. Programa<br />
Regional de Desarrollo Científico y<br />
Tecnológico. Wash ington, D.C. EUA.<br />
Serie Biología. Monografía, N° 23. p. 82.<br />
M<strong>and</strong>elbrot B.B. (1983). The Fractal Geometry<br />
of Nature. Ed. W.H. Freeman, San<br />
Fran cisco.<br />
Margalef R. (1957). La teoría de la<br />
información en ecología. Memorias de la<br />
Real Academia de Ciencias y Artes. Tercera<br />
Época, Barce lona, 32(3), pp. 373-445.<br />
Margalef R. (1980). La biosfera: entre la<br />
termodinámica y el juego. Ed. Omega,<br />
Barce lona.<br />
Morin E. (1994). Introducción al pensamiento<br />
complejo. Ed. Gedisa, Barce lona.<br />
Peters R.H. (1985). Predic tion <strong>and</strong> Under -<br />
st<strong>and</strong>ing Alter na tive Goal in Science.<br />
Conferencia ofrecida en el Simposium<br />
Reductionism versus Holism. Universidad<br />
de Ottawa.<br />
Popper K. (1983). Conjeturas y refutaciones:<br />
el desarrollo del conocimiento<br />
científico. Ed. Paidós, Barce lona.<br />
Ritter W. y Klimek G.R. (1997). La<br />
relación ciencia-educación y la búsqueda<br />
de un nuevo perfil académico.<br />
Ciencia y Mar, 1(1), pp. 31-35.<br />
Ritter W., Guzmán S., Sánchez-Santillán<br />
N., Suárez J., Corona-Muñoz C.,<br />
Ramos A., Rodríguez R. y Pérez T.<br />
(2002). El clima como sistema complejo<br />
adaptativo en coevolución. Ciencia y<br />
Mar, VI (17), pp. 23-25.<br />
Rodríguez D. y Arnold M. (1991). Sociedad<br />
y teoría de sistemas. Ed. Universitaria,<br />
Santiago de Chile.<br />
Shannon C.E. <strong>and</strong> Weaver W. (1969). The<br />
Math e mat ical Theory of Commu ni ca tion.<br />
Univer sity of Illi nois Press, Illi nois.<br />
Shoe maker C.A. (1977). Math e mat ical<br />
Construc tion of Ecolog ical Models. In:<br />
Ecosystem Modeling in Theory <strong>and</strong><br />
Prac tice: An intro duc tion with case<br />
histo ries (Hall A.S., Day W.J.), Ed.<br />
John Wiley & Sons. New York.<br />
Thom R. (1972). Stabilité Structurelle et<br />
Morphogenèse: Essai d’une Théorie<br />
Générale des Modèles. W.A. Benjamin.<br />
Ed. Reading, Massa chu setts.<br />
Semblanza de los autores<br />
Norma Sánchez-Santillán. Realizó sus estudios en hidrobiología en la Universidad Autónoma Metropolitana,<br />
plantel Iztapalapa. Obtuvo el grado de maestra en ciencias (Biología), orientada en aspectos de climatología en<br />
la Facultad de Ciencias de la UNAM en 1994. Posteriormente, alcanzó el grado de doctora, siguiendo la línea de<br />
aplicación climática en aspectos de ecología (1999). Cuenta con un diplomado en divulgación de la ciencia, por<br />
parte de la Dirección General de Divulgación de la Ciencia, UNAM (2004). Es autora de 70 trabajos publicados<br />
en revistas con arbitraje; así como 55 artículos de divulgación en revistas arbitradas. Pertenece al Sistema<br />
Nacional de Investigadores desde el año 2002. Actualmente se desarrolla como investigadora en la<br />
UAM-Xochimilco, como responsable del Laboratorio de Climatología, así como profesora dentro del plantel.<br />
René Garduño-López. Obtuvo la licenciatura en física y el posgrado en geofísica por la Facultad de Ciencias de la<br />
UNAM, en donde es profesor desde 1976. Es investigador titular del Centro de Ciencias de Atmósfera (CCA) de<br />
la UNAM. Ha publicado 24 artículos de investigación en revistas arbitradas y siete capítulos en libros. Es editor<br />
asociado de la revista Atmósfera (incluída en Science Cita tion Index). Es autor de los libros El veleidoso clima y<br />
Pormenores terrestres, del Fondo de Cultura Económica. En el CCA ha sido secretario académico y actualmente<br />
es jefe de departamento.<br />
Vol.VIII No.3 -julio-septiembre- 2007 195
INGENIERÍA Investigación y Tecnología VIII. 3. 197-210, 2007<br />
(artículo arbitrado)<br />
Practical Design of Digital Filters Using the<br />
Pascal Matrix<br />
B. P enika 1 , F. García-Ugalde 2 <strong>and</strong> V.F. Ruiz 3<br />
1 Department of Telecommunications,<br />
2 Department of Digital Signal Processing, Facultad de Ingeniería, UNAM <strong>and</strong><br />
3 Department of Cybernetics, The University of Reading, Reading RG6 6AY, UK.<br />
E-mails: pseboh@servidor.unam.mx, fgarciau@servidor.unam.mx, v.f.ruiz@reading.ac.uk<br />
(Recibido: julio de 2006; aceptado: abril de 2007)<br />
Abstract<br />
In the con text of the de sign of dig i tal fil ters many re search has been done to fa cil i tate<br />
their com pu ta tion. The Pascal ma trix re cently de fined in (Biolkova <strong>and</strong> Biolek,<br />
1999) has proved its util ity in this field. In this pa per we sum ma rize the di rect<br />
trans form from the lowpass con tin u ous-time trans fer func tion H(s) to the dis -<br />
crete-time H(z) of the fol low ing main tree types of dig i tal fil ters: lowpass, highpass<br />
<strong>and</strong> b<strong>and</strong>pass. An al ter na tive rep re sen ta tion of the orig i nal b<strong>and</strong>pass Pascal ma trix<br />
is de vel oped in this pa per that per mits to con vert sys tem at i cally the lowpass<br />
continuous-time pro to type to the dis crete-time b<strong>and</strong>pass trans fer func tion. We also<br />
con sider the in verse trans for ma tion from the dis crete-time do main to the con tin u -<br />
ous one <strong>and</strong> we show that the in verse trans for ma tion is eas ily ob tained as the de ter -<br />
mi nant of the sys tem need not to be com puted. Sev eral nu mer i cal ex am ples il lus -<br />
trate the prac ti cal uti li za tion of this tech nique.<br />
Key words: Fil ter de sign, s-z trans for ma tion, Pascal ma trix, dig i tal fil ter de sign tools.<br />
Resumen<br />
En el contexto del diseño de filtros digitales se ha desarrollado mucha<br />
investigación para facilitar su cálculo. La matriz de Pascal definida recientemente<br />
(Biolkova <strong>and</strong> Biolek, 1999) ha probado su utilidad en este campo.<br />
En este artículo se hace una síntesis de la transformación directa a partir de la<br />
función de transferencia pasa-bajas en tiempo continuo H(s) para obtener la de<br />
tiempo discreto H(z) de cada uno de los tres tipos principales de filtros<br />
digitales: pasa-bajas, pasa-altas y pasa-b<strong>and</strong>a. También se desarrolla una<br />
representación alternativa de la matriz de Pascal pasa-b<strong>and</strong>a orig inal, que<br />
permite la conversión sistemática de un prototipo pasa-bajas en tiempo<br />
continuo a la función de transferencia pasa-b<strong>and</strong>a en tiempo discreto. Adicionalmente<br />
se considera la transformación inversa a partir del dominio de<br />
tiempo discreto, al de tiempo continuo y se demuestra que esta transformación<br />
inversa es fácil de calcular, dado que no es necesario obtener el<br />
determinante del sistema. Varios ejemplos numéricos ilustran la utilización<br />
práctica de esta técnica.<br />
Descriptores: Diseño de filtros, transformaciones s-z, matriz de Pascal,<br />
herramientas para el diseño de filtros digitales.
Prac tical Design of Digital Filters Using the Pascal Matrix<br />
Intro duc tion<br />
A large number of procedures are available<br />
for designing digital filters (Parks <strong>and</strong><br />
Burrus, 1987); (Antoniou, 1993). Many of<br />
them transform a given analog filter into an<br />
equivalent digital filter. The digital filter<br />
design process begins with the synthesis or<br />
specification of the filter transfer function. A<br />
signal x(t) presented to a filter characterized<br />
by its impulse response h(t) produces an<br />
output y(t) given by the convolution y(t)=x(t)<br />
*h(t) or, if using the continuous-time transforms<br />
of the signals, by Y(s)=X(s)H(s). Then<br />
the continuous-time circuit of a filter is<br />
completely described by the transfer function:<br />
A0 + A1s + A2<br />
s + ... + Am<br />
s<br />
H( s)<br />
=<br />
(1)<br />
2 m<br />
B + B s + B s + ... + B s<br />
0 1 2<br />
From this equation the vectors A <strong>and</strong> B<br />
representing respectively the coefficients of<br />
the numerator <strong>and</strong> denominator can be<br />
defined as:<br />
A = ( A0 , A1 , A2<br />
,..., A m )<br />
B = ( B0 , B1 , B2<br />
, ..., B m )<br />
where, A i <strong>and</strong> B i are real coefficients.<br />
2<br />
m<br />
m<br />
(2)<br />
In the discrete-time domain the z<br />
transforms of the signals are used, <strong>and</strong> a<br />
digital filter is characterized by the transfer<br />
function:<br />
−1<br />
−2<br />
−n<br />
a0 + a 1z + a 2 z + ... + anz<br />
H( z)<br />
=<br />
(3)<br />
−1<br />
−2<br />
b0 + b1z + b2z + ... + bnz − n<br />
With real coefficients a i <strong>and</strong> b i .<br />
The problem of the systematic conversion<br />
from the continuous-time prototype transfer<br />
function H(s) to its discrete-time version H(z)<br />
is addressed in this paper considering three<br />
types of conversions: lowpass-to-lowpass, lowpass-to-highpass<br />
<strong>and</strong> lowpass-to-b<strong>and</strong>pass. The<br />
original Pascal matrix (Biolkova <strong>and</strong> Biolek,<br />
1999) is used to achieve this systematization,<br />
<strong>and</strong> an alternative representation of the original<br />
Pascal matrix is developed in this paper<br />
to rich the lowpass-to-b<strong>and</strong>pass conversion.<br />
The remainder of this paper is organized<br />
as follows. Section II describes the lowpassto-lowpass<br />
conversion. Section III adapts the<br />
previous development to the lowpass-tohighpass<br />
case. Section IV main contribution of<br />
this paper, develops an alternative representation<br />
of the original b<strong>and</strong>pass Pascal matrix<br />
which allows the lowpass-to-b<strong>and</strong>pass conversion.<br />
Section V presents the inverse<br />
conversion from the discrete-time domain to<br />
the continuous-time. In Section VI we give<br />
examples to illustrate all the cases.<br />
Lowpass-to-lowpass Transformation<br />
For lowpass filters the digital transfer<br />
function H(z) can be obtained from the<br />
continuous-time prototype (1) using the<br />
bilinear s-z transformation (Parks <strong>and</strong><br />
Burrus, 1987):<br />
where<br />
s c z −1<br />
=<br />
z + 1<br />
f<br />
c = co t π 1<br />
f s<br />
(4)<br />
(5)<br />
<strong>and</strong> the constants f1 <strong>and</strong> f s represent the<br />
lowpass corner <strong>and</strong> sampling frequencies,<br />
respectively.<br />
From the transfer function (3), we define<br />
the vectors a <strong>and</strong> b whose elements are<br />
respectively the coefficients of the numerator<br />
<strong>and</strong> denominator (Klein, 1976):<br />
198 INGENIERIA Investigación y Tecnología FI-UNAM
B. P enika, F. García-Ugalde <strong>and</strong> V.F. Ruiz<br />
a = ( a0 , a1 , a 2,. .., a n )<br />
b = ( b0 , b1 , b2<br />
,..., b n )<br />
(6)<br />
In order to express the numerator vectors<br />
a in terms of A <strong>and</strong> denominator vectors b in<br />
terms of B, we replace the variable s in (1) by<br />
(4) then comparing the numerators <strong>and</strong> the<br />
denominators of the resulting transfer functions<br />
in z, we can identify the coefficients by<br />
equating the coefficients of the like powers in z.<br />
Thus, for n=2 <strong>and</strong> m=2 we obtain the<br />
following expression:<br />
−1<br />
H z<br />
a0 ( ) =<br />
+ a 1z + a 2z<br />
−1<br />
b + b z + b z<br />
0 1<br />
−2<br />
−2<br />
2<br />
2 −1<br />
2<br />
A0 + A1 c+ A2c + z ( 2A0 − 2A2c<br />
) +<br />
=<br />
2 −1<br />
2<br />
B + B c+ B c + z 2B − 2 B c ) +<br />
0 1 2<br />
−2<br />
=<br />
( 0 2<br />
+ z ( A0 − A1c + A 2c<br />
)<br />
−2<br />
2<br />
+ z ( B − B c + B c )<br />
0 1 2<br />
2<br />
(7)<br />
From the numerators the coefficients, a i<br />
,<br />
i=0,1,2 are easily identified <strong>and</strong> re-written in<br />
acquire the following matrix equation<br />
⎡a<br />
⎢<br />
a<br />
⎢<br />
⎣⎢<br />
a<br />
0<br />
1<br />
2<br />
⎤ ⎡1 1 1 ⎤ ⎡ A0<br />
⎤<br />
⎥<br />
=<br />
⎢<br />
2 0 −2<br />
⎥<br />
×<br />
⎢<br />
A1c<br />
⎥<br />
⎥ ⎢ ⎥ ⎢ ⎥<br />
2<br />
⎦⎥<br />
⎣⎢<br />
1 −1 1<br />
⎦⎥<br />
⎣⎢<br />
A2c<br />
⎦⎥<br />
(8)<br />
In a similar manner, a matrix equation can<br />
be obtained for the coefficients, bi,i=0,1,2 of the<br />
denominator vector b.<br />
Using a more compact representation both<br />
equations can be written as follows:<br />
( n)<br />
a = P LP × A'<br />
( n)<br />
b = P LP × B'<br />
(9)<br />
( n)<br />
where P LP is the lowpass Pascal matrix<br />
defined in (P enika et al., 2002) <strong>and</strong> the<br />
vectors A',<br />
B' are represented by<br />
2<br />
m<br />
A' ( A , A c, A c ,..., A c )<br />
=<br />
0 1 2<br />
2<br />
m<br />
B' = ( B 0<br />
, B 1<br />
c, B 2<br />
c ,..., B c )<br />
m<br />
m<br />
(10)<br />
As demonstrated in (P enika et al., 2002)<br />
( n )<br />
the computation of the PLP matrix can be<br />
done in a systematic form. For this we<br />
consider the classical Pascal Triangle<br />
1<br />
1<br />
(11)<br />
Obs<br />
erve, that the coefficients of base n=2 create<br />
the last column in the lowpass Pascal matrix of<br />
(8) with the exception of the elements in the<br />
even rows which have negative values. We<br />
have concluded that the lowpass Pascal matrix<br />
can be formed by taking into account the<br />
following rules (Biolkova <strong>and</strong> Biolek, 1999);<br />
(Pham <strong>and</strong> Psenicka, 1985).<br />
- In the first row of the Pascal<br />
matrix all the elements must be equal to<br />
one.<br />
- The elements of the last column<br />
can be computed using:<br />
where<br />
1<br />
5<br />
1<br />
4<br />
1<br />
3<br />
10<br />
1<br />
2<br />
6<br />
Pi , n+<br />
1<br />
= ( −1<br />
)<br />
i −1<br />
1<br />
3<br />
10<br />
1<br />
4<br />
1<br />
5<br />
1<br />
n!<br />
( n − i + 1)!( i −1)!<br />
i=1,2,...,n+1<br />
1<br />
n=<br />
0<br />
n=<br />
1<br />
n=<br />
2<br />
n=<br />
3<br />
n=<br />
4<br />
n=<br />
5<br />
(12)<br />
Vol.VIII No.3 -julio-septiembre- 2007 199
Prac tical Design of Digital Filters Using the Pascal Matrix<br />
The remaining elements P i, j of the lowpass<br />
Pascal matrix can be determined using the<br />
following equation:<br />
where<br />
P = P + P + P<br />
i, j i−1 , j i − 1, j + 1 i,<br />
j+<br />
1<br />
i = 2 , 3, 4 ,..., n,<br />
n + 1<br />
j = n , n −1 , n − 2, ..., 2 , 1<br />
(13)<br />
Without lost of generality, using letters of<br />
the alphabet in the order shown below we<br />
can identify the elements of the lowpass Pascal<br />
matrix for n=4:<br />
⎡a = 1 b = 1 c= 1 d = 1 e = 1 ⎤<br />
⎢ j i h g f = −4<br />
⎥<br />
⎢<br />
⎥<br />
⎢ ? ? ? ? k = 6 ⎥<br />
⎢ ? ? ? ? l = −4<br />
⎥<br />
⎢<br />
⎥<br />
⎣⎢<br />
? ? ? ? p = 1 ⎦⎥<br />
(14)<br />
where the elements denoted g, h, i, <strong>and</strong> j can<br />
be obtained using the next set of equations:<br />
highpass transfer function H(z), we substitute<br />
the variable s by 1/s in (4). Thus,<br />
with<br />
s = k z + 1<br />
z −1<br />
fc<br />
k = tan π (17)<br />
f<br />
where f c<br />
represents the cut-off frequency of<br />
the highpass <strong>and</strong> f s the sampling frequency.<br />
Following the same process, substituting (17)<br />
into (1) <strong>and</strong> comparing the numerator with<br />
(3) for n=3 <strong>and</strong> m=3, we can obtain:<br />
1 2<br />
a + a z + a z + a z<br />
0 1<br />
s<br />
− − − 3<br />
=<br />
2<br />
3<br />
A + A k + A k + A k +<br />
0 1 2<br />
2<br />
−1<br />
2<br />
3<br />
+ z ( −3A − A k + A k + 3A k ) + (18)<br />
−2<br />
0 1 2<br />
+ z ( 3A − A k − A k + 3 A k ) +<br />
−3<br />
0 1 2<br />
+ z ( − A + A k − A k + A k )<br />
0 1 2<br />
2<br />
2<br />
3<br />
3<br />
3<br />
3<br />
3<br />
3<br />
3<br />
g = d + e + f = − 2 ; h = c + d + g = 0<br />
i = b + c + h = 2 ; j = a + b + i = 4<br />
(15)<br />
Again, equating the coefficients of the like<br />
powers in z, we obtain the following matrix<br />
equation<br />
Then the lowpass Pascal matrix for the<br />
particular case of n=4 is finally given by:<br />
( 4 )<br />
PLP<br />
⎡1 1 1 1 1 ⎤<br />
⎢4 2 0 −2 −4<br />
⎥<br />
⎢<br />
⎥<br />
= ⎢6 0 −2 0 6 ⎥<br />
⎢4 −2 0 2 −4<br />
⎥<br />
⎣⎢<br />
1 −1 1 −1 1 ⎦⎥<br />
Lowpass-to-highpass<br />
Transformation<br />
(16)<br />
In this second case, in order to transform the<br />
lowpass transfer function to the discrete<br />
⎡a<br />
⎢<br />
a<br />
⎢<br />
⎣⎢<br />
a<br />
⎡ 1 1 1 1⎤<br />
⎡ A0<br />
⎤<br />
⎤ ⎢<br />
⎥<br />
3 1 1 3<br />
= − − ⎥ ⎢ A ⎥<br />
1k<br />
⎢<br />
⎥ × ⎢ ⎥<br />
2<br />
⎥ ⎢ 3 −1 −1 3⎥<br />
⎢A2<br />
k ⎥<br />
⎦⎥<br />
⎢<br />
⎣−1 1 −1 1⎥<br />
⎢ 3 ⎥<br />
⎦ ⎣A3<br />
k ⎦<br />
0<br />
1<br />
2<br />
(19)<br />
This equation can be written in the<br />
compact form<br />
( 3)<br />
a = P HP × A''<br />
(20)<br />
( 3)<br />
where P HP is a variant of a Pascal matrix<br />
which corresponds to the highpass filter in<br />
which the first row elements are all equal to<br />
one, <strong>and</strong> the elements of the first column can<br />
200 INGENIERIA Investigación y Tecnología FI-UNAM
B. P enika, F. García-Ugalde <strong>and</strong> V.F. Ruiz<br />
be obtained using (12). The remaining elements<br />
P i, j<br />
can be determined using the<br />
following expression (P enika et al., 2002):<br />
a( a 0 , a1 , a 2 ,..., a n )<br />
b( b0 , b1 , b2<br />
, ..., b n )<br />
(24)<br />
P = P + P + P<br />
i , j i, j− 1 i−1, j−1 i−1,<br />
j<br />
Where i = 2 , 3, ..., n + 1<br />
(21)<br />
j = 2 , 3, ..., n + 1<br />
A similar development can be done for the<br />
denominator vector b .<br />
Lowpass-to-b<strong>and</strong>pass<br />
Transformation<br />
The latest case considered in this paper<br />
shows how to obtain a discrete b<strong>and</strong>pass<br />
filter (Konopacki, 2005) characterized by the<br />
discrete-time transfer function H(z)<br />
In order to obtain the coefficients a i <strong>and</strong> b i<br />
( i = 0, 1 ,..., n ) knowing the continuous time<br />
representation vectors A <strong>and</strong> B , we must first<br />
substitute (23) into (1) then compare the<br />
numerator <strong>and</strong> denominator of the resulting<br />
transfer function with the corresponding<br />
ones in (22).<br />
For example without lost of generalization<br />
we take m=1 in (1), due to the high order<br />
terms appearing in the transformation (23), a<br />
n=2 must taken in (22) resulting in:<br />
−1<br />
Az ( ) a 0 + a1<br />
z + a2<br />
z<br />
H( z)<br />
= =<br />
−1<br />
Bz ( ) b + b z + b z<br />
0 1<br />
2<br />
−2<br />
−2<br />
=<br />
−1<br />
−2<br />
−n<br />
a0 + a<br />
1z + a<br />
2<br />
z + ... + anz<br />
H( z)<br />
=<br />
(22)<br />
−1<br />
−2<br />
b + b z + b z + ... + b z − n<br />
0 1<br />
which also has real coefficients a i <strong>and</strong> b i . As<br />
previously this transfer function can be<br />
obtained from the continuous one (1) by s-z<br />
transformation. The b<strong>and</strong>pass filter can be<br />
seen as a superposition of a lowpass filter <strong>and</strong><br />
a highpass filter (Rabiner <strong>and</strong> Gold, 1975).<br />
Thus, the s-z transformation that applies is<br />
(Bose, 1985):<br />
2<br />
n<br />
−1<br />
A0 + A1 c + A1<br />
k + z ( 2 A1 k − 2 A1c<br />
) +<br />
−1<br />
B + B c + B k + z ( 2 B k − 2 B c) +<br />
0 1 1<br />
−2<br />
1 1<br />
+ z ( − A + A c + A k)<br />
−2<br />
0 1 1<br />
+ z ( − B + B c + B k)<br />
0 1 1<br />
<strong>and</strong> the following matrix equation:<br />
⎡a<br />
⎢<br />
a<br />
⎢<br />
⎣⎢<br />
a<br />
0<br />
1<br />
2<br />
⎤⎡<br />
1 1 1 ⎤ ⎡A1c<br />
⎤<br />
⎥⎢<br />
−2 0 2<br />
⎥<br />
×<br />
⎢<br />
A<br />
⎥<br />
0<br />
⎥⎢<br />
⎥ ⎢ ⎥<br />
⎦⎥<br />
⎣⎢<br />
1 −1 1 ⎦⎥<br />
⎣⎢<br />
A1k<br />
⎦⎥<br />
(25)<br />
(26)<br />
s = c z − 1<br />
k z<br />
z+ + + 1<br />
1 z − 1<br />
f<br />
f−<br />
where c = cot( π<br />
1 ) k = ta n( π<br />
1 )<br />
f<br />
f<br />
s<br />
s<br />
(23)<br />
f 1<br />
<strong>and</strong> f −1<br />
represent the upper <strong>and</strong> lower<br />
frequencies of the b<strong>and</strong>pass filter respectively,<br />
<strong>and</strong> f s<br />
the sampling frequency.<br />
In a similar manner from (22), we define<br />
the coefficient vectors a <strong>and</strong> b:<br />
A similar equation is obtained for the<br />
denominator vector b. Both equations can be<br />
represented in the following compact form:<br />
n<br />
BP<br />
a = P × A'''<br />
n<br />
b = P BP × B'''<br />
(27)<br />
n<br />
where P BP is the so called b<strong>and</strong>pass Pascal<br />
matrix. This matrix transforms the normalized<br />
lowpass to b<strong>and</strong>pass transfer function.<br />
We have named this matrix the b<strong>and</strong>pass<br />
Vol.VIII No.3 -julio-septiembre- 2007 201
Prac tical Design of Digital Filters Using the Pascal Matrix<br />
Pascal matrix (Psenicka <strong>and</strong> García-Ugalde,<br />
2004) because the matrices of all orders have<br />
in the first column the coefficients of the base<br />
of a Pascal triangle (11) with the exception of<br />
elements in even rows, which have negative<br />
signs. In this example the vectors A ''' <strong>and</strong> B '''<br />
are represented respectively by<br />
A''' = ( A1c, A0 , A1k<br />
)<br />
B''' = ( B 1 c, B 0 , B 1 k )<br />
(28)<br />
In order to achieve an alternative representation<br />
of the original b<strong>and</strong>pass Pascal<br />
matrix, without lost of generality let us<br />
consider the case of order m=2 <strong>and</strong> again<br />
because of the high order terms appearing in<br />
the transformation (23), a n=4 must taken.<br />
n<br />
The matrix representation of a = P BP × A<br />
''' is<br />
given by<br />
⎡a<br />
⎢a<br />
⎢<br />
⎢a<br />
⎢a<br />
⎢<br />
⎣⎢<br />
a<br />
0<br />
1<br />
2<br />
3<br />
4<br />
⎡A2<br />
c ⎤<br />
⎤ ⎡ 1 1 1 1 1 1 ⎤ ⎢<br />
⎥ ⎢<br />
−4 −2 0 2 4 0<br />
⎥<br />
A c<br />
⎥<br />
⎢ 1 ⎥<br />
⎥ ⎢<br />
⎥ ⎢A0<br />
⎥<br />
⎥ = ⎢ 6 0 −2 0 6 −2<br />
⎥×<br />
⎢<br />
⎥ ⎢<br />
1<br />
−4 2 0 −2 4 0 ⎥<br />
A k<br />
⎥<br />
⎢ ⎥<br />
2<br />
⎥<br />
⎦⎥<br />
1 −1 1 −1 1 1<br />
⎢A2<br />
k ⎥<br />
⎣⎢<br />
⎦⎥<br />
⎢<br />
⎣2<br />
A 2 ck<br />
⎥<br />
⎦<br />
(29)<br />
Note from this latest example that the<br />
matrix is rectangular <strong>and</strong> it will be the<br />
general case in a lowpass-to-b<strong>and</strong>pass transformation<br />
for values of m=2 or higher. In<br />
order to use the same rules as in the previous<br />
section for the lowpass-to-highpass transformation<br />
(which always has a square matrix)<br />
we decompose this rectangular matrix into<br />
the concatenation of two matrices as shown<br />
in the following equation<br />
n<br />
n<br />
⎡P BP ⎤ S BP R<br />
⎣⎢ ⎦⎥ = ⎡ ⎣⎢<br />
n<br />
BP<br />
⎤<br />
⎦⎥<br />
2<br />
(30)<br />
n<br />
In this equation the matrix S BP is square <strong>and</strong><br />
its computation is exactly the same as that<br />
used in the lowpass-to-highpass transformation,<br />
which means: all the terms in the first<br />
column can be obtained using (12) <strong>and</strong> the<br />
remaining elements S ij<br />
can be established<br />
using the following expression (P enika et<br />
al., 2002):<br />
S = S + S + S<br />
ij i, j −1 i−1 , j−1 i−<br />
1 , j<br />
Where i = 2 , 3,... , n + 1<br />
(31)<br />
j = 2 , 3 ,... , n + 1<br />
n<br />
On the other h<strong>and</strong> the matrix R BP in (30) is<br />
rectangular with n+1 rows. A priori the<br />
number of columns has to be computed by<br />
counting the number of elements different to<br />
1 included in the upper triangle from base m<br />
of the Pascal triangle (11). To illustrate these<br />
values we summarize in table 1 the number<br />
n<br />
of columns col of matrix RBP for different m<br />
<strong>and</strong> n parameter values.<br />
Table 1. Number of columns col in the matrix<br />
n<br />
R BP<br />
m n col<br />
2 4 1<br />
3 6 3<br />
4 8 6<br />
n<br />
Once the elements of matrix SB P are<br />
n<br />
known the columns of R BP can be derived<br />
directly. Let us consider the case m =2, the<br />
n<br />
lonely column of RB P is equal to the central<br />
n<br />
column of SB P (P enika <strong>and</strong> García-Ugalde,<br />
2004). In this paper we call this column the<br />
pivot because for m=2 there is only one<br />
element different to 1 in the upper triangle<br />
from base m in the Pascal triangle <strong>and</strong> its<br />
position corresponds to a central position in<br />
the triangle. For m=3, as shown in table 1,<br />
202 INGENIERIA Investigación y Tecnología FI-UNAM
B. P enika, F. García-Ugalde <strong>and</strong> V.F. Ruiz<br />
n<br />
there are three columns in R B P , one is also the<br />
pivot because again it is equal to the central<br />
n<br />
column of S BP <strong>and</strong> the two others are the<br />
columns on the right of the pivot <strong>and</strong> on the<br />
left of it. Also the reason is because for m=3<br />
there are three elements different to one in<br />
the upper trian- gle from base m <strong>and</strong> their<br />
positions corres- pond to a central position in<br />
the triangle plus its nearest neighbors (right<br />
<strong>and</strong> left). To illustrate the previous structure<br />
n<br />
we show the resulting P BP matrix for vector a<br />
<strong>and</strong> pa- rameters m=3, n=6.<br />
⎡ ⎤<br />
1 1 1 1 1 1 1 1 1 1<br />
⎢a<br />
⎥<br />
⎡<br />
⎤<br />
0<br />
⎢a<br />
⎥<br />
⎢ −6 −4<br />
−2 0 2 4 6 0 2 −2<br />
⎥<br />
1<br />
⎢ ⎥<br />
⎢ 15 5 −1 −3 −1 5 15 −3 −1 −1⎥<br />
a2<br />
⎢ ⎥<br />
⎢<br />
⎥<br />
= −20 0 4 0 −4 0 20 0 −4 4<br />
⎢a3<br />
⎥<br />
⎢<br />
⎥<br />
15 −5 −1 3 −1 5 15 3 1 1<br />
⎢a4<br />
⎥<br />
⎢<br />
− − −<br />
⎥<br />
6 4 2 0 2 4 6 0 2 2<br />
⎢a<br />
⎥<br />
⎢ − − − − ⎥<br />
5<br />
⎢<br />
⎣a<br />
⎥ ⎣⎢<br />
1 −1 1 −1 1 −1 1 −1 1 1 ⎦⎥<br />
⎦<br />
6<br />
3<br />
⎡A c ⎤<br />
3<br />
⎢ 2 ⎥<br />
⎢<br />
A 2c<br />
⎥<br />
⎢A c ⎥<br />
1<br />
⎢ ⎥<br />
⎢<br />
A 0<br />
⎥<br />
⎢A 1k<br />
⎥<br />
× ⎢ 2 ⎥<br />
⎢A 2k<br />
⎥<br />
⎢<br />
3<br />
A k ⎥<br />
3<br />
⎢ ⎥<br />
⎢2<br />
A2<br />
ck ⎥<br />
⎢ 2<br />
3A3<br />
ck ⎥<br />
⎢ ⎥<br />
2<br />
⎣⎢<br />
3A3<br />
c k⎦⎥<br />
(32)<br />
A similar expression can be obtained for<br />
vector b.<br />
Inverse Trans for ma tion from H(z)<br />
to H(s)<br />
The inverse Pascal matrix is defined by the<br />
following equation (Klein, 1976):<br />
P<br />
−1<br />
n<br />
− n<br />
= 2 × Pn<br />
(33)<br />
In all cases using the inverse Pascal matrix<br />
the continuous-time transfer function H(s)<br />
can be obtained from the transfer matrix of<br />
the discrete-time structure H(z) . The advantage<br />
of using this equation is that to compute<br />
the inverse Pascal matrix the determinant of<br />
the system is not necessary.<br />
For example consider the lowpass case, let<br />
H(z) be the transfer function of the discrete<br />
structure that works at the corner frequency<br />
f = 3400[ Hz] 1<br />
<strong>and</strong> sampling frequency<br />
f = 16000 [ Hz].<br />
s<br />
−1 −2<br />
0. 227 + 0. 45 4z<br />
+ 0 . 227z<br />
H( z)<br />
=<br />
(34)<br />
−1 −2 1 − 0. 276z<br />
+ 01 . 85z<br />
First it is necessary to calculate the constant<br />
c of the bilinear transform (1):<br />
⎛ π 3400 ⎞<br />
c = cot ⎜ ⎟ = 126849 .<br />
(35)<br />
⎝ 16000 ⎠<br />
Then the transfer function coefficients of<br />
the analog circuit will be calculated as<br />
follows:<br />
⎡A<br />
0<br />
⎢<br />
A1c<br />
⎢<br />
⎣⎢<br />
A2c<br />
⎡B0<br />
⎢<br />
B1<br />
c<br />
⎢<br />
⎣⎢<br />
B2<br />
c<br />
<strong>and</strong><br />
2<br />
2<br />
⎤ ⎡1 1 1 ⎤ ⎡0.<br />
227⎤<br />
⎥ 1<br />
= ⎢2 0 −2⎥<br />
⎢0.454⎥<br />
⎥ 4 ⎢ ⎥ ⎢ ⎥<br />
⎦⎥<br />
⎣⎢<br />
1 −1 1<br />
⎦⎥<br />
⎣⎢<br />
0.<br />
227<br />
⎦⎥<br />
⎡0.<br />
22 7⎤<br />
= ⎢0.<br />
0 ⎥<br />
⎢ ⎥<br />
⎣⎢<br />
0.<br />
0<br />
⎦⎥<br />
⎤ ⎡1 1 1 ⎤⎡1<br />
⎤ ⎡0227<br />
. ⎤<br />
⎥ 1<br />
=<br />
⎢<br />
2 0 −2<br />
⎥⎢<br />
− 0.<br />
276<br />
⎥<br />
=<br />
⎢<br />
0407 .<br />
⎥<br />
⎥ 4 ⎢ ⎥⎢<br />
⎥ ⎢ ⎥<br />
⎦⎥<br />
⎣⎢<br />
1 −1 1 ⎦⎥<br />
⎣⎢<br />
0.<br />
185 ⎦⎥<br />
⎣⎢<br />
0365 . ⎦⎥<br />
A0 = 022 . 7 A1 = 0. 0 A2<br />
= 00 .<br />
B = 0. 227 B = 0. 321 B = 0227 .<br />
0 1 2<br />
(36)<br />
(37)<br />
Vol.VIII No.3 -julio-septiembre- 2007 203
Prac tical Design of Digital Filters Using the Pascal Matrix<br />
The transfer function of the corresponding<br />
analog filter is the Butterworth transfer<br />
function of the second order:<br />
0.<br />
227<br />
H ( s)<br />
=<br />
=<br />
2<br />
0. 227s<br />
+ 0. 321 s + 0.<br />
227<br />
=<br />
2<br />
s<br />
1<br />
+ 1 . 4142s<br />
+ 1<br />
Numer ical Exam ples<br />
In these examples we shall transform a<br />
lowpass transfer function H(s) to lowpass<br />
<strong>and</strong> highpass transfer functions H(z) using<br />
the features specified by:<br />
c = k = 1, f<br />
s<br />
= 800 0[ Hz],<br />
(38)<br />
2<br />
s + 515 . 3<br />
H( s)<br />
=<br />
3 2<br />
0. 929 s + 2. 781s + 4 . 344s<br />
+ 5.<br />
153<br />
Trans for ma tion LP-to-LP from s to<br />
the z domain<br />
The transfer function coefficients a<br />
i<br />
, bi, for<br />
i=0,1,2,3 can then be obtained using the<br />
equations:<br />
⎡a<br />
⎢a<br />
⎢<br />
⎢a<br />
⎢<br />
⎣<br />
a<br />
0<br />
1<br />
⎤ ⎡1 1 1 1 ⎤ ⎡A0<br />
⎥ ⎢3 1 −1 −3<br />
⎥ ⎢A c<br />
1<br />
⎥ = ⎢<br />
⎥ × ⎢<br />
⎥ ⎢3 −1 −1 3 ⎥ ⎢A2c<br />
⎥ ⎢<br />
⎦ ⎣<br />
1 −1 1 −1<br />
⎥ ⎢<br />
⎦ ⎣<br />
A3c<br />
2<br />
3<br />
2<br />
3<br />
⎤<br />
⎥<br />
⎥ =<br />
⎥<br />
⎥<br />
⎦<br />
given<br />
⎡b<br />
⎢b<br />
⎢<br />
⎢b<br />
⎢<br />
⎣b<br />
⎤ ⎡1 1 1 1 ⎤ ⎡B0<br />
⎤<br />
⎥ ⎢3 1 −1 −3⎥<br />
⎢B ⎥<br />
1<br />
c<br />
⎥ = ⎢<br />
⎥ × ⎢ ⎥<br />
2 =<br />
⎥ ⎢3 −1 −1 3 ⎥ ⎢B2<br />
c ⎥<br />
⎥ ⎢<br />
⎦ ⎣1 −1 1 −1⎥<br />
⎢ 3 ⎥<br />
⎦ ⎣B3<br />
c ⎦<br />
0<br />
1<br />
2<br />
3<br />
⎡1 1 1 1 ⎤ ⎡ 5153 . ⎤<br />
⎢<br />
3 1 −1 −3<br />
⎥ ⎢<br />
4.<br />
344<br />
⎥<br />
= ⎢<br />
⎥ × ⎢ ⎥<br />
⎢3 −1 −1 3 ⎥ ⎢2. 781⎥<br />
⎢<br />
⎣1 −1 1 −1⎥<br />
⎢<br />
⎦ ⎣0.<br />
929⎥<br />
⎦<br />
(40)<br />
a = 6153 . , a = 14. 459 , a = 14 . 459, a = 6.<br />
15 3<br />
0 1 2 3<br />
b = 13 . 207, b = 14. 235 , b = 11. 121, b = 2.<br />
66 1<br />
0 1 2 3<br />
The transfer function H(z) takes the form<br />
H( z) =<br />
−1 −2 −3<br />
0 . 4658+ 1. 0948z + 10948 . z + 0.<br />
4658 z<br />
=<br />
−1<br />
−<br />
1 + 1.<br />
0778z + 0. 842 2 −<br />
z + 0.<br />
2015z<br />
3<br />
(41)<br />
For this equation the corresponding magnitude<br />
<strong>and</strong> phase frequency responses of the<br />
digital lowpass filter are shown in Figure 1.<br />
(39)<br />
⎡1 1 1 1 ⎤ ⎡5.<br />
153⎤<br />
⎢<br />
3 1 −1 −3<br />
⎥ ⎢<br />
0.<br />
0<br />
⎥<br />
= ⎢<br />
⎥ × ⎢ ⎥<br />
⎢3 −1 −1 3 ⎥ ⎢1 . 0 ⎥<br />
⎢<br />
⎣1 −1 1 −1<br />
⎥ ⎢<br />
⎦ ⎣0.<br />
0<br />
⎥<br />
⎦<br />
204 INGENIERIA Investigación y Tecnología FI-UNAM
B. P enika, F. García-Ugalde <strong>and</strong> V.F. Ruiz<br />
Figure 1. Magni tude <strong>and</strong> phase frequency responses of the lowpass filter<br />
Trans for ma tion LP-to-HP from s to the<br />
z domain<br />
( 3 )<br />
Using the Pascal matrix PHP we can transform<br />
the lowpass transfer function (38) to the<br />
highpass transfer function H(z) using the<br />
following equations:<br />
⎡a<br />
⎢<br />
a<br />
⎢<br />
⎢a<br />
⎢<br />
⎣a<br />
0<br />
1<br />
2<br />
3<br />
⎤ ⎡ 1 1 1 1 ⎤ ⎡A0<br />
⎥ ⎢<br />
3 1 1 3<br />
⎥ = − − ⎥ ⎢<br />
A1<br />
k<br />
⎢<br />
⎥ × ⎢<br />
⎥ ⎢ 3 −1 −1 3 ⎥ ⎢A2<br />
k<br />
⎥ ⎢<br />
⎦ ⎣−1 1 −1 1 ⎥ ⎢<br />
⎦ ⎣A3<br />
k<br />
2<br />
3<br />
⎤<br />
⎥<br />
⎥=<br />
⎥<br />
⎥<br />
⎦<br />
⎡b<br />
⎢b<br />
⎢<br />
⎢b<br />
⎢<br />
⎣b<br />
0<br />
1<br />
2<br />
3<br />
⎤ ⎡ 1 1 1 1⎤<br />
⎡B0<br />
⎥ ⎢ 3 1 1 3<br />
⎥ = − − ⎥ ⎢B 1k<br />
⎢<br />
⎥ × ⎢<br />
⎥ ⎢ 3 −1 −1 3⎥<br />
⎢B k<br />
⎥ ⎢<br />
⎦ ⎣−1 1 −1 1⎥<br />
⎢<br />
⎦ ⎣B3k<br />
⎡ 1 1 1 1⎤<br />
⎡5.<br />
153⎤<br />
⎢<br />
= ⎢<br />
− 3 − 1 1 3<br />
⎥ ⎢<br />
4 . 344<br />
⎥<br />
⎥ × ⎢ ⎥<br />
⎢ 3 −1 −1 3⎥<br />
⎢2 . 781⎥<br />
⎢<br />
⎣−1 1 −1 1⎥<br />
⎢<br />
⎦ ⎣0.<br />
929⎥<br />
⎦<br />
2 2<br />
3<br />
⎤<br />
⎥<br />
⎥<br />
⎥<br />
⎥<br />
⎦<br />
(43)<br />
⎡ 1 1 1 1⎤<br />
⎡5.<br />
153⎤<br />
⎢<br />
= ⎢<br />
− 3 − 1 1 3⎥<br />
⎢0.<br />
0 ⎥<br />
⎥ × ⎢ ⎥<br />
⎢ 3 −1 −1 3⎥<br />
⎢1 . 0 ⎥<br />
⎢<br />
⎣−1 1 −1 1⎥<br />
⎢<br />
⎦ ⎣0.<br />
0 ⎥<br />
⎦<br />
(42)<br />
The coefficients of the highpass transfer<br />
function are:<br />
a<br />
a<br />
b<br />
= 6153 . , a = −14 . 459<br />
0 1<br />
= 14 . 459, a = 615 . 3<br />
2 3<br />
= 13 . 207, b = −14.<br />
235<br />
0 1<br />
Vol.VIII No.3 -julio-septiembre- 2007 205
Prac tical Design of Digital Filters Using the Pascal Matrix<br />
b<br />
= 11. 121, b =−2 . 661<br />
2 3<br />
<strong>and</strong> the highpass transfer function is given by<br />
(44). The magnitude <strong>and</strong> phase frequency<br />
responses of the digital highpass filter are<br />
shown in Figure 2.<br />
H( z) =<br />
−1 −2 −3<br />
0. 46 58 − 10 . 948z + 1. 0948 z −0 . 4658z<br />
=<br />
−1<br />
−<br />
1 − 1.<br />
0778z + 0. 842 2 −<br />
z − 0.<br />
2015 z<br />
3<br />
(44)<br />
Trans for ma tion LP-to-BP from s to the z<br />
domain<br />
In this example we transform a Butterworth<br />
lowpass transfer function H(s) to a b<strong>and</strong>pass<br />
transfer function H(z) using the features<br />
specified by:<br />
f = 3000 [ Hz], f = 10 00[ Hz]<br />
f<br />
1 −1<br />
s<br />
= 8000[ Hz] (45)<br />
H( s) =<br />
s<br />
2<br />
1<br />
+ 2s<br />
+ 1<br />
In order to transform the lowpass analog<br />
function (45) into the digital b<strong>and</strong>pass<br />
function, we must first determine the transfer<br />
function coefficients a<br />
1<br />
, b1<br />
for i = 0, 1,... , 4<br />
which can be obtained using the matrix<br />
equations for current values:<br />
⎛ π 3000 ⎞<br />
c = co t ⎜ ⎟ = 0.<br />
4142<br />
⎝ 8000 ⎠<br />
⎛ π1000 ⎞<br />
k = tan ⎜ ⎟ = 0.<br />
4 142<br />
⎝ 8000 ⎠<br />
Figure 2. Magni tude <strong>and</strong> phase frequency responses of the highpass filter<br />
206 INGENIERIA Investigación y Tecnología FI-UNAM
B. P enika, F. García-Ugalde <strong>and</strong> V.F. Ruiz<br />
⎡A2<br />
c ⎤<br />
⎡a<br />
0 ⎤ ⎡ 1 1 1 1 1 1 ⎤ ⎢<br />
⎢<br />
a<br />
⎥ ⎢<br />
1 −4 −2 0 2 4 0<br />
⎥<br />
A1<br />
c<br />
⎥<br />
⎢ ⎥<br />
⎢ ⎥ ⎢<br />
⎥ ⎢A0<br />
⎥<br />
⎢a<br />
2 ⎥ = ⎢ 6 0 −2 0 6 −2<br />
⎥ ×<br />
⎢<br />
⎢a<br />
⎥ ⎢<br />
1<br />
3 −4 2 0 −2 4 0 ⎥<br />
A k<br />
⎥=<br />
⎢ ⎥<br />
2<br />
⎢ ⎥ ⎢<br />
⎥<br />
⎣⎢<br />
a<br />
⎢ 2<br />
4 ⎦⎥<br />
⎣⎢<br />
1 −1 1 −1 1 1<br />
A k ⎥<br />
⎦⎥<br />
⎢<br />
⎣2<br />
A 2<br />
ck<br />
⎥<br />
⎦<br />
⎡b<br />
⎢b<br />
⎢<br />
⎢b<br />
⎢b<br />
⎢<br />
⎣⎢<br />
b<br />
2<br />
(46)<br />
⎡0<br />
⎤<br />
⎡ 1 1 1 1 1 1 ⎤ ⎢ ⎥ ⎡1<br />
⎤<br />
⎢−<br />
−<br />
⎥<br />
0<br />
4 2 0 2 4 0 ⎢ ⎥ ⎢0<br />
⎥<br />
⎢<br />
⎥ ⎢1<br />
⎥ ⎢ ⎥<br />
= ⎢ 6 0 −2 0 6 − 2 ⎥ ×<br />
⎢ ⎥<br />
= ⎢−2<br />
⎥<br />
⎢−4 2 0 −2 4 0 ⎥<br />
0<br />
⎢ ⎥ ⎢0<br />
⎥<br />
⎢<br />
⎥<br />
⎣⎢<br />
1 −1 1 −1 1 1<br />
⎢0<br />
⎥ ⎢ ⎥<br />
⎦⎥<br />
⎢ ⎥ ⎣⎢<br />
1 ⎦⎥<br />
⎣0<br />
⎦<br />
0<br />
1<br />
2<br />
3<br />
4<br />
⎡B2<br />
c ⎤<br />
⎤ ⎡ 1 1 1 1 1 1 ⎤ ⎢<br />
⎥ ⎢<br />
−4 −2 0 2 4 0<br />
⎥<br />
B1<br />
c<br />
⎥<br />
⎢ ⎥<br />
⎥ ⎢<br />
⎥ ⎢B0<br />
⎥<br />
⎥ = ⎢ 6 0 −2 0 6 −2<br />
⎥ × ⎢<br />
⎥ ⎢<br />
1<br />
−4 2 0 −2 4 0 ⎥<br />
B k<br />
⎥=<br />
⎢ ⎥<br />
2<br />
⎥ ⎢<br />
⎥ ⎢ 2<br />
⎦⎥<br />
⎣⎢<br />
1 −1 1 −1 1 1<br />
B k ⎥<br />
⎦⎥<br />
⎢<br />
⎣2<br />
B 2<br />
ck<br />
⎥<br />
⎦<br />
2<br />
(47)<br />
Finally, a more complicated example is presented,<br />
in which the lowpass transfer function<br />
H(s) contains two transfer functions<br />
H ( 1<br />
s ) <strong>and</strong> H s 2<br />
( ) <strong>and</strong> is transformed into the<br />
whole system b<strong>and</strong>pass transfer function H(z)<br />
for f = 3000[ Hz], f = 1000[ Hz ], f = 8000[ Hz ]<br />
1 −1<br />
H( s) = H ( s) × H ( s)<br />
=<br />
0.<br />
123<br />
×<br />
s + 0.<br />
3497 s<br />
2<br />
1 2<br />
s<br />
2<br />
s<br />
+ 02897 .<br />
+ 0 . 0492s<br />
+ 0.<br />
2492<br />
(49)<br />
In order to transform the lowpass analog<br />
function (49) into the digital b<strong>and</strong>pass<br />
function, we proceed the s-z transformation<br />
for each of these two transfer functions, we<br />
must first establish the coefficients a<br />
i<br />
, bi<br />
, for<br />
i = 0 , 1, 2 for the first function H1 ( z) <strong>and</strong> then<br />
the coefficients a<br />
i<br />
, bi<br />
, for i =0, 1 , 2,...,4 for the<br />
second one H2 ( z). This computation can be<br />
obtained using the matrix equations previously<br />
defined for current values:<br />
c =<br />
⎛ π 3000<br />
co t<br />
⎞<br />
⎜ ⎟ = 0.<br />
4142<br />
⎝ 8000 ⎠<br />
k =<br />
⎛ π1000<br />
tan<br />
⎞<br />
⎜ ⎟ = 0.<br />
4 142<br />
⎝ 8000 ⎠<br />
⎡0.<br />
1716 ⎤<br />
⎡ 1 1 1 1 1 1 ⎤ ⎢ ⎥ ⎡2 . 8579⎤<br />
⎢−<br />
−<br />
⎥<br />
0.<br />
5858<br />
4 2 0 2 4 0 ⎢ ⎥ ⎢0<br />
⎥<br />
⎢<br />
⎥<br />
= ⎢ 6 0 −2 0 6 −2<br />
⎥ ×<br />
⎢1<br />
⎥ ⎢ ⎥<br />
⎢0.<br />
5858 ⎥<br />
= ⎢−<br />
0.<br />
627⎥<br />
⎢−4 2 0 −2 4 0 ⎥ ⎢ ⎥ ⎢0<br />
⎥<br />
⎣⎢<br />
1 −1 1 −1 1 1<br />
⎢0.<br />
1716 ⎥ ⎢ ⎥<br />
⎦⎥<br />
⎢<br />
⎣0.<br />
3431 ⎥ ⎣⎢<br />
0.<br />
5147⎦⎥<br />
⎦<br />
The transfer function of the b<strong>and</strong>pass filter<br />
is given by<br />
⎡a<br />
⎢<br />
a<br />
⎢<br />
⎣⎢<br />
a<br />
0<br />
1<br />
2<br />
⎤ ⎡ 1 1 1 ⎤ ⎡A1c<br />
⎤<br />
⎥<br />
=<br />
⎢<br />
− 2 0 2<br />
⎥<br />
×<br />
⎢<br />
A<br />
⎥<br />
0 =<br />
⎥ ⎢ ⎥ ⎢ ⎥<br />
⎦⎥<br />
⎣⎢<br />
1 −1 1 ⎦⎥<br />
⎣⎢<br />
A1k⎦⎥<br />
⎡ 1 1 1 ⎤ ⎡0<br />
⎤ ⎡0 . 123 ⎤<br />
=<br />
⎢<br />
−2 0 2<br />
⎥<br />
×<br />
⎢<br />
0123 .<br />
⎥<br />
=<br />
⎢<br />
0<br />
⎥<br />
⎢ ⎥ ⎢ ⎥ ⎢ ⎥<br />
⎣⎢<br />
1 −1 1 ⎦⎥<br />
⎣⎢<br />
0 ⎦⎥<br />
⎣⎢<br />
− 0.123⎦⎥<br />
(50)<br />
H( z) =<br />
−<br />
0. 3499 − 0. 6998 z + 0.<br />
3499 z<br />
=<br />
−2 −4<br />
1 − 0. 2194 z + 01 . 801z<br />
2 −4<br />
(48)<br />
Vol.VIII No.3 -julio-septiembre- 2007 207
Prac tical Design of Digital Filters Using the Pascal Matrix<br />
⎡a<br />
⎢<br />
a<br />
⎢<br />
⎢a<br />
⎢a<br />
⎢<br />
⎣⎢<br />
a<br />
⎡b<br />
0 ⎤ ⎡ 1 1 1⎤<br />
⎡B1<br />
c⎤<br />
⎢b<br />
⎥<br />
1<br />
= ⎢−2 0 2⎥<br />
× ⎢B<br />
⎥<br />
0<br />
=<br />
⎢ ⎥ ⎢ ⎥ ⎢ ⎥<br />
⎣⎢<br />
b2<br />
⎦⎥<br />
⎣⎢<br />
1 −1 1⎦⎥<br />
⎣⎢<br />
B1<br />
k⎦⎥<br />
⎡ 1 1 1 ⎤ ⎡0 . 4142⎤<br />
⎡11781<br />
. ⎤<br />
=<br />
⎢<br />
−2 0 2<br />
⎥<br />
×<br />
⎢<br />
0.<br />
3497<br />
⎥<br />
=<br />
⎢<br />
0<br />
⎥<br />
⎢ ⎥ ⎢ ⎥ ⎢ ⎥<br />
⎣⎢<br />
1 −1 1 ⎦⎥<br />
⎣⎢<br />
0. 4142⎦⎥<br />
⎣⎢<br />
0.<br />
478 7⎦⎥<br />
0<br />
1<br />
2<br />
3<br />
4<br />
(51)<br />
⎡A2<br />
c ⎤<br />
⎤ ⎡ 1 1 1 1 1 1 ⎤ ⎢<br />
⎥<br />
1<br />
⎢−4 −2 0 2 4 0 ⎥<br />
A c<br />
⎥<br />
⎢ ⎥<br />
⎥ ⎢<br />
⎥ ⎢A0<br />
⎥<br />
⎥ = ⎢ 6 0 −2 0 6 −2<br />
⎥ × ⎢<br />
⎥<br />
A1<br />
k<br />
⎥<br />
=<br />
⎢−4 2 0 −2 4 0 ⎥ ⎢ ⎥<br />
2<br />
⎥<br />
⎢A2<br />
k ⎥<br />
⎦⎥<br />
⎣⎢<br />
1 −1 1 −1 1 1 ⎦⎥<br />
⎢ ⎥<br />
⎣2<br />
A 2<br />
ck ⎦<br />
⎡0 . 1716⎤<br />
⎡ 1 1 1 1 1 1 ⎤ ⎢<br />
⎢<br />
− −<br />
⎥ 0<br />
⎥<br />
4 2 0 2 4 0 ⎢ ⎥<br />
⎢<br />
⎥ ⎢0 . 2897⎥<br />
= ⎢ 6 0 −2 0 6 −2<br />
⎥ × ⎢ ⎥ =<br />
⎢−4 2 0 −2 4 0 ⎥<br />
0<br />
⎢ ⎥<br />
⎣⎢<br />
1 −1 1 −1 1 1 ⎦⎥<br />
⎢0 . 1716⎥<br />
⎢ ⎥<br />
⎣0 . 3431⎦<br />
2<br />
⎡ 1 1 1 1 1 1<br />
⎡01716<br />
. ⎤<br />
⎤ ⎢<br />
⎢−<br />
−<br />
⎥<br />
00204 . ⎥<br />
4 2 0 2 4 0 ⎢ ⎥<br />
⎢<br />
⎥<br />
= ⎢ 6 0 −2 0 6 −2<br />
⎥ ×<br />
⎢02492<br />
. ⎥<br />
=<br />
⎢<br />
⎢−4 2 0 −2 4 0 ⎥<br />
00204 . ⎥<br />
⎢ ⎥<br />
⎢<br />
⎥<br />
⎣⎢<br />
1 −1 1 −1 1 1<br />
⎢01716<br />
. ⎥<br />
⎦⎥<br />
⎣<br />
⎢03431<br />
. ⎦<br />
⎥<br />
⎡0.<br />
97 63⎤<br />
⎢<br />
0<br />
⎥<br />
⎢ ⎥<br />
= ⎢0.<br />
87 46⎥<br />
⎢0<br />
⎥<br />
⎢ ⎥<br />
⎣⎢<br />
0.<br />
89 46⎦⎥<br />
(53)<br />
The whole system transfer function in z of<br />
the b<strong>and</strong>pass filter is given in (54) <strong>and</strong> the<br />
corresponding magnitude <strong>and</strong> phase frequency<br />
responses are shown in Figure 3.<br />
H( z) = H ( z) × H ( z ) =<br />
1 2<br />
−<br />
0. 123 −0.<br />
123z<br />
=<br />
11 . 781 + 0.<br />
4787z<br />
2<br />
−2<br />
−2 −4<br />
×<br />
0. 976+ 0. 7936z<br />
+ 0.<br />
976z<br />
−2<br />
−<br />
0. 9763+ 0. 8746z + 0.<br />
8946z 4<br />
×<br />
(54)<br />
⎡0.<br />
976 ⎤<br />
⎢0<br />
⎥<br />
⎢ ⎥<br />
= ⎢0.<br />
7936⎥<br />
⎢0<br />
⎥<br />
⎢ ⎥<br />
⎣⎢<br />
0.<br />
976<br />
⎦⎥<br />
(52)<br />
⎡b<br />
⎢b<br />
⎢<br />
⎢b<br />
⎢b<br />
⎢<br />
⎣⎢<br />
b<br />
0<br />
1<br />
2<br />
3<br />
4<br />
⎡B2<br />
c ⎤<br />
⎤ ⎡ 1 1 1 1 1 1 ⎤ ⎢<br />
⎥ ⎢<br />
−4 −2 0 2 4 0<br />
⎥<br />
B1<br />
c<br />
⎥<br />
⎢ ⎥<br />
⎥ ⎢<br />
⎥ ⎢B0<br />
⎥<br />
⎥ = ⎢ 6 0 −2 0 6 −2<br />
⎥ × ⎢<br />
⎥ ⎢<br />
1<br />
−4 2 0 −2 4 0 ⎥<br />
B k<br />
⎥=<br />
⎢ ⎥<br />
2<br />
⎥<br />
⎢B2<br />
k ⎥<br />
⎦⎥<br />
⎣⎢<br />
1 −1 1 −1 1 1 ⎦⎥<br />
⎢<br />
⎣2<br />
B 2<br />
ck<br />
⎥<br />
⎦<br />
2<br />
208 INGENIERIA Investigación y Tecnología FI-UNAM
B. P enika, F. García-Ugalde <strong>and</strong> V.F. Ruiz<br />
Figure 3. Magni tude <strong>and</strong> phase frequency responses of the Cauer b<strong>and</strong>pass filter.<br />
Conclu sions<br />
The Pascal matrix is very useful in the context<br />
of the design of digital filters. Transformations<br />
can easily be done from the analog<br />
prototype lowpass transfer function H(s) to<br />
the discrete transfer function H(z) to obtain<br />
one of the main three types of digital filters:<br />
lowpass, highpass <strong>and</strong> b<strong>and</strong>pass. The inverse<br />
transformation from discrete to analog is<br />
very easy to achieve as well because we do<br />
not need to compute the determinant of the<br />
system. In this paper we have summarized all<br />
types of direct transformations <strong>and</strong> illustrate<br />
their use with several numerical examples.<br />
An alternative representation of the original<br />
b<strong>and</strong>pass Pascal matrix has been presented<br />
for the systematic computation of the b<strong>and</strong>pass<br />
Pascal matrix.<br />
Acknowl edge ments<br />
This research was supported by CONACyT<br />
México, project 41069-Y <strong>and</strong> DGAPA-UNAM,<br />
project IN101305.<br />
Refer ences<br />
Antoniou A. (1993). Digital Filters: Analysis,<br />
Design, <strong>and</strong> Appli ca tions. McGraw-<br />
Hill, New York, USA.<br />
Biolkova V. <strong>and</strong> Biolek D. (1999). Generalized<br />
Pascal Matrix of First Order s-z.<br />
Trans forms. ICECS, Pafos, Cyprus, Vol.<br />
2, pp. 929-931, September.<br />
Bose N.K. (1985). Digital Filters Theory <strong>and</strong><br />
Appli ca tions. Elsevier Science Publishing<br />
Co., Inc., Amsterdam, The<br />
Neth er l<strong>and</strong>s.<br />
Klein W. (1976). Finite Systemtheorie. B.G.<br />
Teubner Studienbücher, Stuttgart.<br />
Konopacki J. (2005). The frequency Trans -<br />
for ma tion by Matrix Oper a tion ans its<br />
Appli ca tion in iir Filters Design. IEEE<br />
Signal Processing Letters, Vol. 12, No. 1,<br />
pp. 5-8, January.<br />
Parks T.W. <strong>and</strong> Burrus C. (1987). Digital<br />
Filter Design. John Willey <strong>and</strong> Sons,<br />
Inc., New York, USA.<br />
Pham Khac di <strong>and</strong> P enika B. (1985).<br />
Transfer Func tion Compu ta tion Using<br />
Pascal Matrix. Elec tronic Horizon–<br />
Praha, Vol 46-7, pp. 348-350.<br />
P enika B. <strong>and</strong> García-Ugalde F. (2004).<br />
Z-transform from Lowpass to<br />
B<strong>and</strong>pass by Pascal Matrix. IEEE Signal<br />
Processing Letters, Vol. 11, No. 2, pp.<br />
282-284, February.<br />
P enika B., García-Ugalde F. <strong>and</strong><br />
Herrera-Camacho A. (2002). Z-transfromation<br />
from Lowpass to Lowpass <strong>and</strong><br />
Highpass Transfer Func tion. IEEE Signal<br />
Vol.VIII No.3 -julio-septiembre- 2007 209
Prac tical Design of Digital Filters Using the Pascal Matrix<br />
Processing Letters , Vol. 9, No. 11, pp.<br />
368-370, November.<br />
Rabiner R. <strong>and</strong> Gold B. (1975). Theory <strong>and</strong><br />
Appli ca tions of Digital Signal Processing.<br />
Prentice-Hall, New Jersey, USA.<br />
Suggesting Biography<br />
Bellanger M. (2000). Digital Processing of<br />
Signals, Theory <strong>and</strong> Prac tice. John<br />
Willey <strong>and</strong> Sons, Inc., Chichester, UK.<br />
Manolakis D.G. <strong>and</strong> Proakis J.G. (1996).<br />
Digital Signal Processing: Prin ci ples,<br />
Algo rithms, <strong>and</strong> Appli ca tions. Prentice-<br />
Hall, New Jersey, USA.<br />
Mitra S.K. <strong>and</strong> Kaiser J.F. (1993). H<strong>and</strong> -<br />
book of Digital Signal Processing. John<br />
Willey <strong>and</strong> Sons, Inc., New York, USA.<br />
Oppenheim A.V. <strong>and</strong> Schafer R.W. (1975).<br />
Digital Signal Processing. Prentice-Hall,<br />
New Jersey, USA.<br />
Porat B. (2000). A Course in Digital Signal<br />
Processing. John Willey <strong>and</strong> Sons, Inc.,<br />
New York, USA.<br />
Rorabaugh C.B. (1993). Digital Filter<br />
Designer’s H<strong>and</strong> book. McGraw-Hill,<br />
New York, USA.<br />
Semblanza de los autores<br />
Bohumil Pšenicka. Was born in Prague on April 15, 1933. He received the B.S. degree from Czech Tech nical Univer sity,<br />
Prague, in 1962, <strong>and</strong> the M.S. <strong>and</strong> Ph.D. degrees from Czech Tech nical Univer sity, Prague, in 1967 <strong>and</strong> 1972<br />
respec tively. In 1993 he joined the Universidad Nacional Autónoma de México, Facultad de Ingeniería, where he<br />
is currently a full-time professor in the Depart ment of Tele com mu ni ca tion Engi neering. His research inter ests are<br />
Digital Signal Processing, Analog <strong>and</strong> Digital Filter Theory, <strong>and</strong> Appli ca tions of Micro pro ces sors in<br />
Tele com mu ni ca tions.<br />
Fran cisco García-Ugalde. Obtained his Bach elor in 1977 in Commu ni ca tions, Elec tronics <strong>and</strong> Control Engi neering<br />
from Universidad Nacional Autónoma de México. His Diplôme d’Ingénieur in 1980 from SUPELEC France,<br />
<strong>and</strong> his PhD in 1982 in Infor ma tion Processing from Université de Rennes I, France. Since 1983 is a full-time<br />
professor at UNAM (Universidad Nacional Autónoma de México), Facultad de Ingeniería. He’s spent a sabbat -<br />
ical year at IRISA, France, in 1990, a second sabbat ical in 1996 at the HITLab in Univer sity of Wash ington, USA,<br />
<strong>and</strong> a third sabbat ical in 2003 in the depart ment of Cyber netics in Reading Univer sity, UK. His current interest<br />
fields are: Digital filter design tools, Anal ysis <strong>and</strong> design of digital filters, Image <strong>and</strong> video c oding, Image anal -<br />
ysis, Theory <strong>and</strong> appli ca tions of error control coding, Joint source-channel coding, Turbo coding, Appli ca tions<br />
of cryp tog raphy, Computer archi tec tures <strong>and</strong> Parallel processing.<br />
Virginie F. Ruiz. MIEEE, MIEE, received her BSc, MSc <strong>and</strong> PhD in signal processing from the Univer sity of Rouen,<br />
France. She has the honour of being a recip ient of the French Foreign Office, Lavoisier programme. Her<br />
research focuses on the theory <strong>and</strong> appli ca tion of nonlinear filtering for esti ma tion, detec tion, predic tion,<br />
anal ysis, recog ni tion. She is concerned with the devel op ment of funda mental prin ci ples of finding new ways<br />
of describing <strong>and</strong> processing signals to tackle the more general <strong>and</strong> chal lenging non-linear, non-Gaussian,<br />
non-stationary prob lems. She has a long track record in the appli ca tion of signal processing methods to<br />
medical signal <strong>and</strong> image processing, bioen gi neering, commu ni ca tions, synthetic aper ture radar, <strong>and</strong> mobile<br />
robotics. She has been with the Depart ment of Cyber netics at Univer sity of Reading since 1998. She is a senior<br />
lecturer in signal processing <strong>and</strong> chair of the Instru men ta tion <strong>and</strong> Signal Processing research group. Deputy<br />
Head of Cyber netics she is the Programme Director for several under grad uate programmes <strong>and</strong> is currently<br />
involved in a number of inter na tional research projects <strong>and</strong> indus trial projects. She is a member of many tech -<br />
nical programme commit tees for inter na tional confer ences <strong>and</strong> serves as reviewer for a number of Inter na -<br />
tional Jour nals.<br />
210 INGENIERIA Investigación y Tecnología FI-UNAM