13.07.2015 Views

Uso do Método MDL para Filtragem de Ruído Instrumental ... - PPGQ

Uso do Método MDL para Filtragem de Ruído Instrumental ... - PPGQ

Uso do Método MDL para Filtragem de Ruído Instrumental ... - PPGQ

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Gledson Emidio José<strong>Uso</strong> <strong>do</strong> méto<strong>do</strong> <strong>MDL</strong> <strong>para</strong> filtragem <strong>de</strong> ruí<strong>do</strong> instrumentalempregan<strong>do</strong> a Transformada WaveletDissertação apresentada ao programa<strong>de</strong> Pós-Graduação em Química, daUniversida<strong>de</strong> Fe<strong>de</strong>ral da Paraíba, comoparte <strong>do</strong>s requisitos à obtenção <strong>do</strong>título <strong>de</strong> mestre em Química, área <strong>de</strong>concentração em Química Analítica.Orienta<strong>do</strong>r: Prof. Dr. Mário César Ugulino <strong>de</strong> AraújoCo-orienta<strong>do</strong>r: Prof. Dr. Roberto Kawakami Harrop GalvãoJOÃO PESSOA, março <strong>de</strong> 2008


Para meu pai e minha mãe,EMIDIO e CIRLEI


Agra<strong>de</strong>cimentosAo Conselho Nacional <strong>de</strong> Desenvolvimento Científico e Tecnológico, CNPq,pela bolsa <strong>de</strong> estu<strong>do</strong>s concedida;À Universida<strong>de</strong> Fe<strong>de</strong>ral da Paraíba, pelo apoio institucional;À Coor<strong>de</strong>nação <strong>de</strong> Aperfeiçoamento <strong>de</strong> Pessoal <strong>de</strong> Nível Superior, CAPES,através <strong>do</strong> Programa Nacional <strong>de</strong> Cooperação Acadêmica, PROCAD 0081/05-1,pelo auxílio financeiro durante a missão <strong>de</strong> estu<strong>do</strong>;Ao professor Mário César Ugulino <strong>de</strong> Araújo, pela orientação e confiança nosúltimos quatro anos <strong>de</strong> pesquisa;Ao professor Roberto Kawakami Harrop Galvão, pela orientação e acolhimentocordial e atencioso em todas as minhas visitas ao Instituto Tecnológico daAeronáutica;Aos amigos Francisco Gambarra, Márcio Coelho e Sófacles Carreiro, pelasvalorosas discussões quimiométricas e pelo companheirismo;Ao professor Wallace Fragoso, pelos conselhos e conversas sobre Quimiometria;Ao professor Célio Pasquini, pelo acolhimento no Grupo <strong>de</strong> Instrumentação eAutomação (GIA-UNICAMP);À Simone Simões, pela obtenção <strong>do</strong>s espectros <strong>de</strong> Capropril;À Heroni<strong>de</strong>s A<strong>do</strong>nias, pela cessão <strong>do</strong>s espectros <strong>de</strong> óleo diesel;Ao Núcleo Multi-usuário <strong>de</strong> Caracterização <strong>de</strong> Análise da UFPB, NUCAL, pelasanálises em RMN, e à Josean Fechine, pela cessão da amostra <strong>de</strong> extrato vegetal;À Juliana Cortez, pela estada em Campinas durante uma das missões <strong>de</strong> estu<strong>do</strong>;


Aos amigos e familiares que me apoiaram nessa lida;À to<strong>do</strong>s que me ajudaram direta ou indiretamente nesse processo;À Fabiane, por tu<strong>do</strong>.


SumárioLISTA DE FIGURAS................................................................................................................xLISTA DE TABELAS.............................................................................................................xivLISTA DE ABREVIATURAS E SIGLAS...............................................................................xviRESUMO..............................................................................................................................xviiABSTRACT.........................................................................................................................xviii1 INTRODUÇÃO ......................................................................................................... 21.1 Objetivos ................................................................................................................... 52 FUNDAMENTAÇÃO TEÓRICA ............................................................................... 62.1 A Transformada <strong>de</strong> Fourier ...................................................................................... 72.2 A Transformada Wavelet .......................................................................................... 82.3 Remoção <strong>de</strong> ruí<strong>do</strong> por Transformada Wavelet .................................................... 122.3.1 Escolha da função wavelet ............................................................................ 152.3.1.1 Escolha baseada na literatura ........................................................... 182.3.1.2 Escolha por inspeção visual <strong>do</strong>s resulta<strong>do</strong>s ................................... 182.3.1.3 Escolha pela forma da função wavelet ............................................. 182.3.1.4 Escolha pelo <strong>MDL</strong> ............................................................................... 182.3.2 Limiar ............................................................................................................... 192.3.2.1 Limiar Universal .................................................................................. 192.3.2.2 Limiar por variância ............................................................................ 202.3.2.3 Limiar <strong>MDL</strong> .......................................................................................... 202.3.3 Escolha da função <strong>de</strong> limiarização ................................................................ 213 EXPERIMENTAL ................................................................................................... 243.1 Técnicas .................................................................................................................. 24


3.2 Experimentos .......................................................................................................... 253.2.1 Experimento 1 – Da<strong>do</strong>s simula<strong>do</strong>s ................................................................ 263.2.2 Experimento 2 – Captopril em comprimi<strong>do</strong>s / Espectrometria NIRR ......... 263.2.3 Experimento 3 – Dipirona sódica em pó / Espectrometria NIRR ................ 273.2.4 Experimento 4 – Óleo Diesel Combustível / Espectometria NIR ................ 283.2.5 Experimento 5 – Extrato vegetal / Espectrometria 1 H RMN ........................ 293.3 Programas e Pacotes Computacionais ................................................................ 304 RESULTADOS E DISCUSSÕES ........................................................................... 334.1 Experimento 1 – Sinais simula<strong>do</strong>s ........................................................................ 344.1.1 Ruí<strong>do</strong> com <strong>de</strong>svio-padrão <strong>de</strong> 0,01 ................................................................. 354.1.2 Ruí<strong>do</strong> com <strong>de</strong>svio-padrão <strong>de</strong> 0,3 ................................................................... 404.1.3 Ruí<strong>do</strong> com <strong>de</strong>svio-padrão <strong>de</strong> 1,0 ................................................................... 444.1.4 Análise <strong>do</strong>s diferentes níveis <strong>de</strong> ruí<strong>do</strong> ......................................................... 474.2 Experimento 2 – Captopril / Espectrometria NIRR .............................................. 494.3 Experimento 3 – Dipirona Sódica / Espectrometria NIRR ................................... 574.4 Experimento 4 – Óleo Diesel / Espectrometria NIR ............................................. 624.5 Experimento 5 – Extrato vegetal / 1 H RMN ........................................................... 674.6 Estu<strong>do</strong> <strong>do</strong>s resulta<strong>do</strong>s obti<strong>do</strong>s nos Experimentos 1-5 ....................................... 714.6.1 Escolha da Wavelet ......................................................................................... 724.6.2 Limiar e função <strong>de</strong> limiarização ..................................................................... 734.6.3 Espectros obti<strong>do</strong>s com poucas varreduras ................................................. 745 CONCLUSÕES ...................................................................................................... 775.1 Propostas futuras ................................................................................................... 78REFERÊNCIAS BIBLIOGRÁFICAS ......................................................................... 80APÊNDICE A ............................................................................................................ 86APÊNDICE B ............................................................................................................ 86APÊNDICE C ............................................................................................................ 93


Lista <strong>de</strong> figurasFigura 2.1 Esquema gráfico mostran<strong>do</strong> o funcionamento da translação eescalamento da função wavelet Symlet 8. .................................................................. 9Figura 2.2 Esquema da <strong>de</strong>composição <strong>de</strong> um sinal pelos filtros passa-baixa epassa-alta. ................................................................................................................. 10Figura 2.3 Esquema <strong>de</strong> um banco <strong>de</strong> filtros wavelet <strong>para</strong> <strong>do</strong>is níveis <strong>de</strong><strong>de</strong>composição. .......................................................................................................... 11Figura 2.4 Esquema <strong>de</strong> um banco <strong>de</strong> filtros wavelet <strong>para</strong> três níveis <strong>de</strong><strong>de</strong>composição, mostran<strong>do</strong> os coeficientes em cada etapa. ...................................... 11Figura 2.5 Esquema geral <strong>do</strong> Filtro <strong>de</strong> Quadratura Espelhada, on<strong>de</strong> é mostra<strong>do</strong> oprocesso <strong>de</strong> <strong>de</strong>composição e reconstrução <strong>do</strong> sinal. ................................................ 12Figura 2.6 Forma <strong>de</strong> algumas funções escala (phi) e wavelet (psi) e da famíliaDaubechies. .............................................................................................................. 16Figura 2.7 Forma <strong>de</strong> algumas funções wavelet (psi) e escala (phi) da família Coiflet................................................................................................................................... 16Figura 2.8 Forma <strong>de</strong> algumas funções wavelet (psi) e escala (phi) da família Symlet................................................................................................................................... 17Figura 2.9. Valor <strong>do</strong> coeficiente antes da limiarização e valor <strong>do</strong> coeficiente após alimiarização Suave e Rígida. ..................................................................................... 22Figura 3.1 (a) equipamento ABB-BOMEM; (b) suporte <strong>para</strong> análises <strong>de</strong> sóli<strong>do</strong>s ...... 27


Figura 3.2 Espectrômetro com Transformada <strong>de</strong> Fourier Perkin Elmer Spectrum GX................................................................................................................................... 28Figura 3.3 Espectrômetro FT-NIR BOMEM usa<strong>do</strong> <strong>para</strong> as análises <strong>de</strong> óleo diesel. . 29Figura 3.4 (a) Espectrômetro Bruker DRX-200 utiliza<strong>do</strong> <strong>para</strong> as análises <strong>de</strong> 1 H RMN;(b) Detalhe <strong>do</strong> compartimento <strong>de</strong> inserção da amostra. ............................................ 30Figura 4.1 Sinal sintético livre <strong>de</strong> ruí<strong>do</strong> e os sinais gera<strong>do</strong>s pela adição <strong>de</strong> ruí<strong>do</strong> emtrês níveis <strong>de</strong> <strong>de</strong>svio-padrão. .................................................................................... 34Figura 4.2 Sinais reconstruí<strong>do</strong>s pela TW usan<strong>do</strong> as técnicas <strong>MDL</strong>, Rígi<strong>do</strong> e Suave,sinal <strong>de</strong> referência e sinal rui<strong>do</strong>so (SD=0,01)............................................................ 35Figura 4.3 Curva <strong>do</strong> RMSE médio x função wavelet <strong>para</strong> as três técnicas <strong>de</strong>remoção <strong>de</strong> ruí<strong>do</strong> por TW em um total <strong>de</strong> cem sinais gera<strong>do</strong>s com ruí<strong>do</strong> (SD=0,01)................................................................................................................................... 36Figura 4.4 Gráfico <strong>de</strong> barras apresentan<strong>do</strong> a posição da wavelet selecionada pelo<strong>MDL</strong> <strong>para</strong> cada um <strong>do</strong>s cem sinais gera<strong>do</strong>s, com relação ao RMSE obti<strong>do</strong>. ............ 37Figura 4.5 Curva <strong>do</strong> RMSE x função wavelet <strong>para</strong> a técnica <strong>MDL</strong> <strong>do</strong>s sinais número5 e 17. ....................................................................................................................... 37Figura 4.6 Freqüência <strong>de</strong> seleção da mesma função wavelet pelo <strong>MDL</strong> nos cemsinais sintéticos. ........................................................................................................ 38Figura 4.7 Gráfico <strong>de</strong> barras com o número <strong>de</strong> coeficientes seleciona<strong>do</strong>s pelo limiaruniversal (barras cinza) e <strong>MDL</strong> (barras pretas) através das 22 wavelets <strong>para</strong> (a) oespectro 5 e (b) o espectro 17.. ................................................................................. 39Figura 4.8 De cima <strong>para</strong> baixo, sinais reconstruí<strong>do</strong>s pelas técnicas <strong>MDL</strong>, Rígi<strong>do</strong> eSuave, sinal <strong>de</strong> referência e sinal rui<strong>do</strong>so (SD=0,3). ................................................ 40


Figura 4.9 Curva <strong>do</strong> RMSE médio x função wavelet <strong>para</strong> as três técnicas <strong>de</strong>remoção <strong>de</strong> ruí<strong>do</strong> por Transformada wavelet em um total <strong>de</strong> cem sinais gera<strong>do</strong>s comruí<strong>do</strong> (SD=0,3)........................................................................................................... 41Figura 4.10 Gráfico <strong>de</strong> barras apresentan<strong>do</strong> a posição da wavelet selecionada pelo<strong>MDL</strong> <strong>para</strong> cada um <strong>do</strong>s cem sinais gera<strong>do</strong>s, com relação ao RMSE obti<strong>do</strong>. ............ 41Figura 4.11 Curva <strong>do</strong> RMSE x função wavelet <strong>para</strong> a técnica <strong>MDL</strong> <strong>do</strong>s sinais número6 e 60. ....................................................................................................................... 42Figura 4.12 Freqüência <strong>de</strong> seleção da mesma função wavelet pelo <strong>MDL</strong> nos cemsinais sintéticos. ........................................................................................................ 42Figura 4.13 Curva <strong>do</strong> RMSE x função wavelet da técnica <strong>MDL</strong> <strong>para</strong> os sinais número6 e 60. ....................................................................................................................... 43Figura 4.14 Sinais reconstruí<strong>do</strong>s pelas técnicas <strong>MDL</strong>, Rígi<strong>do</strong> e Suave, sinal <strong>de</strong>referência e sinal rui<strong>do</strong>so (SD=1,0)........................................................................... 44Figura 4.15 Curva <strong>do</strong> RMSE médio x função wavelet <strong>para</strong> as três técnicas <strong>de</strong>remoção <strong>de</strong> ruí<strong>do</strong> por Transformada wavelet em um total <strong>de</strong> cem sinais gera<strong>do</strong>s comruí<strong>do</strong> (SD=1,0)........................................................................................................... 45Figura 4.16 Gráfico <strong>de</strong> barras apresentan<strong>do</strong> a posição da wavelet selecionada pelo<strong>MDL</strong> <strong>para</strong> cada um <strong>do</strong>s cem sinais gera<strong>do</strong>s, com relação ao RMSE obti<strong>do</strong>. ............ 45Figura 4.17 Curva <strong>do</strong> RMSE x função wavelet <strong>para</strong> a técnica <strong>MDL</strong> <strong>do</strong>s sinais número11 e 20. ..................................................................................................................... 46Figura 4.18 Freqüência <strong>de</strong> seleção da mesma função wavelet pelo <strong>MDL</strong> nos cemsinais sintéticos. ........................................................................................................ 46Figura 4.19 Curva <strong>do</strong> RMSE x função wavelet da técnica <strong>MDL</strong> <strong>para</strong> os sinais número11 e 20. A wavelet escolhida é marcada por um triângulo. ....................................... 47


Figura 4.20 Espectro <strong>de</strong> refletância <strong>de</strong> um comprimi<strong>do</strong> <strong>do</strong> princípio-ativo captopril naregião <strong>de</strong> 3.999-10.000 cm -1 . .................................................................................... 49Figura 4.21 Coeficientes <strong>de</strong> <strong>de</strong>talhe <strong>do</strong> primeiro nível <strong>de</strong> <strong>de</strong>composição <strong>para</strong> oespectro <strong>de</strong> captopril. ................................................................................................ 50Figura 4.22 Espectro <strong>de</strong> referência (100 varreduras) e espectro rui<strong>do</strong>so (1 varredura)<strong>de</strong> um comprimi<strong>do</strong> <strong>do</strong> princípio-ativo captopril na região <strong>de</strong> 4.610-8.928 cm -1 . ........ 51Figura 4.23 Cento e um espectros sobrepostos <strong>de</strong> um comprimi<strong>do</strong> <strong>do</strong> princípio-ativocaptopril na região <strong>de</strong> 4610-8928 cm -1 . (a) antes e (b) <strong>de</strong>pois da correção da linha <strong>de</strong>base por EMSC. Em <strong>de</strong>talhe, corte amplia<strong>do</strong> da região entre 5300-5700 cm -1 ......... 51Figura 4.24 Sinais reconstruí<strong>do</strong>s pelas técnicas <strong>MDL</strong>, Rígi<strong>do</strong> e Suave, sinal <strong>de</strong>referência e sinal rui<strong>do</strong>so <strong>para</strong> a mesma amostra <strong>de</strong> captopril. ................................ 52Figura 4.25 Com<strong>para</strong>ção <strong>do</strong> número <strong>de</strong> coeficientes wavelet escolhi<strong>do</strong>s através das22 wavelets <strong>para</strong> os espectros 5 e 47, respectivamente, usan<strong>do</strong>-se o limiar universal(barras cinza) e o limiar <strong>MDL</strong> (barras azuis). ............................................................. 56Figura 4.26 Gráfico <strong>de</strong> barras apresentan<strong>do</strong> a extensão da seleção <strong>do</strong> filtro waveletpelos nos espectros individuais. ................................................................................ 57Figura 4.27 Espectro <strong>de</strong> referência e um espectro <strong>de</strong> varredura unitária <strong>de</strong> umaamostra <strong>do</strong> princípio-ativo dipirona sódica, (a) antes e (b) <strong>de</strong>pois da correção dalinha <strong>de</strong> base pelo EMSC. ......................................................................................... 58Figura 4.28 Sinais reconstruí<strong>do</strong>s pelas técnicas <strong>MDL</strong>, Rígi<strong>do</strong> e Suave, sinal <strong>de</strong>referência e sinal rui<strong>do</strong>so <strong>para</strong> a mesma amostra <strong>do</strong> princípio-ativo dipirona sódica................................................................................................................................... 59Figura 4.29 De cima <strong>para</strong> baixo, sinais reconstruí<strong>do</strong>s pelas técnicas <strong>MDL</strong>, Rígi<strong>do</strong> eSuave, sinal <strong>de</strong> referência e sinal rui<strong>do</strong>so <strong>para</strong> a mesma amostra <strong>do</strong> princípio-ativodipirona. .................................................................................................................... 60


Figura 4.30 Curva <strong>do</strong> RMSE médio x função wavelet <strong>para</strong> as três técnicas <strong>de</strong>remoção <strong>de</strong> ruí<strong>do</strong> por Transformada wavelet <strong>para</strong> os espectros <strong>de</strong> dipirona sódica. 61Figura 4.31 Espectro bruto, espectro <strong>de</strong> referência e os espectros reconstruí<strong>do</strong>sapós remoção <strong>de</strong> ruí<strong>do</strong> pelas técnicas em estu<strong>do</strong>.. .................................................. 63Figura 4.32 Corte realiza<strong>do</strong> na região <strong>do</strong> short-NIR, <strong>do</strong> espectro bruto, espectro <strong>de</strong>referência e <strong>do</strong>s espectros reconstruí<strong>do</strong>s após remoção <strong>de</strong> ruí<strong>do</strong>. ........................... 63Figura 4.33 Curva <strong>do</strong> RMSE médio x função wavelet <strong>para</strong> as quatro técnicas <strong>de</strong>remoção <strong>de</strong> ruí<strong>do</strong> por Transformada Wavelet <strong>para</strong> os espectros <strong>de</strong> óleo diesel. ...... 64Figura 4.34 Curvas <strong>do</strong> número <strong>de</strong> coeficientes seleciona<strong>do</strong>s pelas quatro técnicas <strong>de</strong>remoção <strong>de</strong> ruí<strong>do</strong>, <strong>para</strong> as 22 funções wavelet. ........................................................ 66Figura 4.35 Espectro <strong>de</strong> 1 H RMN obti<strong>do</strong> pela promediação <strong>de</strong> (cima) 1024varreduras, e (baixo) 16 varreduras. ......................................................................... 67Figura 4.36 Espectros <strong>de</strong> 1 H RMN reconstruí<strong>do</strong>s pela TW através das técnicas <strong>MDL</strong>,Rígida e Suave, e os espectros obti<strong>do</strong>s pela promediação <strong>de</strong> (cima) 1024varreduras, e (baixo) 16 varreduras. ......................................................................... 68Figura 4.37 Corte nos espectros <strong>de</strong> 1 H RMN reconstruí<strong>do</strong>s pelas técnicas <strong>MDL</strong>(vermelho), Rígida (ver<strong>de</strong>) e Suave (azul)................................................................. 69Figura 4.38 Corte nos espectros <strong>de</strong> captopril, reconstruí<strong>do</strong>s pela técnica Suaveusan<strong>do</strong>-se as wavelets Daubechies 1-3 e 9-10. ........................................................ 72


Lista <strong>de</strong> tabelasTabela 1. Valores <strong>de</strong> RMSE médios obti<strong>do</strong>s com 1 varredura e 7 níveis <strong>de</strong><strong>de</strong>composição no banco <strong>de</strong> filtros. ............................................................................ 53Tabela 2. Com<strong>para</strong>ção entre as técnicas <strong>para</strong> o melhor (espectro 47) e o pior(espectro 5) resulta<strong>do</strong> na seleção da função wavelet pelo critério <strong>MDL</strong>. .................. 54Tabela 3. Valores <strong>de</strong> RMSE, obti<strong>do</strong>s pelas quatro técnicas frente aos vinte e <strong>do</strong>isfiltros wavelet, entre o espectro <strong>de</strong> referência e o obti<strong>do</strong> pela promediação <strong>de</strong> 16varreduras.. ............................................................................................................... 65Tabela 4. Com<strong>para</strong>ção entre as técnicas <strong>para</strong> o melhor e o pior resulta<strong>do</strong> na seleçãoda função wavelet. ... ................................................................................................ 70


Lista <strong>de</strong> abreviaturas e siglasa Variável <strong>de</strong> escalamentob Variável <strong>de</strong> translaçãoc Coeficientes <strong>de</strong> aproximaçãoCoif CoifletCDCL 3 Clorofórmio <strong>de</strong>utera<strong>do</strong>CLAE-DAD Cromatografia Líquida <strong>de</strong> Alta Eficiência- Detecção <strong>de</strong> Arranjo <strong>de</strong> dio<strong>do</strong>d Coeficientes <strong>de</strong> <strong>de</strong>talheDb DaubechiesDTGS Sulfato <strong>de</strong> Triglicina DeuteradaEMSC Correção <strong>de</strong> Sinal Multiplicativo EstendidaFT-NIR Transformada <strong>de</strong> Fourier – Infravermelho PróximoFT Transformada <strong>de</strong> FourierH Filtro passa-baixaInGaAs Arseneto <strong>de</strong> Gálio e ÍndioKBr Brometo <strong>de</strong> PotássioL Filtro passa-altaLIBS Espectrometria por Emissão com Plasma Induzi<strong>do</strong> por Laser<strong>MDL</strong> Comprimento Mínimo <strong>de</strong> DescriçãoMRA Análise Multi-resolucionalNIR Infravermelho PróximoNIRR Refletância Difusa no Infravermelho PróximoPAT Tecnologia Analitica <strong>de</strong> ProcessosQMF Filtros <strong>de</strong> Quadratura EspelhadaRMN Ressonância Magnética NuclearSD Desvio-padrãoSNR Relação sinal-ruí<strong>do</strong>Sym SymletTFJ Transformada <strong>de</strong> Fourier JaneladaTW Transformada WaveletTWC Transformada Wavelet Contínua


TWD Transformada Wavelet DiscretaTWI Transformada Wavelet InversaWT Wavelet Transform


ResumoExistem várias técnicas que visam à melhora da relação sinal-ruí<strong>do</strong> em sinaisespectrométricos. Uma das mais populares consiste na realização <strong>de</strong> medidasrepetidas e subseqüente promediação das varreduras individuais, o que,<strong>de</strong>pen<strong>de</strong>n<strong>do</strong> da aplicação, po<strong>de</strong> <strong>de</strong>mandar muito tempo, além <strong>de</strong> promover<strong>de</strong>slocamentos na intensida<strong>de</strong> e no eixo <strong>de</strong> comprimento ou número <strong>de</strong> onda. Umaalternativa é a remoção <strong>de</strong> ruí<strong>do</strong> usan<strong>do</strong> técnicas <strong>de</strong> processamento <strong>de</strong> sinaisbaseadas na Transformada Wavelet (TW). Nesta dissertação, três técnicas <strong>de</strong>remoção <strong>de</strong> ruí<strong>do</strong> por TW, a saber, Suave (limiarização Suave e limiar universal),Rígida (limiarização Rígida e limiar universal) e <strong>MDL</strong> (limiarização Rígida e limiar<strong>MDL</strong>) foram com<strong>para</strong>das em relação à qualida<strong>de</strong> <strong>do</strong>s seus espectros reconstruí<strong>do</strong>se a capacida<strong>de</strong> <strong>de</strong> compressão <strong>de</strong> da<strong>do</strong>s. Além <strong>de</strong> sinais simula<strong>do</strong>s, foram utiliza<strong>do</strong>sespectros <strong>de</strong> Ressonância Magnética Nuclear e Espectrometria NIR, obti<strong>do</strong>s por umnúmero pequeno <strong>de</strong> varreduras. Entre essas técnicas, o Comprimento Mínimo <strong>de</strong>Descrição (<strong>MDL</strong>, <strong>do</strong> inglês: Minimum Description Length) tem a vantagem <strong>de</strong>selecionar automaticamente tanto o tipo <strong>do</strong> filtro quanto o limiar. Assim, osresulta<strong>do</strong>s obti<strong>do</strong>s pelo <strong>MDL</strong> em relação à seleção da função wavelet também foramavalia<strong>do</strong>s. Varreduras individuais foram utilizadas a fim <strong>de</strong> estudar o comportamentodas diferentes técnicas frente à ação <strong>de</strong> ruí<strong>do</strong> instrumental real. Os resulta<strong>do</strong>smostraram que o méto<strong>do</strong> <strong>MDL</strong> po<strong>de</strong> ser uma boa alternativa como méto<strong>do</strong> <strong>de</strong>remoção <strong>de</strong> ruí<strong>do</strong> instrumental em da<strong>do</strong>s espectrométricos, proven<strong>do</strong> espectrospouco rui<strong>do</strong>sos, além das vantagens quanto à parcimônia e seleção automática dafunção wavelet e <strong>do</strong> limiar, permitin<strong>do</strong> uma análise sem inferências subjetivas porparte <strong>do</strong> usuário. O procedimento <strong>MDL</strong> aplica<strong>do</strong> a espectros promedia<strong>do</strong>s por umnúmero pequeno <strong>de</strong> varreduras mostrou ser útil em Ressonância Magnética Nuclear,on<strong>de</strong> um consi<strong>de</strong>rável número <strong>de</strong> varreduras <strong>de</strong>ve ser adquiri<strong>do</strong> <strong>para</strong> obter umaa<strong>de</strong>quada relação sinal-ruí<strong>do</strong>, e na Espectrometria NIR como ferramenta emTecnologia <strong>de</strong> Processos Analíticos (PAT), on<strong>de</strong> a rapi<strong>de</strong>z <strong>de</strong> medidas éimprescindível.Palavras-chave: Remoção <strong>de</strong> ruí<strong>do</strong>, Transformada Wavelet, <strong>MDL</strong>, EspectrometriaNIR, Espectrometria <strong>de</strong> RMN, varreduras individuais.


AbstractThere are several approaches that seek to improve the signal-to-noise ratio(SNR) in spectroscopic signals, with the most popular consisting of carrying outrepeated measurements and coaveraging the individual scans. However, suchprocess is time-consuming and may promote drifts in the intensity and wavelengthaxes. An alternative consists of using signal processing techniques for noisereduction, such as the Wavelet Transform (WT). Among the <strong>de</strong>noising techniquesbased on the WT, the <strong>MDL</strong> (Minimum Description Length) method selects both thefilter type and threshold in an automatic manner. The Hard, Soft and <strong>MDL</strong> techniquesare compared in terms of <strong>de</strong>noising and compression, and the <strong>MDL</strong> results areevaluated with regard to filter selection issues. This dissertation presents aninvestigation of wavelet <strong>de</strong>noising procedures for NIR and RMN spectra. In particular,coaveraged spectra are employed in or<strong>de</strong>r to study the effect of actual instrumentalnoise, rather than simulated noise. A simulated example with Gaussian noise in threelevels of standard <strong>de</strong>viation also available. The results showed that the <strong>MDL</strong> methodmay be a good alternative to standard wavelet <strong>de</strong>noising methods concerning theremoval of real instrumental noise in NIR spectrometry, due to the automaticallyselection of filter type and threshold, which <strong>do</strong>es not require subjective choices fromthe analyst. The <strong>MDL</strong> <strong>de</strong>noising procedure applied to coaveraged scans should beparticularly useful in nuclear resonance spectroscopy, where a consi<strong>de</strong>rable numberof scans may be required to achieve an a<strong>de</strong>quate signal-to-noise ratio, and inapplications of Near Infrared Spectroscopy, as tool for process analysis, where rapidmeasurements are vital.Keywords: Wavelet Denoising, Minimum Description Length, NIR spectrometry,NMR spectrometry, individual scans.


introdução1 233 45 R


1 IntroduçãoA Química Analítica mo<strong>de</strong>rna é uma ciência eminentemente instrumental,muito diversa daquela praticada no final <strong>do</strong> século XIX, quan<strong>do</strong> os procedimentos <strong>de</strong>precipitação, extração ou <strong>de</strong>stilação eram essenciais. A partir <strong>de</strong> 1900, novosméto<strong>do</strong>s basea<strong>do</strong>s em fenômenos físicos, como a condutivida<strong>de</strong>, a absorção e aemissão <strong>de</strong> luz, a relação carga/massa etc., trouxeram uma riqueza <strong>de</strong>possibilida<strong>de</strong>s <strong>para</strong> o campo das análises químicas, as quais se concretizaramdurante os cem anos subseqüentes, <strong>de</strong>vi<strong>do</strong> aos avanços nas áreas damicroeletrônica digital, óptica, mecânica e computação. Como resulta<strong>do</strong>, tivemos oaparecimento <strong>de</strong> técnicas mais rápidas e sensíveis, capazes <strong>de</strong> produzir umagran<strong>de</strong> quantida<strong>de</strong> <strong>de</strong> da<strong>do</strong>s sobre a amostra em questão, possibilitan<strong>do</strong> o<strong>de</strong>senvolvimento <strong>de</strong> méto<strong>do</strong>s <strong>de</strong> análise mais robustos. Um exemplo <strong>de</strong>stas técnicasé a Cromatografia Líquida <strong>de</strong> Alta Eficiência acoplada a um sistema <strong>de</strong> <strong>de</strong>tecção <strong>de</strong>arranjo <strong>de</strong> dio<strong>do</strong>s (CLAE-DAD), que gera milhões <strong>de</strong> da<strong>do</strong>s espectocromatográficosa cada medida (CHAU FON-TIN et al., 2004).Devi<strong>do</strong> à enorme quantida<strong>de</strong> <strong>de</strong> da<strong>do</strong>s gera<strong>do</strong>s por tais técnicas, a premênciapor ferramentas capazes <strong>de</strong> extrair informação química <strong>de</strong>sse emaranha<strong>do</strong> <strong>de</strong>números promoveu a união <strong>de</strong> várias áreas <strong>do</strong> conhecimento, como a Matemática, aEstatística e a Computação. Surgiu assim a Quimiometria, um conjunto <strong>de</strong>ferramentas aplicadas a uma análise racional <strong>de</strong> medidas químicas. Multidisciplinarpor natureza, visa criar ou selecionar procedimentos ótimos <strong>de</strong> medida eexperimentos, bem como extrair a máxima informação possível <strong>do</strong>s da<strong>do</strong>s químicos(MASSART et al., 1997). A Quimiometria permeia to<strong>do</strong> o processo analítico, <strong>de</strong>s<strong>de</strong> aparte inicial, no planejamento <strong>do</strong>s experimentos (BARROS NETO et al., 2007), acoleta <strong>do</strong>s da<strong>do</strong>s, o tratamento <strong>do</strong>s sinais obti<strong>do</strong>s (WENTZELL e BROWN, 2000), amanipulação <strong>do</strong>s da<strong>do</strong>s através <strong>de</strong> reconhecimento <strong>de</strong> padrões (MASSART et al.,1997b) ou quantificação (GELADI, 2002) <strong>de</strong> um ou mais constituinte, até a etapafinal <strong>de</strong> interpretação <strong>do</strong>s resulta<strong>do</strong>s.Uma etapa crucial em uma mo<strong>de</strong>lagem quimiométrica é o tratamento dasmedidas analíticas adquiridas. A maioria <strong>de</strong>las é obtida via instrumentoscomputa<strong>do</strong>riza<strong>do</strong>s, como em espectrometrias no Infravermelho próximo (NIR, <strong>do</strong>


inglês: Near Infrared) e no Infravermelho Médio (MIR, <strong>do</strong> inglês: Medium Infrared),em Ressonância Magnética Nuclear (RMN) e também em Cromatografia Líquida <strong>de</strong>Alta Eficiência (WENTZELL e BROWN, 2000). A fi<strong>de</strong>lida<strong>de</strong> da informação analíticaresultante é <strong>de</strong>pen<strong>de</strong>nte <strong>de</strong> como ela foi primeiramente processada. Tal tratamentoexerce influência direta na qualida<strong>de</strong> das etapas subseqüentes da mo<strong>de</strong>lagem(BRERETON, 2003), e por isso, <strong>de</strong>ve-se proce<strong>de</strong>r com cautela na escolha dasdiferentes opções <strong>de</strong> técnicas <strong>de</strong> processamento <strong>de</strong> sinais.Um <strong>do</strong>s problemas que afetam a integrida<strong>de</strong> <strong>de</strong> uma medida analítica é apresença <strong>de</strong> ruí<strong>do</strong>, que po<strong>de</strong> ser origina<strong>do</strong> por interferentes físicos no a<strong>para</strong>toexperimental, ou qualquer flutuação <strong>do</strong> sinal recebi<strong>do</strong> pelo <strong>de</strong>tector. Toda medidaapresenta um componente rui<strong>do</strong>so, afetan<strong>do</strong> sobremaneira a obtenção <strong>de</strong>informação útil <strong>de</strong> um sistema químico.Para contornar esse problema, os espectrômetros mo<strong>de</strong>rnos trabalham comum procedimento <strong>de</strong> promediação, que consiste em registrar um espectro váriasvezes e <strong>de</strong>pois calcular o espectro médio. Como o ruí<strong>do</strong> é aleatório, observan<strong>do</strong>-sevalores negativos e positivos, este efeito é diminuí<strong>do</strong> pela promediação. Assim, aparte <strong>de</strong>terminística <strong>do</strong> sinal é amplificada (FELINGER, 1998), aumentan<strong>do</strong>-se arelação sinal-ruí<strong>do</strong> por um fator <strong>de</strong> √N, com N sen<strong>do</strong> o número <strong>de</strong> repetições(WENTZELL e BROWN, 2000), o que permite a remoção <strong>de</strong> ruí<strong>do</strong> sem distorcer osinal.Porém, <strong>para</strong> se obter um sinal confiável, N precisa ser gran<strong>de</strong>, e quanto maiorfor N, mais tempo será necessário <strong>para</strong> a aquisição <strong>do</strong> sinal, o que é <strong>de</strong>svantajosose a rapi<strong>de</strong>z das respostas for fundamental, como em Tecnologia Analítica <strong>de</strong>Processos (PAT, <strong>do</strong> inglês: Process Analytical Technology). De fato, em aplicaçõesda PAT, o controle <strong>de</strong> qualida<strong>de</strong> <strong>de</strong> um produto (por exemplo, medicamentos) érealiza<strong>do</strong> diretamente na linha <strong>de</strong> produção, em várias etapas da ca<strong>de</strong>ia produtiva.Um controle apropria<strong>do</strong> requer que as informações obtidas através <strong>do</strong>s espectrossejam analisadas imediatamente, <strong>de</strong> mo<strong>do</strong> a permitir a tomada <strong>de</strong> <strong>de</strong>cisões sem ainterrupção <strong>do</strong> processo (FDA, 2004).Uma alternativa consiste em aplicar técnicas <strong>de</strong> processamento <strong>de</strong> sinaisapós a obtenção <strong>do</strong> espectro promedia<strong>do</strong> com um número pequeno <strong>de</strong> varreduras.As principais técnicas <strong>de</strong> processamento <strong>de</strong> sinais empregadas pelos químicosanalíticos são a Savitzky-Golay e a Transformada <strong>de</strong> Fourier (TF) (CERQUEIRA etal, 2000). No entanto, <strong>de</strong>s<strong>de</strong> 1990, méto<strong>do</strong>s basea<strong>do</strong>s na Transformada Wavelet


(TW) têm apareci<strong>do</strong> como opção a essas técnicas, receben<strong>do</strong> gran<strong>de</strong> atenção dacomunida<strong>de</strong> quimiométrica (CHAU FON-TIN et al., 2004).O interesse crescente <strong>do</strong>s químicos pela Transformada Wavelet se justificapela sua capacida<strong>de</strong> <strong>de</strong> representar simultaneamente as proprieda<strong>de</strong>s <strong>do</strong> tempo eda freqüência <strong>de</strong> um sinal, o que po<strong>de</strong> revelar informações químicas importantesacerca da substância ou analito em estu<strong>do</strong>. Além disso, a natureza multiresolucionalda transformada, obtida pelas versões transladadas e escalonadas da funçãowavelet, possibilita a representação <strong>do</strong> sinal em várias escalas, o que po<strong>de</strong> servantajoso <strong>para</strong> fins <strong>de</strong> extração <strong>de</strong> características.O bom <strong>de</strong>sempenho da TW com relação à compressão <strong>de</strong> sinais tem torna<strong>do</strong>possível a utilização eficiente <strong>de</strong> muitos <strong>do</strong>s méto<strong>do</strong>s espectrométricos mo<strong>de</strong>rnos,<strong>de</strong>vi<strong>do</strong> à alta dimensionalida<strong>de</strong> das respostas analíticas. Na Transformada Wavelet,essa compressão po<strong>de</strong> ser realizada empregan<strong>do</strong> técnicas <strong>de</strong> limiarização, comduas técnicas sen<strong>do</strong> mais amplamente utilizadas, a saber, limiarização Rígida (Hardthresholding) e limiarização Suave (Soft thresholding), que consistem em remover ouatenuar os coeficientes wavelet <strong>de</strong> pequena amplitu<strong>de</strong> (DAUBECHIES, 1992), quepossuem baixa relação sinal-ruí<strong>do</strong>. Para isso, há a necessida<strong>de</strong> <strong>de</strong> uma distinçãoentre quais coeficientes <strong>de</strong>verão ser atenua<strong>do</strong>s ou elimina<strong>do</strong>s, o que é realiza<strong>do</strong>pelas técnicas <strong>de</strong> limiar, cujo representante mais conheci<strong>do</strong> e utiliza<strong>do</strong> é o limiaruniversal (DONOHO, 1995b), apesar <strong>de</strong> nos últimos anos outras técnicas terem si<strong>do</strong><strong>de</strong>senvolvidas (SAITO, 1996) (GALVÃO et al., 2006).A escolha da wavelet, da função <strong>de</strong> limiarização e <strong>do</strong> limiar são as questõesque <strong>do</strong>minam as pesquisas sobre remoção <strong>de</strong> ruí<strong>do</strong> por Transformada Wavelet.Segun<strong>do</strong> (MANGANIELLO et al, 2002) o único méto<strong>do</strong> que permite selecionarautomaticamente o limiar e a função wavelet com um critério <strong>de</strong>fini<strong>do</strong> é oComprimento Mínimo <strong>de</strong> Descrição (<strong>MDL</strong>, <strong>do</strong> inglês: Minimum Description Length),introduzi<strong>do</strong> por Jorma Rissanem (RISSANEM, 2000) e adapta<strong>do</strong> por Naoki Saito(SAITO, 1996). Basea<strong>do</strong> no princípio da parcimônia, o <strong>MDL</strong> busca o mínimo <strong>de</strong>coeficientes que expliquem a maior parte da informação.Como o <strong>MDL</strong> não requer a <strong>de</strong>cisão <strong>do</strong> analista sobre estes parâmetros, tornaseuma técnica muito mais simples e viável <strong>para</strong> a manipulação <strong>do</strong>s espectrosobti<strong>do</strong>s pela promediação <strong>de</strong> poucas varreduras, trazen<strong>do</strong> agilida<strong>de</strong> e economia àsanálises, com conseqüente obtenção mais rápida da informação <strong>de</strong> interesse.


2 Fundamentação teóricaTo<strong>do</strong>s os méto<strong>do</strong>s analíticos instrumentais produzem medidas. Naespectrometria NIR, por exemplo, a medida é um espectro, que é comumente obti<strong>do</strong>passan<strong>do</strong> a radiação infravermelha através <strong>de</strong> uma amostra e <strong>de</strong>terminan<strong>do</strong> quefração da radiação inci<strong>de</strong>nte é absorvida.Um espectro é uma seqüência <strong>de</strong> medidas discretas, constituída por umcomponente que contém a informação <strong>de</strong>sejada <strong>do</strong> analito ou substância <strong>de</strong> estu<strong>do</strong>,e outro que contém informação espúria, que traz diversas conseqüências à precisãoda medida (WENTZELL e BROWN, 2000). Nenhuma medida está livre <strong>de</strong>sse últimocomponente, que po<strong>de</strong> ter proveniência química ou instrumental. Dessa forma, oespectro (y) po<strong>de</strong> ser caracteriza<strong>do</strong> como:y = x + ε(2.1)com x sen<strong>do</strong> o sinal relaciona<strong>do</strong> ao analito e ε a função ruí<strong>do</strong>.Em medidas espectrométricas, o ruí<strong>do</strong> po<strong>de</strong> ser homoscedástico ouheteroscedástico (BARROS NETO et al., 2007). Ambos mascaram a informaçãoquímica sobre o analito <strong>de</strong> interesse e po<strong>de</strong>m diminuir a eficácia <strong>de</strong> mo<strong>de</strong>losquimiométricos.No ruí<strong>do</strong> homoscedástico, características como média e <strong>de</strong>svio-padrãopermanecem constantes ao longo <strong>de</strong> to<strong>do</strong> o espectro. Já a natureza <strong>do</strong> ruí<strong>do</strong>heteroscedástico <strong>de</strong>pen<strong>de</strong> das características da medida <strong>para</strong> cada da<strong>do</strong>(WENTZELL e BROWN, 2000), o que dificulta a eliminação <strong>do</strong> ruí<strong>do</strong>.A maioria <strong>do</strong>s equipamentos produz algum componente heteroscedástico.Além <strong>do</strong> mais, o ruí<strong>do</strong> homoscedástico em um espectro po<strong>de</strong> ser converti<strong>do</strong> emheteroscedástico através <strong>de</strong> uma transformação não-linear como transmitância <strong>para</strong>absorbância (ALSBERG et al., 2007) (WOODWARD et al., 2008), tornan<strong>do</strong> aremoção <strong>do</strong> componente rui<strong>do</strong>so uma tarefa não-trivial, por serem <strong>de</strong>sconhecidas ascaracterísticas <strong>do</strong> ruí<strong>do</strong>. Sua análise e eliminação são realizadas usan<strong>do</strong>-se


estimativas aproximadas <strong>de</strong> suas características, através <strong>do</strong> uso <strong>de</strong> técnicaselaboradas <strong>de</strong> processamento <strong>de</strong> sinais, como as transformadas matemáticas.O objetivo <strong>de</strong> qualquer transformada é revelar certas características que nãosão aparentes no sinal original, facilitan<strong>do</strong> o processo <strong>de</strong> análise e processamentoda transformação. As Transformadas <strong>de</strong> Fourier e Wavelet fazem a conversão <strong>do</strong>sinal no <strong>do</strong>mínio temporal (ou <strong>de</strong> comprimento <strong>de</strong> onda) <strong>para</strong> o <strong>do</strong>mínio dasfreqüências. Isso po<strong>de</strong> ser uma gran<strong>de</strong> vantagem, visto que, <strong>de</strong>pen<strong>de</strong>n<strong>do</strong> dacaracterística <strong>do</strong> sinal analítico, gran<strong>de</strong> parte da informação está inacessívelvisualmente, sen<strong>do</strong> mais facilmente extraídas no <strong>do</strong>mínio das freqüências,possibilitan<strong>do</strong> a visualização <strong>de</strong> uma gama muito maior <strong>de</strong> informações que estariamimperceptíveis no <strong>do</strong>mínio temporal.2.1 A Transformada <strong>de</strong> FourierA Transformada <strong>de</strong> Fourier exerce um papel importante na Química, sen<strong>do</strong>comumente usada na maioria <strong>do</strong>s instrumentos analíticos (SHAO et al., 2003).Descoberta em 1807 por Joseph Fourier, baseia-se no princípio <strong>de</strong> que uma forma<strong>de</strong> onda periódica po<strong>de</strong> ser expressa como uma infinita soma <strong>de</strong> senos e co-senos<strong>de</strong> várias freqüências.A TF opera sobre um sinal contínuo, usan<strong>do</strong> a sobreposição <strong>de</strong> funções senoe co-seno <strong>para</strong> a conversão <strong>de</strong> <strong>do</strong>mínio <strong>do</strong> sinal. Se o sinal for estacionário, isto é,se as características <strong>do</strong> sinal não mudarem com o tempo, não haverá problemas,mas como a maioria <strong>do</strong>s sinais apresenta características não-estacionárias etransitórias, como início e fim <strong>de</strong> eventos, drifts, mudanças abruptas <strong>de</strong> eventos etc,(MISITI et al., 1996), a TF po<strong>de</strong> não ser apropriada <strong>para</strong> a <strong>de</strong>tecção <strong>de</strong> informação<strong>do</strong> sinal. Na Transformada <strong>de</strong> Fourier, apenas a informação das freqüências émantida, e toda a informação referente ao tempo é <strong>de</strong>scartada. Além disso, como osinal é trata<strong>do</strong> globalmente, não observan<strong>do</strong> as peculiarida<strong>de</strong>s <strong>de</strong> cada faixaespectral, po<strong>de</strong> haver comprometimento <strong>do</strong> processamento caso tenhamos algumtrecho muito rui<strong>do</strong>so. (GALVÃO et al., 2001)Na tentativa <strong>de</strong> resolver estas <strong>de</strong>ficiências, Gabor introduziu uma versão daTF que é janelada no tempo, técnica que chamou <strong>de</strong> Transformada <strong>de</strong> Fourier


Janelada (TFJ), e que dispõe o sinal em ambos os <strong>do</strong>mínios tempo e freqüência.Este melhoramento consiste em usar uma janela <strong>de</strong> comprimento finito e movê-la aolongo <strong>do</strong> sinal em questão (ALSBERG, 1997). Assim, <strong>para</strong> cada <strong>de</strong>slocamento dajanela, a TF é processada na região <strong>do</strong> sinal compreendida pelo comprimento dajanela.Porém, como o tamanho da janela temporal na TFJ é fixa, estabelecer umalargura i<strong>de</strong>al que contemple as particularida<strong>de</strong>s <strong>de</strong> cada porção <strong>do</strong> sinal é umatarefa não-trivial. Em regiões <strong>de</strong> alta freqüência, necessitaremos <strong>de</strong> uma janelapequena; em baixas freqüências, a janela <strong>de</strong>verá ser maior. Haverá sempre a perda<strong>de</strong> informação, seja no tempo ou na freqüência.2.2 A Transformada WaveletA transformada Wavelet é uma ferramenta que divi<strong>de</strong> o sinal emcomponentes <strong>de</strong> diferentes freqüências, e então estuda cada componente com umaresolução combinada com sua escala (DAUBECHIES, 1992). Sua vantagemcom<strong>para</strong>da com a Transformada <strong>de</strong> Fourier é a boa localização em ambos os<strong>do</strong>mínios <strong>de</strong> tempo e freqüência. Semelhante à TFJ, a TW é calculada através <strong>de</strong>uma janela que percorre to<strong>do</strong> o sinal. A diferença da TW é que essa janela écompletamente modulável e escalonável. Assim, o processo é repeti<strong>do</strong> inúmerasvezes com janelas maiores ou menores <strong>para</strong> cada novo ciclo (MISITI et al., 1996).Como resulta<strong>do</strong>, tem-se uma coleção <strong>de</strong> representações tempo-freqüência <strong>do</strong> sinal,em diferentes resoluções.As funções <strong>de</strong> base usadas na TW são chamadas wavelets Ψ (a,b) . Como opróprio nome sugere, wavelets são pequenas ondas que diferem <strong>do</strong> zero apenas emum <strong>do</strong>mínio limita<strong>do</strong>, chama<strong>do</strong> suporte. Este suporte po<strong>de</strong> variar, permitin<strong>do</strong> umdiferente grau <strong>de</strong> localização.As wavelets são versões escalonadas e transladadas <strong>de</strong> uma função protótipochamada wavelet-mãe, Ψ. O processo <strong>de</strong> escalamento da wavelet é realiza<strong>do</strong> peloparâmetro a, que permite alongá-la ou comprimi-la. Já a translação, <strong>de</strong>sempenhadapelo parâmetro b, consiste em movê-la ao longo <strong>do</strong> eixo das abscissas, como umafunção janelante. Mudan<strong>do</strong>-se o parâmetro b, o centro da localização no tempo é


movi<strong>do</strong>, pois cada Ψ a,b (t) é localiza<strong>do</strong> em volta <strong>de</strong> b, com um espalhamentoproporcional ao parâmetro a (MALLAT, 1999), proven<strong>do</strong> uma <strong>de</strong>scrição tempofreqüência<strong>de</strong> f(t) (DAUBECHIES, 1992). Uma <strong>de</strong>scrição <strong>do</strong> processo <strong>de</strong>rescalonamento e translação po<strong>de</strong> ser vista na Figura 2.1.Figura 2.1 Esquema gráfico mostran<strong>do</strong> o funcionamento da translação e escalamento dafunção wavelet Symlet 8.Conhecen<strong>do</strong> as funções e os parâmetros usa<strong>do</strong>s na análise wavelet,po<strong>de</strong>mos calcular a Transformada Wavelet Contínua (TWC) <strong>de</strong> um sinal:TWC (a,b)[ f(t) ] ∫= ∞ψ*−∞f(t)dt a, b=ψ a, bf(t)(2.2)Sen<strong>do</strong> a função Ψ a,b <strong>de</strong>finida como:1 ⎛ t − b ⎞a,= ψ⎜⎟,a, b∈R,a ≠ 0a ⎝ a ⎠ψ b(2.3)Por razões práticas, estes parâmetros são freqüentemente discretiza<strong>do</strong>s,levan<strong>do</strong> a então chamada Transformada Wavelet Discreta (TWD), com os valores <strong>de</strong>


a e b respeitan<strong>do</strong> a restrição a = 2 m e b = n2 m , on<strong>de</strong> m e n são números inteiros(GALVÃO et al., 2001). Depois da discretização, a função wavelet é <strong>de</strong>finida como:ψa,b(t) = 2a−2− jψ( 2 t − b),(2.4)Realizar a Transformada wavelet em um sinal é equivalente a processá-locom um banco <strong>de</strong> filtros, geran<strong>do</strong> como produto os coeficientes wavelet. Uma formaeficiente <strong>de</strong> se produzir tais filtros foi proposta por Stéphane Mallat, em 1982, enomeada <strong>de</strong> Análise Multi-resolucional (MRA, <strong>do</strong> inglês: Multiresolucional Analysis)(STRANG e NGUYEN, 1996).Na análise MRA, as funções wavelets são relacionadas a um banco <strong>de</strong> filtros,que possui <strong>do</strong>is filtros, um passa-baixa (L) e outro passa-alta (H), que são aplica<strong>do</strong>sao sinal <strong>de</strong> entrada, um espectro NIR, por exemplo, se<strong>para</strong>n<strong>do</strong>-o em bandas <strong>de</strong>freqüência (STRANG e NGUYEN, 1996). A forma <strong>de</strong>stes filtros é <strong>de</strong>terminada pelotipo <strong>de</strong> função wavelet usada (ALSBERG, 1997b). O filtro passa-baixa, relaciona<strong>do</strong> àchamada função escala Φ, gera os coeficientes <strong>de</strong> aproximação (c), que são oscomponentes <strong>de</strong> baixa freqüência. O filtro passa-alta, por sua vez, está relaciona<strong>do</strong>à função wavelet, produzin<strong>do</strong> os coeficientes <strong>de</strong> <strong>de</strong>talhe (d), <strong>de</strong> alta freqüência,conforme o esquema presente na Figura 2.2.Figura 2.2 Esquema da <strong>de</strong>composição <strong>de</strong> um sinal pelos filtros passa-baixa e passa-alta.Após a filtragem, os coeficientes passam por um processo <strong>de</strong> <strong>de</strong>cimação, queconsiste em remover um <strong>de</strong> cada <strong>do</strong>is coeficientes. O conjunto <strong>de</strong> coeficientes <strong>de</strong>aproximação, por sua vez, passa em seguida por uma nova divisão L/H, <strong>de</strong> maneira


a gerar coeficientes c m+1 e d m+1 e assim sucessivamente (GALVÃO et al., 2001),conforme po<strong>de</strong>mos ver na Figura 2.3.Figura 2.3 Esquema <strong>de</strong> um banco <strong>de</strong> filtros wavelet <strong>para</strong> <strong>do</strong>is níveis <strong>de</strong> <strong>de</strong>composição.Como resulta<strong>do</strong>, teremos um vetor com o mesmo tamanho <strong>do</strong> sinal <strong>de</strong>entrada, conten<strong>do</strong> os coeficientes <strong>de</strong> aproximação <strong>do</strong> último nível <strong>de</strong> <strong>de</strong>composição,que possui baixa resolução, e os coeficientes <strong>de</strong> <strong>de</strong>talhe <strong>de</strong> to<strong>do</strong>s os níveis <strong>de</strong><strong>de</strong>composição, <strong>de</strong> baixa e alta resolução. Uma representação gráfica <strong>de</strong>sseprocesso é encontrada na Figura 2.4.Figura 2.4 Esquema <strong>de</strong> um banco <strong>de</strong> filtros wavelet <strong>para</strong> três níveis <strong>de</strong> <strong>de</strong>composição,mostran<strong>do</strong> os coeficientes em cada etapa.


Para a reconstrução ou síntese <strong>do</strong> sinal (Figura 2.5), que <strong>de</strong>ve ser realizadasem perda <strong>de</strong> informação, a Transformada Wavelet Inversa é aplicada, seguin<strong>do</strong> oprocedimento inverso à <strong>de</strong>composição. Os filtros <strong>de</strong> <strong>de</strong>composição (passa-altas epassa-baixas), juntamente com os respectivos filtros <strong>de</strong> reconstrução, formam umsistema chama<strong>do</strong> <strong>de</strong> filtros <strong>de</strong> Quadratura Espelhada (QMF) (MISITI et al., 1996).Como os coeficientes <strong>de</strong> aproximação e <strong>de</strong>talhe passaram por <strong>de</strong>cimação,eles não po<strong>de</strong>m ser combina<strong>do</strong>s diretamente <strong>para</strong> reconstruir o sinal. Eles <strong>de</strong>vemser reconstruí<strong>do</strong>s se<strong>para</strong>damente, pela inserção <strong>de</strong> zeros entre os coeficientes, e<strong>de</strong>pois combina<strong>do</strong>s.Figura 2.5 Esquema geral <strong>do</strong> Filtro <strong>de</strong> Quadratura Espelhada, on<strong>de</strong> é mostra<strong>do</strong> o processo<strong>de</strong> <strong>de</strong>composição e reconstrução <strong>do</strong> sinal.2.3 Remoção <strong>de</strong> ruí<strong>do</strong> por Transformada WaveletUma medida experimental geralmente é contaminada por algum tipo <strong>de</strong> ruí<strong>do</strong>,que po<strong>de</strong> interferir na interpretação <strong>do</strong>s resulta<strong>do</strong>s e nas etapas <strong>de</strong> mo<strong>de</strong>lagemquimiométrica. O ruí<strong>do</strong> é um fenômeno que afeta todas as freqüências, como o sinalrelaciona<strong>do</strong> ao analito ten<strong>de</strong> a <strong>do</strong>minar os componentes <strong>de</strong> baixa freqüência, éespera<strong>do</strong> que a maioria <strong>do</strong>s componentes <strong>de</strong> alta freqüência, abaixo <strong>de</strong> certo nível,seja ruí<strong>do</strong> (ALSBERG et al., 1997a). Os méto<strong>do</strong>s <strong>de</strong> remoção <strong>de</strong> ruí<strong>do</strong> porTransformada Wavelet têm como objetivo se<strong>para</strong>r esse componente rui<strong>do</strong>so <strong>do</strong>sinal.


O uso da Transformada Wavelet pelos químicos analíticos na tarefa <strong>de</strong>remoção <strong>de</strong> ruí<strong>do</strong> tem cresci<strong>do</strong> vertiginosamente, em substituição a técnicas como aSavitzky-Golay (BEEBE et al., 1998). Na realização da remoção <strong>de</strong> ruí<strong>do</strong> pela TW,três etapas <strong>de</strong>vem ser seguidas:■ Transformação <strong>do</strong> sinal em questão <strong>para</strong> o <strong>do</strong>mínio wavelet;■ Seleção <strong>do</strong>s coeficientes mais informativos, e subseqüente tratamento;■ Reconstrução <strong>do</strong> espectro filtra<strong>do</strong>.■ ETAPA 1 ― Transformação <strong>do</strong> sinal <strong>para</strong> o <strong>do</strong>mínio waveletUma das premissas da formulação empregada <strong>para</strong> a TW é que o sinal <strong>de</strong>veter um comprimento diádico, com N sen<strong>do</strong> o número <strong>de</strong> níveis <strong>de</strong> <strong>de</strong>composição.Caso isso não seja possível, existem vários méto<strong>do</strong>s <strong>para</strong> a extrapolação <strong>do</strong>comprimento <strong>do</strong> sinal, como extensão simétrica e zero-padding (CHAU FON-TIN etal., 2004). Tais técnicas têm como objetivo diminuir a distorção das bordas <strong>do</strong>espectro, e envolvem a inserção <strong>de</strong> alguns coeficientes adicionais em cada estágio<strong>do</strong> processo <strong>de</strong> <strong>de</strong>composição, a fim <strong>de</strong> obter uma perfeita reconstrução (MISITI etal., 2000). Na técnica zero-padding, a a<strong>de</strong>quação <strong>do</strong> comprimento <strong>do</strong> sinal érealizada pela inserção <strong>de</strong> zeros, enquanto na extensão simétrica é feita umareplicação simétrica <strong>do</strong> sinal. Neste texto, porém, trabalharemos apenas com da<strong>do</strong>scom comprimento múltiplo <strong>de</strong> 2 N .Para a realização da <strong>de</strong>composição <strong>do</strong> sinal através <strong>do</strong> banco <strong>de</strong> filtroswavelet, <strong>de</strong>vemos escolher quantos níveis <strong>de</strong> <strong>de</strong>composição serão utiliza<strong>do</strong>s. Onúmero máximo <strong>de</strong>pen<strong>de</strong> <strong>do</strong> tamanho <strong>do</strong> sinal e da função wavelet. Quanto maiorfor o nível, maior será a compressão <strong>do</strong> sinal e a remoção <strong>de</strong> ruí<strong>do</strong>. No entanto,efeitos <strong>de</strong> borda po<strong>de</strong>m prejudicar a análise caso o número seja muito alto.Recomenda-se utilizar o número máximo <strong>de</strong> níveis da<strong>do</strong> pela função wmaxlev.m, <strong>do</strong>Matlab ® Wavelet Toolbox (MISITI et al., 2000).A escolha da wavelet que será usada <strong>de</strong>pen<strong>de</strong> da natureza <strong>do</strong>s da<strong>do</strong>s. Aqualida<strong>de</strong> <strong>do</strong>s sinais reconstruí<strong>do</strong>s é diretamente <strong>de</strong>pen<strong>de</strong>nte da função waveletempregada.


■ ETAPA 2 ― Seleção <strong>do</strong>s coeficientes mais informativos e subseqüentetratamentoUma transformada não remove informação ou ruí<strong>do</strong>, ela apenas move-os <strong>de</strong>lugar. Para que a transformada wavelet seja aplicada na tarefa <strong>de</strong> remoção <strong>de</strong> ruí<strong>do</strong>,ou em outras aplicações, <strong>de</strong>ve-se fazer a seleção <strong>do</strong>s coeficientes maisrepresentativos. Tais coeficientes po<strong>de</strong>m ser se<strong>para</strong><strong>do</strong>s respeitan<strong>do</strong> um limiar <strong>de</strong>corte. Valores acima <strong>do</strong> limiar po<strong>de</strong>m ser manti<strong>do</strong>s ou atenua<strong>do</strong>s e valores abaixo<strong>do</strong> corte po<strong>de</strong>m ser excluí<strong>do</strong>s. Para isso, <strong>de</strong>vemos escolher o tipo <strong>de</strong> função <strong>de</strong>limiarização. Este procedimento baseia-se na idéia básica <strong>de</strong> que a energia <strong>de</strong> umafunção freqüentemente será concentrada em poucos coeficientes wavelet, enquantoa energia <strong>do</strong> ruí<strong>do</strong> será espalhada ao longo <strong>de</strong> to<strong>do</strong>s os coeficientes(POORNACHANDRA e KUMARAVEL, 2006), isto é, somente alguns coeficientescontribuem com o sinal propriamente dito.■ ETAPA 3 ― Reconstrução <strong>do</strong> espectro filtra<strong>do</strong>A reconstrução <strong>do</strong> espectro é realizada através da Transformada WaveletInversa (TWI), utilizan<strong>do</strong> somente os coeficientes seleciona<strong>do</strong>s pelas funções <strong>de</strong>limiarização. Após esta etapa, tem-se uma versão menos rui<strong>do</strong>sa <strong>do</strong> sinal original.Ao <strong>de</strong><strong>para</strong>rmos com estas etapas, algumas perguntas aparecemimediatamente:― Qual função wavelet <strong>de</strong>vemos usar?― Quais coeficientes escolheremos?― Que faremos com os coeficientes escolhi<strong>do</strong>s?Depen<strong>de</strong>n<strong>do</strong> da característica <strong>do</strong> sinal utiliza<strong>do</strong>, as respostas <strong>para</strong> essasperguntas po<strong>de</strong>m variar completamente. Por isso, <strong>de</strong>vem ser tratadas com muitacautela e experiência sobre o sinal em questão.


2.3.1 Escolha da função waveletComo existe uma infinida<strong>de</strong> <strong>de</strong> diferentes wavelets <strong>de</strong>scritas na literatura,escolher uma que se adapte bem à natureza <strong>do</strong>s da<strong>do</strong>s é uma tarefa <strong>de</strong>safia<strong>do</strong>ra.Apesar <strong>de</strong> algumas famílias serem mais difundidas, as funções que as integrampossuem proprieda<strong>de</strong>s que variam entre si, como or<strong>de</strong>m <strong>do</strong>s filtros <strong>de</strong><strong>de</strong>composição, momentos <strong>de</strong> <strong>de</strong>caimento, grau <strong>de</strong> oscilação, ortogonalida<strong>de</strong> etc,dificultan<strong>do</strong> ainda mais a escolha (ARGOUD et al., 2004). É necessário enten<strong>de</strong>r ascaracterísticas da wavelet <strong>para</strong> <strong>de</strong>terminar se ela é a<strong>de</strong>quada ou não <strong>para</strong> anatureza <strong>do</strong> sinal em questão. Entre as famílias mais conhecidas e usadas naliteratura <strong>de</strong> Química Analítica temos as famílias Daubechies, Symlet e Coiflet.As Daubechies compreen<strong>de</strong>m wavelets que diferem no comprimento <strong>do</strong> filtro.A primeira é a wavelet mais antiga e também a mais simples, conhecida comowavelet <strong>de</strong> Haar. Elas apresentam uma forma muito assimétrica. Na Figura 2.6, sãomostradas as formas <strong>de</strong> algumas funções escala e wavelet da família Daubechies.


Figura 2.6 Forma <strong>de</strong> algumas funções escala (phi) e wavelet (psi) e da família Daubechies.As Coiflets foram construídas por Daubechies em colaboração com R.Coifman (DAUBECHIES, 1992). Na Figura 2.7 são mostradas algumas funçõesescala e wavelet da família Coiflet.Figura 2.7 Forma <strong>de</strong> algumas funções wavelet (psi) e escala (phi) da família Coiflet.


As Symlets, também produzidas por Ingrid Daubechies, apresentam maiorsimetria e são comumente preferidas na análise <strong>de</strong> espectros vibracionais(ALSBERG, 1997). Na Figura 2.8, po<strong>de</strong>m ser visualizadas algumas das funçõesescala e wavelet da família Symlet.Figura 2.8 Forma <strong>de</strong> algumas funções wavelet (psi) e escala (phi) da família Symlet.Vale salientar que os filtros correspon<strong>de</strong>ntes às wavelets dbN, coifN e symNpossuem comprimento 2N, 6N e 2N, respectivamente.Entre os méto<strong>do</strong>s mais utiliza<strong>do</strong>s <strong>para</strong> a escolha da wavelet temos o usobasea<strong>do</strong> em indicações da literatura, com<strong>para</strong>ção visual, forma da wavelet e atécnica <strong>MDL</strong>.


2.3.1.1 Escolha baseada na literaturaDevi<strong>do</strong> à ausência <strong>de</strong> técnicas mais robustas <strong>para</strong> a escolha da wavelet quese adapte bem à natureza <strong>do</strong>s da<strong>do</strong>s, freqüentemente tal escolha se baseia emindicações na literatura que a tenham utiliza<strong>do</strong> em um tipo particular <strong>de</strong> sinal. EmEspectroscopia NIR, por exemplo, a função wavelet Symlet 8 tem si<strong>do</strong> muito usada,talvez por influência <strong>do</strong> clássico tutorial <strong>de</strong> TW escrito por Alsberg e colabora<strong>do</strong>res(1998b).2.3.1.2 Escolha por inspeção visual <strong>do</strong>s resulta<strong>do</strong>sTestar o comportamento das diferentes wavelets frente a uma <strong>de</strong>terminadaaplicação não é uma tarefa fácil, po<strong>de</strong> consumir muito tempo computacional e acom<strong>para</strong>ção efetiva <strong>do</strong>s resulta<strong>do</strong>s nem sempre é possível.2.3.1.3 Escolha pela forma da função waveletA forma da função wavelet que preten<strong>de</strong>mos usar <strong>de</strong>ve ser capaz <strong>de</strong> traduziras características <strong>do</strong> espectro. É um critério muito usa<strong>do</strong>, embora seja difícil <strong>de</strong>implementar <strong>de</strong>vi<strong>do</strong> à quantida<strong>de</strong> <strong>de</strong> wavelets disponíveis, além <strong>de</strong> ser passível <strong>de</strong>inferências <strong>do</strong> usuário.2.3.1.4 Escolha pelo <strong>MDL</strong>O <strong>MDL</strong> é o único méto<strong>do</strong> que realiza a escolha sistemática da wavelet. Comoele também seleciona automaticamente um limiar, será tratada mais <strong>de</strong>talhadamentena próxima seção.


2.3.2 LimiarA escolha <strong>do</strong> limiar <strong>de</strong> corte é a mais importante da remoção <strong>de</strong> ruí<strong>do</strong> porTransformada Wavelet, e por isso, requer muita atenção e critério <strong>para</strong> a escolha daconfiguração correta <strong>do</strong>s parâmetros necessários.Os coeficientes com pequena amplitu<strong>de</strong> po<strong>de</strong>m ser <strong>de</strong>scarta<strong>do</strong>s sem perdasignificativa <strong>de</strong> informação. Os coeficientes restantes, que portam a maior parte dainformação, po<strong>de</strong>m ser aplica<strong>do</strong>s nas tarefas <strong>de</strong> remoção <strong>de</strong> ruí<strong>do</strong>, na seleção <strong>de</strong>variáveis <strong>para</strong> regressão, análise discriminante, <strong>de</strong>tecção <strong>de</strong> pontos <strong>de</strong> inflexão etc.No entanto, a escolha <strong>de</strong>stes coeficientes é uma tarefa trabalhosa, e <strong>de</strong>ve serrealizada criteriosamente, <strong>para</strong> não per<strong>de</strong>r informação válida, ou remover poucoruí<strong>do</strong> in<strong>de</strong>sejável.A maioria das técnicas <strong>de</strong> remoção <strong>de</strong> ruí<strong>do</strong>s trabalha zeran<strong>do</strong> os coeficientesabaixo <strong>de</strong> um limiar pré-estabeleci<strong>do</strong>, e/ou atenuan<strong>do</strong> os coeficientes acima <strong>de</strong>stelimiar. Escolher o limiar correto é a questão-chave.2.3.2.1 Limiar UniversalO limiar universal é basea<strong>do</strong> nas proprieda<strong>de</strong>s estatísticas <strong>do</strong> ruí<strong>do</strong> branco,Gaussiano. Sua fórmula é a seguinte:limiar = σ2logN(2.5)on<strong>de</strong> σ é o <strong>de</strong>svio padrão <strong>do</strong> ruí<strong>do</strong> e N é o comprimento <strong>do</strong> sinal. Como na maioria<strong>do</strong>s sinais reais o σ é <strong>de</strong>sconheci<strong>do</strong>, uma estimativa é obtida através da mediana<strong>do</strong>s coeficientes da mais fina escala <strong>de</strong> resolução (DONOHO et al., 1995b), isto é,<strong>do</strong>s coeficientes <strong>de</strong> <strong>de</strong>talhe <strong>do</strong> primeiro nível <strong>de</strong> <strong>de</strong>composição, sen<strong>do</strong> dividi<strong>do</strong> pelofator 0,674. A equação da estimativa <strong>do</strong> ruí<strong>do</strong> po<strong>de</strong> ser vista abaixo:σ = mediana(d1)0,674(2.6)


on<strong>de</strong> d1 são os coeficientes <strong>de</strong> <strong>de</strong>talhe <strong>do</strong> primeiro nível <strong>de</strong> <strong>de</strong>composição. Aestimativa é feita nesses coeficientes, pois se assume que sejam compostosessencialmente por ruí<strong>do</strong>. No entanto, caso haja presença <strong>de</strong> alguma porção <strong>de</strong>sinal entre estes coeficientes, po<strong>de</strong> ocorrer superestimação <strong>do</strong> ruí<strong>do</strong> (DONOHO eJOHNSTONE, 1994).2.3.2.2 Limiar por variânciaEste méto<strong>do</strong> baseia-se na escolha <strong>do</strong>s coeficientes cuja variância seja maiorque um valor estipula<strong>do</strong>, por exemplo, uma porcentagem <strong>de</strong> variância <strong>de</strong> 90%.Dessa forma, os coeficientes que apresentarem variância inferior a 90% sãoelimina<strong>do</strong>s.2.3.2.3 Limiar <strong>MDL</strong>O critério <strong>MDL</strong>, proposto por Jorma Rissanen em 1978 (RISSANEM, 2000),estabelece que a melhor representação <strong>de</strong> um sinal é aquela que minimiza onúmero <strong>de</strong> bits utiliza<strong>do</strong>s <strong>para</strong> representar o sinal e os parâmetros <strong>de</strong>starepresentação. É basea<strong>do</strong> na idéia <strong>de</strong> que qualquer regularida<strong>de</strong> nos da<strong>do</strong>s po<strong>de</strong>ser usada <strong>para</strong> comprimi-lo (GRUNWALD, 2005), e assim, <strong>de</strong>screvê-lo usan<strong>do</strong> umnúmero menor <strong>de</strong> pontos que o original.Naoki Saito (1996) aplicou o critério <strong>MDL</strong> <strong>para</strong> estimar um sinal discreto <strong>de</strong>uma medida rui<strong>do</strong>sa usan<strong>do</strong> uma biblioteca <strong>de</strong> funções wavelet. Seu méto<strong>do</strong>objetiva obter simultaneamente uma boa remoção <strong>de</strong> ruí<strong>do</strong> e compressão <strong>do</strong>s sinais,selecionan<strong>do</strong> automaticamente o limiar e a função wavelet.O <strong>MDL</strong> consiste em uma função custo que objetiva expressar umcompromisso entre o número <strong>de</strong> coeficientes reti<strong>do</strong>s e o erro da reconstrução <strong>do</strong>sinal. É expresso como a soma <strong>de</strong> <strong>do</strong>is termos conflitantes, segun<strong>do</strong> a Equação 2.7,


<strong>MDL</strong> (k*,m*)2 2 ⎞( ( − ))⎟ ⎠⎛ 3 N= min⎜klog(N) + log ∑ xmx⎝ 2 2mk(2.7)on<strong>de</strong> k é o número <strong>de</strong> maiores coeficientes que foram reti<strong>do</strong>s, m <strong>de</strong>signa o tipo <strong>de</strong>filtro, x m os coeficientes <strong>do</strong> tipo da transformada m, x mk <strong>para</strong> os k maiorescoeficientes em amplitu<strong>de</strong>, e k * e m * <strong>para</strong> os valores otimiza<strong>do</strong>s. O valorcorrespon<strong>de</strong>nte a k* é o limiar escolhi<strong>do</strong>, e m* é a função wavelet escolhida.O primeiro termo representa uma função penalizante, que aumentalinearmente com o número <strong>de</strong> coeficientes wavelet reti<strong>do</strong>s. O segun<strong>do</strong> termocaracteriza a energia residual, que é o erro entre o sinal reconstruí<strong>do</strong> e o sinaloriginal. O número <strong>de</strong> coeficientes escolhi<strong>do</strong> como o mínimo por esta equação éconsi<strong>de</strong>ra<strong>do</strong> o limiar. Semelhante operação ocorre com a seleção da melhorwavelet.2.3.3 Escolha da função <strong>de</strong> limiarizaçãoApós a escolha <strong>do</strong> limiar <strong>de</strong> corte, precisamos saber em qual abrangência <strong>do</strong>universo <strong>de</strong> coeficientes iremos aplicá-lo, e em que magnitu<strong>de</strong> eles serãomodifica<strong>do</strong>s. Duas estratégias apresentam vasto uso pela comunida<strong>de</strong> científica,ambas <strong>de</strong>senvolvidas por David Donoho e colabora<strong>do</strong>res (DONOHO, 1995), sen<strong>do</strong> aprimeira chamada <strong>de</strong> função <strong>de</strong> limiarização Suave (Soft thresholding), e a segundachamada <strong>de</strong> função <strong>de</strong> limiarização Rígida (Hard thresholding).Nessas duas abordagens clássicas, to<strong>do</strong>s os coeficientes cujas magnitu<strong>de</strong>ssejam inferiores ao valor <strong>do</strong> limiar são zera<strong>do</strong>s, pois se presume que sejamresultantes <strong>de</strong> ruí<strong>do</strong>. A diferença entre elas resi<strong>de</strong> no tratamento da<strong>do</strong> aoscoeficientes com magnitu<strong>de</strong>s superiores ao limiar. Enquanto na abordagem Rígidaos coeficientes acima <strong>do</strong> limiar são manti<strong>do</strong>s inaltera<strong>do</strong>s, na abordagem Suave elessão atenua<strong>do</strong>s pelo valor <strong>do</strong> limiar.Embora sejam utilizadas intensamente, tais técnicas são passíveis <strong>de</strong> algunsproblemas. Entre eles, a limiarização Suave po<strong>de</strong> ser ten<strong>de</strong>nciosa <strong>de</strong>vi<strong>do</strong> àatenuação <strong>de</strong> coeficientes <strong>de</strong> maior amplitu<strong>de</strong>. Já a limiarização Rígida, por ser umafunção <strong>de</strong>scontínua, como po<strong>de</strong>mos ver na Figura 2.9, po<strong>de</strong> ser sensível a


pequenas mudanças no perfil <strong>do</strong> sinal. (POORNACHANDRA e KUMARAVEL, 2006).O comportamento das duas funções <strong>de</strong> limiarização é mostra<strong>do</strong> em um sinal <strong>de</strong> 100pontos, conforme a Figura 2.9.Figura 2.9. Valor <strong>do</strong> coeficiente antes da limiarização e valor <strong>do</strong> coeficiente após alimiarização Suave e Rígida.Vale notar que tanto a limiarização Rígida quanto a Suave atuam somentenos coeficientes <strong>de</strong> <strong>de</strong>talhe (DONOHO et al., 1995b), da<strong>do</strong> que os mesmos contéma maior parte <strong>do</strong> ruí<strong>do</strong>.Uma abordagem mais simples chama-se limiarização Bruta (cru<strong>de</strong>thresholding), que consiste em zerar to<strong>do</strong>s os coeficientes <strong>de</strong> <strong>de</strong>talhe, manten<strong>do</strong>apenas os <strong>de</strong> aproximação. No entanto, tal abordagem po<strong>de</strong> causar excessivadistorção <strong>do</strong> sinal.Outras técnicas são <strong>de</strong>scritas na literatura, sen<strong>do</strong> a maioria <strong>de</strong>las <strong>de</strong>rivadasdas abordagens propostas por Donoho e colabora<strong>do</strong>res (1995b). Neste trabalho,restringiremos a investigação às funções <strong>de</strong> limiarização Rígida e Suave.


experimental1 233 45 R


3 Experimental3.1 TécnicasNeste experimental é explora<strong>do</strong> o uso <strong>de</strong> três técnicas <strong>de</strong> remoção <strong>de</strong> ruí<strong>do</strong>instrumental por Transformada Wavelet, sen<strong>do</strong> elas:■ Suave ― limiarização Suave e limiar universal;■ Rígida ― limiarização Rígida e limiar universal;■ <strong>MDL</strong> ― limiarização Rígida e limiar <strong>MDL</strong>.| 24


Afim <strong>de</strong> avaliar a sensibilida<strong>de</strong> <strong>de</strong>sses méto<strong>do</strong>s <strong>de</strong> remoção <strong>de</strong> ruí<strong>do</strong> comrespeito à escolha <strong>do</strong>s filtros wavelet, uma investigação foi conduzida com vinte eduas wavelets, das famílias Daubechies (1-10), Symlet (4-10) e Coiflet (1-5). Comomenciona<strong>do</strong> anteriormente, os filtros passa-altas e passa-baixas <strong>para</strong> DbN, SymN eCoifN têm comprimento 2N, 2N, e 6N, respectivamente. A escolha <strong>de</strong>ssas funçõesbaseou-se no seu uso intensivo na literatura, conforme po<strong>de</strong>mos ver em WALCZAKe MASSART (1997) e CAI e HARRINGTON (1998).Em to<strong>do</strong>s os experimentos avalia<strong>do</strong>s nesta dissertação, os cálculos foramrealiza<strong>do</strong>s usan<strong>do</strong> o nível máximo <strong>de</strong> <strong>de</strong>composição que permita um bomfuncionamento <strong>do</strong> banco <strong>de</strong> filtros wavelet, da<strong>do</strong> pela função wmaxlev.m, <strong>do</strong> Matlab ®Wavelet Toolbox (MISITI et al., 1996).3.2 ExperimentosPara avaliar o <strong>de</strong>sempenho das técnicas aqui abordadas, cinco experimentosforam avalia<strong>do</strong>s:■ Experimento 1 ― Sinais simula<strong>do</strong>s;■ Experimento 2 ― Espectros <strong>do</strong> medicamento Captopril em comprimi<strong>do</strong>s,obti<strong>do</strong>s por Espectrometria <strong>de</strong> Refletância Difusa no Infravermelho Próximo;■ Experimento 3 ― Espectros <strong>do</strong> princípio ativo Dipirona Sódica em pó,obti<strong>do</strong>s por Espectrometria <strong>de</strong> Refletância Difusa no Infravermelho Próximo;■ Experimento 4 ― Espectros <strong>de</strong> óleo diesel combustível obti<strong>do</strong>s porEspectrometria no Infravermelho Próximo, medi<strong>do</strong>s em transmitância;■ Experimento 5 ― Espectros <strong>de</strong> um extrato vegetal medi<strong>do</strong>s emEspectrometria <strong>de</strong> Ressonância Magnética Nuclear.


3.2.1 Experimento 1 – Da<strong>do</strong>s simula<strong>do</strong>sNeste exemplo simula<strong>do</strong>, um sinal sintético {x(λ)}, λ=1, 2,..., 1024, foi gera<strong>do</strong>pela superposição <strong>de</strong> seis funções Gaussianas com médias igualmente distribuídasno intervalo <strong>de</strong> 1-1024. Os pesos <strong>do</strong> pico e o <strong>de</strong>svio padrão das Gaussianas foramaleatoriamente gera<strong>do</strong>s na faixa <strong>de</strong> 2-4 e 0-30, respectivamente. Ao sinal gera<strong>do</strong> foiadiciona<strong>do</strong> ruí<strong>do</strong> Gaussiano branco <strong>de</strong> média zero, em três níveis diferentes <strong>de</strong><strong>de</strong>svio-padrão, a saber, 0,01, 0,3 e 1,0. Para cada nível <strong>de</strong> ruí<strong>do</strong> foram gera<strong>do</strong>s cemespectros rui<strong>do</strong>sos.3.2.2 Experimento 2 – Captopril em comprimi<strong>do</strong>s / Espectrometria NIRREste experimento envolve a análise <strong>do</strong> medicamento Captopril na formafarmacêutica comprimi<strong>do</strong>, 25 mg, através da espectrometria <strong>de</strong> Refletância Difusa noInfravermelho Próximo (NIRR). As análises foram realizadas no Grupo <strong>de</strong>Instrumentação e Automação (GIA), da Universida<strong>de</strong> <strong>de</strong> Campinas (UNICAMP), emum espectrômetro FT-NIR Bomen (ABB-Canadá), mo<strong>de</strong>lo MB 160D, equipa<strong>do</strong> comum <strong>de</strong>tector à base <strong>de</strong> Arseneto <strong>de</strong> Gálio e Índio (InGaAs). Os espectros forammedi<strong>do</strong>s em um acessório <strong>para</strong> sóli<strong>do</strong>s, na faixa espectral compreendida entre 3.999cm -1 e 10.0000cm -1 , com uma resolução <strong>de</strong> 2 cm -1 . Para a centralização da amostrasob a fonte <strong>de</strong> radiação foi adapta<strong>do</strong> ao acessório <strong>para</strong> sóli<strong>do</strong>s um suporte metálico(Figura 3.1b). Na medida <strong>do</strong> branco foi utiliza<strong>do</strong> Teflon, 99% reflective Spectralon(Labsphere, North Sutton, E.U.A.). A temperatura ambiente foi mantida constante em24ºC e a umida<strong>de</strong> relativa <strong>do</strong> ar em 48%.


Figura 3.1 (a) equipamento ABB-BOMEM; (b) suporte <strong>para</strong> análises <strong>de</strong> sóli<strong>do</strong>sInicialmente, a partir <strong>de</strong> uma mesma amostra <strong>de</strong>sse medicamento foramregistra<strong>do</strong>s cinqüenta espectros <strong>de</strong> varredura individual. Um espectro adicional daamostra, obti<strong>do</strong> pela promediação <strong>de</strong> cem varreduras foi registra<strong>do</strong> <strong>para</strong> fins <strong>de</strong>referência nos cálculos <strong>de</strong> RMSE. To<strong>do</strong>s os espectros foram obti<strong>do</strong>s na faixaespectral <strong>de</strong> 3.999 a 10.000 cm -1 e submeti<strong>do</strong>s à técnica EMSC (Correção <strong>de</strong> SinalMultiplicativo Estendida, <strong>do</strong> inglês: Exten<strong>de</strong>d Multiplicative Signal Correction)(Martens et al, 2003), <strong>para</strong> redução <strong>de</strong> possíveis espalhamentos da linha <strong>de</strong> base.3.2.3 Experimento 3 – Dipirona sódica em pó / Espectrometria NIRRO terceiro experimento envolve a análise <strong>do</strong> princípio ativo Dipirona Sódica,na forma farmacêutica pó, através da espectrometria <strong>de</strong> Refletância Difusa noInfravermelho Próximo (NIRR). O registro <strong>do</strong>s espectros foi realiza<strong>do</strong> em umespectrômetro FT-IR Perkin Elmer, mo<strong>de</strong>lo Spectrum GX, equipa<strong>do</strong> com um <strong>de</strong>tectora base DTGS (Sulfato <strong>de</strong> Triglicina Deuterada, <strong>do</strong> inglês: Deuterated TriGlicineSulfate) e fonte <strong>de</strong> Halogênio-Tungstênio com envelope <strong>de</strong> quartzo. O acessório <strong>de</strong>refletância difusa Perkin Elmer foi acopla<strong>do</strong> ao equipamento. As análises foramrealizadas no Laboratório <strong>de</strong> Automação e Instrumentação em Química Analítica eQuimiometria (LAQA), da Universida<strong>de</strong> Fe<strong>de</strong>ral da Paraíba.


Figura 3.2 Espectrômetro com Transformada <strong>de</strong> Fourier Perkin Elmer Spectrum GX.Os espectros foram registra<strong>do</strong>s na faixa espectral <strong>de</strong> 7710 - 4000 cm -1 , emuma resolução <strong>de</strong> 4,0 cm -1 , com temperatura <strong>do</strong> ambiente constante em 25,5°C eumida<strong>de</strong> relativa <strong>do</strong> ar <strong>de</strong> 42%. O sinal <strong>do</strong> branco foi registra<strong>do</strong> com brometo <strong>de</strong>Potássio (KBr).A partir da mesma amostra <strong>de</strong> dipirona, foram registra<strong>do</strong>s cinqüentaespectros <strong>de</strong> varredura individual e um espectro <strong>de</strong> referência, obti<strong>do</strong> pelapromediação <strong>de</strong> 256 varreduras, disponibilizan<strong>do</strong> <strong>para</strong> as etapas subseqüentes duasmatrizes, uma matriz <strong>de</strong> dimensão 50x3712; outra <strong>de</strong> 1x3712, respectivamente.3.2.4 Experimento 4 – Óleo Diesel Combustível / Espectometria NIRNeste experimento foi reproduzi<strong>do</strong> o experimental realiza<strong>do</strong> em GALVÃO etal. (2007). Espectros NIR <strong>de</strong> uma única amostra <strong>de</strong> óleo diesel combustível foramadquiri<strong>do</strong>s usan<strong>do</strong> o mesmo equipamento utiliza<strong>do</strong> no Experimento 2, na faixaespectral <strong>de</strong> 850 a 1300 nm, utilizan<strong>do</strong> uma cubeta <strong>de</strong> quartzo <strong>de</strong> 10 mm. Oespectro resultante tem 2560 variáveis espectrais.


Figura 3.3 Espectrômetro FT-NIR BOMEM utiliza<strong>do</strong> <strong>para</strong> as análises <strong>de</strong> óleo diesel.A fim <strong>de</strong> reduzir possíveis espalhamentos da linha <strong>de</strong> base que po<strong>de</strong>mcomprometer os cálculos <strong>de</strong> RMSE, os espectros foram submeti<strong>do</strong>s a umprocedimento que consiste em remover <strong>de</strong> cada espectro, a média <strong>de</strong>les mesmos,conforme realiza<strong>do</strong> em GALVÃO et al. (2007).Neste experimento, além das três técnicas <strong>de</strong> remoção <strong>de</strong> ruí<strong>do</strong> usadas nosoutros estu<strong>do</strong>s, foi utilizada a técnica Subótima, proposta na referência supracitada.3.2.5 Experimento 5 – Extrato vegetal / Espectrometria 1 H RMNNeste experimento, espectros <strong>de</strong> 1 H RMN foram obti<strong>do</strong>s <strong>de</strong> uma mesmaamostra <strong>de</strong> um diterpeno (o áci<strong>do</strong> ent-7Racetoxitrachilobano-18-óico), <strong>do</strong> tipo enttrachilobano,isola<strong>do</strong> das cascas <strong>do</strong> caule da espécie Xylopia langs<strong>do</strong>rffiana,conhecida popularmente como “pimenteira da terra”. Detalhes sobre a espécie e aobtenção <strong>do</strong> extrato vegetal po<strong>de</strong>m ser encontra<strong>do</strong>s em TAVARES et al., (2006). Osespectros RMN foram obti<strong>do</strong>s em um espectrômetro Bruker DRX-200 (BrukerGmbH, Rheinstetten, Alemanha), operan<strong>do</strong> a 200 MHz <strong>para</strong> a freqüência 1 H, usan<strong>do</strong>CDCl 3 como solvente. As análises foram realizadas no Núcleo Multi-usuário <strong>de</strong>Caracterização e Análises da UFPB (NUCAL).


Figura 3.4 (a) Espectrômetro Bruker DRX-200 utiliza<strong>do</strong> <strong>para</strong> as análises <strong>de</strong> 1 H RMN; (b)Detalhe <strong>do</strong> compartimento <strong>de</strong> inserção da amostra.Inicialmente foi obti<strong>do</strong> um espectro resultante da promediação <strong>de</strong> <strong>de</strong>zesseistransientes (ou varreduras). Um espectro promedia<strong>do</strong> por 1024 transientes foiregistra<strong>do</strong> <strong>para</strong> fins <strong>de</strong> referência nos cálculos <strong>de</strong> RMSE. Os da<strong>do</strong>s foram coleta<strong>do</strong>ssobre 32 kpts.3.3 Programas e Pacotes ComputacionaisOs algoritmos das três técnicas <strong>de</strong> remoção <strong>de</strong> ruí<strong>do</strong> por Transformadawavelet foram <strong>de</strong>senvolvi<strong>do</strong>s usan<strong>do</strong> o pacote Wavelet Toolbox, conti<strong>do</strong> no softwareMatlab ® 6.5 (The Mathworks, Natick, E.U.A.), basea<strong>do</strong> nos fluxogramasapresenta<strong>do</strong>s no Apêndice da dissertação, bem como os respectivos códigos-fonte.To<strong>do</strong>s os cálculos consoantes às técnicas <strong>de</strong> remoção <strong>de</strong> ruí<strong>do</strong> foramrealiza<strong>do</strong>s usan<strong>do</strong>-se o software Matlab ® 6.5, usan<strong>do</strong> os algoritmos acimamenciona<strong>do</strong>s. Para a execução da técnica EMSC foi utiliza<strong>do</strong> o softwareUnscrambler 9.7, da CAMO (Trondheim, Noruega).


Um computa<strong>do</strong>r portátil Toshiba Satelitte ® , equipa<strong>do</strong> com um processa<strong>do</strong>rIntel ® Celeron ® <strong>de</strong> 1,33 MHz, com 512 MB <strong>de</strong> memória, foi utiliza<strong>do</strong> em to<strong>do</strong> otrabalho.


esulta<strong>do</strong>s e discussões1 233 45 R


4 Resulta<strong>do</strong>s e discussõesCom<strong>para</strong>r a eficiência das técnicas <strong>de</strong> remoção <strong>de</strong> ruí<strong>do</strong> aplicadas a da<strong>do</strong>sreais é uma tarefa complicada, pois o sinal verda<strong>de</strong>iro sem o componente rui<strong>do</strong>so é<strong>de</strong>sconheci<strong>do</strong>. Assim, geralmente avaliam-se as técnicas por meio <strong>de</strong> inferênciasvisuais nos sinais resultantes, muito embora seja uma métrica assaz subjetiva epassível <strong>de</strong> interferências pessoais. Neste trabalho, visan<strong>do</strong> superar estadificulda<strong>de</strong>, a<strong>do</strong>ta-se como sinal livre <strong>de</strong> ruí<strong>do</strong> um espectro obti<strong>do</strong> pela promediação<strong>de</strong> um gran<strong>de</strong> número <strong>de</strong> varreduras, e então, a raiz <strong>do</strong> erro médio quadrático(RMSE) é calculada entre este espectro e o obti<strong>do</strong> com um reduzi<strong>do</strong> número <strong>de</strong>varreduras. O RMSE, então, é a medida da disparida<strong>de</strong> entre estes espectros,sen<strong>do</strong> calcula<strong>do</strong> como,RMSE =1N∑ N xf(λ) − x(λ) ]1[λ=2(4.1)on<strong>de</strong> N é o número <strong>de</strong> pontos <strong>do</strong> sinal, xf é o espectro reconstruí<strong>do</strong> e x o espectro<strong>de</strong> referência.| 33


Figura 4.3 Curva <strong>do</strong> RMSE médio x função wavelet <strong>para</strong> as três técnicas <strong>de</strong> remoção <strong>de</strong>ruí<strong>do</strong> por TW em um total <strong>de</strong> cem sinais gera<strong>do</strong>s com ruí<strong>do</strong> (SD=0,01).Como discuti<strong>do</strong> no Capítulo 2, o méto<strong>do</strong> <strong>MDL</strong> po<strong>de</strong> selecionar com um critério<strong>de</strong>fini<strong>do</strong>, tanto o limiar quanto o tipo <strong>de</strong> filtro. O critério a<strong>do</strong>ta<strong>do</strong> pelo <strong>MDL</strong> é aminimização da sua função-custo, que representa o interesse conflitante <strong>de</strong> <strong>do</strong>istermos, um relaciona<strong>do</strong> à parcimônia <strong>do</strong> resulta<strong>do</strong>, outro buscan<strong>do</strong> a diminuição <strong>do</strong>erro da reconstrução <strong>do</strong> sinal. A minimização <strong>de</strong>ssa função-custo, isto é, a obtenção<strong>do</strong> menor valor <strong>de</strong> <strong>MDL</strong>, representa um compromisso entre estes <strong>do</strong>is objetivos.Assim, entre a biblioteca <strong>de</strong> wavelets, a que resultar no menor valor <strong>de</strong> <strong>MDL</strong>, será aescolhida. A valida<strong>de</strong> <strong>de</strong>ssa seleção foi avaliada pelos RMSE’s obti<strong>do</strong>s entre o sinal<strong>de</strong> referência e o sinal reconstruí<strong>do</strong> pelo <strong>MDL</strong> através <strong>de</strong> uma biblioteca <strong>de</strong> vinte eduas wavelets, <strong>para</strong> cada um <strong>do</strong>s cem sinais gera<strong>do</strong>s. Dessa forma, po<strong>de</strong>mos julgarse a minimização da função custo <strong>do</strong> <strong>MDL</strong> <strong>para</strong> cada sinal po<strong>de</strong> resultar em baixosRMSE’s.Através da Figura 4.4, po<strong>de</strong>mos observar que <strong>do</strong>s cem sinais gera<strong>do</strong>s, em 14<strong>de</strong>les o <strong>MDL</strong> escolheu o filtro que forneceu o menor RMSE. Em 10 casos a funçãoescolhida resultou no 2º menor erro, e em 17 no 3º menor erro. Em 65% <strong>do</strong>s casos,o <strong>MDL</strong> selecionou um filtro cujo RMSE estava entre os cinco menores erros entre osvinte <strong>de</strong> <strong>do</strong>is filtros. Em 31% <strong>do</strong>s casos (barras cinza escuro) o <strong>MDL</strong> escolheu o filtroque forneceu o menor RMSE ou um que não tinha diferenças significativas comeste, segun<strong>do</strong> um teste-F com 95% <strong>de</strong> confiança.


Figura 4.4 Gráfico <strong>de</strong> barras apresentan<strong>do</strong> a posição da wavelet selecionada pelo <strong>MDL</strong> <strong>para</strong>cada um <strong>do</strong>s cem sinais gera<strong>do</strong>s, com relação ao RMSE obti<strong>do</strong>.Na Figura 4.5, abaixo, são mostradas as curvas <strong>de</strong> RMSE x função waveletobtidas nos casos on<strong>de</strong> o <strong>MDL</strong> obteve o seu melhor e pior <strong>de</strong>sempenho em relaçãoà escolha a<strong>de</strong>quada da wavelet.Figura 4.5 Curva <strong>do</strong> RMSE x função wavelet <strong>para</strong> a técnica <strong>MDL</strong> <strong>do</strong>s sinais número 5 e 17.Para o espectro 5, um caso em que o <strong>MDL</strong> obteve <strong>de</strong>sempenho ótimo, awavelet selecionada (Coiflet 5) obteve o menor RMSE entre as 22 funções,enquanto que <strong>para</strong> o espectro 17, a wavelet Daubechies 10, selecionada comoótima, resultou no 12º menor erro. Apesar da baixa colocação em termos <strong>de</strong> RMSE


da wavelet selecionada pelo <strong>MDL</strong> <strong>para</strong> esse sinal, um erro relativamente baixo foiobti<strong>do</strong>, mostran<strong>do</strong> a eficiência da técnica. Com efeito, além <strong>de</strong> removersatisfatoriamente o componente rui<strong>do</strong>so com erros comparáveis aos obti<strong>do</strong>s pelatécnica Rígida, o <strong>MDL</strong> possui a vantagem da escolha automática da wavelet que<strong>de</strong>ve ser utilizada, sem perdas significativas no RMSE.O <strong>MDL</strong> mostrou consi<strong>de</strong>rável robustez na escolha da wavelet, selecionan<strong>do</strong>apenas cinco wavelets diferentes em to<strong>do</strong>s os cem sinais (Figura 4.6), sen<strong>do</strong> queem 91 % <strong>do</strong>s casos foram selecionadas apenas duas wavelets, Daubechies 10(70%) e Coiflet 5 (21%).Figura 4.6 Freqüência <strong>de</strong> seleção da mesma função wavelet pelo <strong>MDL</strong> nos cem sinaissintéticos.Em relação à capacida<strong>de</strong> <strong>de</strong> compressão <strong>do</strong>s da<strong>do</strong>s, as duas estratégias <strong>de</strong>limiar (<strong>MDL</strong> e universal) mostraram eficiências comparáveis, selecionan<strong>do</strong> umnúmero muito pequeno <strong>de</strong> coeficientes wavelet, conforme po<strong>de</strong> ser visto na Figura4.7, on<strong>de</strong> <strong>do</strong>is gráficos <strong>de</strong> barras apresentam o número <strong>de</strong> coeficientes obti<strong>do</strong> pelasvinte e duas funções <strong>para</strong> os espectros 5 e 17 estuda<strong>do</strong>s anteriormente. Apesar <strong>do</strong>comportamento semelhante das duas estratégias, po<strong>de</strong>mos perceber uma levevantagem da técnica <strong>MDL</strong> <strong>para</strong> a maioria das funções wavelets, sen<strong>do</strong> que em trêscasos (Db1, Db2 e Coif1) as duas técnicas mostraram diferenças mais expressivas.Uma explicação <strong>para</strong> tal discrepância po<strong>de</strong> ser a maior sensibilida<strong>de</strong> <strong>do</strong> limiaruniversal frente a filtros <strong>de</strong> comprimento curto. De fato, os filtros Db1, Db2 e Coif1são os menores entre os vinte e <strong>do</strong>is filtros wavelet, possuin<strong>do</strong> comprimento 2, 4 e 6,respectivamente. Para os <strong>do</strong>is sinais, conforme o comprimento <strong>do</strong> filtro aumenta,


po<strong>de</strong>mos notar que as diferenças no número <strong>de</strong> coeficientes seleciona<strong>do</strong>s entre os<strong>do</strong>is limiares diminui.Figura 4.7 Gráfico <strong>de</strong> barras com o número <strong>de</strong> coeficientes seleciona<strong>do</strong>s pelo limiaruniversal (barras cinza) e <strong>MDL</strong> (barras pretas) através das 22 wavelets <strong>para</strong> (a) o espectro 5e (b) o espectro 17. A wavelet selecionada pelo <strong>MDL</strong> é escrita em ver<strong>de</strong>.


4.1.2 Ruí<strong>do</strong> com <strong>de</strong>svio-padrão <strong>de</strong> 0,3Igualmente aos sinais <strong>do</strong> exemplo anterior, todas as três técnicas mostraram<strong>de</strong>sempenhos semelhantes, removen<strong>do</strong> to<strong>do</strong> o componente rui<strong>do</strong>so presente nosinal bruto, porém, manten<strong>do</strong> distorções em algumas regiões, todas causadas peloruí<strong>do</strong> proeminente <strong>de</strong>ste sinal, conforme po<strong>de</strong>mos ver na Figura 4.8, abaixo.Figura 4.8 De cima <strong>para</strong> baixo, sinais reconstruí<strong>do</strong>s pelas técnicas <strong>MDL</strong>, Rígi<strong>do</strong> e Suave,sinal <strong>de</strong> referência e sinal rui<strong>do</strong>so (SD=0,3).Em termos <strong>de</strong> RMSE, conforme po<strong>de</strong> ser visto na Figura 4.9, o padrão <strong>de</strong>eficiência das técnicas se manteve, com a técnica Rígida apresentan<strong>do</strong> os menoreserros, seguida pelo <strong>MDL</strong> e pela técnica Suave. Esta, por sua vez apresentoumelhora em relação aos resulta<strong>do</strong>s anteriores, obten<strong>do</strong> erros próximos aos obti<strong>do</strong>spelas outras técnicas.


Figura 4.9 Curva <strong>do</strong> RMSE médio x função wavelet <strong>para</strong> as três técnicas <strong>de</strong> remoção <strong>de</strong>ruí<strong>do</strong> por Transformada wavelet em um total <strong>de</strong> cem sinais gera<strong>do</strong>s com ruí<strong>do</strong> (SD=0,3).A eficiência <strong>do</strong> <strong>MDL</strong> na seleção da função ótima foi avaliada com base nosRMSE’s obti<strong>do</strong>s pelas vinte e duas wavelets em um total <strong>de</strong> cem sinais gera<strong>do</strong>s.Figura 4.10 Gráfico <strong>de</strong> barras apresentan<strong>do</strong> a posição da wavelet selecionada pelo <strong>MDL</strong><strong>para</strong> cada um <strong>do</strong>s cem sinais gera<strong>do</strong>s, com relação ao RMSE obti<strong>do</strong>.Através <strong>do</strong> gráfico <strong>de</strong> barras da Figura 4.10, po<strong>de</strong>mos notar que o <strong>MDL</strong>obteve bons resulta<strong>do</strong>s, selecionan<strong>do</strong> em 27% <strong>do</strong>s casos a wavelet que resultou nomenor RMSE. Em 74% <strong>do</strong>s sinais, o <strong>MDL</strong> escolheu wavelets que obtiveram até oquinto menor erro. Através <strong>de</strong> um teste-F com 95% <strong>de</strong> confiança, po<strong>de</strong>mos concluirque em 59% <strong>do</strong>s casos o <strong>MDL</strong> selecionou a wavelet que resultou no menor RMSEou uma cujo erro não tem diferença significativa com o menor (barras cinza-escuro).


Figura 4.11 Curva <strong>do</strong> RMSE x função wavelet <strong>para</strong> a técnica <strong>MDL</strong> <strong>do</strong>s sinais número 6 e 60.Entre os cem sinais gera<strong>do</strong>s, o <strong>MDL</strong> apresentou sua pior eficiência na seleçãoda wavelet <strong>do</strong> sinal número 60, on<strong>de</strong> a wavelet Daubechies 9 foi escolhida, obten<strong>do</strong>o 14º menor erro. Porém, essa mesma função forneceu o menor erro entre as vinte eduas funções quan<strong>do</strong> selecionada pelo <strong>MDL</strong> <strong>para</strong> o sinal 6 (Figura 4.11). Valeressaltar que o <strong>MDL</strong> mostrou consi<strong>de</strong>rável robustez na seleção da wavelet,escolhen<strong>do</strong> em 74% <strong>do</strong>s casos a mesma função (Db9), também escolhidamaciçamente nos sinais menos rui<strong>do</strong>sos <strong>do</strong> experimento anterior. O gráfico <strong>de</strong>barras conten<strong>do</strong> a freqüência <strong>de</strong> seleção da wavelet em cem sinais po<strong>de</strong> ser visto naFigura 4.12.Figura 4.12 Freqüência <strong>de</strong> seleção da mesma função wavelet pelo <strong>MDL</strong> nos cem sinaissintéticos.


servin<strong>do</strong>-nos apenas <strong>de</strong> exemplo sobre a influência da manipulação <strong>do</strong>scoeficientes.Em termos <strong>de</strong> RMSE, as três técnicas apresentaram a maior similarida<strong>de</strong>observada entre os experimentos simula<strong>do</strong>s ora estuda<strong>do</strong>s. A técnica Rígidaprevaleceu em boa parte das wavelets, porém, foi suplantada em algumas pelastécnicas <strong>MDL</strong> e Suave (Figura 4.15).Figura 4.15 Curva <strong>do</strong> RMSE médio x função wavelet <strong>para</strong> as três técnicas <strong>de</strong> remoção <strong>de</strong>ruí<strong>do</strong> por Transformada wavelet em um total <strong>de</strong> cem sinais gera<strong>do</strong>s com ruí<strong>do</strong> (SD=1,0).Em relação à escolha da wavelet pelo <strong>MDL</strong>, pela análise <strong>do</strong> gráfico <strong>de</strong> barrasda Figura 4.16, temos que em 75% <strong>do</strong>s casos o <strong>MDL</strong> selecionou um filtro cujoRMSE estava entre os cinco menores erros, <strong>do</strong>s vinte e <strong>do</strong>is filtros analisa<strong>do</strong>s. Em40% <strong>do</strong>s casos, a função escolhida pelo <strong>MDL</strong> forneceu o menor RMSE ou um quenão tinha diferenças significantes com o menor, segun<strong>do</strong> um teste-F com 95% <strong>de</strong>confiança.Figura 4.16 Gráfico <strong>de</strong> barras apresentan<strong>do</strong> a posição da wavelet selecionada pelo <strong>MDL</strong><strong>para</strong> cada um <strong>do</strong>s cem sinais gera<strong>do</strong>s, com relação ao RMSE obti<strong>do</strong>.


Como po<strong>de</strong>mos ver pelas Figuras 4.16 e 4.17, o caso em que o <strong>MDL</strong> obteveseu pior <strong>de</strong>sempenho na seleção <strong>do</strong> filtro wavelet foi o sinal 20, com a seleção <strong>do</strong>filtro Daubechies 5, obten<strong>do</strong> o 19º pior erro. O melhor <strong>de</strong>sempenho pô<strong>de</strong> serobserva<strong>do</strong> em sete casos, on<strong>de</strong> os filtros seleciona<strong>do</strong>s pelo <strong>MDL</strong> forneceram o maisbaixo RMSE entre os vinte e <strong>do</strong>is filtros. Um exemplo é o sinal 11, no qual o <strong>MDL</strong>selecionou a wavelet Daubechies 9.Figura 4.17 Curva <strong>do</strong> RMSE x função wavelet <strong>para</strong> a técnica <strong>MDL</strong> <strong>do</strong>s sinais número 11 e20.Apesar <strong>de</strong> o <strong>MDL</strong> ter seleciona<strong>do</strong> apenas duas wavelets (Daubechies 9 eSymlet 9) em 73% <strong>do</strong>s casos (Figura 4.18), o universo <strong>de</strong> wavelets selecionadas<strong>para</strong> este exemplo foi 7, um pouco maior que nos casos anteriores (5 e 3,respectivamente). Além disso, as duas wavelets selecionadas confirmaram umatendência <strong>de</strong> seleção em sinais mais rui<strong>do</strong>sos, visto terem si<strong>do</strong> intensamenteescolhidas nos <strong>do</strong>is exemplos simula<strong>do</strong>s mais rui<strong>do</strong>sos, mostran<strong>do</strong> a robustez <strong>do</strong><strong>MDL</strong> na tarefa <strong>de</strong> seleção da wavelet mais a<strong>de</strong>quada à natureza <strong>do</strong>s da<strong>do</strong>s.Figura 4.18 Freqüência <strong>de</strong> seleção da mesma função wavelet pelo <strong>MDL</strong> nos cem sinaissintéticos.


O número <strong>de</strong> coeficientes wavelet seleciona<strong>do</strong>s pelas duas técnicas <strong>de</strong> limiarfoi o menor observa<strong>do</strong> neste estu<strong>do</strong> com sinais simula<strong>do</strong>s. O aumento no nível <strong>de</strong>ruí<strong>do</strong> po<strong>de</strong> ter diminuí<strong>do</strong> o número <strong>de</strong> coeficientes realmente relaciona<strong>do</strong>s aocomponente <strong>do</strong> sinal. Na Figura 4.19 po<strong>de</strong>m ser observadas as curvas <strong>do</strong> número<strong>de</strong> coeficientes seleciona<strong>do</strong>s em relação à função wavelet <strong>para</strong> os <strong>do</strong>is sinaisdiscuti<strong>do</strong>s acima. Com exceção <strong>de</strong> duas wavelets no sinal 11, todas as outraswavelets, <strong>de</strong>ste e <strong>do</strong> sinal 20, selecionaram um número fixo <strong>de</strong> coeficientes (33),enquanto o limiar universal oscilou entre 32 e 37, obten<strong>do</strong> menos coeficientes que olimiar <strong>MDL</strong>.Figura 4.19 Curva <strong>do</strong> RMSE x função wavelet da técnica <strong>MDL</strong> <strong>para</strong> os sinais número 11 e20. A wavelet escolhida é marcada por um triângulo.4.1.4 Análise <strong>do</strong>s diferentes níveis <strong>de</strong> ruí<strong>do</strong>Pela análise <strong>do</strong> comportamento das três técnicas na remoção <strong>de</strong> ruí<strong>do</strong> emsinais sintéticos gera<strong>do</strong>s em três níveis <strong>de</strong> ruí<strong>do</strong> homoscedástico, po<strong>de</strong>mos concluirque todas se mostraram eficientes, sen<strong>do</strong> capazes <strong>de</strong> remover satisfatoriamente ocomponente rui<strong>do</strong>so visível. A técnica Rígida apresentou os melhores resulta<strong>do</strong>s,tanto em termos das características qualitativas <strong>do</strong> sinal como em relação ao RMSE,sen<strong>do</strong> seguida pelo <strong>MDL</strong>, que obteve <strong>de</strong>sempenho similar. A técnica Suave obteveresulta<strong>do</strong>s menos satisfatórios que as outras técnicas, porém, com uma melhoraconsi<strong>de</strong>rável à medida que se aumentou o nível <strong>de</strong> ruí<strong>do</strong>, chegan<strong>do</strong> a resulta<strong>do</strong>s


similares às outras técnicas <strong>para</strong> algumas wavelets. A técnica Suave utiliza a função<strong>de</strong> limiarização Suave, diferentemente das outras duas técnicas, que fazem uso dalimiarização Rígida. O maior rigor da limiarização Suave, <strong>de</strong>vi<strong>do</strong> à atenuação <strong>do</strong>scoeficientes com amplitu<strong>de</strong>s acima <strong>do</strong> limiar, foi o responsável pelo fraco<strong>de</strong>sempenho <strong>de</strong>ssa técnica.Em to<strong>do</strong>s os casos, os maiores RMSE’s foram observa<strong>do</strong>s nas wavelets cujoscomprimentos <strong>do</strong>s filtros são menores. O mesmo comportamento se <strong>de</strong>u em relaçãoao número <strong>de</strong> coeficientes necessários <strong>para</strong> a reconstrução <strong>do</strong> sinal, com umamenor compressão <strong>do</strong>s da<strong>do</strong>s obtida nessas wavelets. De fato, as waveletsDaubechies 1 a 3, e a coiflet 1, <strong>de</strong> comprimento 2, 4, 6 e 6, respectivamente,obtiveram sempre os maiores erros e um eleva<strong>do</strong> número <strong>de</strong> coeficientes. Essecomportamento é <strong>de</strong>vi<strong>do</strong> ao fato que em filtros <strong>de</strong> curto comprimento as “janelas”são menores, por conseguinte, mas janelas são necessárias <strong>para</strong> analisar to<strong>do</strong> osinal, com conseqüente aumento no número <strong>de</strong> coeficientes seleciona<strong>do</strong>s. Alémdisso, a suavida<strong>de</strong> da wavelet aumenta conforme se aumenta o comprimento <strong>do</strong>filtro (ROSAS-OREA et al., 2005), permitin<strong>do</strong> uma melhor aproximação <strong>do</strong> sinal.A parcimônia na seleção <strong>de</strong> coeficientes apresentou uma tendênciarelacionada ao nível <strong>de</strong> ruí<strong>do</strong>, com a seleção <strong>de</strong> um número menor <strong>de</strong> coeficientesconforme se aumentou o nível <strong>do</strong> ruí<strong>do</strong>, como conseqüência da diminuição nonúmero <strong>de</strong> coeficientes relaciona<strong>do</strong>s ao componente <strong>do</strong> sinal propriamente dito.Todas as três técnicas apresentaram uma representação mais compacta <strong>do</strong>s sinaisaqui estuda<strong>do</strong>s.Em relação à escolha da wavelet, o <strong>MDL</strong> manteve uma eficiência constanteem to<strong>do</strong>s os casos, selecionan<strong>do</strong> sempre filtros que forneceram baixos RMSE’s.Além disso, apresentou consi<strong>de</strong>rável robustez, selecionan<strong>do</strong> a wavelet Sym9 emto<strong>do</strong>s os níveis <strong>de</strong> ruí<strong>do</strong> estuda<strong>do</strong>s, principalmente nos <strong>do</strong>is últimos, on<strong>de</strong> a waveletDb9 também teve ótimo <strong>de</strong>sempenho, sen<strong>do</strong> majoritariamente escolhida. Vale notarque ambas possuem filtro com comprimento 18, o segun<strong>do</strong> maior entre as vinte eduas wavelets.


4.2 Experimento 2 – Captopril / Espectrometria NIRRComumente, espectros <strong>de</strong> refletância difusa sofrem mais com a presença <strong>de</strong>ruí<strong>do</strong> que os espectros <strong>de</strong> absorbância e transmitância, principalmente <strong>de</strong>vi<strong>do</strong> aoforte espalhamento da radiação. Neste experimento, a amostra (um comprimi<strong>do</strong>)apresenta compactação uniforme <strong>do</strong>s grânulos, possibilitan<strong>do</strong> a aquisição <strong>de</strong> umespectro menos suscetível aos espalhamentos <strong>de</strong> luz. Dessa forma, osespalhamentos não comprometeram <strong>de</strong> maneira acentuada os espectros, conformepo<strong>de</strong>mos ver através da Figura 4.20, que apresenta um espectro bruto <strong>de</strong> varreduraunitária na faixa espectral <strong>de</strong> 3.999 a 10.000 cm -1 .Apesar <strong>de</strong> o espectro ser resulta<strong>do</strong> <strong>de</strong> apenas uma varredura, com exceção<strong>de</strong> algumas porções, não apresenta ruí<strong>do</strong> consi<strong>de</strong>rável. De fato, a intensida<strong>de</strong> <strong>do</strong>ruí<strong>do</strong> não é uniforme em toda a faixa espectral, sen<strong>do</strong> mais intenso na regiãoconhecida como short-NIR, o que po<strong>de</strong> ser explica<strong>do</strong> pela <strong>de</strong>gradação dasensibilida<strong>de</strong> <strong>do</strong> <strong>de</strong>tector à base <strong>de</strong> InGaAs.Figura 4.20 Espectro <strong>de</strong> refletância <strong>de</strong> um comprimi<strong>do</strong> <strong>do</strong> princípio-ativo captopril na região<strong>de</strong> 3.999-10.000 cm -1 .Essa heteroscedasticida<strong>de</strong> no sinal po<strong>de</strong> ser evi<strong>de</strong>nciada também pelainspeção <strong>do</strong>s coeficientes wavelet <strong>do</strong> primeiro nível <strong>de</strong> <strong>de</strong>talhe (WALCZAK eMASSART, 1997b). Conforme po<strong>de</strong>mos ver na Figura 4.21, a freqüência nosprimeiros quinhentos e últimos mil coeficientes apresenta alta variabilida<strong>de</strong> naintensida<strong>de</strong>, o que po<strong>de</strong> reduzir a eficiência da limiarização wavelet, <strong>de</strong>vi<strong>do</strong> à


dificulda<strong>de</strong> em selecionar um limiar que contemple uniformemente to<strong>do</strong>s oscoeficientes wavelet.Figura 4.21 Coeficientes <strong>de</strong> <strong>de</strong>talhe <strong>do</strong> primeiro nível <strong>de</strong> <strong>de</strong>composição <strong>de</strong> um espectro <strong>de</strong>captopril.Assim, <strong>de</strong>cidiu-se pela exclusão das regiões acima citadas, <strong>de</strong> forma tambéma satisfazer um <strong>do</strong>s critérios necessários ao a<strong>de</strong>qua<strong>do</strong> funcionamento <strong>do</strong> banco <strong>de</strong>filtros wavelet na formulação a<strong>do</strong>tada, que requer sinais com comprimento múltiplo<strong>de</strong> 2 N .Para o cálculo <strong>do</strong> nível <strong>de</strong> <strong>de</strong>composição máximo em que o banco <strong>de</strong> filtrospossa funcionar a<strong>de</strong>quadamente, utilizamos a função wmaxlev.m, <strong>do</strong> WaveletToolbox, com uma estimativa <strong>de</strong> 4.500 pontos, a qual resultou em sete níveis. Vistoque 2 7 =128, o múltiplo <strong>de</strong>sse resulta<strong>do</strong> mais próximo <strong>de</strong> 4500 é 4480. Assim, a faixa<strong>de</strong> comprimento <strong>de</strong> onda foi reduzida pela exclusão das últimas 20 variáveis,resultan<strong>do</strong> em uma região <strong>de</strong> trabalho entre 4610 cm -1 e 8.928 cm -1 , disponibilizan<strong>do</strong><strong>para</strong> os cálculos subseqüentes uma matriz <strong>de</strong> tamanho 51x4480. Na Figura 4.22 émostra<strong>do</strong> o espectro <strong>de</strong> referência e um espectro <strong>de</strong> varredura individual, utiliza<strong>do</strong>snos cálculos subseqüentes.


Figura 4.22 Espectro <strong>de</strong> referência (100 varreduras) e espectro rui<strong>do</strong>so (1 varredura) <strong>de</strong> umcomprimi<strong>do</strong> <strong>do</strong> princípio-ativo captopril na região <strong>de</strong> 4.610-8.928 cm -1 .Na Figura 4.23a, po<strong>de</strong>mos visualizar o espalhamento da linha <strong>de</strong> base nosespectros, principalmente entre o espectro <strong>de</strong> referência (ver<strong>de</strong>) e os <strong>de</strong>mais, o quepo<strong>de</strong> trazer influências negativas sobre o cálculo <strong>do</strong> RMSE. Visan<strong>do</strong> contornar esseproblema, to<strong>do</strong>s os espectros foram submeti<strong>do</strong>s ao emprego da técnica EMSC, como resulta<strong>do</strong> <strong>do</strong> tratamento po<strong>de</strong>n<strong>do</strong> ser visto na Figura 4.23b.Figura 4.23 Cento e um espectros sobrepostos <strong>de</strong> um comprimi<strong>do</strong> <strong>do</strong> princípio-ativocaptopril na região <strong>de</strong> 4610-8928 cm -1 . (a) antes e (b) <strong>de</strong>pois da correção da linha <strong>de</strong> basepor EMSC. Em <strong>de</strong>talhe, corte amplia<strong>do</strong> da região entre 5300-5700 cm -1 .


Cada um <strong>do</strong>s cinqüenta espectros <strong>de</strong> varredura unitária foi submeti<strong>do</strong> às trêstécnicas <strong>de</strong> remoção <strong>de</strong> ruí<strong>do</strong> por Transformada Wavelet, e o RMSE individual emédio foi calcula<strong>do</strong> entre os espectros reconstruí<strong>do</strong>s e o espectro <strong>de</strong> referência,obti<strong>do</strong> pela promediação <strong>de</strong> cem varreduras.Pela com<strong>para</strong>ção qualitativa entre os espectros reconstruí<strong>do</strong>s, o espectrobruto <strong>de</strong> varredura unitária e o espectro <strong>de</strong> referência, po<strong>de</strong>mos constatar que todasas técnicas mostraram <strong>de</strong>sempenhos diferentes na remoção <strong>do</strong> componente rui<strong>do</strong>so(Figura 4.24).Figura 4.24 Sinais reconstruí<strong>do</strong>s pelas técnicas <strong>MDL</strong>, Rígi<strong>do</strong> e Suave, sinal <strong>de</strong> referência esinal rui<strong>do</strong>so <strong>para</strong> a mesma amostra <strong>de</strong> captopril.Uma porção consi<strong>de</strong>rável <strong>do</strong> ruí<strong>do</strong> presente no espectro bruto foi mantida noespectro reconstruí<strong>do</strong> pela técnica Rígida, principalmente quan<strong>do</strong> com<strong>para</strong><strong>do</strong> com oobti<strong>do</strong> pela abordagem Suave, a qual apresentou um espectro visualmente limpoabaixo <strong>de</strong> 7900 cm -1 . Por outro la<strong>do</strong>, a técnica <strong>MDL</strong> foi mais eficiente, removen<strong>do</strong>praticamente to<strong>do</strong> o ruí<strong>do</strong>, persistin<strong>do</strong> apenas alguns artefatos na região posterior a8300 cm -1 , difíceis <strong>de</strong> serem elimina<strong>do</strong>s <strong>de</strong>vi<strong>do</strong> à baixa relação sinal-ruí<strong>do</strong> <strong>do</strong>espectro bruto nesta região. Como po<strong>de</strong>mos ver pela Figura 4.24, o espectro obti<strong>do</strong>pela técnica <strong>MDL</strong>, embora seja a reconstrução <strong>de</strong> uma única varredura, é muitosimilar ao <strong>de</strong> referência, obti<strong>do</strong> pela média <strong>de</strong> cem varreduras.As técnicas <strong>MDL</strong> e Rígida mostraram resulta<strong>do</strong>s discrepantes, apesar <strong>de</strong>usarem a mesma função <strong>de</strong> limiarização (Rígida). Isso é <strong>de</strong>vi<strong>do</strong> ao limiar a<strong>do</strong>ta<strong>do</strong>,


mostran<strong>do</strong> que o limiar <strong>MDL</strong> foi mais eficiente na distinção entre ruí<strong>do</strong> e sinal que olimiar universal, emprega<strong>do</strong> na técnica Rígida.Na Tabela 1 são mostra<strong>do</strong>s os RMSE’s médios <strong>para</strong> as três técnicas frente àsvinte e duas funções wavelet. É interessante notar que, na gran<strong>de</strong> maioria daswavelets analisadas, as duas abordagens que fazem uso <strong>do</strong> limiar universal ficaramaquém <strong>do</strong> méto<strong>do</strong> <strong>MDL</strong>, corroboran<strong>do</strong> os resulta<strong>do</strong>s obti<strong>do</strong>s pela inspeção visual<strong>do</strong>s espectros.Tabela 1 Valores <strong>de</strong> RMSE médios obti<strong>do</strong>s com 1 varredura e 7 níveis <strong>de</strong> <strong>de</strong>composição nobanco <strong>de</strong> filtros.RMSE (x10 -3 )FiltrowaveletTécnicasSuave Rígida <strong>MDL</strong>Db1 1,33 1,37 1,57Db2 1,03 1,33 1,05Db3 1,01 1,34 1,01Db4 1,01 1,35 0,99Db5 1,02 1,35 1,00Db6 1,03 1,36 1,00Db7 1,02 1,36 1,01Db8 1,03 1,36 1,01Db9 1,04 1,37 1,02Db10 1,05 1,37 1,02Sym4 1,02 1,34 1,01Sym5 1,02 1,35 1,00Sym6 1,03 1,36 1,01Sym7 1,03 1,37 1,00Sym8 1,03 1,36 1,00Sym9 1,04 1,36 1,01Sym10 1,03 1,36 1,00Coif1 1,03 1,32 1,06Coif2 1,02 1,35 1,00Coif3 1,03 1,36 1,01Coif4 1,03 1,36 1,01Coif5 1,03 1,37 1,00Pela análise da Tabela 1 e da Figura 4.24, po<strong>de</strong>mos perceber que osresulta<strong>do</strong>s <strong>para</strong> cada técnica foram influencia<strong>do</strong>s apenas pela capacida<strong>de</strong> <strong>de</strong>


emoção <strong>de</strong> ruí<strong>do</strong> <strong>de</strong> cada uma, já que nenhuma <strong>de</strong>las causou <strong>de</strong>formações aosinal, o que po<strong>de</strong>ria trazer perda <strong>de</strong> informação química.Como discuti<strong>do</strong> anteriormente, o méto<strong>do</strong> <strong>MDL</strong> po<strong>de</strong> ser usa<strong>do</strong> <strong>para</strong> selecionaruma wavelet apropriada <strong>para</strong> o processo <strong>de</strong> remoção <strong>de</strong> ruí<strong>do</strong>. Essa escolha ébaseada no menor valor obti<strong>do</strong> pela minimização da função custo <strong>MDL</strong>. Através <strong>do</strong>sRMSE’s obti<strong>do</strong>s pela técnica <strong>MDL</strong> <strong>para</strong> os vinte e <strong>do</strong>is filtros, em cada um <strong>do</strong>scinqüenta espectros, po<strong>de</strong>mos avaliar a eficiência <strong>de</strong>ssa escolha. Na Tabela 2 sãoapresenta<strong>do</strong>s os erros obti<strong>do</strong>s pelas três técnicas nos espectros em que o <strong>MDL</strong>obteve o melhor e o pior <strong>de</strong>sempenho, respectivamente, no que diz respeito àseleção <strong>do</strong> filtro ótimo.Tabela 2 Com<strong>para</strong>ção entre as técnicas <strong>para</strong> o melhor (espectro 47) e o pior (espectro 5)resulta<strong>do</strong> na seleção da função wavelet pelo critério <strong>MDL</strong>.FiltrowaveletEspectro 47 Espectro 5Suave Rígida k <strong>MDL</strong> k Suave Rígida k <strong>MDL</strong> kDb1 1,33 1,38 679 1,57 196 1,30 1,35 674 1,55 194Db2 1,05 1,35 651 1,05 152 1,01 1,30 598 0,99 145Db3 1,02 1,35 642 1,04 139 0,99 1,32 625 0,98 128Db4 1,02 1,36 663 1,01 148 0,99 1,32 653 0,93 138Db5 1,04 1,36 659 1,01 141 1,00 1,33 633 0,94 147Db6 1,05 1,37 709 1,02 135 1,01 1,33 636 0,93 139Db7 1,05 1,38 682 1,04 142 1,02 1,35 671 0,96 134Db8 1,05 1,38 739 1,06 152 1,02 1,36 712 0,98 142Db9 1,06 1,37 716 1,07 146 1,03 1,35 725 0,97 147Db10 1,06 1,39 761 1,03 148 1,04 1,35 725 0,97 144Sym4 1,02 1,35 624 1,02 135 1,00 1,33 627 0,98 133Sym5 1,03 1,36 667 1,01 142 1,01 1,33 648 0,98 146Sym6 1,03 1,37 678 1,01 132 1,02 1,33 612 0,98 131Sym7 1,05 1,38 711 1,07 154 1,02 1,34 677 0,94 145Sym8 1,04 1,38 697 1,03 137 1,02 1,34 670 0,96 131Sym9 1,05 1,38 709 1,02 155 1,03 1,35 688 0,98 146Sym10 1,05 1,38 716 1,01 148 1,02 1,34 660 0,97 130Coif1 1,04 1,34 616 1,06 138 1,03 1,30 571 1,04 138Coif2 1,03 1,36 670 1,02 137 1,00 1,33 622 0,94 123Coif3 1,03 1,37 693 1,03 138 1,02 1,33 609 1,01 125Coif4 1,05 1,38 717 1,03 141 1,02 1,34 649 0,95 128Coif5* 1,04 1,38 730 1,00 134 1,02 1,34 640 0,99 129


Entre os cinqüenta espectros analisa<strong>do</strong>s, o espectro 47 foi o que o <strong>MDL</strong>apresentou o melhor <strong>de</strong>sempenho na seleção <strong>do</strong> filtro wavelet, obten<strong>do</strong> o mínimovalor da função-custo <strong>para</strong> a wavelet Coiflet 5, que obteve o menor RMSE entre osvinte e <strong>do</strong>is filtros. Já no espectro 5, apesar <strong>de</strong> o <strong>MDL</strong> ter seleciona<strong>do</strong> o mesmo filtrowavelet (Coiflet 5), este apresentou o 18º menor erro, sen<strong>do</strong> o pior <strong>de</strong>sempenho <strong>do</strong><strong>MDL</strong> na seleção <strong>do</strong> filtro ótimo. É interessante notar que, em ambos os espectros, oserros obti<strong>do</strong>s pela wavelet escolhida através <strong>do</strong> uso da técnica <strong>MDL</strong> foram menoresque os obti<strong>do</strong>s pelas outras técnicas.A abordagem <strong>MDL</strong> tem um compromisso com a parcimônia na seleção <strong>do</strong>scoeficientes wavelet. Sua função-custo busca um limiar que permita umareconstrução com o mínimo possível <strong>de</strong> coeficientes e com um erro aceitavelmentebaixo, garanti<strong>do</strong> pela função penalizante contida no segun<strong>do</strong> termo da função custo.Tal característica foi evi<strong>de</strong>nciada experimentalmente através <strong>do</strong> número <strong>de</strong>coeficientes seleciona<strong>do</strong>s <strong>para</strong> cada wavelet pelo méto<strong>do</strong> <strong>MDL</strong>. Pela inspeção <strong>do</strong>sgráficos <strong>de</strong> barras da Figura 4.25, po<strong>de</strong>mos notar que o limiar <strong>MDL</strong> obteve <strong>para</strong>todas as funções um número muito menor <strong>de</strong> coeficientes que as técnicas baseadasno limiar universal.


Figura 4.25 Com<strong>para</strong>ção <strong>do</strong> número <strong>de</strong> coeficientes wavelet escolhi<strong>do</strong>s através das 22wavelets <strong>para</strong> os espectros 5 e 47, respectivamente, usan<strong>do</strong>-se o limiar universal (barrascinza) e o limiar <strong>MDL</strong> (barras azuis).Para o espectro 47, por exemplo, o <strong>MDL</strong> indicou que apenas 134 coeficientes,<strong>de</strong> um total <strong>de</strong> 4480, seriam necessários <strong>para</strong> a reconstrução <strong>do</strong> espectro commínima distorção, enquanto que as técnicas baseadas no limiar universal indicaram730 coeficientes, o quádruplo <strong>do</strong>s coeficientes da técnica <strong>MDL</strong> <strong>para</strong> o mesmoespectro. Para o espectro 5, o <strong>MDL</strong> escolheu apenas 128 coeficientes, sen<strong>do</strong> o 5ºresulta<strong>do</strong> mais parcimonioso entre as vinte e duas wavelets, o que po<strong>de</strong> explicar oerro relativamente alto da wavelet escolhida pelo <strong>MDL</strong> <strong>para</strong> este espectro, quiçá,pela busca <strong>de</strong> um equilíbrio entre a parcimônia e o erro da reconstrução, inerentes àfunção-custo <strong>do</strong> <strong>MDL</strong>.O <strong>MDL</strong> apresentou consi<strong>de</strong>rável robustez na seleção da função wavelet,selecionan<strong>do</strong> o mesmo filtro (coiflet 5) em 64% <strong>do</strong>s cinqüenta espectros individuais.O filtro Sym8 foi seleciona<strong>do</strong> em 20% <strong>do</strong>s casos, e somente cinco filtros foramseleciona<strong>do</strong>s nos restantes 16% <strong>do</strong>s espectros (Figura 4.26).


Figura 4.26 Gráfico <strong>de</strong> barras apresentan<strong>do</strong> a extensão da seleção <strong>do</strong> filtro wavelet pelosnos espectros individuais.Vale salientar que <strong>para</strong> as técnicas Rígida e Dura não há um critério objetivo<strong>para</strong> a escolha <strong>do</strong> filtro wavelet, dificultan<strong>do</strong> em muito a tarefa <strong>do</strong> analista.4.3 Experimento 3 – Dipirona Sódica / Espectrometria NIRRO foco <strong>de</strong>ste experimento é a remoção <strong>de</strong> ruí<strong>do</strong> em sinais <strong>de</strong> refletânciadifusa na região <strong>do</strong> infravermelho próximo. Porém, diferentemente <strong>do</strong> experimentoanterior, os espectros foram registra<strong>do</strong>s em um equipamento <strong>de</strong> outro fabricante(Perkin Elmer) e usan<strong>do</strong> um <strong>de</strong>tector diferente (DTGS). Além disso, a amostra emquestão, por se tratar <strong>de</strong> um sóli<strong>do</strong> em pó, apresenta maior suscetibilida<strong>de</strong> aproduzir espectros rui<strong>do</strong>sos. Tal comportamento po<strong>de</strong> ser confirma<strong>do</strong> pela inspeçãoda Figura 4.27a, que apresenta o espectro <strong>de</strong> dipirona sódica obti<strong>do</strong> pelapromediação <strong>de</strong> 256 varreduras (ver<strong>de</strong>) e um espectro <strong>de</strong> varredura unitária (preto),na região <strong>de</strong> 7.500 a 4.000 cm -1 .


Figura 4.27 Espectro <strong>de</strong> referência e um espectro <strong>de</strong> varredura unitária <strong>de</strong> uma amostra <strong>do</strong>princípio-ativo dipirona sódica, (a) antes e (b) <strong>de</strong>pois da correção da linha <strong>de</strong> base peloEMSC.Notadamente, o espectro <strong>de</strong> varredura unitária <strong>do</strong> princípio-ativo dipironaapresenta-se mais rui<strong>do</strong>so que o espectro <strong>do</strong> experimento anterior, apresentan<strong>do</strong>ruí<strong>do</strong> proeminente em todas as regiões, a ponto <strong>de</strong> <strong>de</strong>formar algumas feiçõespresentes no sinal <strong>de</strong> referência, o que po<strong>de</strong> comprometer a obtenção <strong>de</strong> umespectro similar a este pelas técnicas aqui estudadas. Os problemas <strong>de</strong><strong>de</strong>slocamento da linha <strong>de</strong> base também se mostraram maiores, sen<strong>do</strong> aplicada atécnica EMCS <strong>para</strong> a correção <strong>do</strong>s mesmos (Figura 4.27b).To<strong>do</strong>s os espectros resultantes compreen<strong>de</strong>m 3.712 variáveis, um númeroa<strong>de</strong>qua<strong>do</strong> <strong>para</strong> a aplicação das técnicas <strong>de</strong> remoção <strong>de</strong> ruí<strong>do</strong> por TW. O nívelmáximo <strong>de</strong> <strong>de</strong>composição <strong>do</strong> banco <strong>de</strong> filtros foi escolhi<strong>do</strong> pela função wmaxlev.m,que indicou o uso <strong>de</strong> 7 níveis.Cada um <strong>do</strong>s cinqüenta espectros <strong>de</strong> varredura unitária foi submeti<strong>do</strong> às trêstécnicas <strong>de</strong> remoção <strong>de</strong> ruí<strong>do</strong> por Transformada wavelet, e o RMSE individual e


médio foi calcula<strong>do</strong> entre os espectros reconstruí<strong>do</strong>s e o espectro <strong>de</strong> referência,obti<strong>do</strong> pela promediação <strong>de</strong> 256 varreduras.Na Figura 4.28, po<strong>de</strong>mos visualizar os espectros reconstruí<strong>do</strong>s pelas trêstécnicas, o espectro <strong>de</strong> referência e o espectro <strong>de</strong> varredura unitária.Figura 4.28 Sinais reconstruí<strong>do</strong>s pelas técnicas <strong>MDL</strong>, Rígi<strong>do</strong> e Suave, sinal <strong>de</strong> referência esinal rui<strong>do</strong>so <strong>para</strong> a mesma amostra <strong>do</strong> princípio-ativo dipirona sódica.Como po<strong>de</strong>mos notar, o ruí<strong>do</strong> proeminente no espectro <strong>de</strong> varredura semanteve nos espectros reconstruí<strong>do</strong>s pelas técnicas Suave e Rígida. A técnica <strong>MDL</strong>removeu consi<strong>de</strong>rável porção <strong>do</strong> ruí<strong>do</strong>, porém, alguns artefatos aindapermaneceram <strong>de</strong>vi<strong>do</strong> ao eleva<strong>do</strong> ruí<strong>do</strong> no espectro bruto. Ao trabalharmos comamostras suscetíveis a produzirem espectros muito rui<strong>do</strong>sos, talvez uma varreduraseja insuficiente <strong>para</strong> a obtenção <strong>de</strong> um espectro reconstruí<strong>do</strong> fiel ao espectro <strong>de</strong>referência. Em tais casos, um estu<strong>do</strong> com mais varreduras é recomendável. NaFigura 4.29 é mostra<strong>do</strong> o comportamento das técnicas na remoção <strong>de</strong> ruí<strong>do</strong> em umespectro obti<strong>do</strong> pela promediação <strong>de</strong> quatro varreduras.


Figura 4.29 De cima <strong>para</strong> baixo, sinais reconstruí<strong>do</strong>s pelas técnicas <strong>MDL</strong>, Rígi<strong>do</strong> e Suave,sinal <strong>de</strong> referência e sinal rui<strong>do</strong>so <strong>para</strong> a mesma amostra <strong>do</strong> princípio-ativo dipirona.Igualmente ao experimento com o espectro <strong>de</strong> uma varredura, as técnicasbaseadas no limiar universal também não foram eficientes na extração <strong>do</strong>componente rui<strong>do</strong>so, manten<strong>do</strong> consi<strong>de</strong>rável porção em seus espectrosreconstruí<strong>do</strong>s. Por outro la<strong>do</strong>, a técnica <strong>MDL</strong> mostrou-se eficiente, excluin<strong>do</strong> a maiorparte <strong>do</strong> ruí<strong>do</strong> e conservan<strong>do</strong> apenas pequenas <strong>de</strong>formações inerentes ao espectrobruto, em menor proporção que as observadas no espectro reconstruí<strong>do</strong> <strong>de</strong> umaúnica varredura. Na região compreendida entre 5.400 e 4.000 cm -1 , o espectroreconstruí<strong>do</strong> pela técnica <strong>MDL</strong> é similar ao <strong>de</strong> referência, apesar da gran<strong>de</strong>diferença no número <strong>de</strong> varreduras, e conseqüentemente, no tempo <strong>de</strong>spendi<strong>do</strong><strong>para</strong> a sua obtenção.De fato, <strong>para</strong> o equipamento em questão, um espectro promedia<strong>do</strong> por quatrovarreduras foi obti<strong>do</strong> em 1 minuto, enquanto o espectro obti<strong>do</strong> por 256 varredurasnecessitou <strong>de</strong> aproximadamente 35 minutos. Em um experimento normal,comumente utiliza-se uma média <strong>de</strong> 32 a 64 varreduras, mesmo assim,<strong>de</strong>mandan<strong>do</strong> um tempo consi<strong>de</strong>rável. Isso po<strong>de</strong> ser uma <strong>de</strong>svantagem emaplicações on<strong>de</strong> a rapi<strong>de</strong>z é fator prepon<strong>de</strong>rante, como em Tecnologia Analítica <strong>de</strong>Processos.


Na Figura 4.30 são mostra<strong>do</strong>s os RMSE’s obti<strong>do</strong>s pelas técnicas Rígida,Suave e <strong>MDL</strong>, com relação as vinte e duas wavelets. Essa avaliação quantitativacorrobora os resulta<strong>do</strong>s obti<strong>do</strong>s pela inspeção visual <strong>do</strong>s espectros, com a técnica<strong>MDL</strong> obten<strong>do</strong> os menores erros, bem abaixo das técnicas baseadas no limiaruniversal, com exceção <strong>para</strong>s a wavelet Daubechies 1, on<strong>de</strong> o <strong>MDL</strong> apresentou umRMSE eleva<strong>do</strong>.Figura 4.30 Curva <strong>do</strong> RMSE médio x função wavelet <strong>para</strong> as três técnicas <strong>de</strong> remoção <strong>de</strong>ruí<strong>do</strong> por Transformada wavelet <strong>para</strong> os espectros <strong>de</strong> dipirona sódica.Entre as vinte e duas wavelets contidas na biblioteca <strong>de</strong> funções, o <strong>MDL</strong>apontou como ótima a wavelet coiflet 5, que forneceu o quinto menor RMSE, cujovalor não difere estatisticamente <strong>do</strong> menor erro, segun<strong>do</strong> um teste F realiza<strong>do</strong> com95% <strong>de</strong> confiança.Em relação à capacida<strong>de</strong> <strong>de</strong> compressão das duas funções <strong>de</strong> limiar <strong>para</strong> awavelet escolhida pelo limiar <strong>MDL</strong>, apenas 194 coeficientes foram escolhi<strong>do</strong>s <strong>de</strong> umtotal <strong>de</strong> 3712, enquanto que o limiar universal escolheu 1565 coeficientes, umnúmero oito vezes maior, reforçan<strong>do</strong> as vantagens <strong>de</strong> compressão <strong>de</strong> sinais daabordagem <strong>MDL</strong>.Dessa forma, <strong>para</strong> o problema <strong>de</strong> remoção <strong>de</strong> ruí<strong>do</strong> em espectros <strong>de</strong>refletância difusa <strong>de</strong> amostras sólidas em pó usan<strong>do</strong>-se um número pequeno <strong>de</strong>varreduras, po<strong>de</strong>mos concluir que a técnica <strong>MDL</strong> apresentou resulta<strong>do</strong>s maissatisfatórios que as técnicas Rígida e Suave. O <strong>MDL</strong>, além <strong>de</strong> resultar em erros maisbaixos em relação ao espectro <strong>de</strong> referência, permitiu a reconstrução com menos


informação espúria <strong>do</strong> sinal, através da seleção <strong>de</strong> um número muito menor <strong>de</strong>coeficientes, possibilitan<strong>do</strong> um espectro muito similar ao espectro <strong>de</strong> referência.Além disso, a wavelet a ser utilizada po<strong>de</strong> ser escolhida automaticamente, nãonecessitan<strong>do</strong> <strong>de</strong> inferências <strong>do</strong> analista, principalmente por não haver um critério<strong>de</strong>fini<strong>do</strong> usan<strong>do</strong>-se as outras duas técnicas.4.4 Experimento 4 – Óleo Diesel / Espectrometria NIRNeste experimento os resulta<strong>do</strong>s obti<strong>do</strong>s por GALVÃO et al (2007) em umartigo publica<strong>do</strong> na Analytica Chimica Acta foram reproduzi<strong>do</strong>s e contrasta<strong>do</strong>s comos obti<strong>do</strong>s pela técnica <strong>MDL</strong>.Para a remoção da linha <strong>de</strong> base, diferentemente <strong>do</strong>s experimentosanteriores, foi emprega<strong>do</strong> o procedimento usa<strong>do</strong> pelos autores, que consiste emsubtrair a média <strong>de</strong> cada espectro sobre ele mesmo.Para com<strong>para</strong>r as técnicas em termos visuais, os autores utilizaram umcritério <strong>para</strong> <strong>de</strong>finir um número <strong>de</strong> varreduras i<strong>de</strong>al, acima <strong>do</strong> qual o tempoconsumi<strong>do</strong> não justificaria varreduras adicionais. O critério baseia-se na melhora daqualida<strong>de</strong> <strong>do</strong> sinal na medida em que se aumenta o número <strong>de</strong> varreduras, até umponto em que a melhora não seja mais significativa. Detalhes sobre o critério po<strong>de</strong>mser encontra<strong>do</strong>s na referência supracitada. Segun<strong>do</strong> o critério, foi a<strong>do</strong>ta<strong>do</strong> comoespectro bruto, o obti<strong>do</strong> pela promediação <strong>de</strong> <strong>de</strong>zesseis varreduras, sen<strong>do</strong>, então,calcula<strong>do</strong> o RMSE em relação ao espectro <strong>de</strong> referência.Os espectros compreen<strong>de</strong>m 2560 variáveis, portanto, um número a<strong>de</strong>qua<strong>do</strong><strong>para</strong> a aplicação das técnicas <strong>de</strong> remoção <strong>de</strong> ruí<strong>do</strong> por TW. O número máximo <strong>de</strong>níveis <strong>de</strong> <strong>de</strong>composição <strong>do</strong> banco <strong>de</strong> filtros foi escolhi<strong>do</strong> pela função wmaxlev.m,que indicou 7 níveis.A Figura 4.31 apresenta o espectro bruto, bem como os espectros <strong>de</strong>referência e os trata<strong>do</strong>s pelas quatro técnicas em estu<strong>do</strong>. Po<strong>de</strong>mos notar que, comexceção da técnica Rígida, todas as outras técnicas resultaram em espectros maissuaviza<strong>do</strong>s. Quan<strong>do</strong> com<strong>para</strong><strong>do</strong>s com o espectro <strong>de</strong> referência, os resulta<strong>do</strong>s sãosemelhantes aos obti<strong>do</strong>s no Experimental 2, com o <strong>MDL</strong> apresentan<strong>do</strong> o espectromais similar.


Figura 4.31 Espectro bruto, espectro <strong>de</strong> referência e os espectros reconstruí<strong>do</strong>s apósremoção <strong>de</strong> ruí<strong>do</strong> pelas técnicas em estu<strong>do</strong>. Diferentes <strong>de</strong>slocamentos <strong>do</strong> eixo y foramadiciona<strong>do</strong>s <strong>para</strong> melhor visualização.As principais diferenças po<strong>de</strong>m ser vistas na região <strong>do</strong> short-NIR, on<strong>de</strong> arelação sinal-ruí<strong>do</strong> é relativamente pobre. A Figura 4.32 apresenta essa região (850-900 nm), em maior <strong>de</strong>talhe.Figura 4.32 Corte realiza<strong>do</strong> na região <strong>do</strong> short-NIR, <strong>do</strong> espectro bruto, espectro <strong>de</strong>referência e <strong>do</strong>s espectros reconstruí<strong>do</strong>s após remoção <strong>de</strong> ruí<strong>do</strong>.


Pela inspeção da região <strong>do</strong> short-NIR, po<strong>de</strong>mos notar que o <strong>MDL</strong> apresentouo melhor resulta<strong>do</strong>, removen<strong>do</strong> to<strong>do</strong> o ruí<strong>do</strong> presente no espectro bruto na regiãoacima <strong>de</strong> 900 nm, sem distorcer o sinal, restan<strong>do</strong> apenas alguns artefatos na regiãoinferior a essa, <strong>de</strong>vi<strong>do</strong> ao comprometimento <strong>do</strong> espectro bruto.Contu<strong>do</strong>, os resulta<strong>do</strong>s qualitativos contrastam com os obti<strong>do</strong>s pelacom<strong>para</strong>ção através <strong>do</strong> cálculo <strong>do</strong> RMSE, como po<strong>de</strong>mos ver na Figura 4.33 e naTabela 3.Figura 4.33 Curva <strong>do</strong> RMSE médio x função wavelet <strong>para</strong> as quatro técnicas <strong>de</strong> remoção <strong>de</strong>ruí<strong>do</strong> por Transformada Wavelet <strong>para</strong> os espectros <strong>de</strong> óleo diesel.O <strong>MDL</strong> resultou em erros maiores que as técnicas Suave e Subótima, <strong>para</strong>to<strong>do</strong>s os filtros wavelet. Este comportamento conflitante entre os resulta<strong>do</strong>s <strong>de</strong>RMSE e a inspeção visual <strong>do</strong>s espectros, que aponta claramente uma superiorida<strong>de</strong><strong>do</strong> <strong>MDL</strong> em relação à eficiência da remoção <strong>de</strong> ruí<strong>do</strong>, po<strong>de</strong> ser explica<strong>do</strong> pelapresença <strong>de</strong> consi<strong>de</strong>rável ruí<strong>do</strong> na região <strong>do</strong> short-NIR <strong>do</strong> espectro <strong>de</strong> referência,que comprometeu a eficiência da métrica <strong>do</strong> RMSE. De fato, o <strong>MDL</strong> resultou em umespectro mais limpo que o próprio espectro <strong>de</strong> referência.


Tabela 3 Valores <strong>de</strong> RMSE, obti<strong>do</strong>s pelas quatro técnicas frente aos vinte e <strong>do</strong>is filtroswavelet, entre o espectro <strong>de</strong> referência e o obti<strong>do</strong> pela promediação <strong>de</strong> 16 varreduras. Awavelet selecionada com base no critério <strong>MDL</strong> seria a Sym5, indicada com um asterisco*.RMSE (x10 -3 )FiltroWaveletSuave Rígida kTécnicas <strong>de</strong> remoção <strong>de</strong> ruí<strong>do</strong>Subótimak <strong>MDL</strong> kDb1 1,55 1,26 487 0,96 1043 2,18 151Db2 0,90 1,11 459 0,89 387 0,98 115Db3 0,88 1,10 435 0,89 333 0,94 91Db4 0,86 1,10 427 0,88 311 0,94 97Db5 0,85 1,10 409 0,86 319 0,92 94Db6 0,86 1,10 371 0,86 302 0,91 80Db7 0,85 1,10 396 0,87 318 0,90 93Db8 0,85 1,12 468 0,86 327 0,93 87Db9 0,85 1,11 443 0,86 331 0,90 91Db10 0,86 1,11 434 0,85 321 0,89 90Sym4 0,86 1,11 430 0,87 339 0,91 89Sym5* 0,87 1,11 433 0,86 314 0,90 76Sym6 0,86 1,11 427 0,88 345 0,91 86Sym7 0,86 1,11 421 0,89 322 0,89 91Sym8 0,85 1,11 426 0,87 345 0,90 88Sym9 0,85 1,11 440 0,82 322 0,88 83Sym10 0,84 1,10 409 0,83 344 0,90 93Coif1 0,89 1,10 432 0,87 405 0,97 111Coif2 0,86 1,11 424 0,88 329 0,89 83Coif3 0,85 1,10 387 0,87 331 0,90 86Coif4 0,84 1,10 419 0,86 320 0,88 87Coif5 0,84 1,10 406 0,82 327 0,88 88A função wavelet escolhida pelo <strong>MDL</strong> como ótima foi a wavelet Symlet 5, queapresentou o 12º menor erro, porém, através <strong>de</strong> um teste-F com 95% <strong>de</strong> confiança,constata-se que este valor não é estatisticamente significativo ao menor valor. Valeressaltar que a wavelet Symlet 5 permitiu a reconstrução <strong>do</strong> sinal com apenas 76coeficientes, o resulta<strong>do</strong> mais parcimonioso entre as 22 wavelets, bem menor que onúmero <strong>de</strong> coeficientes necessários <strong>para</strong> a reconstrução <strong>do</strong>s espectros pelo limiarUniversal, que necessitou <strong>de</strong> até seis vezes mais coeficientes que o limiar <strong>MDL</strong>. O


limiar Subótimo, por sua vez, necessitou <strong>de</strong> quatro vezes mais coeficientes que o<strong>MDL</strong>, porém, superan<strong>do</strong> as técnicas baseadas no limiar universal, com exceção <strong>para</strong>o filtro wavelet Haar, no qual apresentou <strong>de</strong>sempenho assaz fraco. Ocomportamento <strong>de</strong> cada uma das vinte e duas wavelets, com respeito ao número <strong>de</strong>coeficientes seleciona<strong>do</strong>s em cada técnica, po<strong>de</strong> ser visto na Figura 4.34 e naTabela 3, acima.Figura 4.34 Curvas <strong>do</strong> número <strong>de</strong> coeficientes seleciona<strong>do</strong>s pelas quatro técnicas <strong>de</strong>remoção <strong>de</strong> ruí<strong>do</strong>, <strong>para</strong> as 22 funções wavelet.É interessante notar o comportamento das técnicas com relação ao filtrowavelet Daubechies 1, que apresentou resulta<strong>do</strong> diverso aos outros filtros. Devi<strong>do</strong>ao comprimento <strong>de</strong>ste filtro (2), o menor entre todas as 22 wavelets, maiscoeficientes foram necessários <strong>para</strong> a reconstrução <strong>do</strong>s espectros, elevan<strong>do</strong> oRMSE <strong>para</strong> as técnicas <strong>MDL</strong>, Rígida e Suave. A técnica Subótima obteve <strong>para</strong> essawavelet, um RMSE similar aos obti<strong>do</strong>s <strong>para</strong> as outras 21, porém, sacrifican<strong>do</strong> aparcimônia, necessitan<strong>do</strong> <strong>de</strong> 1043 coeficientes wavelet <strong>para</strong> a a<strong>de</strong>quadareconstrução <strong>do</strong> espectro, um número onze vezes maior que o seleciona<strong>do</strong> pelo<strong>MDL</strong> <strong>para</strong> a mesma função.


4.5 Experimento 5 – Extrato vegetal / 1 H RMNNeste experimento, diferentemente <strong>do</strong>s outros aborda<strong>do</strong>s nesta dissertação, éestudada a remoção <strong>de</strong> ruí<strong>do</strong> em espectros <strong>de</strong> Ressonância Magnética Nuclear.Semelhante à espectrometria no infravermelho próximo, a RMN também opera comTransformada <strong>de</strong> Fourier, sen<strong>do</strong> um exemplo clássico <strong>do</strong> emprego da promediação<strong>de</strong> sinais objetivan<strong>do</strong> o aumento da relação sinal-ruí<strong>do</strong>. Cortes <strong>do</strong> espectro brutoobti<strong>do</strong> pela promediação <strong>de</strong> <strong>de</strong>zesseis transientes, e <strong>do</strong> espectro <strong>de</strong> referência,promedia<strong>do</strong> por mil e vinte e quatro transientes, são mostra<strong>do</strong>s na Figura 4.35.Figura 4.35 Espectro <strong>de</strong> 1 H RMN obti<strong>do</strong> pela promediação <strong>de</strong> (cima) 1024 varreduras, e(baixo) 16 varreduras.Os <strong>do</strong>is espectros resultaram em 32.768 pontos cada, ou seja, umcomprimento a<strong>de</strong>qua<strong>do</strong> <strong>para</strong> o bom funcionamento <strong>do</strong> banco <strong>de</strong> filtros wavelet.Espectros <strong>de</strong> RMN geralmente são registra<strong>do</strong>s com um tamanho múltiplo <strong>de</strong> 16.384(chama<strong>do</strong> <strong>de</strong> 16 k) <strong>para</strong> a a<strong>de</strong>quada execução <strong>do</strong> algoritmo que calcula a


transformada <strong>de</strong> Fourier (LAMBERT e MAZZOLA, 2004). Assim, não houvepreocupação com a a<strong>de</strong>quação no tamanho <strong>do</strong> espectro, como também não foinecessário o uso <strong>de</strong> técnicas <strong>de</strong> atenuação da linha <strong>de</strong> base, já que os espectros seapresentaram bem sobrepostos. O nível máximo <strong>de</strong> <strong>de</strong>composição <strong>do</strong> banco <strong>de</strong>filtros wavelet foi fixa<strong>do</strong> em 10 através da função wmaxlev.m.Através da Figura 4.36 po<strong>de</strong> ser observa<strong>do</strong> que as técnicas Suave, Rígida e<strong>MDL</strong> foram eficazes na remoção <strong>do</strong> ruí<strong>do</strong> presente no espectro bruto obti<strong>do</strong> por<strong>de</strong>zesseis varreduras. Apesar <strong>do</strong> proeminente ruí<strong>do</strong> conti<strong>do</strong> neste, os espectrosreconstruí<strong>do</strong>s pelas três técnicas se mostraram muito similares ao espectro <strong>de</strong>referência, obti<strong>do</strong> pela promediação <strong>de</strong> 1024 transientes. Igualmente ao observa<strong>do</strong>nos sinais sintéticos <strong>do</strong> Experimento 1, a natureza homoscedástica <strong>do</strong> ruí<strong>do</strong> nestesespectros contribuiu fortemente <strong>para</strong> o bom funcionamento das duas funções <strong>de</strong>limiar.Figura 4.36 Espectros <strong>de</strong> 1 H RMN reconstruí<strong>do</strong>s pela TW através das técnicas <strong>MDL</strong>, Rígidae Suave, e os espectros obti<strong>do</strong>s pela promediação <strong>de</strong> (cima) 1024 varreduras, e (baixo) 16varreduras.


Figura 4.37 Corte nos espectros <strong>de</strong> 1 H RMN reconstruí<strong>do</strong>s pelas técnicas <strong>MDL</strong> (vermelho),Rígida (ver<strong>de</strong>) e Suave (azul).Dessa forma, como ambos os limiares funcionaram bem, a diferença <strong>de</strong>eficiência entre as três técnicas foi influenciada pelo rigor no tratamento <strong>do</strong>scoeficientes wavelet, isto é, pela função <strong>de</strong> limiarização, o que po<strong>de</strong> ser constata<strong>do</strong>pela análise das Figuras 4.36-37, além da Tabela 4. De fato, a técnica Suave, <strong>de</strong>vi<strong>do</strong>à sua função <strong>de</strong> limiarização mais severa, atenuan<strong>do</strong> os coeficientes <strong>de</strong> <strong>de</strong>talhecujos valores estão acima <strong>do</strong> limiar, resultou nos maiores valores <strong>de</strong> RMSE,justamente por distorcer o sinal em algumas regiões, como por exemplo, a diferençaem intensida<strong>de</strong> no pico localiza<strong>do</strong> em volta <strong>de</strong> 1,65 ppm (Figura 4.37) , em relaçãoaos espectros reconstruí<strong>do</strong>s através das técnicas que fazem uso da função <strong>de</strong>limiarização Rígida (Rígida e <strong>MDL</strong>). Entre elas, a técnica Rígida obteve os menoresvalores <strong>de</strong> RMSE, também corroboran<strong>do</strong> os resulta<strong>do</strong>s obti<strong>do</strong>s com sinais sintéticoscom ruí<strong>do</strong> homoscedástico (Experimento 1).


Tabela 4 Com<strong>para</strong>ção entre as técnicas <strong>para</strong> o melhor e o pior resulta<strong>do</strong> na seleção dafunção wavelet. A wavelet selecionada com base no critério <strong>MDL</strong> é indicada com umasterisco.RMSEFiltroWaveletTécnicas <strong>de</strong> remoção <strong>de</strong> ruí<strong>do</strong>Suave Rígida k <strong>MDL</strong> kDb1 135,81 85,67 358 94,90 310Db2 111,25 67,65 257 74,12 229Db3 108,32 64,09 258 69,82 233Db4 107,61 63,43 260 69,87 232Db5 112,91 62,22 278 68,40 254Db6 115,19 63,31 294 67,87 272Db7 113,33 64,69 287 70,54 268Db8 116,34 64,05 305 69,99 283Db9 118,70 66,73 310 70,27 294Db10 121,58 63,15 338 69,82 309Sym4 109,03 64,23 248 71,51 222Sym5 107,96 64,07 260 72,22 232Sym6 110,33 63,79 260 69,62 239Sym7 109,58 61,61 267 68,36 238Sym8 113,04 65,82 270 71,89 248Sym9 110,71 63,01 286 71,73 256Sym10 113,68 65,19 275 72,40 249Coif1 111,96 66,31 265 74,91 233Coif2* 107,30 63,08 247 69,11 226Coif3 112,40 64,77 265 71,61 242Coif4 113,04 64,63 271 71,61 248Coif5 114,54 65,62 281 71,94 259A boa eficiência na remoção <strong>de</strong> ruí<strong>do</strong> <strong>de</strong>sempenhada pelas três técnicas aquiestudadas, além <strong>do</strong> pequeno número <strong>de</strong> coeficientes wavelet seleciona<strong>do</strong>s porambas as técnicas <strong>de</strong> limiar (até cem vezes menores), po<strong>de</strong> ser explica<strong>do</strong> pelahomoscedasticida<strong>de</strong> <strong>do</strong> ruí<strong>do</strong>, que é uma das premissas <strong>para</strong> o bom funcionamentodas técnicas <strong>de</strong> remoção <strong>de</strong> ruí<strong>do</strong> por Transformada Wavelet.De fato, com o ruí<strong>do</strong> sen<strong>do</strong> homoscedástico, as funções <strong>de</strong> limiar po<strong>de</strong>mtrabalhar <strong>de</strong> forma a<strong>de</strong>quada, visto que o limiar escolhi<strong>do</strong> po<strong>de</strong> abranger toda a faixa


<strong>de</strong> coeficientes, <strong>de</strong>vi<strong>do</strong> à constância da variância <strong>do</strong> ruí<strong>do</strong>, o que não ocorre emespectros heteroscedásticos. O número <strong>de</strong> coeficientes seleciona<strong>do</strong>s pelos limiaresuniversal e <strong>MDL</strong> <strong>para</strong> os espectros <strong>de</strong> RMN corroboram este comportamento, vistoque ambas selecionaram números aproxima<strong>do</strong>s <strong>de</strong> coeficientes, com uma levevantagem <strong>para</strong> a técnica <strong>MDL</strong> em todas as wavelets. Para a wavelet selecionadapelo <strong>MDL</strong> (Coif2), foi necessário menos que o 1% (226 coeficientes) <strong>do</strong> número <strong>de</strong>variáveis iniciais (32768 variáveis).Este experimento mostrou a viabilida<strong>de</strong> da remoção <strong>de</strong> ruí<strong>do</strong> porTransformada Wavelet em espectros <strong>de</strong> RMN obti<strong>do</strong>s por poucas varreduras,possibilitan<strong>do</strong> a economia <strong>de</strong> tempo <strong>de</strong> equipamento e opera<strong>do</strong>r, visto que <strong>para</strong> aobtenção <strong>de</strong> um espectro, por exemplo, <strong>de</strong> 16 varreduras, é necessário menos <strong>de</strong>um minuto, enquanto <strong>para</strong> obter um espectro <strong>de</strong> 1024 varreduras são requeri<strong>do</strong>s 84minutos.Além disso, o uso da técnica <strong>MDL</strong> permite que a filtragem seja realizada seminferências <strong>do</strong> opera<strong>do</strong>r, já que a técnica seleciona automaticamente um limiar e afunção wavelet a<strong>de</strong>quada. Soma<strong>do</strong>s o tempo <strong>de</strong> equipamento e o tempocomputacional <strong>para</strong> o cálculo da TW, o procedimento completo po<strong>de</strong> ser efetua<strong>do</strong>em menos <strong>de</strong> <strong>do</strong>is minutos, <strong>para</strong> espectros <strong>de</strong> tamanho 32 kptos.4.6 Estu<strong>do</strong> <strong>do</strong>s resulta<strong>do</strong>s obti<strong>do</strong>s nos Experimentos 1-5Neste experimental, cinco experimentos foram realiza<strong>do</strong>s acerca <strong>do</strong> problemada remoção <strong>de</strong> ruí<strong>do</strong> em sinais analíticos usan<strong>do</strong> técnicas baseadas naTransformada Wavelet. Para uma com<strong>para</strong>ção fi<strong>de</strong>digna entre as técnicas aquiabordadas, a saber, <strong>MDL</strong>, Rígida e Suave, foram realiza<strong>do</strong>s estu<strong>do</strong>s usan<strong>do</strong> da<strong>do</strong>ssimula<strong>do</strong>s com diferentes níveis <strong>de</strong> ruí<strong>do</strong>, da<strong>do</strong>s instrumentais <strong>de</strong> EspectrometriaNIR, nos mo<strong>do</strong>s <strong>de</strong> refletância, usan<strong>do</strong> <strong>do</strong>is equipamentos diferentes e duas formasfarmacêuticas, e em absorbância, usan<strong>do</strong> amostras <strong>de</strong> óleo diesel. Da<strong>do</strong>s <strong>de</strong>Ressonância Magnética Nuclear também foram explora<strong>do</strong>s.


O comportamento das diferentes técnicas com relação à escolha da wavelet,limiar e função <strong>de</strong> limiarização, em espectros obti<strong>do</strong>s usan<strong>do</strong>-se um número baixo<strong>de</strong> varreduras, é resumi<strong>do</strong> a seguir em forma <strong>de</strong> tópicos.4.6.1 Escolha da WaveletSelecionar uma função wavelet que melhor se adapte à natureza <strong>do</strong>s da<strong>do</strong>s éuma tarefa não-trivial. Das quatro técnicas estudadas aqui, somente o <strong>MDL</strong> possuium critério <strong>de</strong>fini<strong>do</strong> <strong>para</strong> efetuar tal escolha. As outras técnicas requerem que asvárias funções wavelet sejam testadas, e os resulta<strong>do</strong>s sejam com<strong>para</strong><strong>do</strong>svisualmente, tornan<strong>do</strong>-se uma tarefa ineficiente e <strong>de</strong>pen<strong>de</strong>nte da inferência subjetiva<strong>do</strong> analista (CAI e HARRINGTON, 1998). Uma outra possibilida<strong>de</strong> é o uso <strong>de</strong> umafunção referendada pela literatura <strong>para</strong> um tipo particular <strong>de</strong> sinal, o que po<strong>de</strong> noslevar a um resulta<strong>do</strong> diverso <strong>do</strong> ótimo, visto que <strong>para</strong> um da<strong>do</strong> sinal, duas funçõeswavelet similares po<strong>de</strong>m dar resulta<strong>do</strong>s diferentes. Um exemplo <strong>de</strong>stecomportamento po<strong>de</strong> ser observa<strong>do</strong> na Figura 4.38, que apresenta um espectro <strong>de</strong>uma amostra <strong>de</strong> Captopril (Experimental 2) reconstruí<strong>do</strong> após o emprego da técnicaSuave usan<strong>do</strong>-se wavelets da família Daubechies.Figura 4.38 Corte nos espectros <strong>de</strong> captopril, reconstruí<strong>do</strong>s pela técnica Suave usan<strong>do</strong>-seas wavelets Daubechies 1-3 e 9-10.


Como po<strong>de</strong>mos notar, os espectros reconstruí<strong>do</strong>s apresentam feiçõesdiferentes, embora as wavelets sejam da mesma família e <strong>de</strong> comprimento <strong>de</strong> filtropróximos (Daubechies 1-3 e 9-10). O espectro reconstruí<strong>do</strong> através da funçãoDaubechies 1 distorceu completamente as curvas, <strong>de</strong>ixan<strong>do</strong>-as retas. Conforme seaumentou o tamanho <strong>do</strong> filtro, as feições <strong>do</strong>s espectros se alteraram, tornan<strong>do</strong>-semais suaves. Esse comportamento nos indica que a escolha <strong>de</strong> uma wavelet aoacaso po<strong>de</strong> levar a resulta<strong>do</strong>s não satisfatórios.Nos cinco experimentos realiza<strong>do</strong>s nesta dissertação, o <strong>MDL</strong> <strong>de</strong>sempenhouconsi<strong>de</strong>rável eficiência na escolha da wavelet ótima. Nos experimentos com sinaissintéticos, on<strong>de</strong> foi realiza<strong>do</strong> um estu<strong>do</strong> com cem sinais gera<strong>do</strong>s e suas respectivaswavelets selecionadas, o <strong>MDL</strong> sempre escolheu wavelets que forneceram baixosvalores <strong>de</strong> RMSE, entre os cinco menores, em aproximadamente 50% <strong>do</strong>s casos.Nos estu<strong>do</strong>s com sinal instrumental real, a wavelet selecionada pelo <strong>MDL</strong> obtevesempre erros que não diferiam significativamente com relação aos menores obti<strong>do</strong>s,comprovan<strong>do</strong> a eficácia da técnica na seleção da melhor função.O <strong>MDL</strong> mostrou ser robusto na seleção da mesma wavelet, visto que apenasalgumas funções foram escolhidas em pre<strong>do</strong>minância. É interessante notar que namaioria <strong>do</strong>s casos o <strong>MDL</strong> selecionou wavelets com filtros <strong>de</strong> comprimento maior,como a Sym9 e Db9, que possuem comprimento <strong>de</strong> 18.4.6.2 Limiar e função <strong>de</strong> limiarizaçãoO <strong>de</strong>sempenho da função <strong>de</strong> limiar é muito <strong>de</strong>pen<strong>de</strong>nte da natureza <strong>do</strong> ruí<strong>do</strong>.Em ruí<strong>do</strong> homoscedástico, como a variância <strong>do</strong> ruí<strong>do</strong> permanece constante em to<strong>do</strong>o sinal, a estimativa <strong>do</strong> limiar torna-se mais fácil, pois po<strong>de</strong> abranger igualmenteto<strong>do</strong>s os coeficientes. Já em da<strong>do</strong>s heteroscedásticos, a estimativa <strong>do</strong> limiar po<strong>de</strong>ser subestimada <strong>para</strong> alguns coeficientes e superestimada <strong>para</strong> outros, causan<strong>do</strong>uma distinção errônea entre ruí<strong>do</strong> e sinal.Nos experimentos com da<strong>do</strong>s sintéticos, cujo ruí<strong>do</strong> é sabidamentehomoscedástico, todas as três técnicas obtiveram bom comportamento. O limiarUniversal obteve melhores resulta<strong>do</strong>s quan<strong>do</strong> associa<strong>do</strong> à limiarização Rígida, queresultou sempre em baixo valores <strong>de</strong> RMSE, além <strong>de</strong> espectros mais fi<strong>de</strong>dignos ao


sinal <strong>de</strong> referência, in<strong>de</strong>pen<strong>de</strong>nte <strong>do</strong> limiar. A técnica <strong>MDL</strong>, embora tenha obti<strong>do</strong>erros um pouco maiores que a técnica Rígida, possibilitou a reconstrução <strong>do</strong>sespectros filtra<strong>do</strong>s com um número menor <strong>de</strong> coeficientes, em to<strong>do</strong>s osexperimentos, mostran<strong>do</strong> maior parcimônia que o limiar universal, sem distorcer osinal. O mesmo comportamento po<strong>de</strong> ser observa<strong>do</strong> nos sinais <strong>de</strong> RessonânciaMagnética Nuclear, que apresentam um forte caráter homoscedástico.Em ruí<strong>do</strong>s cuja variância não é uniforme em to<strong>do</strong> o sinal, como osencontra<strong>do</strong>s nos experimentos com Espectrometria NIR, a estimativa <strong>do</strong> ruí<strong>do</strong>realizada pelo limiar universal foi subestimada, visto ambas as técnicas Rígida eSuave serem incapazes <strong>de</strong> remover o ruí<strong>do</strong> <strong>de</strong> maneira satisfatória. De fato, atécnica <strong>MDL</strong>, apesar <strong>de</strong> utilizar a limiarização Rígida, obteve espectros muitosimilares aos <strong>de</strong> referência, além <strong>de</strong> baixos erros, <strong>de</strong>vi<strong>do</strong>, sobretu<strong>do</strong>, a sua função<strong>de</strong> limiar.Vale salientar que o limiar <strong>MDL</strong> mostrou maior robustez frente aos diferentesregimes <strong>do</strong> ruí<strong>do</strong>, mostran<strong>do</strong> menor suscetibilida<strong>de</strong> à heteroscedasticida<strong>de</strong> <strong>do</strong> ruí<strong>do</strong>que o limiar universal, visto que em to<strong>do</strong>s os experimentos com espectrometria NIRresultou nos espectros menos rui<strong>do</strong>sos e mais semelhantes ao espectro <strong>de</strong>referência.Em to<strong>do</strong>s os casos, o limiar <strong>MDL</strong> selecionou um número menor <strong>de</strong>coeficientes que o limiar Universal, principalmente nos da<strong>do</strong>s com ruí<strong>do</strong>heteroscedástico, cuja diferença chegou a oito vezes menos coeficientes, indican<strong>do</strong>que o limiar <strong>MDL</strong> foi mais eficaz na estimativa <strong>do</strong> ruí<strong>do</strong>. O limiar Subótimo tambémapresentou bons resulta<strong>do</strong>s, mas <strong>de</strong>vi<strong>do</strong> à utilização em apenas um experimento,não foi possível fazer inferências mais aprofundadas.4.6.4 Espectros obti<strong>do</strong>s com poucas varredurasA possibilida<strong>de</strong> <strong>de</strong> se obter espectros usan<strong>do</strong>-se um número pequeno <strong>de</strong>varreduras é muito atraente. Além da economia gerada pela diminuição <strong>de</strong> tempo,tanto <strong>de</strong> opera<strong>do</strong>r e <strong>de</strong> equipamento, a agilida<strong>de</strong> nas análises é uma importantecaracterística, principalmente em aplicações da Tecnologia <strong>de</strong> Processos Analíticos,


agilizan<strong>do</strong> a análise quimiométrica <strong>do</strong>s da<strong>do</strong>s, e conseqüentemente, a obtenção <strong>de</strong>informação.Entre as técnicas estudadas nessa dissertação, o <strong>MDL</strong> é a que mais seadapta a esse fim, visto que resultou nos espectros mais similares aos espectros <strong>de</strong>referência, obti<strong>do</strong> pela promediação <strong>de</strong> um número eleva<strong>do</strong> <strong>de</strong> varreduras. Alémdisso, sua capacida<strong>de</strong> <strong>de</strong> selecionar automaticamente o limiar e a wavelet a<strong>de</strong>quadaà natureza <strong>do</strong>s sinais permite que a análise seja feita livre <strong>de</strong> inferências subjetivas<strong>do</strong> opera<strong>do</strong>r.Nos experimentos usan<strong>do</strong> a Espectrometria NIR, foi possível a obtenção <strong>de</strong>espectros fi<strong>de</strong>dignos aos <strong>de</strong> referência, com o uso <strong>de</strong> apenas uma varredura. Noentanto, <strong>de</strong>pen<strong>de</strong>n<strong>do</strong> <strong>do</strong> nível <strong>de</strong> ruí<strong>do</strong>, algumas varreduras po<strong>de</strong>m seracrescentadas, <strong>de</strong> acor<strong>do</strong> com um estu<strong>do</strong> pormenoriza<strong>do</strong>. Nos da<strong>do</strong>s <strong>de</strong> RMN,<strong>de</strong>vi<strong>do</strong> à necessida<strong>de</strong> <strong>de</strong> um tempo maior <strong>de</strong> aquisição, o uso <strong>de</strong> um número menor<strong>de</strong> varreduras torna-se fundamental, visto que um espectro obti<strong>do</strong> por 1024varreduras po<strong>de</strong> <strong>de</strong>mandar até sessenta minutos <strong>para</strong> ser adquiri<strong>do</strong>, ao passo queum espectro obti<strong>do</strong> pela promediação <strong>de</strong> <strong>de</strong>zesseis varreduras po<strong>de</strong> ser obti<strong>do</strong> emapenas um minuto.


conclusões1 233 45 R


5 ConclusõesNesta dissertação foi aborda<strong>do</strong> o problema da remoção <strong>de</strong> ruí<strong>do</strong> instrumentalpor Transformada Wavelet usan<strong>do</strong> o méto<strong>do</strong> Mínimo Comprimento <strong>de</strong> Descrição. Ométo<strong>do</strong> <strong>MDL</strong> seleciona automaticamente o limiar e a função wavelet, dispensan<strong>do</strong> atomada <strong>de</strong> <strong>de</strong>cisões <strong>do</strong> analista, que requerem conhecimento <strong>do</strong> assunto, e quegeralmente po<strong>de</strong> ser muito subjetiva.A técnica <strong>MDL</strong> se mostrou capaz <strong>de</strong> selecionar uma wavelet a<strong>de</strong>quada aossinais, escolhen<strong>do</strong> sempre funções wavelet que forneceram baixos RMSE’s. Alémdisso, apresentou resulta<strong>do</strong>s satisfatórios na remoção <strong>de</strong> ruí<strong>do</strong>, obten<strong>do</strong> espectrossuaviza<strong>do</strong>s em sinais com ruí<strong>do</strong> homoscedástico e heteroscedástico, enquanto queas técnicas Rígida e Suave obtiveram <strong>de</strong>sempenhos variáveis, o que dificultaria aescolha <strong>de</strong> uma <strong>de</strong>las.Em relação à capacida<strong>de</strong> <strong>de</strong> compressão <strong>do</strong>s sinais, o <strong>MDL</strong> mostrou serparcimonioso, selecionan<strong>do</strong> um número menor <strong>de</strong> coeficientes wavelet em to<strong>do</strong>s osexperimentos.A melhora da relação sinal-ruí<strong>do</strong> em espectros obti<strong>do</strong>s por um númeropequeno <strong>de</strong> varreduras mostrou ser possível, principalmente usan<strong>do</strong> a técnica <strong>MDL</strong>,que obteve sempre espectros similares ao espectro <strong>de</strong> referência, obti<strong>do</strong> por umnúmero eleva<strong>do</strong> <strong>de</strong> varreduras.Enfim, este trabalho mostrou que o méto<strong>do</strong> <strong>MDL</strong> po<strong>de</strong> ser uma boa alternativaaos méto<strong>do</strong>s padrão <strong>de</strong> remoção <strong>de</strong> ruí<strong>do</strong> por Transformada Wavelet, em relação àremoção <strong>de</strong> ruí<strong>do</strong> instrumental real em técnicas espectrométricas.


5.1 Propostas futurasAs propostas futuras <strong>para</strong> a continuida<strong>de</strong> <strong>de</strong>ste trabalho são:- construção <strong>de</strong> mo<strong>de</strong>los quimiométricos <strong>de</strong> Calibração Multivariada emconjuntos <strong>de</strong> da<strong>do</strong>s com espectros obti<strong>do</strong>s pela promediação <strong>de</strong> um númeropequeno <strong>de</strong> varreduras;- estu<strong>do</strong> <strong>do</strong> comportamento da técnica <strong>MDL</strong> em medidas analíticas obtidaspor outras técnicas, como CLAE e Espectrometria <strong>de</strong> Emissão Óptica com PlasmaInduzi<strong>do</strong> por Laser (LIBS, <strong>do</strong> inglês: Laser Induced Break<strong>do</strong>wn Spectroscopy).


eferências bibliográficas1 233 45 R


Referências BibliográficasALSBERG, B. K.; WOODWARD, A. M.; WINSON, M. K.; ROWLAND, J.; Kell, D.B.,Wavelet Denoising of Infrared Spectra. Analyst, 122: 645, 1997.ALSBERG, B. K.; WOODWARD, A. M.; KELL, D. B., An introduction to wavelettransforms for chemometricians: A time-frequency approach. Chem. Intell. Lab. Sys.37: 215, 1997.ARGOULD, F.I.M.; AZEVEDO, F.M.; MARINO NETO, J., Estu<strong>do</strong> com<strong>para</strong>tivo entreFunções wavelet e suas diferentes aplicabilida<strong>de</strong>s em reconhecimento <strong>de</strong> padrõesepileptogênicos em eletroencefalograma. Revista Brasileira <strong>de</strong> EngenhariaBiomédica, 20: 49, 2004.BEEBE, K. R.; PELL, R. J.; SEASHOLTZ, M. B., Chemometrics: A Practical Gui<strong>de</strong>.New York: John Wiley & Sons, 1998.BRERETON, R.G., Data Analysis for the Laboratory and Chemical Plant. Chichester:John Wiley & Sons, 2003.BARROS-NETO, B.; SCARMINIO, I. S.; BRUNS, R. E. Como Fazer Experimentos.Campinas: Editora UNICAMP, 2007.CAI, C.S., HARRINGTON, P.D., Different discrete wavelet transforms applied to<strong>de</strong>noising analytical data. J. Chem. Inf. Comput. Sci. 38: 1161, 1998.CERQUEIRA, E. O.; POPPI, R. J.; KUBOTA, L. T.; MELLO, C., Utilização <strong>de</strong> filtro <strong>de</strong>Transformada <strong>de</strong> Fourier <strong>para</strong> a minimização <strong>de</strong> ruí<strong>do</strong>s em Sinais Analíticas.Química Nova, 23: 690 (2000).


CHAU, F.T.; LIANG, Y.Z.; GAO, J.; SHAO. X.G. Chemometrics: From basics toWavelet Transform. Nova Jersey: Wiley-Interscience, 2004.DONOHO, D.L.; JOHNSTONE, I.M., I<strong>de</strong>al spatial adaptation via wavelet shrinkage.Biometrika, 81: 425, 1994.DONOHO, D.L., De-noising by soft thresholding, IEEE Transactions on InformationTheory, 41: 613, 1995.DONOHO, D.L.; JOHNSTONE, I.M.; KERKYACHARIAN, G; PICARD, D., WaveletShrinkage: Asymptopia. J. Roy. Statist. Soc. 57-2: 301, 1995.DAUBECHIES, I. Ten Lectures on Wavelets. CBMS-NSF Series in AppliedMathematics n. 61, Phila<strong>de</strong>lphia: SIAM, 1992.FELINGER, A., Data Analysis and Signal Processing in Chromatography. DataHandling in Science and Technology, Volume 21, Elsevier, 1998.FOOD AND DRUG ADMINISTRATION (FDA). PAT, Guidance for Industry — AFramework for Innovative Pharmaceutical Development, Manufacturing, and QualityAssurance. Disponível em: http://www.fda.gov/c<strong>de</strong>r/OPS/PAT.htm. Acessa<strong>do</strong> em23/01/2008.GALVÃO, R. K. H.; ARAÚJO, M. C. U.; SALDANHA, T. C. B.; VISANI, V.;PIMENTEL, M. F., Estu<strong>do</strong> com<strong>para</strong>tivo sobre filtragem <strong>de</strong> sinais instrumentaisusan<strong>do</strong> transformadas <strong>de</strong> Fourier e wavelet. Química Nova, 24: 874, 2001.GALVÃO, R.K.H.; DANTAS FILHO, H.A.D.; MARTINS, M.N.; ARAÚJO, M.C.U.;PASQUINI, C., Sub-optimal wavelet <strong>de</strong>noising of coaveraged spectra employingstatistics from individual scans. Analytica Chimica Acta. 581: 159, 2007.GELADI, P., Some recent trends in the calibration literature. Chem. Intell. Lab. Sys.60: 211, 2002.


GRUNWALD, P., A Tutorial Introduction to the Minimum Description Length Principle.MIT Press, 2004.LAMBERT, J.B.; MAZZOLA, E.P., Nuclear Magnetic Resonance Spectroscopy: AnIntroduction to Principles, Applications, and Experimental Methods, Nova Jersey:Prentice Hall, 2004.MALLAT, S., A wavelet tour of signal processing. Londres: Aca<strong>de</strong>mic Press, 1999.MANGANIELLO, L.; VEGA, C.; RÍOS, A.; VALCÁRCEL, M., Use of WaveletTransform to enhance piezoelectric signals for analytical purposes, Analytica ChimicaActa, 456: 93 (2002).MARTENS, H.; NIELSEN, J. P.; ENGELSEN, S. B., Light Scattering and LightAbsorbance Se<strong>para</strong>ted by Exten<strong>de</strong>d Multiplicative Signal Correction. Application toNear-Infrared Transmission Analysis of Pow<strong>de</strong>r Mixtures, Analytical Chemistry,78:394 (2003).MASSART, D. L.; VANDEGINSTE, B. G. M.; BUYDENS, S. J.; LEWI, P. J.;SMEYERS-VERBEKE, J., Handbook of Chemometrics and Qualimetrics: Parte A,Amsterdam: Elsevier, 1997.MASSART, D. L.; VANDEGINSTE, B. G. M.; BUYDENS, S. J.; LEWI, P. J.;SMEYERS-VERBEKE, J., Handbook of Chemometrics and Qualimetrics: Parte B,Amsterdam: Elsevier, 1997.MISITI, M., MISITI, Y., OPPENHEIM, G., POGGI, J.M. Wavelet Toolbox User’sGui<strong>de</strong>. Natick, Mass.: The Mathworks, Inc. 1996.POORNACHANDRA, S.; KUMARAVEL, N., Subband-Adaptive Shrinkage forDenoising of ECG Signals. Journal on Applied Signal Processing. 1, 2006.RISSANEM, J., <strong>MDL</strong> <strong>de</strong>noising. IEEE Transactions on Information Theory, 46: 7,2000.


SAITO, N., Simultaneous noise suppression and signal compression using a libraryof orthonormal bases and the Minimum Description Length criterion, in E. Foufoula-Georgiou & P. Kumar, eds., in Wavelets in Geophysics, 299-324 New York:Aca<strong>de</strong>mic Press, 1994SHAO, X. G.; LEUNG, K. M.; CHAU, F. T., Wavelet: A new trend in Chemistry. Acc.Chem. Res. 36: 276 (2003).STRANG G., NGUYEN T., Wavelets and Filter Banks, Wellesley: Cambridge Press,1996.TAVARES, J.F.; QUEIROGA, K.F.; SILVA, M.V.B.; DINIZ, M.F.F.M.; FILHO, J.M.B.;DA-CUNHA, E.V.L.; SIMONE, C.A.; ARAÚJO JÚNIOR, J.X.; MELO, P.S.; HAUN, M.;SILVA, M.S., ent-Trachylobane Diterpenoids from Xylopia langs<strong>do</strong>rffiana. J. Nat.Prod. 69: 960, 2007.WALCZAK, B.; MASSART, D.L. Wavelet packet transform applied to a set of signals:A new approach to the best-basis selection. Chem. Intell. Lab. Sys. 38: 39, 1997.WALCZAK, B.; MASSART, D.L. Wavelets: Something for Analytical Chemistry?Trends in Analytical Chemistry. Chem. Intell. Lab. Sys. 16: 451, 1997.WENTZELL, P.D., BROWN, C.D. Signal Processing in Analytical Chemistry.Encyclopedia of Analytical Chemistry. Chichester: John Wiley & Sons Ltd, 2000.WOODWARD, A.M., ALSBERG, B.J., KELL, D.B. The effect of heteroscedastic noiseon the chemometric mo<strong>de</strong>lling of frequency <strong>do</strong>main data. Chem. Intell. Lab. Sys. 40:101-107, 1998.


apêndice1 233 45 A


ApêndiceApêndice A% Algoritmo <strong>para</strong> remoção <strong>de</strong> ruí<strong>do</strong> por Transformada Wavelet, através <strong>do</strong> méto<strong>do</strong><strong>MDL</strong> e limiarização Rígida.Escrito por Gledson Emidio José, sob orientação <strong>do</strong> Prof. Dr. Roberto Kawakami HarropGalvão.Programa utiliza<strong>do</strong>: Matlab ® 6.5, com o pacote Wavelet Toolbox.%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%clearclose allNiveis = 7; % número máximo <strong>de</strong> níveis <strong>de</strong> <strong>de</strong>composição da<strong>do</strong> pela função wmaxlev.m, <strong>do</strong> Matlab.% Passo 1: Inicialização <strong>do</strong>s da<strong>do</strong>sload xtrue % Espectro <strong>de</strong> referênciaxtrue = Matrix;load xrui<strong>do</strong> % Espectros <strong>de</strong> varredura unitáriax = Matrix;RMSE = []; % Usan<strong>do</strong> apenas a promediação <strong>do</strong>s espectrosRMSEmdl = [];E1 = sqrt(mean((xtrue - x(1,:)).^2)); % cálculo <strong>do</strong> RMSERMSE(1) = E1;RMSEmdl(1) = E1;mdl=[];Xmdl=[];M=size(x,1);% Passo 2: Geração da biblioteca <strong>de</strong> waveletswname1 ={'db1','db2','db3','db4','db5','db6','db7','db8','db9','db10','sym4','sym5','sym6','sym7','sym8','sym9','sym10','coif1','coif2','coif3','coif4','coif5'};


for i = 1:M % loop <strong>para</strong> as amostras (N=número <strong>de</strong> amostras)disp(['amostra numero ' num2str(i)]);for w=1:22 % laço <strong>para</strong> testar todas as waveletswname=wname1{w};% Calculo <strong>do</strong> RMSEe = xtrue - x(i,:);RMSE(w,i) = sqrt(mean(e.^2));% Passo 3: Análise wavelet usan<strong>do</strong> a abordagem <strong>MDL</strong>% disp('Será feito a escolha da melhor wavelet pelo principio <strong>MDL</strong>!')% Passo 3.1: Decomposição wavelet[C,L] = wave<strong>de</strong>c(x(i,:),Niveis,wname);C1=C(1:L(2)); % se<strong>para</strong>ção <strong>do</strong>s coeficientes <strong>de</strong> aproximaçãoC2=C(L(2)+1:end); % se<strong>para</strong>ção <strong>do</strong>s coeficientes <strong>de</strong> <strong>de</strong>talhe[Csort,in<strong>de</strong>x] = sort(abs(C2)); % colocan<strong>do</strong> em or<strong>de</strong>m crescente <strong>de</strong> valor absolutoN=length(C2);% Passo 3.2: Calculo da função custo <strong>MDL</strong>for k = 1:ceil((N-1)/2); % k = Número <strong>de</strong> coeficientes manti<strong>do</strong>sC<strong>de</strong>scarta<strong>do</strong>s = Csort(1:N-k);%função custo <strong>MDL</strong>mdl(k,w) = (3/2)*k*log2(N) + (N/2)*log2(sum(C<strong>de</strong>scarta<strong>do</strong>s.^2));end % encerra k[mdl_min(w),zopt(w)] = min(mdl(:,w));C<strong>de</strong>noise = C2;C<strong>de</strong>noise(in<strong>de</strong>x(1:N-zopt(w))) = 0; % excluin<strong>do</strong> os espectros abaixo <strong>do</strong> limiar <strong>MDL</strong>C<strong>de</strong>noise2= [C1 C<strong>de</strong>noise]; % reor<strong>de</strong>nan<strong>do</strong> os espectrosmdlcoeficientes(w,:)= C<strong>de</strong>noise2;% Passo 3.3: Reconstrução <strong>do</strong> espectro filtra<strong>do</strong>[coluna,linha]=min(mdl_min);Xmdl(w,:) = waverec(C<strong>de</strong>noise2,L,wname);% Calculo <strong>do</strong> RMSERMSEmdl(w,i) = sqrt(mean((xtrue - Xmdl(w,:)).^2));end % encerra w


[coluna,linha]=min(mdl_min);% Passo 4: Pre<strong>para</strong>ção da matriz finalEspectrosfinais(i,:)= Xmdl(linha,:);disp(['a wavelet escolhida pelo <strong>MDL</strong> foi a ' num2str(linha)]);end % finalizan<strong>do</strong> i%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%


Apêndice B% Algoritmo <strong>para</strong> remoção <strong>de</strong> ruí<strong>do</strong> por Transformada Wavelet, usan<strong>do</strong> limiarUniversal e limiarização Rígida e Suave.%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%clear,close allNiveis = 7; % número máximo <strong>de</strong> níveis <strong>de</strong> <strong>de</strong>composição da<strong>do</strong> pela função wmaxlev.mwname1 ={'db1','db2','db3','db4','db5','db6','db7','db8','db9','db10','sym4','sym5','sym6','sym7','sym8','sym9','sym10','coif1','coif2','coif3','coif4','coif5'};% Passo 1: Carregar os da<strong>do</strong>sload xtrue % Espectro <strong>de</strong> referênciaxtrue = Matrix;load xrui<strong>do</strong> % Espectros <strong>de</strong> varredura unitáriax = Matrix;RMSE = []; % Usan<strong>do</strong> apenas a promediação <strong>do</strong>s espectrosRMSEsoft = []; % Usan<strong>do</strong> a TW e a limiarização Suave com limiar universalRMSEhard = []; % Usan<strong>do</strong> a TW e a limiarização Rígida com limiar universalE1 = sqrt(mean((xtrue - x(1,:)).^2)); % calculo <strong>do</strong> RMSERMSE(1) = E1;RMSEsoft(1) = E1;RMSEhard(1) = E1;M=size(x,1);for i = 1:Mdisp(['amostra numero ' num2str(i)]);% Passo 2: Gerar a biblioteca <strong>de</strong> waveletsfor w=1:22 % laço <strong>para</strong> testar todas as waveletswname=wname1{w};


% Calculo <strong>do</strong> RMSEe = xtrue - x(i,:);RMSE(w,i) = sqrt(mean(e.^2));% Passo 3: Analise wavelet usan<strong>do</strong> o limiar Universal com limiarização Suave e Rígida% Passo 3.1: Decomposição <strong>do</strong> espectro[tmean,L] = wave<strong>de</strong>c(x(i,:),Niveis,wname);% Passo 3.2: Estimar <strong>de</strong>svio-padrão <strong>do</strong> ruí<strong>do</strong> usan<strong>do</strong> a mediana sob a hipótese <strong>de</strong>% homoscedasticida<strong>de</strong>.D1 = <strong>de</strong>tcoef(tmean,L,1); % Primeiro nível <strong>de</strong> <strong>de</strong>talhesigma_mediana = median(abs(D1))/0.6745;% Passo 3.3: Calcular o limiar (universal)n = length(tmean);lim = sigma_mediana * sqrt(2*log(n));% Passo 3.4: Aplicar a limiarização Suave e a Rígidatsoft = tmean;thard = tmean;for j=(L(2)+1):n % Os coeficientes <strong>de</strong> aproximação não são modifica<strong>do</strong>stj = tmean(j);if abs(tj) < limtsoft(j) = 0;thard(j) = 0;elsetsoft(j) = sign(tj)*(abs(tj)-lim);en<strong>de</strong>nd% Passo 3.5: Reconstrução <strong>do</strong> espectro filtra<strong>do</strong>[xsoft(w,:)] = waverec(tsoft,L,wname);[xhard(w,:)] = waverec(thard,L,wname);% Calculo <strong>do</strong> RMSEe = xtrue - xsoft(w,:);RMSEsoft(w,i) = sqrt(mean(e.^2));


e = xtrue - xhard(w,:);RMSEhard(w,i) = sqrt(mean(e.^2));en<strong>de</strong>nd%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%


APÊNDICE C% Geração <strong>do</strong>s sinais sintéticos%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%clear,close all% Passo 1: Geração <strong>do</strong> espectro simula<strong>do</strong> com 1024 pontosrand('state',0)t = 1:1024;m = linspace(1,1024,8);m = m(2:7);s = 30*rand(1,6);a = 2 + 2*rand(1,6);xtrue = 0.0*ones(1,1024); % Linha <strong>de</strong> basefor i=1:6tsm = (t-m(i))/s(i);xtrue = xtrue + a(i)*exp(-0.5*tsm.^2);endSigmaNoise=[.01 .3 1.0];% Passo 2: Simulação <strong>de</strong> 100 varreduras rui<strong>do</strong>sas individuaisfor sn=1:3randn('state',0)X = repmat(xtrue,100,1) + SigmaNoise(sn)*randn(100,1024);end%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!