25.11.2014 Views

Como podem ser analisados dados pareados de ... - IESC/UFRJ

Como podem ser analisados dados pareados de ... - IESC/UFRJ

Como podem ser analisados dados pareados de ... - IESC/UFRJ

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

C ARLA JORGE MACHADO<br />

to every record. Results: Application of (a) showed wi<strong>de</strong>r confi<strong>de</strong>nce intervals, reflecting<br />

smaller samples sizes but, in general, the approaches yiel<strong>de</strong>d similar results. Conclusions:<br />

The approach (a) seems to be more acceptable for analysis of matched files.<br />

KEY WORDS<br />

Probabilistic record linkage, database, neonatal <strong>de</strong>ath<br />

1. INTRODUÇÃO<br />

Com o objetivo <strong>de</strong> aumentar o número <strong>de</strong> informações disponíveis sobre o<br />

que se <strong>de</strong>seja estudar, ou para corrigir <strong>dados</strong> <strong>de</strong> um banco <strong>de</strong> <strong>dados</strong>, informações<br />

<strong>de</strong> dois bancos <strong>de</strong> <strong>dados</strong> diferentes <strong>po<strong>de</strong>m</strong> <strong>ser</strong> combinadas, freqüentemente através<br />

<strong>de</strong> procedimentos <strong>de</strong> relacionamento ou pareamento <strong>de</strong> registros (Lavallée &<br />

Caron, 2001). O relacionamento <strong>de</strong> registros é feito através da comparação <strong>de</strong><br />

variáveis comuns aos dois bancos <strong>de</strong> <strong>dados</strong> (também <strong>de</strong>nominadas i<strong>de</strong>ntificadores),<br />

as quais <strong>de</strong>vem <strong>ser</strong> comparadas. Estas variáveis <strong>de</strong>vem <strong>ser</strong>, além <strong>de</strong> comuns, confiáveis<br />

e <strong>de</strong> boa qualida<strong>de</strong>, para que o par formado e julgado pertencente à mesma<br />

pessoa ou à mesma entida<strong>de</strong> seja obtido com a menor chance possível <strong>de</strong> erros.<br />

Os procedimentos <strong>de</strong> relacionamento <strong>de</strong> registros <strong>po<strong>de</strong>m</strong> <strong>ser</strong> <strong>de</strong>terminísticos,<br />

probabilísticos ou uma combinação <strong>de</strong> ambos os métodos. O procedimento<br />

<strong>de</strong>terminístico relaciona pares <strong>de</strong> registros com base na concordância exata <strong>de</strong><br />

i<strong>de</strong>ntificadores; já o relacionamento probabilístico utiliza a probabilida<strong>de</strong> a fim <strong>de</strong><br />

<strong>de</strong>terminar se um par <strong>de</strong> registros se refere ao mesmo indivíduo. O relacionamento<br />

<strong>de</strong>terminístico po<strong>de</strong> <strong>ser</strong> feito se um i<strong>de</strong>ntificador único e confiável existir<br />

(Martikainen et al., 2001). Além disso, caso exista uma quantida<strong>de</strong> suficiente<br />

<strong>de</strong> informações sobre os indivíduos em dois bancos <strong>de</strong> <strong>dados</strong>, estas informações<br />

(ou i<strong>de</strong>ntificadores mais gerais, não únicos), em seu conjunto, <strong>po<strong>de</strong>m</strong>, <strong>de</strong> forma<br />

única e precisa, i<strong>de</strong>ntificar um indivíduo como sendo o mesmo em dois bancos <strong>de</strong><br />

<strong>dados</strong> distintos. No entanto, uma crítica às regras <strong>de</strong>terminísticas é o fato <strong>de</strong> que<br />

<strong>po<strong>de</strong>m</strong> não refletir a<strong>de</strong>quadamente a incerteza possível para pares potenciais<br />

(Scheuren, 1999). Exemplificando, ao simplesmente contar as concordâncias<br />

existentes entre i<strong>de</strong>ntificadores, po<strong>de</strong>-se, por exemplo, obter dois pares potenciais<br />

formados com uma concordância cada. Imagine-se que se <strong>de</strong>ve selecionar um<br />

<strong>de</strong>stes pares sendo que, para um, há concordância na variável sexo e discordância<br />

no nome do indivíduo; para o outro, há discordância em sexo e concordância em<br />

nome. Não há, teoricamente, como resolver a questão, pois o relacionamento<br />

<strong>de</strong>terminístico não permite que sejam feitas pon<strong>de</strong>rações diferenciadas aos tipos <strong>de</strong><br />

concordâncias (e discordâncias) encontradas. Parece razoável, então, utilizar<br />

métodos que possam pon<strong>de</strong>rar a<strong>de</strong>quadamente a informação contida nos<br />

i<strong>de</strong>ntificadores utilizados para o relacionamento, permitindo que possíveis erros<br />

contidos nos i<strong>de</strong>ntificadores (como erros <strong>de</strong> digitação, erro <strong>de</strong> <strong>de</strong>claração) além<br />

234 – CADERNOS SAÚDE COLETIVA, RIO DE JANEIRO, 14 (2): 233 - 250, 2006

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!