Como podem ser analisados dados pareados de ... - IESC/UFRJ
Como podem ser analisados dados pareados de ... - IESC/UFRJ
Como podem ser analisados dados pareados de ... - IESC/UFRJ
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
C ARLA JORGE MACHADO<br />
to every record. Results: Application of (a) showed wi<strong>de</strong>r confi<strong>de</strong>nce intervals, reflecting<br />
smaller samples sizes but, in general, the approaches yiel<strong>de</strong>d similar results. Conclusions:<br />
The approach (a) seems to be more acceptable for analysis of matched files.<br />
KEY WORDS<br />
Probabilistic record linkage, database, neonatal <strong>de</strong>ath<br />
1. INTRODUÇÃO<br />
Com o objetivo <strong>de</strong> aumentar o número <strong>de</strong> informações disponíveis sobre o<br />
que se <strong>de</strong>seja estudar, ou para corrigir <strong>dados</strong> <strong>de</strong> um banco <strong>de</strong> <strong>dados</strong>, informações<br />
<strong>de</strong> dois bancos <strong>de</strong> <strong>dados</strong> diferentes <strong>po<strong>de</strong>m</strong> <strong>ser</strong> combinadas, freqüentemente através<br />
<strong>de</strong> procedimentos <strong>de</strong> relacionamento ou pareamento <strong>de</strong> registros (Lavallée &<br />
Caron, 2001). O relacionamento <strong>de</strong> registros é feito através da comparação <strong>de</strong><br />
variáveis comuns aos dois bancos <strong>de</strong> <strong>dados</strong> (também <strong>de</strong>nominadas i<strong>de</strong>ntificadores),<br />
as quais <strong>de</strong>vem <strong>ser</strong> comparadas. Estas variáveis <strong>de</strong>vem <strong>ser</strong>, além <strong>de</strong> comuns, confiáveis<br />
e <strong>de</strong> boa qualida<strong>de</strong>, para que o par formado e julgado pertencente à mesma<br />
pessoa ou à mesma entida<strong>de</strong> seja obtido com a menor chance possível <strong>de</strong> erros.<br />
Os procedimentos <strong>de</strong> relacionamento <strong>de</strong> registros <strong>po<strong>de</strong>m</strong> <strong>ser</strong> <strong>de</strong>terminísticos,<br />
probabilísticos ou uma combinação <strong>de</strong> ambos os métodos. O procedimento<br />
<strong>de</strong>terminístico relaciona pares <strong>de</strong> registros com base na concordância exata <strong>de</strong><br />
i<strong>de</strong>ntificadores; já o relacionamento probabilístico utiliza a probabilida<strong>de</strong> a fim <strong>de</strong><br />
<strong>de</strong>terminar se um par <strong>de</strong> registros se refere ao mesmo indivíduo. O relacionamento<br />
<strong>de</strong>terminístico po<strong>de</strong> <strong>ser</strong> feito se um i<strong>de</strong>ntificador único e confiável existir<br />
(Martikainen et al., 2001). Além disso, caso exista uma quantida<strong>de</strong> suficiente<br />
<strong>de</strong> informações sobre os indivíduos em dois bancos <strong>de</strong> <strong>dados</strong>, estas informações<br />
(ou i<strong>de</strong>ntificadores mais gerais, não únicos), em seu conjunto, <strong>po<strong>de</strong>m</strong>, <strong>de</strong> forma<br />
única e precisa, i<strong>de</strong>ntificar um indivíduo como sendo o mesmo em dois bancos <strong>de</strong><br />
<strong>dados</strong> distintos. No entanto, uma crítica às regras <strong>de</strong>terminísticas é o fato <strong>de</strong> que<br />
<strong>po<strong>de</strong>m</strong> não refletir a<strong>de</strong>quadamente a incerteza possível para pares potenciais<br />
(Scheuren, 1999). Exemplificando, ao simplesmente contar as concordâncias<br />
existentes entre i<strong>de</strong>ntificadores, po<strong>de</strong>-se, por exemplo, obter dois pares potenciais<br />
formados com uma concordância cada. Imagine-se que se <strong>de</strong>ve selecionar um<br />
<strong>de</strong>stes pares sendo que, para um, há concordância na variável sexo e discordância<br />
no nome do indivíduo; para o outro, há discordância em sexo e concordância em<br />
nome. Não há, teoricamente, como resolver a questão, pois o relacionamento<br />
<strong>de</strong>terminístico não permite que sejam feitas pon<strong>de</strong>rações diferenciadas aos tipos <strong>de</strong><br />
concordâncias (e discordâncias) encontradas. Parece razoável, então, utilizar<br />
métodos que possam pon<strong>de</strong>rar a<strong>de</strong>quadamente a informação contida nos<br />
i<strong>de</strong>ntificadores utilizados para o relacionamento, permitindo que possíveis erros<br />
contidos nos i<strong>de</strong>ntificadores (como erros <strong>de</strong> digitação, erro <strong>de</strong> <strong>de</strong>claração) além<br />
234 – CADERNOS SAÚDE COLETIVA, RIO DE JANEIRO, 14 (2): 233 - 250, 2006