25.11.2014 Views

Como podem ser analisados dados pareados de ... - IESC/UFRJ

Como podem ser analisados dados pareados de ... - IESC/UFRJ

Como podem ser analisados dados pareados de ... - IESC/UFRJ

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

C OMO PODEM SER ANALISADOS DADOS PAREADOS DE FORMA PROBABILÍSTICA<br />

NA PRESENÇA DE INCERTEZA? UM EXERCÍCIO CONTRASTANDO QUATRO PROCEDIMENTOS<br />

do grau <strong>de</strong> completu<strong>de</strong> do preenchimento (ou <strong>de</strong>claração) <strong>de</strong> um dado i<strong>de</strong>ntificador<br />

e do seu grau <strong>de</strong> especificida<strong>de</strong> (ou o quão discriminante é o i<strong>de</strong>ntificador), possam<br />

<strong>ser</strong> um elemento que seja, <strong>de</strong>liberadamente, consi<strong>de</strong>rado no cômputo dos pesos <strong>de</strong><br />

pareamento. No caso exemplificado acima, pareceria mais lógico selecionar como<br />

correto o par com nome concordante, pois nome é muito mais específico e mais<br />

<strong>de</strong>finidor do que sexo (supondo, hipoteticamente, qualida<strong>de</strong> igual do registro das<br />

duas variáveis). Assim, quando não há informação confiável, ou há um número<br />

insuficiente <strong>de</strong> i<strong>de</strong>ntificadores, ou por outras razões ligadas ao tipo <strong>de</strong> i<strong>de</strong>ntificador<br />

utilizado, o relacionamento probabilístico <strong>de</strong> registros é o método indicado.<br />

Consi<strong>de</strong>ra-se que as idéias seminais na formulação do relacionamento<br />

probabilístico são <strong>de</strong> Howard Newvombe (Newcombe et al., 1959; Winkler, 1999;<br />

Blakely et al., 2002). Em primeiro lugar, este pesquisador ob<strong>ser</strong>vou que a freqüência<br />

<strong>de</strong> ocorrência <strong>de</strong> uma característica entre pares verda<strong>de</strong>iros (pares que <strong>de</strong> fato<br />

pertencem ao mesmo indivíduo) e entre pares falsos po<strong>de</strong>ria <strong>ser</strong> utilizada para<br />

computar um escore (ou peso) <strong>de</strong> pareamento. Também ob<strong>ser</strong>vou que o peso <strong>de</strong><br />

pareamento atribuído <strong>de</strong> forma individual a diferentes i<strong>de</strong>ntificadores, em caso<br />

<strong>de</strong> concordância, ou <strong>de</strong> discordância, <strong>de</strong>veria <strong>ser</strong> computado. Os pesos <strong>de</strong><br />

pareamento são construídos <strong>de</strong> tal forma que, para cada i<strong>de</strong>ntificador, <strong>de</strong>fine-se<br />

a probabilida<strong>de</strong> m do i<strong>de</strong>ntificador concordar entre os dois registros, dado que<br />

se trata <strong>de</strong> par verda<strong>de</strong>iro, e a probabilida<strong>de</strong> u do i<strong>de</strong>ntificador concordar em<br />

caso <strong>de</strong> par falso. Da mesma forma, po<strong>de</strong>-se <strong>de</strong>finir (1 – m) como a probabilida<strong>de</strong><br />

<strong>de</strong> discordância do i<strong>de</strong>ntificador entre dois registros, uma vez que se trata <strong>de</strong> par<br />

verda<strong>de</strong>iro, enquanto (1 – u) representa a probabilida<strong>de</strong> <strong>de</strong> o campo discordar,<br />

no caso <strong>de</strong> par falso. Com base nestas probabilida<strong>de</strong>s são construídos dois fatores<br />

<strong>de</strong> pon<strong>de</strong>ração: um, para o caso <strong>de</strong> concordância, e outro, para o caso <strong>de</strong><br />

discordância. Ou seja, compara-se o i<strong>de</strong>ntificador do primeiro registro com o<br />

do segundo registro e, se concordarem, aplica-se o fator <strong>de</strong> pon<strong>de</strong>ração <strong>de</strong><br />

concordância e, em caso contrário, o <strong>de</strong> discordância. O fator <strong>de</strong> pon<strong>de</strong>ração <strong>de</strong><br />

concordância é calculado como o logaritmo <strong>de</strong> base 2 da razão <strong>de</strong> verossimilhança<br />

entre as probabilida<strong>de</strong>s m e u e o <strong>de</strong> discordância como o logaritmo <strong>de</strong> base 2 da<br />

razão <strong>de</strong> verossimilhança entre as probabilida<strong>de</strong>s (1 – m) e (1 – u). O escore total<br />

<strong>de</strong> <strong>de</strong>terminado par é obtido a partir da soma dos fatores <strong>de</strong> pon<strong>de</strong>ração atribuídos<br />

após a comparação <strong>de</strong> cada i<strong>de</strong>ntificador (Winkler, 1999). Espera-se que m seja<br />

maior que u, <strong>de</strong> tal forma que o fator <strong>de</strong> concordância contribua positivamente para<br />

o escore final, enquanto o fator <strong>de</strong> discordância contribua negativamente (Camargo<br />

Jr & Coeli, 2000). Pares com escores mais elevados, além <strong>de</strong> um certo valor <strong>de</strong><br />

escore geral (ou limiar), <strong>ser</strong>iam consi<strong>de</strong>rados pares verda<strong>de</strong>iros. Fellegi e Sunter<br />

(1969), baseados nas primeiras idéias <strong>de</strong> Newcombe, introduziram os fundamentos<br />

matemáticos e estatísticos para o relacionamento probabilístico <strong>de</strong> registros da<br />

C ADERNOS SAÚDE COLETIVA, RIO DE JANEIRO, 14 (2): 233 - 250, 2006 – 235

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!