11.03.2014 Views

ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ

ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ

ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ<br />

Να δοθούν οι βασικές αρχές των µη παραµετρικών<br />

ελέγχων (non-parametric tests).<br />

Να παρουσιασθούν και να αναλυθούν οι γνωστότεροι µη<br />

παραµετρικοί έλεγχοι<br />

Να αναπτυχθεί η µεθοδολογία των ελέγχων: έλεγχος<br />

πρόσηµου (sign-test), ο έλεγχος προσηµασµένης διάταξης<br />

του Wilcoxon (signed-rank test), ο έλεγχος αθροίσµατος<br />

διατάξεων του Wilcoxon (rank sum test) ή Wilcoxon Mann<br />

Whitney.<br />

Να σκιαγραφηθούν άλλοι γνωστοί µη-παραµετρικοί<br />

έλεγχοι.<br />

Τέλος να κατανοηθεί µε βάση τα πλεονεκτήµατα και<br />

µειονεκτήµατα των µεθόδων πότε γίνεται η χρήση τους.<br />

1<br />

ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΜΗ ΠΑΡΑΜΕΤΡΙΚΩΝ ΕΛΕΓΧΩΝ<br />

‣ Στους παραµετρικούς ελέγχους (π.χ. t-test ανεξάρτητων<br />

δειγµάτων) η κατανοµή της/των µεταβλητών είναι<br />

κανονική ή τουλάχιστον προσεγγίζει την κανονική και<br />

εκτιµούνται οι άγνωστοι παράµετροι (π.χ. µ)<br />

‣ Οι µη-παραµετρικοί εφαρµόζονται όταν δεν γνωρίζουµε<br />

την κατανοµή στις µετρήσεις.<br />

‣ Για τα παραπάνω καλούνται και µέθοδοι ελεύθερης<br />

κατανοµής (distribution-free-methods).<br />

‣ Οι έλεγχοι που θα εξετασθούν βασίζονται κυρίως στην<br />

διάταξη των µετρήσεων και όχι στις ίδιες τις µετρήσεις.<br />

‣ Οι µη παραµετρικοί έλεγχοι που εξετάζονται είναι σε<br />

αντιστοιχία όπως και στα t-test ως ανεξάρτητων και<br />

ζευγαρωτών µετρήσεων.<br />

2<br />

1


Ο προσηµικός έλεγχος (Sign test)<br />

‣ Εφαρµόζεται όταν οι µετρήσεις είναι κατά ζεύγη (αν και µπορεί<br />

να εφαρµοσθεί σε ένα δείγµα).<br />

‣ Στη µηδενική υπόθεση δεχόµαστε ότι η διάµεσος διαφορά<br />

είναι 0. ∆ιαφορετικά αν οι τιµές των µεταβλητών προέρχονται<br />

από την ίδια κατανοµή ότι ο αριθµός των θετικών<br />

διαφορών είναι ίσο µε τον αριθµό των αρνητικών διαφορών.<br />

‣ ∆εχόµαστε ότι ο αριθµός των θετικών (αρνητικών) προσήµων<br />

του δείγµατος ακολουθεί τη ∆ιωνυµική κατανοµή µε Bi(n,<br />

p=1/2). ∆ιαφορετικά ότι αναµένουµε µε βάση τη Ho np=n/2<br />

θετικά πρόσηµα.<br />

‣ Χρησιµοποιούµε την προσέγγιση της κανονικής κατανοµής<br />

Z<br />

+<br />

n<br />

D −<br />

= 2<br />

n /4<br />

D= αριθµός θετικών διαφορών<br />

Αλλιώς υπολογίζουµε µε βάση τη διωνυµική κατανοµή.<br />

3<br />

Έλεγχος προσηµασµένης διάταξης Wilcoxon<br />

(Wilcoxon signed-rank test)<br />

‣ Εφαρµόζεται όταν οι µετρήσεις είναι κατά ζεύγη.<br />

‣ Στη µηδενική υπόθεση δεχόµαστε ότι η διάµεσος διαφορά<br />

είναι 0. Ίδια υπόθεση µε τον προσηµικό έλεγχο.<br />

‣ Οι διατάξεις ορίζονται µε βάση την απόλυτη τιµή της<br />

διαφοράς, ενώ οι προσηµασµένες διατάξεις προκύπτουν από<br />

τη διάταξη επί το πρόσηµο της διαφοράς.<br />

‣ Το άθροισµα των θετικών προσηµασµένων διατάξεων<br />

προσεγγίζει την κανονική κατανοµή.<br />

Z<br />

T<br />

=<br />

T<br />

−<br />

σ Τ<br />

µ τ<br />

T: άθροισµα προσηµασµένων διατάξεων<br />

n (n+1) nn ( + 1)(2n+<br />

1)<br />

µ<br />

Τ<br />

=<br />

σ Τ<br />

=<br />

4 24<br />

Αλλιώς υπολογίζουµε µε βάση στατιστικούς πίνακες.<br />

4<br />

2


Παράδειγµα 1. Μια µελέτη διεξήχθη για να διερευνήσει εάν η<br />

βρόµη βοηθάει να ελαττωθεί το επίπεδο χοληστερόλης στον ορό<br />

σε άνδρες µε υψηλή χοληστερόλη. Σε ένα τυχαίο δείγµα από 14<br />

άνδρες χορηγήθηκαν δύο δίαιτες. Η µία αφορούσε την<br />

κατανάλωση πρωινού µε βάση τη βρόµη και η άλλη τον<br />

αραβόσιτο. Στη µελέτη καταγράφονται τα επίπεδα χαµηλής<br />

πυκνότητας λιποπρωτείνης (LDL) χοληστερόλης, µετά από δύο<br />

εβδοµάδες. Στη συνέχεια ο κάθε άνδρας ακολούθησε την άλλη<br />

δίαιτα. Μετά από άλλες δύο εβδοµάδες καταγράφηκαν και πάλι<br />

τα LDL επίπεδα.<br />

Άτο µο 1 2 3 4 5 6 7<br />

Αραβόσιτο ς 4,61 6,42 5,40 4,54 3,98 3,82 5,01<br />

Βρώµη 3,84 5,57 5,85 4,80 3,68 2,96 4,41<br />

Άτο µο 8 9 10 11 12 13 14<br />

Αραβόσιτο ς 4,34 3,80 4,56 5,35 3,89 2,25 4,24<br />

Βρώµη 3,72 3,49 3,84 5,26 3,73 1,84 4,14<br />

5<br />

ΛΥΣΗ ΠΑΡΑ∆ΕΙΓΜΑΤΟΣ 1 (ΠΡΟΣΗΜΙΚΟ ΤΕΣΤ)<br />

Βήµα 1ο. Ηο: µ 1 = µ 2 (n + =n – )<br />

Ηα: µ 1 ≠ µ 2 (n + ≠ µ 2 )<br />

Βήµα 2ο. Εκτίµηση του αριθµού των πρόσηµων, του D=Σ+<br />

D= Σ+=12 Αναµενόµενα θετικά πρόσηµα: np=14/2=7.<br />

Βήµα 3ο. Χρήση του προσεγγιστικού<br />

Z-στατιστικού<br />

για τη διωνυµική κατανοµή<br />

Βήµα 4ο. Σύγκριση µε την κρίσιµη z τιµή 1,96.<br />

Z<br />

+<br />

n<br />

D −<br />

2 12 − 7<br />

= = = 2.67<br />

n /4 14/4<br />

Βήµα 5ο. Επειδή |Ζ|= >1,96 η Ηο απορρίπτεται. υπάρχει διαφορά<br />

στις δύο δίαιτες.<br />

∆ιαφορετικά P(D≥12)=2*(P(D=12)+P(D=13)+P(D=14))=<br />

⎡⎛14⎞ ⎛14⎞ ⎛14⎞<br />

⎢⎜ ⎟ ⎜ ⎟ ⎜ ⎟<br />

⎣⎝12⎠ ⎝13⎠ ⎝14⎠<br />

14 13 14<br />

2 * 0.5 + 0.5 + 0.5 = 2 * 0,00647=0.013<br />

⎤<br />

⎥<br />

⎦<br />

6<br />

3


ΛΥΣΗ ΠΑΡΑ∆ΕΙΓΜΑΤΟΣ 1<br />

(Wilcoxon ΠΡΟΣΗΜΑΣΜΕΝΗΣ ∆ΙΑΤΑΞΗΣ )<br />

Βήµα 1ο. Ηο: µ χ -µ y =0 εναντίον Ηα: µ χ -µ υ ≠ 0<br />

Βήµα 2ο. Εκτίµηση του αθροίσµατος των θετικών προσηµασµένων<br />

διατάξεων<br />

T= 94 µ Τ =52,5 σ=15,9<br />

Βήµα 3ο. Χρήση του προσεγγιστικού Z-στατιστικού<br />

T − µ<br />

Τ<br />

94 − 52,5<br />

Z = = = 2,54<br />

σ 15,9<br />

Βήµα 4ο. Σύγκριση µε την κρίσιµη z τιµή 1,96.<br />

Βήµα 5ο. Επειδή |Ζ|= 2,54 >1,96 η Ηο απορρίπτεται. υπάρχει<br />

διαφορά στις δύο δίαιτες.<br />

∆ιαφορετικά ελέγχω από Πίνακες για Wilcoxon<br />

Τ<br />

7<br />

ΛΥΣΗ ΠΑΡΑ∆ΕΙΓΜΑΤΟΣ 1 (EXCEL)<br />

Προσηµικό test. Χρήση των συναρτήσεων RANK, NORMSINV, NORMSDIST,<br />

BINOMDIST<br />

8<br />

4


ΛΥΣΗ ΠΑΡΑ∆ΕΙΓΜΑΤΟΣ 1 (EXCEL)<br />

Wilcoxon test. Χρήση των συναρτήσεων RANK, NORMSINV, NORMSDIST.<br />

9<br />

ΛΥΣΗ ΠΑΡΑ∆ΕΙΓΜΑΤΟΣ 1 (SPSS)<br />

Επιλογή από Analyze-Non Parametric Tests-2 Related Samples<br />

10<br />

5


ΛΥΣΗ ΠΑΡΑ∆ΕΙΓΜΑΤΟΣ 1 (SPSS)<br />

Descriptive Statistics<br />

CORN<br />

OATS<br />

N Mean Std. Deviation Minimum Maximum<br />

14 4,44 ,97 2,25 6,42<br />

14 4,08 1,06 1,84 5,85<br />

Frequencies<br />

OATS - CORN<br />

a. OATS < CORN<br />

b. OATS > CORN<br />

c. OATS = CORN<br />

Negative Differences<br />

Positive Differences<br />

Ties c<br />

Total<br />

b<br />

a<br />

N<br />

12<br />

2<br />

0<br />

14<br />

Test Statistics b<br />

NPAR TEST<br />

/WILCOXON=corn WITH oats<br />

(PAIRED)<br />

/SIGN= corn WITH oats (PAIRED)<br />

/STATISTICS DESCRIPTIVES<br />

/MISSING ANALYSIS.<br />

Exact Sig. (2-tailed)<br />

OATS - CORN<br />

,013 a<br />

a. Binomial distribution used.<br />

b. Sign Test<br />

11<br />

ΛΥΣΗ ΠΑΡΑ∆ΕΙΓΜΑΤΟΣ 1 (SPSS)<br />

Ranks<br />

OATS - CORN<br />

a. OATS < CORN<br />

b. OATS > CORN<br />

c. OATS = CORN<br />

Negative Ranks<br />

Positive Ranks<br />

Ties<br />

Total<br />

N Mean Rank Sum of Ranks<br />

12 a 7,75 93,00<br />

2 b 6,00 12,00<br />

0 c<br />

14<br />

Test Statistics b<br />

OATS - CORN<br />

Z<br />

-2,542 a<br />

Asymp. Sig. (2-tailed)<br />

,011<br />

a. Based on positive ranks.<br />

b. Wilcoxon Signed Ranks Test<br />

12<br />

6


Έλεγχος Αθροίσµατος διατάξεων του Wilcoxon<br />

(Wilcoxon rank sum test) ή (Wilcoxon-Mann-Whitney)<br />

‣ Εφαρµόζεται όταν οι µετρήσεις είναι από ανεξάρτητα δείγµατα<br />

‣ Προϋπόθεση εφαρµογής είναι οι κατανοµές των δύο<br />

δειγµάτων να έχουν την ίδια γενική µορφή.<br />

‣ Μηδενική υπόθεση: Οι διάµεσοι των ηλικιών είναι ίδιες<br />

‣ Όλες οι τιµές των δειγµάτων διατάσσονται κατά αύξουσα<br />

σειρά.<br />

‣ Το µικρότερο άθροισµα διατάξεων (W) ακολουθεί<br />

προσεγγιστικά κανονική κατανοµή<br />

W − µ<br />

n<br />

w<br />

S( ns + nL<br />

+ 1) nn<br />

s L( ns + nL<br />

+ 1)<br />

Zw<br />

=<br />

µ<br />

W<br />

=<br />

σ<br />

W<br />

=<br />

σ όπου<br />

2<br />

12<br />

w<br />

Όπου n S , n L οι αριθµοί των δειγµάτων µε το µικρότερο και<br />

µεγαλύτερο άθροισµα διατάξεων αντίστοιχα.<br />

Αλλιώς υπολογίζουµε µε βάση στατιστικούς πίνακες.<br />

13<br />

Παράδειγµα 2. Εξετάστηκαν και για τα δύο φύλα, τα<br />

χαρακτηριστικά των βρεφών µε χαµηλό βάρος κατά τη γέννηση<br />

που πέθαναν από σύνδροµο αιφνίδιου θανάτου. Οι ηλικίες κατά<br />

το χρόνο θανάτου για δείγµατα 11 κοριτσιών και 16 αγοριών,<br />

παρουσιάζονται στον παρακάτω πίνακα.<br />

Ελέγξτε εάν διαφοροποιούνται οι διάµεσοι χρόνοι επιβίωσης.<br />

Ηλικία (Ηµέρες)<br />

Αγό ρια Κο ρίτσ ια<br />

46 115 53<br />

52 133 56<br />

58 134 60<br />

59 167 60<br />

77 175 78<br />

78 87<br />

80 102<br />

81 117<br />

84 134<br />

103 160<br />

114 277<br />

14<br />

7


ΛΥΣΗ ΠΑΡΑ∆ΕΙΓΜΑΤΟΣ 2<br />

(Wilcoxon – Μann - Whitney)<br />

Βήµα 1ο. Ηο: X και Υ έχουν την ίδια κατανοµή<br />

Ηα: Χ και Υ δεν έχουν την ίδια κατανοµή<br />

Βήµα 2ο. Εκτίµηση του αθροίσµατος των θετικών διατάξεων<br />

W L = 221 W k =157 N s =11 N L =16<br />

µ W =154 s w =20,265<br />

Βήµα 3ο. Υπολογισµός του Z<br />

Z<br />

w<br />

W − µ<br />

w<br />

157 −154<br />

= = = 0,148<br />

σ 20,265<br />

w<br />

Βήµα 4ο. Υπολογισµός της κρίσιµης τιµής Z crit. Z crit. = 1.96<br />

Βήµα 5o. H Ho είναι αποδεκτή. Η κατανοµή των Χ, Υ είναι ίδια.<br />

Συνεπώς οι διάµεσοι χρόνοι επιβίωσης για τα δύο φύλα είναι ίδιοι.<br />

15<br />

ΛΥΣΗ ΠΑΡΑ∆ΕΙΓΜΑΤΟΣ 2 (EXCEL)<br />

Συναρτήσεις που χρησιµοποιήθηκαν<br />

RANK<br />

Π.χ. RANK(B2; $B$2:$B$28; 1)<br />

NORMSINV<br />

NORMSDIST<br />

16<br />

8


ΛΥΣΗ ΠΑΡΑ∆ΕΙΓΜΑΤΟΣ 2 (SPSS)<br />

Επιλογή από Analyze-Non Parametric Tests-2 Independent Samples<br />

17<br />

ΛΥΣΗ ΠΑΡΑ∆ΕΙΓΜΑΤΟΣ 2 (SPSS)<br />

Ranks<br />

SURV<br />

GENDER<br />

Female<br />

Male<br />

Total<br />

N Mean Rank Sum of Ranks<br />

11 14,27 157,00<br />

16 13,81 221,00<br />

27<br />

Test Statistics b SURV<br />

Mann-Whitney U<br />

85,000<br />

Wilcoxon W<br />

221,000<br />

Z<br />

-,148<br />

Asymp. Sig. (2-tailed) ,882<br />

Exact Sig. [2*(1-tailed<br />

,904 a<br />

Sig.)]<br />

a. Not corrected for ties.<br />

b. Grouping Variable: GENDER<br />

SURV<br />

GENDER<br />

Descriptive Statistics<br />

N Mean Std. DeviationMinimumMaximum<br />

27 101,48 51,066 46 277<br />

27 ,59 ,501 0 1<br />

NPAR TESTS<br />

/M-W= surv BY gender(0 1)<br />

/STATISTICS= DESCRIPTIVES<br />

/MISSING ANALYSIS.<br />

18<br />

9


ΓΝΩΣΤΟΙ ΜΗ ΠΑΡΑΜΕΤΡΙΚΟΙ ΕΛΕΓΧΟΙ<br />

• Kruskal-Wallis. Μη παραµετρικός έλεγχος αντίστοιχος της<br />

ανάλυσης διασποράς. Εξετάζει αν τα δείγµατα προέρχονται από την<br />

ίδια κατανοµή.<br />

• Friedman. Μη παραµετρικός έλεγχος. Γενίκευση του<br />

προσηµικού test για περισσότερα από 2 συσχετισµένα δείγµατα.<br />

• Kolmogorov-Smirnov 2 δειγµάτων. Χρησιµοποιείται για<br />

ανεξάρτητα δείγµατα και ελέγχει εάν προέρχονται από την ίδια<br />

κατανοµή<br />

• χ 2 -καλής προσαρµογής. Ελέγχει εάν οι πειραµατικές τιµές<br />

ακολουθούν µια γνωστή κατανοµή.<br />

• χ 2 -για πίνακες συνάφειας. Ελέγχει εάν υπάρχει συσχέτιση σε<br />

ένα πίνακα συνάφειας µεταξύ δύο µεταβλητών<br />

• Mc-Nemar. Ελέγχει εάν υπάρχει µεταβολή σε πίνακες συνάφειας<br />

2x2. Εφαρµόζεται σε επαναληπτικές διαδικασίες.<br />

19<br />

ΣΥΖΗΤΗΣΗ<br />

• Ποιους ελέγχους θα πρέπει να χρησιµοποιώ; Παραµετρικούς ή µη<br />

παραµετρικούς;<br />

• ΠΛΕΟΝΕΚΤΗΜΑΤΑ ΜΗ ΠΑΡΑΜΕΤΡΙΚΩΝ ΕΛΕΓΧΩΝ<br />

∆εν απαιτούν περιοριστικές υποθέσεις.<br />

Μεγαλύτερη ταχύτητα στους υπολογισµούς….<br />

Είναι λιγότερο ευαίσθητοι στις ακραίες τιµές<br />

• ΜΕΙΟΝΕΚΤΗΜΑΤΑ ΜΗ ΠΑΡΑΜΕΤΡΙΚΩΝ ΕΛΕΓΧΩΝ<br />

Όταν ισχύουν οι προϋποθέσεις για τους παραµετρικούς<br />

παρουσιάζουν µικρότερη ισχύ.<br />

Πως θα ελέγξω την κανονικότητα των δεδοµένων;<br />

Άλλη αντιµετώπιση …<br />

Μετασχηµατισµός των µετρήσεων<br />

20<br />

10

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!