Ãnizleme
Ãnizleme
Ãnizleme
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
BİLİMSEL<br />
ARAŞTIRMALARDA VERİ<br />
DEĞERLENDİRME VE<br />
İSTATİSTİKSEL ANALİZ<br />
YÖNTEMLERİ<br />
PROF.DR.MEHMET MENDEŞ
BİLİMSEL ÇALIŞMALAR İÇİN AKIŞ DİYAGRAMI<br />
• AMAÇ (Merak Edilen Konu)<br />
HANGİ FAKTÖR YA DA FAKTÖRLERİN ETKİSİ ARAŞTIRILACAK<br />
HEDEF POPULASYON<br />
KAÇ DENEY ÜNİTESİ ÜZERİNDE ÇALIŞILMALI n=<br />
DENEY ÜNİTELERİ NASIL SEÇİLMELİ<br />
HANGİ ÖZELLİKLER ÜZERİNDE DURULACAK<br />
DENEY ÜNİTELERİNDEN GÖZLEM YA DA VERİLER NASIL ELDE EDİLECEK<br />
KULLANILACAK İSTATİSTİK YÖNTEMİ NASIL BELİRLENECEK<br />
VERİLER NASIL ANALİZ EDİLİP, YORUMLANIP VE RAPOR EDİLECEK
AMAÇ: Farklı Sınav Yöntemlerinin İstatistik Dersi Başarı Puanlarına Etkisi<br />
DİKKATE ALINACAK FAKTÖRLER:<br />
Sınav Yöntemleri: Yazılı, Test, Sözlü<br />
HEDEF POPULASYON:<br />
Üniversite II.sınıf öğrencileri Kaç öğrenci var 2 milyon!<br />
KAÇ ÖĞRENCİ ÜZERİNDEN ÇALIŞILMALI<br />
n=10, 20, 30, 50, 100,300,500,1000,……..42000, …..<br />
BU ÖĞRENCİLER NASIL SEÇİLECEK ÖRNEKLEME NASIL YAPILACAK<br />
Bütün öğrenciler üzerinden çalışılması mümkün mü<br />
Keyfi (Mesela hep ODTÜ’de okuyan öğrencileri ya da ÇOMU Su Ürünleri<br />
Fakültesi öğrencilerini alırsak ne olur<br />
Rastgele<br />
Tabakalı….<br />
DİKKATE ALINACAK ÖZELLİK:<br />
İstatistik dersi başarı puanları
Özellik ya da Değişkenler esas olarak:<br />
Kantitatif (sayısal ya da nicel) ve<br />
Kalitatif (kategorik ya da nitel) değişkenler olmak üzere iki kısma<br />
ayrılır.<br />
Kantitatif değişkenler rakamlarla ifade edilirler ve söz konusu rakamlar<br />
arasındaki farkların matematiksel olarak bir anlamı vardır.<br />
Sürekli değişkenler ve Kesikli değişkenler olmak üzere ikiye ayrılır.<br />
Mesela:<br />
Bu tür değişkenler daha ziyade ölçüm, tartım ve analiz sonucunda<br />
elde edilirler.<br />
Canlı ağırlık, günlük sıcaklık değerleri, m2’ye düşen yağış miktarı, bitki<br />
boyu, insanların hemoglobin düzeyleri, sütteki % yağ miktarı, topraktaki<br />
organik madde düzeyi sürekli değişkenler için örnek olarak verilebilir.
Kesikli değişkenler ise sayılarak elde edilen ve tanım<br />
aralıklarındaki her değeri alamayan değişkenlerdir<br />
Bu tür değişkenler tanım aralıklarında sadece tam sayı değerlerini<br />
alabilirler.<br />
Mesela:<br />
Kardeş sayısı, ağızdaki çürük diş sayısı, bir çiftlikte gebe olan<br />
ineklerin sayısı, bir kümesteki günlük yumurta sayısı, bitkideki<br />
yaprak sayısı, bir sınıftaki kız öğrencilerin sayısı vb ise kesikli<br />
değişkenler için örnek olarak verilebilir.<br />
Ancak her tamsayı değerini alan değişkenlerin kesikli<br />
değişken olmasının gerekmeyeceği unutulmamalıdır.
Kalitatif değişkenler sayısal olarak ifade edilemeyen ve<br />
kategorik ya da sınıflandırılmış olarak ifade edilen değişkenlerdir<br />
Bu tür değişkenlerin her bir kategorisine verilecek rakamlar arasındaki<br />
farkların matematiksel olarak bir anlamı yoktur.<br />
Sadece her bir rakam ayrı bir kategoriyi göstermek için verilir.<br />
Mesela:<br />
Göz rengi, cinsiyet, eğitim durumu, başarı durumu, medeni hal,<br />
desteklediği siyasi parti, yaşadığı bölge, hastalık aşaması vb<br />
kalitatif değişkenler için birer örnektir.<br />
sıralanmış (ordinal) ve<br />
isimsel (nominal)
YUKARIDAKİ ÇALIŞMA İÇİN<br />
GÖZLEMLER NASIL ELDE EDİLECEK<br />
Ölçüm ile elde edilecek (0-100, 0-5, 0-10 vb bir ölçüm skalası),
DENEY ÜNİTELERİNDEN GÖZLEM YA DA<br />
VERİLER NASIL ELDE EDİLECEK<br />
Üzerinde durulan özellik bakımından bir gözlem ya da deney<br />
sonucunda deney ünitelerinden elde edilen her bir rakam ise veri<br />
ya da gözlem değeri (varyant) olarak adlandırılır.<br />
Mesela:<br />
Öğrencilerin notları: Özelliktir<br />
Veri ya da gözlem değeri: 50, 42, 88, 17
KULLANILACAK İSTATİSTİK YÖNTEMİ NASIL<br />
BELİRLENECEK<br />
• Verilerin elde ediliş şekillerine<br />
• Çalışmanın amacına<br />
• Dikkate alınan faktör sayısına<br />
• Tespit edilen özelliklerin ayrı ayrı ya da birlikte dikkate alınıp<br />
alınmayacağına göre<br />
• Gözlem sayısına<br />
• Materyalin yapısına<br />
• İlişkinin mi araştırılacağı yoksa farkların mı karşılaştırılacağına<br />
• Gözlemlerin aynı bireylerden mi yoksa farklı bireylerden mi<br />
alındığına bağlı olarak değişir.<br />
• Burada faktör olarak sadece Sınav Yöntemi var. Dolayısıyla<br />
• t-testi
VERİLER NASIL ANALİZ EDİLİP, YORUMLANIP VE<br />
RAPOR EDİLECEK<br />
Uygun İstatistiksel model<br />
Minitab, SPSS, SAS, NCSS, Statistica vb. İstatistik Paket<br />
Programları kullanılarak<br />
HİPOTEZ KONTROLÜ:<br />
ÖNEMLİLİK DÜZEYİ: P>0.05 ya da P≤0.05
Hangi alanda olursa olsun merak edilen konu ile ilgili güvenilir bilgiler elde etmek için<br />
araştırma ve deneye ihtiyaç vardır. Çünkü:<br />
Araştırma ve deney yapmadan uygulanacak bilgi yoktur.<br />
Üzerinde durulan özellik bakımından deney ünitelerinden veriler toplandıktan sonra<br />
söz konusu verilerin aynı olmadıkları, aralarında bir takım farklılıkların (varyasyon)<br />
bulunduğu görülür.<br />
Dolayısıyla araştırma ve denemelerde temel kavram; farklılık<br />
ya da değişimdir (varyasyon).<br />
Araştırıcılar hep bu kavram üzerine odaklanır ve farklılığa neden olan unsurları<br />
belirlemeye çalışırlar.<br />
Diğer yandan eğer bütün gözlem değerleri aynı olsaydı, her hangi<br />
bir farklılıktan söz edilemeyeceği için araştırma ve denemelere de<br />
gerek kalmazdı.<br />
Ancak bu gibi durumlara uygulamada hemen hemen hiç rastlanılmaz.
Neden İstatistiğe İhtiyaç Duyulur<br />
Etrafımızda birçok biyolojik, sosyal ve ekonomik olay cereyan etmektedir. Bu olaylarla<br />
ilgili değişik sorular aklımıza gelebilir ya da değişik konuları merak edebiliriz.<br />
Mesela:<br />
Yeni geliştirilen bir ilacın kanseri önlemede etkili olup olmadığının belirlenmesi<br />
Farklı firmalar tarafından üretilen meyve sularındaki C-vitamini miktarı arasında<br />
fark olup olmadığının belirlenmesi<br />
Domuz gribinden korunmak için farklı ilaç firmaları tarafından geliştirilen aşı<br />
çeşitlerinin etkileri arasında fark olup olmadığının belirlenmesi<br />
Beslenme tarzındaki değişikliklerin insan sağlığına etkilerinin nasıl olduğunun<br />
araştırılması<br />
Acaba sınav yöntemlerindeki farklılıklar öğrencilerin başarı notlarını<br />
nasıl etkiler
Acaba akciğer kanserine yakalanma oranı bakımından bölgeler arasında fark var<br />
mıdır<br />
<br />
İşsizlik oranları bakımından Avrupa Birliği ülkeleri ile Ortadoğu ülkeleri arasında fark<br />
var mıdır Acaba Genetik yapısı değiştirilmiş (GDO) ürünler insan sağlığını nasıl<br />
etkiliyor gibi aklımıza pek çok soru gelebilir.<br />
Yeni geliştirilen bir kaplama materyalinin, mevcut kaplama materyallerine göre<br />
raf ömrünü uzatıp uzatmadığının araştırılması<br />
Farklı buğday çeşitlerinin gluten içeriklerinin farklı olmasının nedenleri nelerdir<br />
Acaba bu sorulara nasıl cevap verebiliriz Ya da söz konusu karşılaştırmaları nasıl<br />
yapabiliriz<br />
İşte İstatistik Bilimi bu soruların bilimsel olarak cevaplandırılmasına imkân<br />
sağlar.
İstatistiğin Tarihçesi<br />
Yaşamın başlangıcından beri insanların kendilerine ait:<br />
Doğum,<br />
Ölüm,<br />
Evlenme,<br />
Mal varlığı gibi bazı olayları inceleme ve kaydetme ihtiyacı duymuş olmaları<br />
dikkate alındığında, insanların toplu yaşamaya başladıkları günden beri<br />
dolaylı olarak istatistik ile ilgilenmiş oldukları kabul edilebilir.
İstatistiğin Tarihçesi<br />
İstatistik sözcüğünün kullanılması Aristotle zamanlarına kadar gitmektedir.<br />
Bu tarihlerde devletler toplam askeri ve mali güçlerini saptayabilmek için<br />
bazı sayımlar yapmışlardır.<br />
Mesela:<br />
Mısırlılar, Yunanlılar, Çinliler, Romalılar ve Türklerin mali ve askeri<br />
güçlerini diğer toplumlarla karşılaştırmak ve buna göre de kimin güçlü kimin<br />
güçsüz olduğunu belirleyerek, savaş stratejilerini yön verme amacıyla<br />
istatistik yaptıklarını göstermektedir.
Günümüzdeki anlamı ile modern istatistiğin gelişmesindeki en büyük<br />
etmenlerden birisi; 16. ve 17. YY'larda olasılık teorisinin ilgi çekmesi ve<br />
bazı bilim adamlarının bu konu üzerinde çalışmasıdır.<br />
İstatistik alanındaki ilk çalışmalara şans oyunlarındaki kazanma<br />
ihtimallerinin hesaplanmaya çalışılması ile başlanmıştır.<br />
Acaba kazanma ihtimalimi nasıl arttırabilirim<br />
Ancak, 17 YY kadar önemli bir gelişme sağlanamamıştır.<br />
Toplanan verilerin istatistik analizlerine doğru ilk adım 17. YY'da<br />
İngiltere'de John Graunt tarafından atılmıştır.
Daha sonraları ünlü matematikçilerden:<br />
Pascal,<br />
Fermat,<br />
James<br />
Daniel Bernoulli,<br />
de Moivre, Laplace,<br />
Gauss,<br />
Simpson,<br />
Lagrange,<br />
Hermite ve Legendre birçok önemli olasılık kuralını ve teoremlerini geliştirerek istatistiğin<br />
gelişmesine önemli katkılarda bulunmuşlardır.
19. YY'ın sonlarına doğru bir bireyde birden fazla özelliğe ilişkin veri elde<br />
edildiği durumlarda nasıl bir yol izlenebileceği üzerinde durulmuş.<br />
Sir Francis Galton<br />
Daha sonra Galton'un bu fikirleri Karl Pearson ve C. Sperman<br />
tarafından genişletilerek psikoloji ve sosyal bilimlere uygulanmıştır.<br />
• Korelasyon<br />
• Regresyon
Yeni Bir Dönem<br />
1908 yılında Biometrika dergisinde yayınladığı bir makale ile William S. Gosset<br />
istatistikte yeni bir dönemin başlamasına yol açmıştır.<br />
Bir bira fabrikasında arpa ıslahı projelerinde çalışan Gosset, ekonomik<br />
nedenlerle küçük örneklerle uğraşmak zorunluluğunda kalmıştır.<br />
Bu gibi durumlar için uygun istatistik yöntemlere gereksinim duymuştur.<br />
Böyle bir gereksinimden hareketle, küçük örneklerin dağılışını deneysel olarak<br />
inceleyen Gosset günümüzde çok yaygın olarak kullanılan bazı yöntemleri<br />
geliştirmiş, pek çoğuna da ışık tutmuştur.<br />
STUDENT T-TESTİ<br />
Yazılarını "Student" takma adıyla yayınlayan Gosset'ten sonra Ronald A. Fisher<br />
küçük örnek teorisini geliştirerek günlük araştırmalarda uygulanmasını sağlamıştır.
20. YY'ın en büyük istatistikçisi olarak tanımlayabileceğimiz Sir Ronald<br />
A. Fisher günümüzde kullanılan istatistik yöntemlerin hemen hemen<br />
hepsinin ilk fikirlerini ortaya atan ve en yaygın olarak kullanılan pek<br />
çok yöntemi de geliştiren kişidir.<br />
VARYANS ANALİZİ
Peki tahminler %100 doğrumudur
Günümüzde!<br />
Özellikle son yıllarda bilim ve teknolojinin gelişmesine paralel olarak istatistik metotları<br />
daha fazla ihtiyaç duyulur bir hale gelmiştir.<br />
Çünkü istatistik, amaca bağlı olarak araştırma ve denemelerin nasıl planlanıp<br />
yürütülmesinden başlar, deney ünitelerinden elde edilen gözlem değerlerinin bilimsel<br />
olarak nasıl değerlendirileceği ya da analiz edileceği, elde edilen sonuçların nasıl<br />
yorumlanıp rapor edileceğine kadarki bütün aşamaları kapsamaktadır.<br />
Dolayısıyla istatistik, bilimsel çalışmalardan elde edilen verilerin değerlendirilmesinde ve<br />
elde edilen sonuçların yorumlanarak genelleştirilebilmesinde yararlanılan en önemli<br />
araçlardan birisidir.<br />
Artık günümüz dünyasında sonuçları istatistiksel olarak ta<br />
desteklenmeyen bilimsel araştırma sonuçlarına hep kuşku ile<br />
bakılmaktadır.
İstatistik Nedir<br />
• Deneme desenlerinin planlanması veya tasarım,<br />
• Verilerin toplanması,<br />
• Verilerin özetlenmesi ve analizi,<br />
• Sonuçların yorumlanması ve genelleştirilmesi
İstatistiğin Uygulama Alanları<br />
Özellikle son yıllarda bütün dünyada önemi gittikçe daha fazla<br />
anlaşılmaya başlanan istatistik metotlarının günümüzde<br />
uygulanmadığı alan hemen hemen yok gibidir.
İstatistik<br />
Teorik (Matematiksel)<br />
Uygulamalı<br />
Son yıllarda, istatistik yöntemlerin kullanılması o kadar gelişmiş ve<br />
genişlemiştir ki, uygulamalı istatistiğin birçok çeşitli alan için özelleşmiş alt<br />
disiplinleri ortaya çıkmıştır. Örneğin:<br />
Biyometri veya Biyoistatistik:<br />
Environmetri<br />
Ekonometri<br />
Jeoistatistik<br />
Psikometri vb
• Bunlardan Biyometri (Biyoistatistik) istatistik yöntemlerinin biyoloji<br />
alanına uygulamasıdır.<br />
• Bu alan ziraat, tıp, eczacılık, diş hekimliği, veteriner hekimliği, su<br />
ürünleri, ormancılık, zooloji, ekoloji ve botanik gibi birçok disiplini<br />
kapsayan çok geniş bir uygulama alanıdır.
Metot Bilimi Olarak İstatistik<br />
• Araştırma ve Denemelerin Planlanması,<br />
• Verilerin toplanması,<br />
• Verilerin özetlenmesi (tablo ve grafik),<br />
• Tespit edilen özellikler arasındaki ilişkilerin araştırılması,<br />
• Dikkate alınan faktörlere göre analiz edilmesi,<br />
• Sonuçların yorumlanması ve genelleştirilmesi
• İstatistik metotlarına genel olarak, üzerinde durulan özellik<br />
bakımından örneğimizin tanıtılması ve<br />
• örnekten elde edilen değerlerden yararlanılarak populasyona ilişkin<br />
bazı sonuçlara ulaşmak amacıyla başvurulur
Dolayısıyla istatistik metotları esas olarak;<br />
• Tanıtıcı İstatistikler (Descriptive)<br />
Tanıtıcı istatistikler örneğimizi tanıtmaya yarayan istatistiklerdir.<br />
• Çıkarımsal ya da Sonuç çıkartıcı (inferential) istatistikler olmak<br />
üzere iki kısma ayrılır.<br />
Tahmin yapma ve hipotez kontrolü
• Veri:<br />
• Veri Türleri:<br />
• Verilerin elde edilişleri, verilerin değerlendirilmesinde kullanılacak<br />
istatistik analiz tekniğini etkiler mi
Bir araştırma veya deneme yürütüldüğünde bir çok veri ya da gözlem değeri<br />
elde edilir. Eğer bu veriler bilimsel olarak değerlendirilmediğinde ne olur<br />
X1 X2 X3 X4 X5<br />
115 129 105 122 62<br />
113 86 71 90 76<br />
113 83 97 94 118<br />
87 99 100 93 98<br />
106 76 93 70 86<br />
115 107 108 78 95<br />
98 161 84 169 61<br />
123 90 91 95 100<br />
111 106 121 126 89<br />
96 117 114 113 118<br />
120 89 110 119 110<br />
94 64 97 91 98<br />
100 97 100 123 108<br />
128 119 80 110 116<br />
116 123 95 101 133
Söz konusu veriler birer rakam ya da simge<br />
olmaktan başka hiçbir şey ifade etmezler.
Verileri nasıl tanıtıp, özetleyebiliriz<br />
•<br />
ORTALAMA STANDART HATA VARYANS MEDYAN EN KÜÇÜK EN BÜYÜK<br />
108,9959 3,012221 136,1021 113,1205 87,02 127,89<br />
103,1357 6,265684 588,8819 99,16618 64,46 161,47<br />
97,64207 3,415573 174,9921 97,18834 71,26 121,31<br />
106,2732 6,260185 587,8488 101,1385 69,53 169,1<br />
97,83517 5,339958 427,7272 98,26915 60,73 132,73
175<br />
150<br />
125<br />
Data<br />
100<br />
75<br />
50<br />
X1<br />
X2<br />
X3<br />
X4<br />
X5
30 öğrencinin kardeş sayıları<br />
• 1,3,9,5,1,1,2,3,2,3,4,3,5,2,2,1,1,3,5,4,4,3,1,<br />
3,1,2,3,3,2,2<br />
• Acaba bu veri grubunu tanıtmak ve özetlemek için aynı istatistikleri<br />
hesaplayıp, aynı grafikleri çizebilirmiyiz<br />
• HAYIR
Kardeş sayılarına ilişkin frekans<br />
dağılım tablosu
• Bir Araştırma ya da denemeden elde edilen<br />
gözlem değerleri aynı olsaydı herhangi bir<br />
istatistik analize ihtiyaç duyulur muydu
10 öğrencinin Bilgisayara Giriş, İstatistik ve ADY derslerinden<br />
aldıkları notlar aşağıdaki gibi olsun.
Acaba İstatistik ve ADY derslerindeki<br />
farklılığı nasıl özetleyebiliriz
Yazılı, Sözlü ve Test sınavlarına tabii tutulan öğrencilerin<br />
İstatistik dersinden aldıkları notlar aşağıdaki gibi bulunmuş<br />
olsun:<br />
Yazılı Sözlü Test<br />
65 70 75<br />
58 55 70<br />
70 40 65<br />
40 50 85<br />
49 30 90<br />
63 60 60<br />
25 40 45<br />
66 70 30<br />
72 55 60<br />
85 40 70
Sınav yöntemleri arasında gözlenen<br />
farkın sebepleri neler olabilir<br />
• Sınav yöntemi<br />
• Tesadüf ya da sebebini bilemediğimiz,<br />
kontrol altına alamadığımız faktörler<br />
• DENEME HATASI!!!!
NASIL BELİRLEYEBİLİRİZ<br />
• HİPOTEZ KONTROLÜ,<br />
•<br />
• P>0.05 P≤0.05<br />
• P=0.174 >0.05<br />
• P=0.174 değeri, 0.05 ten büyük olduğu için hipotezi kabul edilir.<br />
Dolayısıyla “bu üç sınav yönteminin ortalamaları arasında<br />
gözlenen farkların tamamen tesadüften ileri geldiği ve<br />
istatistiksel olarak önemli olmadığı” sonucuna varılır. Diğer bir<br />
ifade ile “sınav yöntemlerinin başarı puanlarına etkilerinin<br />
benzer olduğu sonucuna varılır.”
Peki varılan bu sonuç % 100<br />
doğrumudur<br />
• HAYIR<br />
• O ZAMAN DOĞRULUK DERECESİ
Bilimsel çalışma sonuçları rapor edilirken ilk aşama verilerin<br />
tanıtılmasıdır. Yani tanıtıcı istatistiklerin hesaplanmasıdır
Söz konusu denemeyi 2.yıl tekrarlayan bir araştırıcının<br />
elde ettiği veriler aşağıdaki gibi olsun.
MINITAB İstatistik Paket Programını<br />
Kullanarak Analiz Edelim
SONUÇ<br />
• Sadece Test ve Sözlü sınav yöntemleri<br />
arasında istatistiksel olarak önemli bir fark<br />
bulunmaktadır.<br />
• Öneri: Öğrencilerin Test ya da Yazılı<br />
Sınavlarından birisine tabii tutulmaları.<br />
• Hangisinin uygulanması daha kolay ise
Rastgele belirlenen 9 bireyin Ağırlıkları ve Sistolik (S) kan basınçları (mm /<br />
Hg) aşağıdaki gibi ölçülmüştür. Buna göre bireylerin ağırlıkları ile sistolik<br />
kan basınçları arasında önemli bir ilişki varmıdır
Ne kadar bir doğrusal ilişki var<br />
• r=0.834=%83.4<br />
• Peki bu ilişki istatistiksel olarak önemli ya da<br />
anlamlımıdır<br />
• P=0.026!!!<br />
• 0.026
Acaba ağırlıktaki 1 kg lık artışa karşılık, Sistolik<br />
Kan basıncı kaç mmHg değişir<br />
• b=0.934<br />
• Bu değişme önemli ya da anlamlımıdır<br />
• P=0.026