19.01.2015 Views

Önizleme

Önizleme

Önizleme

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

BİLİMSEL<br />

ARAŞTIRMALARDA VERİ<br />

DEĞERLENDİRME VE<br />

İSTATİSTİKSEL ANALİZ<br />

YÖNTEMLERİ<br />

PROF.DR.MEHMET MENDEŞ


BİLİMSEL ÇALIŞMALAR İÇİN AKIŞ DİYAGRAMI<br />

• AMAÇ (Merak Edilen Konu)<br />

HANGİ FAKTÖR YA DA FAKTÖRLERİN ETKİSİ ARAŞTIRILACAK<br />

HEDEF POPULASYON<br />

KAÇ DENEY ÜNİTESİ ÜZERİNDE ÇALIŞILMALI n=<br />

DENEY ÜNİTELERİ NASIL SEÇİLMELİ<br />

HANGİ ÖZELLİKLER ÜZERİNDE DURULACAK<br />

DENEY ÜNİTELERİNDEN GÖZLEM YA DA VERİLER NASIL ELDE EDİLECEK<br />

KULLANILACAK İSTATİSTİK YÖNTEMİ NASIL BELİRLENECEK<br />

VERİLER NASIL ANALİZ EDİLİP, YORUMLANIP VE RAPOR EDİLECEK


AMAÇ: Farklı Sınav Yöntemlerinin İstatistik Dersi Başarı Puanlarına Etkisi<br />

DİKKATE ALINACAK FAKTÖRLER:<br />

Sınav Yöntemleri: Yazılı, Test, Sözlü<br />

HEDEF POPULASYON:<br />

Üniversite II.sınıf öğrencileri Kaç öğrenci var 2 milyon!<br />

KAÇ ÖĞRENCİ ÜZERİNDEN ÇALIŞILMALI<br />

n=10, 20, 30, 50, 100,300,500,1000,……..42000, …..<br />

BU ÖĞRENCİLER NASIL SEÇİLECEK ÖRNEKLEME NASIL YAPILACAK<br />

Bütün öğrenciler üzerinden çalışılması mümkün mü<br />

Keyfi (Mesela hep ODTÜ’de okuyan öğrencileri ya da ÇOMU Su Ürünleri<br />

Fakültesi öğrencilerini alırsak ne olur<br />

Rastgele<br />

Tabakalı….<br />

DİKKATE ALINACAK ÖZELLİK:<br />

İstatistik dersi başarı puanları


Özellik ya da Değişkenler esas olarak:<br />

Kantitatif (sayısal ya da nicel) ve<br />

Kalitatif (kategorik ya da nitel) değişkenler olmak üzere iki kısma<br />

ayrılır.<br />

Kantitatif değişkenler rakamlarla ifade edilirler ve söz konusu rakamlar<br />

arasındaki farkların matematiksel olarak bir anlamı vardır.<br />

Sürekli değişkenler ve Kesikli değişkenler olmak üzere ikiye ayrılır.<br />

Mesela:<br />

Bu tür değişkenler daha ziyade ölçüm, tartım ve analiz sonucunda<br />

elde edilirler.<br />

Canlı ağırlık, günlük sıcaklık değerleri, m2’ye düşen yağış miktarı, bitki<br />

boyu, insanların hemoglobin düzeyleri, sütteki % yağ miktarı, topraktaki<br />

organik madde düzeyi sürekli değişkenler için örnek olarak verilebilir.


Kesikli değişkenler ise sayılarak elde edilen ve tanım<br />

aralıklarındaki her değeri alamayan değişkenlerdir<br />

Bu tür değişkenler tanım aralıklarında sadece tam sayı değerlerini<br />

alabilirler.<br />

Mesela:<br />

Kardeş sayısı, ağızdaki çürük diş sayısı, bir çiftlikte gebe olan<br />

ineklerin sayısı, bir kümesteki günlük yumurta sayısı, bitkideki<br />

yaprak sayısı, bir sınıftaki kız öğrencilerin sayısı vb ise kesikli<br />

değişkenler için örnek olarak verilebilir.<br />

Ancak her tamsayı değerini alan değişkenlerin kesikli<br />

değişken olmasının gerekmeyeceği unutulmamalıdır.


Kalitatif değişkenler sayısal olarak ifade edilemeyen ve<br />

kategorik ya da sınıflandırılmış olarak ifade edilen değişkenlerdir<br />

Bu tür değişkenlerin her bir kategorisine verilecek rakamlar arasındaki<br />

farkların matematiksel olarak bir anlamı yoktur.<br />

Sadece her bir rakam ayrı bir kategoriyi göstermek için verilir.<br />

Mesela:<br />

Göz rengi, cinsiyet, eğitim durumu, başarı durumu, medeni hal,<br />

desteklediği siyasi parti, yaşadığı bölge, hastalık aşaması vb<br />

kalitatif değişkenler için birer örnektir.<br />

sıralanmış (ordinal) ve<br />

isimsel (nominal)


YUKARIDAKİ ÇALIŞMA İÇİN<br />

GÖZLEMLER NASIL ELDE EDİLECEK<br />

Ölçüm ile elde edilecek (0-100, 0-5, 0-10 vb bir ölçüm skalası),


DENEY ÜNİTELERİNDEN GÖZLEM YA DA<br />

VERİLER NASIL ELDE EDİLECEK<br />

Üzerinde durulan özellik bakımından bir gözlem ya da deney<br />

sonucunda deney ünitelerinden elde edilen her bir rakam ise veri<br />

ya da gözlem değeri (varyant) olarak adlandırılır.<br />

Mesela:<br />

Öğrencilerin notları: Özelliktir<br />

Veri ya da gözlem değeri: 50, 42, 88, 17


KULLANILACAK İSTATİSTİK YÖNTEMİ NASIL<br />

BELİRLENECEK<br />

• Verilerin elde ediliş şekillerine<br />

• Çalışmanın amacına<br />

• Dikkate alınan faktör sayısına<br />

• Tespit edilen özelliklerin ayrı ayrı ya da birlikte dikkate alınıp<br />

alınmayacağına göre<br />

• Gözlem sayısına<br />

• Materyalin yapısına<br />

• İlişkinin mi araştırılacağı yoksa farkların mı karşılaştırılacağına<br />

• Gözlemlerin aynı bireylerden mi yoksa farklı bireylerden mi<br />

alındığına bağlı olarak değişir.<br />

• Burada faktör olarak sadece Sınav Yöntemi var. Dolayısıyla<br />

• t-testi


VERİLER NASIL ANALİZ EDİLİP, YORUMLANIP VE<br />

RAPOR EDİLECEK<br />

Uygun İstatistiksel model<br />

Minitab, SPSS, SAS, NCSS, Statistica vb. İstatistik Paket<br />

Programları kullanılarak<br />

HİPOTEZ KONTROLÜ:<br />

ÖNEMLİLİK DÜZEYİ: P>0.05 ya da P≤0.05


Hangi alanda olursa olsun merak edilen konu ile ilgili güvenilir bilgiler elde etmek için<br />

araştırma ve deneye ihtiyaç vardır. Çünkü:<br />

Araştırma ve deney yapmadan uygulanacak bilgi yoktur.<br />

Üzerinde durulan özellik bakımından deney ünitelerinden veriler toplandıktan sonra<br />

söz konusu verilerin aynı olmadıkları, aralarında bir takım farklılıkların (varyasyon)<br />

bulunduğu görülür.<br />

Dolayısıyla araştırma ve denemelerde temel kavram; farklılık<br />

ya da değişimdir (varyasyon).<br />

Araştırıcılar hep bu kavram üzerine odaklanır ve farklılığa neden olan unsurları<br />

belirlemeye çalışırlar.<br />

Diğer yandan eğer bütün gözlem değerleri aynı olsaydı, her hangi<br />

bir farklılıktan söz edilemeyeceği için araştırma ve denemelere de<br />

gerek kalmazdı.<br />

Ancak bu gibi durumlara uygulamada hemen hemen hiç rastlanılmaz.


Neden İstatistiğe İhtiyaç Duyulur<br />

Etrafımızda birçok biyolojik, sosyal ve ekonomik olay cereyan etmektedir. Bu olaylarla<br />

ilgili değişik sorular aklımıza gelebilir ya da değişik konuları merak edebiliriz.<br />

Mesela:<br />

Yeni geliştirilen bir ilacın kanseri önlemede etkili olup olmadığının belirlenmesi<br />

Farklı firmalar tarafından üretilen meyve sularındaki C-vitamini miktarı arasında<br />

fark olup olmadığının belirlenmesi<br />

Domuz gribinden korunmak için farklı ilaç firmaları tarafından geliştirilen aşı<br />

çeşitlerinin etkileri arasında fark olup olmadığının belirlenmesi<br />

Beslenme tarzındaki değişikliklerin insan sağlığına etkilerinin nasıl olduğunun<br />

araştırılması<br />

Acaba sınav yöntemlerindeki farklılıklar öğrencilerin başarı notlarını<br />

nasıl etkiler


Acaba akciğer kanserine yakalanma oranı bakımından bölgeler arasında fark var<br />

mıdır<br />

<br />

İşsizlik oranları bakımından Avrupa Birliği ülkeleri ile Ortadoğu ülkeleri arasında fark<br />

var mıdır Acaba Genetik yapısı değiştirilmiş (GDO) ürünler insan sağlığını nasıl<br />

etkiliyor gibi aklımıza pek çok soru gelebilir.<br />

Yeni geliştirilen bir kaplama materyalinin, mevcut kaplama materyallerine göre<br />

raf ömrünü uzatıp uzatmadığının araştırılması<br />

Farklı buğday çeşitlerinin gluten içeriklerinin farklı olmasının nedenleri nelerdir<br />

Acaba bu sorulara nasıl cevap verebiliriz Ya da söz konusu karşılaştırmaları nasıl<br />

yapabiliriz<br />

İşte İstatistik Bilimi bu soruların bilimsel olarak cevaplandırılmasına imkân<br />

sağlar.


İstatistiğin Tarihçesi<br />

Yaşamın başlangıcından beri insanların kendilerine ait:<br />

Doğum,<br />

Ölüm,<br />

Evlenme,<br />

Mal varlığı gibi bazı olayları inceleme ve kaydetme ihtiyacı duymuş olmaları<br />

dikkate alındığında, insanların toplu yaşamaya başladıkları günden beri<br />

dolaylı olarak istatistik ile ilgilenmiş oldukları kabul edilebilir.


İstatistiğin Tarihçesi<br />

İstatistik sözcüğünün kullanılması Aristotle zamanlarına kadar gitmektedir.<br />

Bu tarihlerde devletler toplam askeri ve mali güçlerini saptayabilmek için<br />

bazı sayımlar yapmışlardır.<br />

Mesela:<br />

Mısırlılar, Yunanlılar, Çinliler, Romalılar ve Türklerin mali ve askeri<br />

güçlerini diğer toplumlarla karşılaştırmak ve buna göre de kimin güçlü kimin<br />

güçsüz olduğunu belirleyerek, savaş stratejilerini yön verme amacıyla<br />

istatistik yaptıklarını göstermektedir.


Günümüzdeki anlamı ile modern istatistiğin gelişmesindeki en büyük<br />

etmenlerden birisi; 16. ve 17. YY'larda olasılık teorisinin ilgi çekmesi ve<br />

bazı bilim adamlarının bu konu üzerinde çalışmasıdır.<br />

İstatistik alanındaki ilk çalışmalara şans oyunlarındaki kazanma<br />

ihtimallerinin hesaplanmaya çalışılması ile başlanmıştır.<br />

Acaba kazanma ihtimalimi nasıl arttırabilirim<br />

Ancak, 17 YY kadar önemli bir gelişme sağlanamamıştır.<br />

Toplanan verilerin istatistik analizlerine doğru ilk adım 17. YY'da<br />

İngiltere'de John Graunt tarafından atılmıştır.


Daha sonraları ünlü matematikçilerden:<br />

Pascal,<br />

Fermat,<br />

James<br />

Daniel Bernoulli,<br />

de Moivre, Laplace,<br />

Gauss,<br />

Simpson,<br />

Lagrange,<br />

Hermite ve Legendre birçok önemli olasılık kuralını ve teoremlerini geliştirerek istatistiğin<br />

gelişmesine önemli katkılarda bulunmuşlardır.


19. YY'ın sonlarına doğru bir bireyde birden fazla özelliğe ilişkin veri elde<br />

edildiği durumlarda nasıl bir yol izlenebileceği üzerinde durulmuş.<br />

Sir Francis Galton<br />

Daha sonra Galton'un bu fikirleri Karl Pearson ve C. Sperman<br />

tarafından genişletilerek psikoloji ve sosyal bilimlere uygulanmıştır.<br />

• Korelasyon<br />

• Regresyon


Yeni Bir Dönem<br />

1908 yılında Biometrika dergisinde yayınladığı bir makale ile William S. Gosset<br />

istatistikte yeni bir dönemin başlamasına yol açmıştır.<br />

Bir bira fabrikasında arpa ıslahı projelerinde çalışan Gosset, ekonomik<br />

nedenlerle küçük örneklerle uğraşmak zorunluluğunda kalmıştır.<br />

Bu gibi durumlar için uygun istatistik yöntemlere gereksinim duymuştur.<br />

Böyle bir gereksinimden hareketle, küçük örneklerin dağılışını deneysel olarak<br />

inceleyen Gosset günümüzde çok yaygın olarak kullanılan bazı yöntemleri<br />

geliştirmiş, pek çoğuna da ışık tutmuştur.<br />

STUDENT T-TESTİ<br />

Yazılarını "Student" takma adıyla yayınlayan Gosset'ten sonra Ronald A. Fisher<br />

küçük örnek teorisini geliştirerek günlük araştırmalarda uygulanmasını sağlamıştır.


20. YY'ın en büyük istatistikçisi olarak tanımlayabileceğimiz Sir Ronald<br />

A. Fisher günümüzde kullanılan istatistik yöntemlerin hemen hemen<br />

hepsinin ilk fikirlerini ortaya atan ve en yaygın olarak kullanılan pek<br />

çok yöntemi de geliştiren kişidir.<br />

VARYANS ANALİZİ


Peki tahminler %100 doğrumudur


Günümüzde!<br />

Özellikle son yıllarda bilim ve teknolojinin gelişmesine paralel olarak istatistik metotları<br />

daha fazla ihtiyaç duyulur bir hale gelmiştir.<br />

Çünkü istatistik, amaca bağlı olarak araştırma ve denemelerin nasıl planlanıp<br />

yürütülmesinden başlar, deney ünitelerinden elde edilen gözlem değerlerinin bilimsel<br />

olarak nasıl değerlendirileceği ya da analiz edileceği, elde edilen sonuçların nasıl<br />

yorumlanıp rapor edileceğine kadarki bütün aşamaları kapsamaktadır.<br />

Dolayısıyla istatistik, bilimsel çalışmalardan elde edilen verilerin değerlendirilmesinde ve<br />

elde edilen sonuçların yorumlanarak genelleştirilebilmesinde yararlanılan en önemli<br />

araçlardan birisidir.<br />

Artık günümüz dünyasında sonuçları istatistiksel olarak ta<br />

desteklenmeyen bilimsel araştırma sonuçlarına hep kuşku ile<br />

bakılmaktadır.


İstatistik Nedir<br />

• Deneme desenlerinin planlanması veya tasarım,<br />

• Verilerin toplanması,<br />

• Verilerin özetlenmesi ve analizi,<br />

• Sonuçların yorumlanması ve genelleştirilmesi


İstatistiğin Uygulama Alanları<br />

Özellikle son yıllarda bütün dünyada önemi gittikçe daha fazla<br />

anlaşılmaya başlanan istatistik metotlarının günümüzde<br />

uygulanmadığı alan hemen hemen yok gibidir.


İstatistik<br />

Teorik (Matematiksel)<br />

Uygulamalı<br />

Son yıllarda, istatistik yöntemlerin kullanılması o kadar gelişmiş ve<br />

genişlemiştir ki, uygulamalı istatistiğin birçok çeşitli alan için özelleşmiş alt<br />

disiplinleri ortaya çıkmıştır. Örneğin:<br />

Biyometri veya Biyoistatistik:<br />

Environmetri<br />

Ekonometri<br />

Jeoistatistik<br />

Psikometri vb


• Bunlardan Biyometri (Biyoistatistik) istatistik yöntemlerinin biyoloji<br />

alanına uygulamasıdır.<br />

• Bu alan ziraat, tıp, eczacılık, diş hekimliği, veteriner hekimliği, su<br />

ürünleri, ormancılık, zooloji, ekoloji ve botanik gibi birçok disiplini<br />

kapsayan çok geniş bir uygulama alanıdır.


Metot Bilimi Olarak İstatistik<br />

• Araştırma ve Denemelerin Planlanması,<br />

• Verilerin toplanması,<br />

• Verilerin özetlenmesi (tablo ve grafik),<br />

• Tespit edilen özellikler arasındaki ilişkilerin araştırılması,<br />

• Dikkate alınan faktörlere göre analiz edilmesi,<br />

• Sonuçların yorumlanması ve genelleştirilmesi


• İstatistik metotlarına genel olarak, üzerinde durulan özellik<br />

bakımından örneğimizin tanıtılması ve<br />

• örnekten elde edilen değerlerden yararlanılarak populasyona ilişkin<br />

bazı sonuçlara ulaşmak amacıyla başvurulur


Dolayısıyla istatistik metotları esas olarak;<br />

• Tanıtıcı İstatistikler (Descriptive)<br />

Tanıtıcı istatistikler örneğimizi tanıtmaya yarayan istatistiklerdir.<br />

• Çıkarımsal ya da Sonuç çıkartıcı (inferential) istatistikler olmak<br />

üzere iki kısma ayrılır.<br />

Tahmin yapma ve hipotez kontrolü


• Veri:<br />

• Veri Türleri:<br />

• Verilerin elde edilişleri, verilerin değerlendirilmesinde kullanılacak<br />

istatistik analiz tekniğini etkiler mi


Bir araştırma veya deneme yürütüldüğünde bir çok veri ya da gözlem değeri<br />

elde edilir. Eğer bu veriler bilimsel olarak değerlendirilmediğinde ne olur<br />

X1 X2 X3 X4 X5<br />

115 129 105 122 62<br />

113 86 71 90 76<br />

113 83 97 94 118<br />

87 99 100 93 98<br />

106 76 93 70 86<br />

115 107 108 78 95<br />

98 161 84 169 61<br />

123 90 91 95 100<br />

111 106 121 126 89<br />

96 117 114 113 118<br />

120 89 110 119 110<br />

94 64 97 91 98<br />

100 97 100 123 108<br />

128 119 80 110 116<br />

116 123 95 101 133


Söz konusu veriler birer rakam ya da simge<br />

olmaktan başka hiçbir şey ifade etmezler.


Verileri nasıl tanıtıp, özetleyebiliriz<br />

•<br />

ORTALAMA STANDART HATA VARYANS MEDYAN EN KÜÇÜK EN BÜYÜK<br />

108,9959 3,012221 136,1021 113,1205 87,02 127,89<br />

103,1357 6,265684 588,8819 99,16618 64,46 161,47<br />

97,64207 3,415573 174,9921 97,18834 71,26 121,31<br />

106,2732 6,260185 587,8488 101,1385 69,53 169,1<br />

97,83517 5,339958 427,7272 98,26915 60,73 132,73


175<br />

150<br />

125<br />

Data<br />

100<br />

75<br />

50<br />

X1<br />

X2<br />

X3<br />

X4<br />

X5


30 öğrencinin kardeş sayıları<br />

• 1,3,9,5,1,1,2,3,2,3,4,3,5,2,2,1,1,3,5,4,4,3,1,<br />

3,1,2,3,3,2,2<br />

• Acaba bu veri grubunu tanıtmak ve özetlemek için aynı istatistikleri<br />

hesaplayıp, aynı grafikleri çizebilirmiyiz<br />

• HAYIR


Kardeş sayılarına ilişkin frekans<br />

dağılım tablosu


• Bir Araştırma ya da denemeden elde edilen<br />

gözlem değerleri aynı olsaydı herhangi bir<br />

istatistik analize ihtiyaç duyulur muydu


10 öğrencinin Bilgisayara Giriş, İstatistik ve ADY derslerinden<br />

aldıkları notlar aşağıdaki gibi olsun.


Acaba İstatistik ve ADY derslerindeki<br />

farklılığı nasıl özetleyebiliriz


Yazılı, Sözlü ve Test sınavlarına tabii tutulan öğrencilerin<br />

İstatistik dersinden aldıkları notlar aşağıdaki gibi bulunmuş<br />

olsun:<br />

Yazılı Sözlü Test<br />

65 70 75<br />

58 55 70<br />

70 40 65<br />

40 50 85<br />

49 30 90<br />

63 60 60<br />

25 40 45<br />

66 70 30<br />

72 55 60<br />

85 40 70


Sınav yöntemleri arasında gözlenen<br />

farkın sebepleri neler olabilir<br />

• Sınav yöntemi<br />

• Tesadüf ya da sebebini bilemediğimiz,<br />

kontrol altına alamadığımız faktörler<br />

• DENEME HATASI!!!!


NASIL BELİRLEYEBİLİRİZ<br />

• HİPOTEZ KONTROLÜ,<br />

•<br />

• P>0.05 P≤0.05<br />

• P=0.174 >0.05<br />

• P=0.174 değeri, 0.05 ten büyük olduğu için hipotezi kabul edilir.<br />

Dolayısıyla “bu üç sınav yönteminin ortalamaları arasında<br />

gözlenen farkların tamamen tesadüften ileri geldiği ve<br />

istatistiksel olarak önemli olmadığı” sonucuna varılır. Diğer bir<br />

ifade ile “sınav yöntemlerinin başarı puanlarına etkilerinin<br />

benzer olduğu sonucuna varılır.”


Peki varılan bu sonuç % 100<br />

doğrumudur<br />

• HAYIR<br />

• O ZAMAN DOĞRULUK DERECESİ


Bilimsel çalışma sonuçları rapor edilirken ilk aşama verilerin<br />

tanıtılmasıdır. Yani tanıtıcı istatistiklerin hesaplanmasıdır


Söz konusu denemeyi 2.yıl tekrarlayan bir araştırıcının<br />

elde ettiği veriler aşağıdaki gibi olsun.


MINITAB İstatistik Paket Programını<br />

Kullanarak Analiz Edelim


SONUÇ<br />

• Sadece Test ve Sözlü sınav yöntemleri<br />

arasında istatistiksel olarak önemli bir fark<br />

bulunmaktadır.<br />

• Öneri: Öğrencilerin Test ya da Yazılı<br />

Sınavlarından birisine tabii tutulmaları.<br />

• Hangisinin uygulanması daha kolay ise


Rastgele belirlenen 9 bireyin Ağırlıkları ve Sistolik (S) kan basınçları (mm /<br />

Hg) aşağıdaki gibi ölçülmüştür. Buna göre bireylerin ağırlıkları ile sistolik<br />

kan basınçları arasında önemli bir ilişki varmıdır


Ne kadar bir doğrusal ilişki var<br />

• r=0.834=%83.4<br />

• Peki bu ilişki istatistiksel olarak önemli ya da<br />

anlamlımıdır<br />

• P=0.026!!!<br />

• 0.026


Acaba ağırlıktaki 1 kg lık artışa karşılık, Sistolik<br />

Kan basıncı kaç mmHg değişir<br />

• b=0.934<br />

• Bu değişme önemli ya da anlamlımıdır<br />

• P=0.026

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!