İstatistikten Hipotez Aşamasında Yararlanma-Çalışma Öncesi İstatistik Desteği

Yazarlar Hüseyin Kadıoğlu

İnsanoğlunun kendisini ve çevresini tanımasını, anlamasını ve çevresinde oluşan olayların nedenlerini araştırarak doğa ve toplum olaylarını denetim altına almasını amaçlayan bilim, neden sonuç ilişkilerinin incelenerek ifade edildiği sistematik bilgiler birikimi olarak tanımlanabilir. Bu tanımlamadan yola çıkarak bilimin işlevi, anlama, açıklama ve kontrol altına alma olarak ifade edilebilir. Bilim üretmenin bir yolu olan bilimsel yöntem, problemleri çözmenin, bilim üretmenin bilinen ve belli süreçleri olan, en güvenilir yolu olarak kabul edilir 

İnsanoğlunun kendisini ve çevresini tanımasını, anlamasını ve çevresinde oluşan olayların nedenlerini araştırarak doğa ve toplum olaylarını denetim altına almasını amaçlayan bilim, neden sonuç ilişkilerinin incelenerek ifade edildiği sistematik bilgiler birikimi olarak tanımlanabilir. Bu tanımlamadan yola çıkarak bilimin işlevi, anlama, açıklama ve kontrol altına alma olarak ifade edilebilir. Bilim üretmenin bir yolu olan bilimsel yöntem, problemleri çözmenin, bilim üretmenin bilinen ve belli süreçleri olan, en güvenilir yolu olarak kabul edilir [1, 2].

Bilime katkı sağlamak ve problemlere güvenilir çözümler aramak amacı ile planlı ve

sistematik bir şekilde verilerin toplanması, yorumlanması ve değerlendirilmesi süreci

bilimsel araştırma olarak tanımlanmaktadır [3]. Bilimsel araştırmalarla elde edilen sonuçlar genellikle dört ayrı biçimde ortaya çıkar: Yan tutma, nedensel etkide yanılgı, rastlantı ve nedensellik. Bilimsel araştırma ilk üç olasılığı saf dışı ederek nedenselliğe ulaşmayı amaçlar. Nedenselliğe ulaşabilmek bilimsel yöntem doğrultusunda bazı nesnel ilkelere uymak zorunludur [4]. Bu şekilde bilimsel yöntemler kullanılarak bir araştırmanın sonuçları geçerli ve güvenilir olacaktır.

Bilimsel Yöntemin Basamakları

Bilgiyi sağlamada bir dizge oluşturan bilimsel yöntem, ikilemleri en aza indirecek

denetleme ve değerlendirmeleri içerir. Böylece yanlılıklar azaltılır ve geçerlilik en üst

düzeye ulaşır [2]. Bilimsel yöntem, bilimlerin ortaklaşa kullandıkları tasvir ve açıklama

yollarını içeren, eylemsel ve düşünsel yanları olan bir süreçtir. Bilimsel yöntemin bugünkü anlamında biçimlendirilişi John Dewey ile başlatılmaktadır. Literatürde farklı şekillerde sınıflandırılan bilimsel yöntemin aşamaları genel olarak aşağıda verilen şekliyle açıklanmaktadır [2, 5]:

1) Sorunun fark edilmesi (Güçlüğün sezilmesi)

2) Sorunun tanımlanması (Güçlüğün araştırılabilecek bir probleme dönüştürülmesi/

problemin tanımlanması ve sınırlandırılması)

3) Hipotez oluşturulması (Sınanmak istenen olası neden-sonuç ilişkisinin ifade edildiği

denencelerin/hipotezlerin kurulması ve/veya cevaplandırıldığında problemin çözümüne

katkı sağlayacağı düşünülen soruların hazırlanması)

4) Araştırma yönteminin geliştirilmesi (Gözlenebilir sınayıcıların belirlenmesi/denencenin sınanması ya da soruların cevaplandırılması için gerekli olabilecek verilerin neler olabileceğine önceden karar verilmesi)

5) Verilerin toplanması ve analizi (Öngörülen sınayıcılar doğrultusunda gerekli verilerin

toplanması ve beklentilerin değerlendirilmesi)

6) Karar verme ve yorumlama (Araştırmanın raporlanması)

Hipotez Oluşturulması ve İstatistiğin Yeri

Bir araştırmanın değeri, araştırma konusunun güncel, önemli ve sonuçlarının yararlı

olmasının yanı sıra istatistiksel değeri ile de doğrudan ilişkilidir [6]. İstatistik, pozitif

bilimlerin temeli olarak kabul edilen gözlemlerin yapılması, verilerin toplanması, toplanan bu verilerin analizi ve yorumlanması için gerekli yöntemlerin geliştirilip uygulanması ile uğraşan, verilerden yola çıkılarak objektif karar vermede önemli rolü olan bir bilim dalıdır.

İstatistik biliminin gereğince kullanılması araştırmaların bilimsel olmasını sağlar.

Araştırmanın planlanmasından yayınlanmasına kadar her aşamada istatistik yöntemlerden uygun biçimde yararlanılmalıdır. Bu yöntemlerden uygun biçimde yararlanmadan gerçekleştirilen bir araştırmanın sonuçlarının geçerliliği ve güvenilirliği kuşkulu ve tartışılır olacaktır. İstatistik yöntemlerine bilimsel araştırma  tamamlandığında değil, daha planlama aşamasında başvurulmalıdır [6, 7].

Etkili bir bilimsel araştırma yapabilmenin ilk koşulu doğru ve işe yarar bir hipotez

oluşturmaktır [8]. Hipotez ortaya konan probleme ilişkin ileri sürülen, doğru veya yanlış

olması mümkün olan, temel varsayımlardır [9]. Bilimsel araştırmalarda yapılan şey bir

bilimsel hipotezi test etmektir. İstatistikte bir hipotezin doğruluğunu test etmek için hipotez takımı oluşturulur. Bu hipotez takımının iki bileşeni vardır [3, 7, 9]:

1. Kontrol veya Yokluk hipotezi (H0): Sıfır hipotezi de denilen bu hipotez bilimsel

araştırmada öne sürülen hipotezdir. Bu hipotezde her zaman gruplar arasında fark olmadığı belirtilir. Başka bir ifadeyle, evrenin araştırmadan önce varsayılan gerçek değeri ile örneklemden elde edilen değeri arasında önemli bir farklılık olmadığını, görülen farklılığın rassal sebeplerden ileri geldiğini ve önemsiz olduğunu iddia eder. Bu nedenle bu iki değer eşitlik biçiminde formüle edilir ve reddedilmek maksadıyla kurulur. Araştırma sonucunda bu hipotez reddedilirse iki değer arasında fark olduğu kabul edilir ve alternatif hipotez kabul edilmiş olur.

2. Alternatif veya Karşıt hipotez (H1): Yokluk hipotezine karşı kurulan hipotezdir. Gruplar arası fark var anlamındadır. Yani evrenin araştırmadan önce varsayılan gerçek değeri ile örneklemden elde edilen değeri arasında önemli bir farklılık olduğunu iddia eder. Araştırmacının şüphe ettiği veya ispatlamak istediği iddia alternatif hipotez olarak yazılır.

Tip I ve Tip II Hata:

Hipotez testlerini kabul ya da ret ederken iki tip hata yapılabilir: Tip I ve Tip II hata.

Tip I hata: Gerçekte doğru olan sıfır hipotezinin (H0) reddedilmesidir. Başka bir ifadeyle,  gerçekte gruplar arasında fark yokken, araştırma sonucunda fark bulunabilmesi ihtimalidir.

Buna α hatası ya da p değeri de denir. Tip I hata yapma olasılığına, yani gerçekte doğru

olan sıfır hipotezinin reddedilmesi olasılığına “önem seviyesi” denir. Araştırmadan elde

edilecek sonuçların araştırmacının seçiminden etkilenmemesi için genellikle α değeri

örneklerin alınmasından önce ve genellikle 0.05 ya da 0.01 olarak belirlenir. Eğer Tip I

hata düzeyi 0.05 olarak kabul edilmişse fark yoktur sonucu çıktığında %95 olasılıkla fark yoktur anlamına gelir.

Tip II hata: Gerçekte yanlış olan sıfır hipotezinin (H0) kabul edilmesidir. Başka bir

ifadeyle, gerçekte gruplar arasında fark varken, araştırma sonucunda fark bulunamaması

ihtimalidir. Buna β hatası da denir. Bir testin gücü, testin gerçekte var olan farkı bulabilme yeteneği olarak ifade edilir. Bu nedenle Tip II hata miktarı ile ilişkilidir. Testin gücü 1-β ile ifade edilir ve tip II hata 0.20 olduğunda, testin gücü 0.80 olacaktır. Sonuçta özellikle klinik araştırmalarda en düşük güç değeri %80 ve dolayısıyla da tip II hata (β hata) değeri de maksimum 0.20 olarak seçilmelidir [3, 9-12].

Bu aşamada belirtilmesi gereken konulardan biri de p değeri kavramıdır. p değeri verinin ürüne göre seçilen hipotez testlerinden birinin kullanılması ile hesaplanır. Eğer p değeri α değerinden (Tip I hatadan) küçük çıkarsa sonuç önemli kabul edilir ve H0 hipotezi reddedilir. Genellikle araştırmanın sonuçları verilirken, H0, H1, Tip I hata gibi terimler kullanılmaz ve p değeri 0.05’den küçükse “sonuç ya da gruplar arasındaki fark anlamlıdır” şeklinde ifade edilir. Sonuç olarak, eğer p = 0.05 ise, %5 olasılıkla H0 hipotezi yanlışlıkla reddedilmiştir anlamı çıkarılır ve %95 olasılıkla fark gerçektir anlamına gelir. Başka bir ifadeyle, H0 hipotezinin % türünden doğru olma ihtimalidir [10, 12]. Araştırmalarda hipotezlerden ziyade önemlilik tespit etmek daha öncelikli olarak istenen bir durumdur. Bu noktada p değerinin anlamsız çıkması önem kazanır. p değerinin anlamsız çıkmasında bazı faktörler etkili olabilir. Öncelikle sonuçların gerçekten anlamsız olması bir etkendir. Bunun dışında, tip II hatanın yapılması durumu, yani gerçekte önemlilik olsa dahi araştırmacıların fark yoktur şeklinde sonuca ulaşmalarıdır. Tip II hatanın nedeni, uygulanan girişim prosedüründen kaynaklanmış olabileceği gibi, örneklem büyüklüğü ve etki büyüklüğünden de kaynaklanmış olabilir. Örneklem büyüklüğü gerçek etkiyi ortaya çıkaracak yeterlilikte veya çok küçük etki büyüklüğünü tespit edecek genişlikte olmayabilir[10].

Tüm bu kavramlar araştırmalarda hipotez oluşturulması aşamasında iki önemli konuyu ön plana çıkarmaktadır:

1. Örneklem büyüklüğü

2. Güç analizi

Örneklem Büyüklüğü

Araştırma verilerinin elde edildiği kaynağın tamamına ya da olguların yaşandığı ve

meydana geldiği canlılar toplumunun tümüne evren denir. Bu evren içerisinden belirli

kurallar çerçevesinde seçilmiş, seçildiği evreni nicel ve nitel yönden temsil etme

kapasitesine sahip, evrenin herhangi bir alt grubu ise örneklem olarak tanımlanır. Üzerinde çalışılan evrenden örneklem seçme işlemine ise örnekleme adı verilmektedir [3, 4, 9].

Bilimsel bir araştırmanın planlanması aşamasında ilk sorulan soru, örneklem

büyüklüğünün ne kadar olacağı ve nasıl hesaplanacağıdır. Örneklem büyüklüğü

belirlenmenin hem etik hem de istatistiksel boyutu vardır. Örneklem küçüldükçe evreni

nitelik ve nicelik açısından temsil etme özelliği azalır, aksine örneklem büyüdükçe evrenin yapısında daha yakın hale geleceği için temsil etme gücü de artar [4, 13, 14]. Evrenin tamamı yerine evrenden seçilmiş bir örneklem üzerinde çalışmak hem daha kolay hem de daha az maliyetlidir. İyi bir örneklem de, minimum iş gücü, zaman ve maliyet ile araştırılacak olayla ilgili yeterli bilginin elde edilebildiği örneklem olarak ifade edilmektedir [3, 9].

Bilimsel araştırmalar seçilen örneklem üzerinde yapılır ve sonuçları topluma genellenir. Bu nedenle, örneklem sayısı doğru belirlenmelidir. Ayrıca örneklemin, sayısal olarak yeterli ve yapısal olarak toplumun tümünü temsil etme gücüne sahip olması gerekir. Bir çalışma yeterli örneklem sayısı ile yürütülmemişse, sonuçların önemli olup olmadığını istatistiksel olarak belirlemede yetersiz kalınır. Aksine örneklem büyüklüğü olması gerekenden yüksek tutulur ise bu kez araştırma maliyetinin artması söz konusu olacaktır [15-17]. Bilimsel araştırmaların istatistik boyutunda pek çok hipotez testi kullanıldığı ve bu testlerin de her biri için farklı örneklem büyüklüğü formülleri olduğu hesaba katılırsa örneklem büyüklüğü hesaplamak kolay bir işlem değildir. Örneklem büyüklüğünün hesaplanmasında etkili bazı faktörler mevcuttur. Bu faktörler [14, 18-20]:

1. Deneme Planı: Araştırmanın yürütüleceği minimum örneklem büyüklüğünün

belirlenmesinde etkilidir. Çünkü güç analizi yapıldıktan sonra elde edilen sonuç

doğrultusunda hesaplanan sayı her grup için gerekli olan minimum denek sayısıdır. Aynı kişilerden belirli bir uygulama öncesinde ve sonrasında ölçümler alınması planlanan araştırmalarda bir tek çalışma grubunun farklı zamanlardaki değerleri karşılaştırılacağı için belirlenen örneklem büyüklüğü kadar kişi ile çalışmak yeterli olacaktır. Ancak eğer bir çalışmada iki farklı grup varsa araştırmaya dahil edilen kişi sayısı 2 katına çıkacaktır.

2. Sonuç değişkenini tipi: Bir araştırmanın sonucunda iki farklı çeşit sonuç değişkeni

olabilir. Bunlar, kategorik değişkenler ve sayısal olarak ifade edilen değişkenlerdir. Sonuç değişkeninin tipine göre uygulanacak istatistiksel analizler farklılık göstereceği için örneklem genişliği belirlenme şekli de farklı olacaktır.

3. Tip I hata miktarı: Yukarıda da belirtildiği gibi araştırma sonucunda ortaya çıkabilecek hatalardan biridir ve iki uygulama arasında fark yokken, fark bulunabilmesi ihtimalidir. Α hatası ya da p değeri olarak da belirtilir. Örneklem büyüklüğü hesaplanırken genellikle tip Ihata miktarı 0.05 ya da 0.01 olarak kabul edilir.

4. Tip II hata: Araştırmalarda hipotez testi sırasında yapılabilecek bir diğer hata türüdür.

Burada ise iki uygulama arasında fark varken, farkın bulunamaması ihtimalidir. β hatası

olarak da belirtilir. Örneklem büyüklüğü hesaplanırken genellikle tip II hata miktarı 0.20 olarak kabul edilir.

5. Etki büyüklüğü: Araştırmada anlamlı farklılığın ortaya konması için ilgilenilen sonuç

değişkenine göre iki ortalama ya da iki oran arasında beklenen farklılıktır. Klinik

araştırmalarda etki büyüklüğünün ≥0.5 olması önerilmektedir. Etki büyüklüğüne ya

literatür taranarak ya da araştırmacının geçmiş deneyimleri ile karar vermesi mümkün iken, herhangi bir örneği bulunmayan bir çalışma için bir pilot çalışma düzenlenerek

belirlenebilir. Gruplar arasındaki beklenen farklılık yani etki büyüklüğü ne kadar büyük

olursa o farkı ortaya koymak daha kolay olacağı için daha küçük örneklem ile çalışmak

yeterli olacaktır. Uygulamada etki büyüklüğü değerleri şu şekilde yorumlanır:

Etki büyüklüğü <0.1à            Önemsiz etki

0.1 ≤ Etki büyüklüğü <0.3à   Düşük etki

0.3 ≤ Etki büyüklüğü <0.5à   Orta derecede etki

Etki büyüklüğü ≥ 0.5 à          Büyük etki

Örneklem büyüklüğü ile istatistiksel güç arasında ilişki mevcuttur. Örneklem büyüklüğü

gücü etkileyen önemli bir faktördür. Örneklem büyüklüğünün artırılması gücün artmasını  sağlar. Sonuçta, gerçekçi bir örneklem sayısı için güç analizi yapılması gereklidir. Bilimsel bir araştırmanın henüz planlama aşamasında güç analizini kullanmak çalışma için kaç katılımcı gerektiği hakkında hassas karar vermeye yardımcı olur [21]. Araştırmada gerçek durumu ortaya çıkaracak kadar yeterli büyüklükte örneklem alınmadı zaman Tip II hata (β) büyür, dolayısı ile güç (1-β) küçülür [22].

Güç Analizi

İstatistiksel güç, H0 hipotezinin doğru olarak reddedilme ihtimalidir. Başka bir ifadeyle

popülasyonda var olan farklılığı bulabilme olasılığıdır. Bu nedenle tip II hata ile ilişkilidir. Sonuç olarak, istatistiksel güç gruplar arasında anlamlı bir fark saptanması durumunda bu farkın gerçek olabilme ihtimalini ifade etmektedir [22, 23].

Bilimsel araştırmalarda güç analizi veri toplamaya başlanmadan önce yapılabileceği gibi veri toplama aşamasından sonra da yapılabilir. Araştırma öncesinde yapılan güç analizi, hedeflenen gücü elde etmek amacıyla gerekli olan örneklem büyüklüğünü tahmin etmede kullanılır. Veri toplama sonrasında yapılan güç analizi ile de çalışmanın gerçek gücü hesaplanabilir. Bu bağlamda üç tür güç analizi türü bulunmaktadır [11, 19]:

1. Önsel (Priori) güç analizi: Güç analizinin araştırma başlamadan önce yapılmasıdır.

Bunun için örneklem sayısı, gruplar arası fark ya da etki büyüklüğü değeri, α değeri,

gruplara dağıtım oranı ile araştırma hipotezinin yönünün bilinmesi gereklidir.

2. Deneysel (Post hoc) güç analizi: Güç analizinin araştırmanın sonunda yapılan türüdür. Araştırmanın gücü hesap edilerek sonuçların anlamlı etkiye sahip olup olmadığı saptanır. Deneysel gücü hesaplamada da, her bir gruptaki örneklem sayılarının, gruplar arası fark ya da etki büyüklüğü değeri, α değeri, gruplara dağıtım oranı ile araştırma hipotezinin yönünün bilinmesi gereklidir.

3. Uzlaşmacı (Compromise) güç analizi: Yaygın kullanım alanı yoktur ve q=β/α dengesini temel alır. Etki büyüklüğü düşük olduğunda hesap edilen örneklem sayısı yüksek olacaktır. Ancak yüksek sayıda örneklemi incelenin mümkün olmadığı bu durumda güç değerinin minimum %80 olması yerine q=β/α formülü ile α ve β arasında bir denge oluşturulur.

Uzlaşmacı güç analizi ile araştırmanın gücüne ilişkin orta bir yol bulunmuş olur.

Bilimsel bir araştırmada gruplar arasındaki farkı ortaya koyacak yeterli sayıda örneklemle çalışılmamış ise, gruplar arasında gerçekte var olan fark saptanamayacak ve güç düşük olacaktır. Güç şartlı bir olasılıktır ve başka etkenlere göre değişir [24]. Bu nedenle istatistiksel gücün nelerden etkilendiği önemli bir konudur. Güç büyük oranda şu üç faktörden etkilenir ve eğer bunlardan herhangi iki tanesi bilinirse üçüncüsü hesaplanabilir:

1. α değeri: α değeri ne kadar küçük olursa, β o kadar büyür, sonuçta testin gücü (1-β)

küçülür. Genellikle p değeri 0.05’den daha küçük bir değer olarak sabitlenirse güç daha

düşük çıkacaktır [13].

2. Etki büyüklüğü: Etki büyüklüğünün yüksek olması ortalamalar arasında standardize

edilmiş farkın çok olduğu anlamı taşır, böyle bir durumda farkı tespit etmek kolaylaşır ve güç büyür [22].

3. Örneklem büyüklüğü: Daha önce belirtildiği gibi gücü etkileyen bir diğer etken

örneklemin büyüklüğüdür. Araştırmalarda en uygun örneklem sayısı güç analizi ile

hesaplanabilmektedir. Etki büyüklüğünün küçük çıkması durumunda bunu değiştirmek zor olmakla birlikte örneklem sayısı yükseltilerek araştırmanın gücü arttırılabilir. Ancak

örneklem sayısı çok aşırı düzeyde yükseltilirse, ortalamalar arasındaki çok küçük

farklılıkların bile istatistiksel olarak anlamlı çıkma eğilimi ortaya çıkacaktır. Sonuçta elde ettiğimiz bulgular gerçek hayatta bir işe yaramayabilir.

H0 yani yokluk hipotezi kabul edildiğinde gruplar arasında fark yoktur sonucuna ulaşılır ve tartışma da bu yönde yapılır. Ancak bu çalışmanın gücü düşükse aslında gerçekte var olan fark görülememiştir ve yanlış bulgu ve yorum yapılmış olur. Bu durum güç analizini önemli yapan başka bir etkendir [21].

Bilimsel araştırmalarda güç 0.00 ve 1.00 arasında değişir. Araştırmanın gücü yükseldikçe yapılan ölçümün farkı bulmada daha hassas olduğu anlamı çıkarılır. Bilimsel araştırmalarda gücün 0.80 ve üzerinde olması istenir. Literatürde bu sınır 0.70 - 0.90 arasında da bildirmektedir. Bilimsel bir araştırmanın gücü 0.50’den düşük ise sonuçları genellikle yanlış yorumlanır [10, 21].

Sonuç

Bilimsel yöntemin önemli basamaklarından biri olan hipotez oluşturulması aşaması

araştırmanın etkisini ve değerini artırmada istatistiğin yoğun olarak kullanıldığı bir

aşamadır. Bu aşamada yokluk hipotezi, alternatif hipotez, tip I hata, tip II hata, örneklem büyüklüğü ve güç analizi gibi kavramların bilinmesi gereklidir. Özellikle araştırmaların hipotez oluşturulması aşamasında istatistiğin en yoğun kullanıldığı konular olan örneklem büyüklüğü ve güç analizinin üzerinde önemle durulmalıdır. Örneklem büyüklüğü ve araştırmanın gücü arasındaki ilişkiler dikkatli bir şekilde değerlendirilmeli ve araştırmanın planlama aşamasında doğru bir şekilde belirlenmelidir. Örneklem sayısının yeterli olması araştırmanın gücünü de etkilemektedir. Bu nedenle bilimsel bir araştırmanın uygun sayıda örneklemle yürütülmesi sonuçların güvenirliğinin sağlanmasında önem taşımaktadır.

Sonuç olarak, bilimsel araştırmaların hipotez oluşturulması aşamasında istatistiğin etkin ve doğru bir şekilde kullanılması araştırma sonuçlarının geçerliliğine ve güvenilirliğine katkı sağlayacaktır.

Kaynaklar

1) World Health Organization. Guide for writing a Research Protocol for research involving human participation; 2014. Available from: http://www.who.int/rpc/ research_ethics/guide_rp/en/index.html
2) Guidelines for writing a research protocol. Pan American Health Organization; 2014. Available from: http://www.paho.org/English/HDP/HDR/RPG/ResearchProtocol-Guides.htm.
3) Leon AC, Davis LL, Kraemer HC. The role and interpretation of pilot studies in clinical research. J Psychiatr Res 2011;45:626-9.
4) Al, H. Bilimsel Araştırma Yöntemleri, Akademik Yazım Kuralları. Adapazarı: Sakarya Yayıncılık, 2007.
5) Benson K, Hartz AJ. A comparison of observational studies and randomized, controlled trials. N Engl J Med 2000;342:1878-86.
6) Dickersin K, Rennie D. Registering clinical trials. JAMA 2003;290:516-23.
7) Gulmezoglu AM, Pang T, Horton R, Dickersin K. WHO facilitates international collaboration in setting standards for clinical trial registration. Lancet 2005;365:1829-31.
8) Antes G. Registering clinical trials is necessary for ethical, scientific and economicreasons. Bull World Health Organ 2004;82: 321. Available: http://www.pubmedcentral.nih.gov/articlerender.fcgi?artid=2622841&tool=pmcentrez&rendertype=abstract.

Modül için henüz bir yorum yazılmamıştır.

Yorumlarınız için bizim için önemlidir.

Yorum yazmak için tıklayınız