İstatistik Analiz İçin Verilerin Sınıflandırılması

Yazarlar Mustafa Hasbahçeci

Verilerin istatistiksel analiz için düzenlenmesi öncesinde, verilerin alabileceği değerlerin ne olduğu veya ne olamayacağı, verilerin nasıl ölçüldüğü belirlenmelidir. Burada verinin nasıl ölçüldüğünden amaç, ne ile ölçüldüğü olmayıp, daha çok verinin alabileceği değerler ile ilgili kısıtlamaları belirlemektir. Glasgow koma skoru 0 ile 15 arasında bir değer olup bunun 5,5 olması mümkün değildir. Aynı şekilde bir hastanın çocuk sayısı tam sayı olmak zorundadır. 

Verilerin istatistiksel analiz için düzenlenmesi öncesinde, verilerin alabileceği değerlerin ne olduğu veya ne olamayacağı, verilerin nasıl ölçüldüğü belirlenmelidir. Burada verinin nasıl ölçüldüğünden amaç, ne ile ölçüldüğü olmayıp, daha çok verinin alabileceği değerler ile ilgili kısıtlamaları belirlemektir [1]. Glasgow koma skoru 0 ile 15 arasında bir değer olup bunun 5,5 olması mümkün değildir. Aynı şekilde bir hastanın çocuk sayısı tam sayı olmak zorundadır.   

Bu bilgiler ışığında veriler, ölçüm özelliklerine göre nominal, ordinal ve sayısal olmak üzere üç ana grupta incelenebilir [1]:

1.           Nominal veriler: Verilerin kategorik olarak alabileceği değerler anlamında bir ölçüm yapılabilir. Burada rakamların bir anlamı olmayıp sadece kodlama olarak kullanılmaktadır. Verilerin alabileceği değerler arasında bir sıralama ve değerler arasında bir anlamlılık ilişkisi yoktur [2].

 İki ve ikiden çok kategorili nominal veriler vardır. Yalnızca iki değer alabilen verilere ikili veriler (dichotomous variables) denmektedir. Kadın/erkek, pozitif/negatif ya da evet/hayır bunlara örnek olarak verilebilir. Medeni durum, renk, kan grubu, ırk, şehir,  isim, forma numarası gibi veriler ise ikiden çok kategorili verilere örnektir.

2.           Ordinal veriler: Verilerin ölçüm değerleri arasında mantıksal bir sıralama vardır [3]. Fakat her bir sıralama için, değerler arası mesafe her bir veri için aynı değildir. Tümör evresi ya da hastalık evresi için kullanılan 1-4 değerlerinin rakamsal bir değeri olmaması buna örnek olarak verilebilir. Ordinal verilere sayısal bir değer olarak işlem yapılmaz. Sadece < ya da > işareti ile birlikte kullanılabilirler [1]. Verilere verilen değerlerin birbirini bir sıra ile takip etmesi gereklidir.  Örnek olarak tümör evresi için 1, 2, 3, 4 veya bir başka veri için 1, 3, 5, 7 kullanılabilir. Fakat bunun 1, 3, 2, 4 veya 7, 3, 5, 1 olması uygun değildir. Ordinal veriler için sıklıkla kullanılan 1’den 5’e kadar derecelendirmeyi esas alan Likert skalası örnek olarak verilebilir [3]. Sosyoekonomik düzey (düşük, orta, yüksek), eğitim düzeyi (ilkokul, ortaokul, lise, üniversite) ve ASA skoru (1-5) ordinal veriler için diğer örneklerdir.

Nominal ve ordinal verilerin her ikisi kategorik veriler olarak da tanımlanmaktadır [1-3].

3.           Sayısal veriler: Sayısal ölçümle belirlenen, her türlü matematik işlemin uygulandığı, veri düzeyleri arasında gerçek bir sıralama ve mesafe olan, gerçek rakamlarla ifade edilen sayısal (continuous) verilerdir. Kesikli ya da sayımla belirtilen aralık ölçeği (interval scale) ve sürekli ya da ölçümle belirtilen oran ölçeğinden (ratio scale)  bahsedilebilir [3]. İkisi arasındaki temel fark, atıf yapılan ölçeğin mutlak sıfır değerine sahip olup olmadığıdır.

Kesikli veriler, gerçekte doğal bir sıfır değerinin olmadığı değişkenler için kullanılır. Kesikli verilerde rakamlar birbirini bir sıra ile takip eder. Sıcaklığın sıfır derece olması, sıcaklığın olmadığı değil, suyun donma derecesi olarak kabul edilmektedir [3]. Aynı şekilde sıvının pH derecesinin sıfır olması, pH değerinin olmadığı anlamına kullanılamaz. VAS ağrı skorunda sıfır değeri bir hiçliği değil, ağrı olmamasını ifade etmektedir. Çocuk sayısı, kaza sayısı, ameliyat sayısı gibi veriler kesikli veriler için diğer örneklerdir.

Oran ölçeği sıfır değerinin mutlak yokluk anlamına geldiği sürekli veriler için kullanılır. Bu veriler için herhangi bir şekilde ölçüm gereklidir. Yaş, ağırlık,  kalp hızı, kan basıncı ve hız gibi değişkenlere ait veriler oran ölçeğine örnek olarak verilebilir [3]

Kaynaklar

1) Seto B. History of medical ethics and perspectives on disparities in minority recruitment and involvement in health research. Am J Med Sci 2001; 322:248–52
2) http://www.resmigazete.gov.tr/eskiler/2013/04/20130413-7.html.
3) WMA: Declaration of Helsinki: Ethical Principles for Medical Research Involving Human Subjects. 2011. http://www.wma.net/en/30publications/10policies/ b3/index.html
4) CIOMS: International Ethical Guidelines for Biomedical Research Involving Human Subjects. 2002. http://www.fhi360.org/training/fr/retc/pdf_files/cioms. pdf.
5) ICH: ICH Guidelines for Good Clinical Practice GCP. 2004. http://www.ich.org/ products/guidelines/efficacy/article/efficacy-guidelines.html.

Modül için henüz bir yorum yazılmamıştır.

Yorumlarınız için bizim için önemlidir.

Yorum yazmak için tıklayınız