Aşağıdaki içerikler, bilimsel yöntemlerle test ve sınav hazırlama konusunda bilgilendirme amaçlı hazırlanmıştır.
Sorularınız için bizimle iletişime geçebilirsiniz:
E-posta: [email protected]
PBX: +90 212 318 80 99
Canlıların davranışsal özelliklerini ve bunlardan da özellikle bilişsel (zihinsel) ve duyuşsal (hissi) yönü baskın olanları ölçme söz konusu olunca, kullanılan ölçme araçlarının ölçülmek istenen özelliği ölçme dereceleri önem kazanır. Bu konuya ışık tutacak araştırma, ölçme aracının geçerliliği ile ilgilidir. Geçerlik araştırması, şöyle bir gerekçeye dayanır. Ölçülmek istenen özellik soyutlaştıkça, amaca hizmet gücü olmayan ya da bu gücü çok sınırlı olan ölçeklerle çalışmakta olma tehlikesi artar. Diğer bir deyişle, elle tutulan, gözle görülen ve iyice bilinmekte olan özelliklerden uzaklaşıldıkça, bunları ölçme gücü zayıf olan, bunları başka özelliklerle karıştırarak ölçen ölçeklerden yararlanılmakta olabilir.
Bir ölçek, başkaca yönleriyle ne kadar mükemmel, ne kadar yüksek nitelikli olursa olsun (örneğin ölçtüğü özelliği ne kadar az hata ile ölçmekte olursa olsun) istediğimiz özelliği ölçmüyorsa, onu başka özelliklerle karıştırarak ölçüyorsa işe yaramaz. Ya da işe yararlılığı, bu aksaklıklar ölçüsünde sınırlıdır
Bir ölçeğin geçerliği, onun istenilen özelliği ölçme ve bu işi diğer özelliklerin etkilerini ölçülere yansıtmadan yapma derecesini gösterir. Daha değişik bir deyişle bir ölçeğin geçerliği, onun belli bir amaca hizmet etme, belli bir işe yarama derecesidir. Ölçme araçlarının bu teknik özelliği, canlıların davranışsal özelliklerinin ölçülmesinde kullanılan ölçekler için özel bir yere ve öneme sahiptir.
Ölçme aracının geçerliği ile diğer bir nokta da şudur: Canlıların davranışsal özelliklerinin ölçülmesinde kullanılan hiçbir ölçme aracının geçerliği tam değildir. Bu da daha önce hata ile ilgili belirttiğimiz bir noktaya benzer ve onunla ilişkilidir. Hiçbir ölçümün hatadan tam olarak arınmış olmayacağını söylemiştik. Burada da, hiçbir ölçeğin geçerliğinin tam olamayacağını söylüyoruz. Hata için olduğu gibi geçerlik için de denebilir ki, bütün bunlara karşın, uygulamada yeterli sayılabilecek doğrulukta ölçüler verecek kadar yüksek geçerlikte ölçekler geliştirilebilir. Bunun için izlenecek bazı yollar vardır.
Bir ölçme aracının geçerliği, o ölçme aracı ile elde edilebilecek ölçülerdeki değişkenliğin (varyansın) ne kadarının, incelenen kişilerin ölçülen özelliğe sahip oluş dereceleri arasındaki gerçek farklardan geldiğini gösterir. Bu da geçerliğin daha teknik bir tanımıdır. Bir ölçme aracının geçerliğinin belirlenmesinde işte bu son tanımdan yararlanılır. Geçerliği saptanacak olan araçla standart koşullarda elde edilmiş olan ölçülerdeki değişkenliğin ne kadarının, özelliği ölçülen kişiler arasındaki gerçek farklardan gelmekte olduğuna bakılır. Ölçülen özelliğe sahip oluş derecesi bakımından kişiler arasındaki gerçek farklardan gelen değişkenliğin, bu ölçülerde gözlenen toplam değişkenliğe oranı hesaplanarak testin geçerlik göstergesi olarak kullanılır.
Bir ölçme aracı ile standart koşullarda elde edilmiş olan ölçülerde gözlenen (bu ölçülerden hesaplanan) toplam değişkenliğin, kişilerin ilgilenilen özelliğe sahip oluş dereceleri arasındaki gerçek farklardan gelen değişkenlikten daha büyük olması beklenir. Bunun tersi olanaksızdır. Kişilerin bir özelliğe sahip oluş dereceleri arasındaki gerçek farklardan gelen değişkenlik, olsa olsa, aynı ölçülerde gözlenen toplam değişkenlik kadar olabilir. Bu son durumda, kullanılan ölçeğin geçerliği tam demektir. Böyle bir durumun ideal olduğunu daha önce de belirtmiştik. Ölçme hatasının tam olarak sıfıra indirilemeyeceğini biliyoruz. Bunun, doğa bilimlerinin ilgi alanına giren bazı kararlı özellikleri ölçmek üzere geliştirilmiş, yüksek nitelikli (geçerlik ve güvenirliği çok yüksek) ölçme araçları için bile mümkün olmadığını biliyoruz. İstenmeyen özellikler ölçüleri hiç etkilememiş olsa bile, ölçülerde gözlenen değişkenlik ölçme hatası yüzünden artacaktır. Başka bir neden olmasa bile, değişkenliğin miktarı gerçek farklardan gelen değişkenlikten, hatanın katkısı kadar daha fazla olacaktır. Ölçülerde gözlenen toplam değişkenlik en azından, bu iki kaynaktan gelen katkıyı da kapsamak durumundadır. Üstelik yukarıda da sözü edildiği üzere canlıların davranışsal özellikleri ölçülürken kullanılan ölçeklerin, ölçmek istediğimiz özellikten başka özelliklerdeki farklardan da etkilenmekte olması mümkündür. Buraya kadar sayılan bu üç etki kaynağının ortak etkilerinin (etkileşimlerinin) sonuçları da dikkate alınırsa, davranışsal özelliklerin ölçülmesinde kullanılan ölçme araçlarının neden tam geçerli olamayacağı daha iyi anlaşılır.
Sonuç olarak, belli bir ölçekle ve standart koşullar altında elde edilmiş olan ölçülerdeki toplam değişkenlik (a) bireylerin ölçülen özelliğe sahip oluş dereceleri arasındaki gerçek farkların, (b) istenmediği halde ölçüleri etkilemiş olan öteki özelliklerdeki gerçek farkların, (c) ölçme hatasının ve (d) yukarıdaki “a” ile “b” de belirtilen kaynaklarla ilgili ortak etkinin bir toplamı olmak durumundadır (Bu kaynakların ölçme hatası ile ortak etkileri olması düşünülemez).
Ölçme aracının geçerliği yüksek ise güvenirliği yüksektir; ama bunun tersi doğru değildir. Güvenirliği yüksek olan bir aracın geçerliği yüksek de olabilir; düşük de. Hata kaynaklı değişkenliğe çok yer veren bir ölçeğin geçerliği yüksek olamaz. Başka bir deyişle, kararlı (bazı gerçek farkları yansıtan) değişkenlik fazla ise bu mutlaka ölçülmek istenen farklardan gelemeyebilir. Ölçülmek istenmeyen farklardan da gelmekte olabilir. Bu yüzden güvenirliğin yüksek olması, geçerliğin yüksek olması demek olmaz. Ancak kararlı değişkenliğin az olması, gerçek farklara dayanan değişkenliğin de az olması demektir. Böyle bir durumda, güvenirliğin düşmesi geçerliği de düşürür.
Özetle bir test, hem güvenirliği hem de geçerliği yüksek bir test olmalıdır. Bir testin geçerliğinin yüksek olması o testin güvenirliğinin de bir dereceye kadar yüksek olduğunu gösterir. Ancak, bir testin güvenirliğinin yüksek olması aynı testin geçerliğinin ne olabileceği hakkında tam bir bilgi veremez (Özçelik, Ölçme ve Değerlendirme, 2016, s. 42-46).