Aşağıdaki içerikler, bilimsel yöntemlerle test ve sınav hazırlama konusunda bilgilendirme amaçlı hazırlanmıştır.
Sorularınız için bizimle iletişime geçebilirsiniz:
E-posta: [email protected]
PBX: +90 212 318 80 99
Ölçme yapan kişinin ilk ve en önemli amacı hatasız bir ölçü elde etmektir. Ancak hatasız bir ölçü elde etme, ilk bakışta sanılabileceği kadar kolay değildir. Elle tutulur, gözle görülür ve kararlı özellikler üzerindeki ölçülerin bile tümüyle hatadan arınmış olması olanaksızdır.
Ölçme hatası, aynı koşullarda fakat birbirinden bağımsız olarak tekrarlanan ölçme sonuçlarından hesaplanan değer ile ölçülen özelliğin gerçek değeri arasındaki farktır.
Davranışsal özellikler genellikle koşulsuz olarak (kendiliğinden) istenen derecede kararlılık göstermez. Bu tür özelliklerin birçoğuna, insan denetimindeki bazı koşullarla kararlılık kazandırmak da çok güç ve hatta olanaksızdır. İkincisi, davranışsal özelliklerden önemlice bir kısmının ölçülmesinde kullanılmak üzere geliştirilmiş yüksek nitelikli, yani hem kendi içinde kararlı hem de neyi ölçtüğü tartışma götürmeyecek derecede açık olan ölçme araçları yoktur. Üçüncüsü, davranışsal özelliklerin, bunların ölçülmesinde kullanılacak ölçeklerle “karşılaştırılması” işlemi, kuralları bakımından oldukça karmaşıktır. Davranışsal özellikler üzerindeki bir ölçme işleminin tekrarları arasında, koşullar bakımından özdeşlik sağlamak hemen hemen olanaksız gibidir.
Davranışlar, davranışsal özelliklerin yapı taşları, onları belirleyen temel öğelerdir. Ancak, bir davranış örneklemi ile böyle bir örneklemdeki davranışların belirlediği (ve aynı zamanda işaretçileri olduğu) davranışsal özellik arasındaki ilişkinin doğası bir durumdan diğerine değişme gösterebilir. Kişinin belli bir özelliği ölçme işlemini, bu özellik değişikliğe uğramadan tekrarlama olanağı yok gibidir. Bu yüzden davranışsal özellikler üzerindeki ölçmeleri tekrarlamakla sağlanacak yararı başka yollardan elde etmek gerekmektedir. Ne var ki bu başka yollar da kolayca izlenebilen, verimli yollar değildir. Bunun nedenlerini şöyle açıklayabiliriz. Bir kere davranışsal özellikler için, ölçmedeki yanlışları hatadan ayırmak zordur. Ayrıca, ölçek niteliklerinin belirlenebilmesi için değişik kişiler üzerinde ölçme yaparken bu kişiler arasındaki önemli farkların da göz önünde tutulması gerekmektedir.
İkincisi, davranışsal özelliklerin ölçülmesinde kullanılmak üzere geliştirilmiş olan en yüksek nitelikli ölçekler bile normal bir uzunluk ölçeği kadar kararlı değildir. Ayrıca bu ölçeklerin neyi ölçtükleri de bir dereceye kadar tartışılabilmektedir. Davranışsal özelliklerin ölçülmesinde kullanılan testlerde şöyle durumlarla karşılaşılabilir. Bu ölçeklerin, sadece kendi kararsızlıkları yüzünden, örneğin %68 olasılıkla 3,3; %95 olasılıkla 6,6; %99,7 olasılıkla 9,9 puanlık bir hata sınırına sahip olması bu tür ölçeklerle uğraşan ölçmeciler için hiç de beklenmedik bir hal değildir. İleride görüleceği gibi, güvenirliği yaklaşık 0,90 ve standart sapması 10 olan bir test için durum böyledir. Bu güvenirlik göstergesi ise, testler için oldukça yüksek bir güvenirliği ifade etmektedir.
Davranışsal özelliklerin ölçülmesinde kullanılan tipik ölçme araçları olarak testlerin neyi ölçmekte oldukları da genellikle tartışmaya açıktır. Nitekim her testin bir dereceye kadar, ölçülmek istenmeyen bazı özelliklerden de etkilenmekte, yani onları da ölçmekte olması mümkündür. Somut bir örnekle durumu açıklamak gerekirse şöyle denilebilir: Bir tarih testi, tarih dersindeki öğrenme düzeyi (ölçülmek istenen özellik) ile birlikte öğrencilerin, bir dereceye kadar okuma hızını, okuduğunu anlama gücünü, düşünme yeterliğini vb.ni de ölçmekte olabilir. Bunlar, bu durumda, ölçülmek istenmediği halde puanları etkilemekte olan özelliklerdir. Bunların etkileri, tarih dersindeki öğrenme düzeyi ölçülerini değiştirdiği ölçüde bizi istediğimizden farklı sonuçlara götürür.
Üçüncü bir nokta da şudur: Davranışsal özelliklerin, bu özelliklerin ölçülmesinde kullanılacak ölçeklerle karşılaştırılmasına ilişkin kurallar oldukça karmaşıktır. Ölçek ile karşılaştırılacak olan özellik genellikle uzunluk ve ağırlık gibi iyi tanınan bir özellik değildir. Davranışsal özelliklerin büyük bir kısmını ölçekle doğrudan karşılaştırma olanağı da yoktur. Bu özellikler genellikle kavramsal nitelikte olan örtülü özelliklerdir. Bunların ölçek ile doğrudan ya da genellikle olduğu gibi dolaylı olarak etkileştirilmesi ve böyle bir etkileşimin sonuçları aracılığı ile gözlenmesi gerekir. Ayrıca davranışsal özellikler için, ölçek ile ölçülecek olan özellik arasındaki etkileşimin önceden belirlenen koşullara uygunluk derecesinin belirlenmesi de çok zordur. Örneğin bu gibi durumlardaki ölçek-özellik etkileşimi üzerinde, bir termometre ile su ya da hava sıcaklığı etkileşimindeki kadar sıkı bir denetim sağlanamaz.
Sonuç olarak, davranışsal özellikler üzerindeki ölçülere karışmış olabilecek hatanın belirlenebilmesi için farklı bir yaklaşımdan yararlanılması zorunluluğu ile karşılaşılmaktadır. Davranışsal özellikler söz konusu olunca ölçme işlemini, aynı kişi üzerinde, aynı koşullarla ve birbirinden bağımsız olarak tekrarlanması olanaksız gibidir demiştik. Bu yüzden iki yoldan birini tutmak gerekmektedir. Ya ölçme işleminin aynı kişiler üzerinde, olanaklar ölçüsünde birbirine benzer koşullarda tekrarlanması ve hem kişinin özelliğinde meydana gelmiş olabilecek değişmenin hem de koşulların değişmiş olmasından gelebilecek etkilerin dikkate alınmasına çalışılmaktadır. Ya da bu amaçla, değişik kişilerden yararlanılması ve bu son halde söz konusu olabilecek başka etki kaynaklarının dikkate alınması yoluna gidilmektedir. Doğal olarak, her iki halde de özelliğin ölçekle karşılaştırılmasına ilişkin kurallara olanaklar ölçüsünde uymaya çalışılmakta; bütün çabalara karşın giderilemeyen uyumsuzlukların etkileri de dikkate alınmaktadır.
Son olarak sözü edilen bu gereklerin karşılanmasında, bu tür amaçlara elverişli düzenleme ve analiz tekniklerinden yararlanılmaktadır. Bu gerekler, davranışsal özellikler üzerinde çalışan bir ölçmeciyi, testler için, bir yandan kendi içindeki kararlığını (testin, en azından ele alınacak olan güvenirliğini) öte yandan da onun, ölçülmek istenen özelliği başka özelliklerden etkilenmeksizin ölçme derecesini (testin, daha sonra ele alınacak olan geçerliğini) araştırmaya yöneltmektedir (Özçelik, Ölçme ve Değerlendirme, 2016, s. 29-37).