SNAPSHOT.01 EZESTAT2 ÚÄPage 36ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ ³Kolmogorov-Smirnov [KS] test of differences in cumulative frequency ³ ³distributions ³ ³ ³ ³The KS test is an extremely effective way of determining differences ³ ³between variables measured at the nominal or ordinal level ³ ³ - between two different samples ³ ³ - one group measured again after an interval. ³ ³ ³ ³As such, it is particularly useful in questionnaire analysis. ³ ³ ³ ³Worked example "Opinions concerning capital punishment" ³ ³ -------------------------------------- ³ ³ 1982 ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ 1992 ³ ³ Nos. Cum% ³ ABSOLUTE ³ Cum% Nos. ³ ³ --------- ³ DIFFERENCES ³ ---------- ³ ³ Strongly opposed 20 20% ³ 20% ³ 40% 16 ³ ³ Opposed 25 45% ³ -> 30% ³ 75% 14 ³ ³ In favour 35 80% ³ 10% ³ 90% 6 ³ ³ Strongly in favour 20 100% ³ - ³ 100% 4 ³ ³ --- ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ -- ³ ³ 100 40 ³ ³ [Pg Dn] [Pg Up] ³ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ SNAPSHOT.02 EZESTAT2 ÚÄPage 37ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ ³Kolmogorov-Smirnov Test - calculations ³ ³ ³ ³Is this evident shift in opinion statistically sigificant or not ? ³ ³ ³ ³ þ Work out the cumulative frequencies in percentages and then find ³ ³ the largest ABSOLUTE difference between them (central column). ³ ³ /------- ³ ³ þ We need a difference of 1.358 * / (n1+n2) at the 5% level ³ ³ / -------- ³ ³ \/ (n1*n2) ³ ³ ³ ³where n1,n2 are the sample sizes. If n1=100 and n2=40 then we need at least³ ³1.358 û ( 140/4000 ) = 0.2541 (25.41%) so 30% is significant at 5% level. ³ ³ ³ ³Use 1.628 to test at the 1% level. In the example, the figure would work ³ ³out at 0.3046 (30.46%) which would NOT be significant at the 1% level. ³ ³ ³ ³The KS test is much less sensitive to small cell numbers than a ³ ³chisquare test but more powerful as it uses the WHOLE of the distribution. ³ ³ ³ ³ ³ ³ [Pg Dn] [Pg Up] ³ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ SNAPSHOT.03 EZESTAT2 ÚÄPage 38ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ ³Recoding data ³ ³ ³ ³We may need to recode data to turn CONTINUOUS into CATEGORICAL data... ³ ³INCOME Y_CODE SEX ³ ³ 1000 1 1 ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ ³ ³ 2000 1 2 ³ Here we have INCOME (a continuous variable) ³ ³ ³ 3000 1 1 ³ coded into Y_CODE (a categorical variable) ³ ³ ³ 4000 1 2 ³ We could now, for example, do a chi- square ³ ³ ³ 5000 2 1 ³ test on Y_CODE v SEX ³ ³ ³ 6000 2 2 ³ ³ ³ ³ 7000 2 1 ³ NB We do lose some of the 'richness' in ³ ³ ³ 8000 2 2 ³ the data when we code like this. ³ ³ ³ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ ³ ³ ³ ³We can also COLLAPSE data, which is similar to recoding. If we have a ³ ³variable CLASS measured on a six-point scale [1-6] then we could recode ³ ³1-3 into a 1 [ Middle class ] ³ ³4-6 into a 2 [ Working Class] ³ ³for easier analysis [ or to reduce the cells ] in a chi-square. ³ ³ ³ ³ ³ ³ [Pg Dn] [Pg Up] ³ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ SNAPSHOT.04 EZESTAT2 ÚÄPage 39ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ ³Choice of Test ³ ³ ³ ³The choice of test depends upon whether the data is measured at ³ ³the CONTINUOUS or the CATEGORICAL (or ORDINAL) level.. ³ ³ ³ ³ Variable Type of Statistics ³ ³ Statistic ³ ³------------------------------------------------------------------------ ³ ³ CONTINUOUS PARAMETRIC Means; Standard Deviations ³ ³ (e.g. Incomes) Correlation (Pearson) ³ ³ Regression ³ ³ 't' tests on means, proportions ³ ³ ³ ³ CATEGORICAL NON- Frequency Distributions ³ ³ (e.g. coding PARAMETRIC Correlation (Spearman) ³ ³ number for Chi-square ³ ³ SEX) Kolmogorov-Smirnov tests ³ ³------------------------------------------------------------------------- ³ ³ ³ ³ ³ ³ ³ ³ [Pg Dn] [Pg Up] ³ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ