Abstract
Adjusted F-tests have typically been proposed as an alternative to the F-statistic in repeated measures ANOVA. Despite considerable research, it remains unclear how these statistics perform under simultaneous violation of normality and sphericity. Accordingly, our aim here was to conduct a detailed examination of Type I error and power of the F-statistic and the Greenhouse-Geisser (F-GG) and Huynh-Feldt (F-HF) adjustments, manipulating the number of repeated measures (3-6), sample size (10-300), sphericity (Greenhouse-Geisser epsilon estimator, from its lower to upper limit), and distribution shape (slight to extreme deviations from normality). The findings show that the behavior of F-GG and F-HF depends on the degree of violation of both normality, sphericity, and sample size. Overall, we suggest using F-GG under violation of sphericity and slight or moderate deviations from normality in all sample size; with severe deviations from both normality and sphericity F-GG may be used with a sample size larger than 10; and with extreme deviation from both normality and sphericity this statistic may be used with a sample size larger than 30. In the event of discrepant results between F-GG and F-HF, the choice depends on the epsilon value.
Las pruebas F ajustadas se han propuesto como alternativa al estadístico F en el ANOVA de medidas repetidas. A pesar de existir investigación previa, falta evidencia sobre el comportamiento de estos estadísticos en caso de violación simultánea de normalidad y esfericidad. El objetivo del presente trabajo ha sido realizar un examen detallado del error de tipo I y la potencia del estadístico F y los ajustes de Greenhouse-Geisser (F-GG) y Huynh-Feldt (F-HF), manipulando el número de medidas repetidas (3-6), el tamaño de la muestra (10-300), la esfericidad (estimador Greenhouse-Geisser de épsilon, desde su límite inferior al superior), y la forma de la distribución (desde desviaciones leves a extremas de la normalidad). Los resultados muestran que el comportamiento de F-GG y F-HF depende del grado de violación de la normalidad, esfericidad y tamaño muestral. En general, se sugiere utilizar F-GG en caso de violación de la esfericidad y desviaciones leves o moderadas de la normalidad; con desviaciones graves de ambos, F-GG puede utilizarse con un tamaño muestral superior a 10; y con desviaciones extremas, este estadístico puede utilizarse con un tamaño muestral superior a 30. En caso de resultados discrepantes entre F-GG y F-HF, la elección depende del valor epsilon.
Publisher
Servicio de Publicaciones de la Universidad de Murcia