Test Psicológicos (Anastasi y Urbina) PDF

Title Test Psicológicos (Anastasi y Urbina)
Author Valentina Lobos
Course Psicometría 1
Institution Pontificia Universidad Católica de Valparaíso
Pages 7
File Size 86.5 KB
File Type PDF
Total Downloads 67
Total Views 126

Summary

Download Test Psicológicos (Anastasi y Urbina) PDF


Description

Test Psicológicos – Anastasi y Urbina Capítulo 2: Antecedentes históricos de las pruebas actuales Las pruebas psicométricas surgen por la necesidad de contar con criterios uniformes para identificar y clasificar a las personas con problemas mentales. Individuos insanos ≠ individuos con retardo mental: los primeros manifestaban trastornos emocionales que podrían o no estar acompañados por un deterioro intelectual, mientras que los segundos se caracterizaban principalmente por una deficiencia intelectual presente desde el nacimiento o primera infancia. Esquirol  el habla proporciona el criterio más confiable del nivel intelectual del individuo. Actualmente los criterios también son principalmente lingüísticos y los test de inteligencia tienen una fuerte carga de contenido vebal. Seguin  pionero en capacitación de retardados. Experimentó muchos años con el “método fisiológico de capacitación”. Estableció la primera escuela para niños retardados. Creador de muchas técnicas de entrenamiento sensorial y muscular, que luego fueron incorporadas a tests de inteligencia no verbal o de ejecución. Binet  niños retardados asignados a cursos de educación especial, no expulsados. A cargo de una comisión ministerial para el estudio de estos infantes, acontecimiento trascendental en la historia de las pruebas psicológicas. Primeros psicólogos experimentales  buscaban descripciones generalizadas de la conducta humana (uniformidad). Las diferencias individuales bajo las mismas condiciones eran consideradas como errores que disminuían la exactitud de las generalizaciones. Influenciados por la fisiología y la física, los problemas que estudiaban se relacionaban principalmente con el tiempo de reacción y con la sensibilidad a estímulos sensoriales. Influencia de la psicología experimental sobre el movimiento psicométrico: insistencia por ejercer un control riguroso de las condiciones en las que se realizan las observaciones, ej: forma de dar instrucciones, brillo o color de fondo de estímulos visuales  condiciones estandarizadas, señales distintivas de las pruebas psicológicas. Galton  principal responsable del inicio del movimiento psicométrico. Interés por la herencia humana. Necesidad de medir las características de personas que estaban y no emparentadas. Estableció labortarios antropométricos donde medía rasgos físicos y sometía a pruebas de agudeza visual y auditiva, fuerza muscular, tiempo de reacción y otras funciones sensoriomotoras simples. Creía que las pruebas de discriminación sensorial sirven para estimar el intelecto. Contribuciones: barra de Galton para la discriminación visual de la longitud, silbato de Galton para determinar el mayor tono audible, serie graduada de pesos para medir la discriminación cinestésica, pionero en la aplicación de escalas de calificación y cuestionarios, uso de la técnica de asociación libre, formulación de métodos estadísticos para el análisis de datos sobre diferencias individuales.

Cattell  participó activamente en el establecimiento de laboratorios de psicología experimental y en la difusión del movimiento psicométrico. Se le atribuye el término “test mental”. Compartía las ideas de Galton. Sus pruebas son características de los instrumentos derrallodados en la última década del s. XIX. Kraepelin y Ebbinghaus  elaboraron pruebas que tendían a cubrir funciones algo más complejas. Binet y Henri  criticaron el predominio de pruebas sensoriales y concentradas indebidamente en habilidades especializadas simples. Propusieron tests que cubrían funciones como memoria, imaginación, atención, comprensión, susceptibilidad a la sugestión, apreciación estética, etc. Binet  dedicó muchos años a la investigación de las formas de medir la inteligencia hasta llegar a la convicción de que la medición directa de las funciones intelectuales complejas era la más promisoria. En colaboración con Simon preparó la primera escala de Binet-Simon (1905): 30 problemas arreglados en orden de dificultad creciente, diseñados para cubrir una amplia variedad de funciones, con énfasis en el juicio, la comprensión y el razonamiento (componentes principales de las inteligencia según Binet). Incluían pruebas sensoriales y perceptuales, pero tenían mayor contenido verbal. 1908  segunda escala, aumentó el número de tests, eliminaron los insatisfactorios, se agruparon en niveles de edad. La calificación del niño en toda la prueba podía expresarse como el “nivel mental” (o “edad mental”) correspondiente a la edad de los niños normales cuya ejecución había igualado. 1911  tercera revisión, no presenta mayores modificaciones: revisiones menores, cambios en la localización de algunos tests, adición de otros en varios niveles de edad y extensión de la escala al nivel adulto. Escala de Binet-Simon  satisfizo la urgente necesidad de un instrumento estandarizado para diagnosticar y clasificar a personas con retardo mental. Escala Stanford-Binet  reemplazó la anterior por ser un instrumento más extenso y psicométricamente refinado. Utilizó por primera vez el “cociente de inteligencia” (CI) o razón entre la edad mental y la cronológicas. Escala Kuhlmann-Binet  se amplió hasta la edad de 3 meses, uno de los primeros esfuerzos por elaborar tests de la inteligencia para preescolares e infantes. *Los tests de Binet y sus revisiones son escalas individuales (sólo pueden aplicarse a una persona, luego a otra) Pruebas de grupo  elaboradas para satisfacer una necesidad práctica. Primera Guerra Mundial, necesidad de una rápida clasificación del nivel intelectual general de los reclutas, información importante para tomar decisiones administrativas, incluyendo rechazo o dispensa del servicio militar, asignación a diferentes servicios o admisión a campos de entrenamiento de oficiales.

Contribución importante de este instrumento: introducción de preguntas de opción múltiple y otros reactivos “objetivos”. Army Alpha y Army Beta (pruebas Alfa y Beta): la primera se ocupaba de las pruebas generales de rutina, la segunda era una escala no lingüística utilizada con reclutas iletrados o de países cuyo idioma no era el inglés. Luego de la guerra, sirvieron como modelo para la mayor parte de los tests colectivos de inteligencia para civiles  notable crecimiento del movimiento psicométrico. Las pruebas colectivas no sólo permitieron la medición simultánea de grandes grupos, también simplificaron las instrucciones y los procedimientos de aplicación, lo que disminuyó la capacitación requerida del aplicador. El auge psicométrico de los años veinte, basado en el uso indiscriminado de los instrumentos, puede haber demorado el progreso de las pruebas psicológicas. Los “test de inteligencia” tenían un alcance muy limitado, no todas las funciones importantes estaban representadas, su nombre era inadecuado porque sólo medían ciertos aspectos de la inteligencia, por lo que algunos comenzaron a llamarse test de aptitud. También se mostraba a menudo una marcada variación en diferentes partes de la prueba. Los usuarios se valían de esas comparaciones internas para obtener un conocimiento más profundo de la estructura psicológica del individuo, pero no se recomienda esta práctica porque los tests de inteligencia no fueron diseñados para un análisis diferencial de las aptitudes. Análisis factorial  señalaron la presencia de diversos factores o rasgos relativamente independientes, lo que llevó al desarrollo de “baterías de aptitudes múltiples” (1945), diseñadas para proporcionar una medida de la posición del individuo en una serie de rasgos. En vez de una puntuación total o CI, obtienen una puntuación aparte para distintos rasgos (comprensión verbal, aptitud numérica, visualización espacial, razonamiento aritmético, rapidez perceptual). Además, incorporaron en un programa amplio y sistemático de evaluación gran parte de la información que antes se obtenía por pruebas de aptitud especial.

Capítulo 3: Normas y significado de las puntuaciones de los tests El desarrollo y uso de las normas y otros procedimientos facilitan la interpretación de las puntuaciones de pruebas psicológicas. Sin datos interpretativos adicionales, la sola puntuación cruda (o porcentaje) carece de significado. El grado de dificultad de los reactivos que componen cada prueba determinará el significado del resultado. En los instrumentos psicológicos, las puntuaciones suelen interpretarse haciendo referencia a “normas” que representan el desempeño de la muestra de estandarización en la prueba; es decir, las normas se establecen empíricamente al determinar lo que hacen en la prueba los miembros de un grupo representativo.

Puntuación transformada: distribución de las puntuaciones obtenidas por la muestra de estandarización para descubrir qué lugar ocupa en esa distribución. Cumplen una doble función: indican la posición del individuo en relación con la muestra normativa, permitiendo la evaluación de su desempeño en comparación con otros, y proporcionan medidas equivalentes que permiten la comparación directa del desempeño del individuo en pruebas diferentes. Las puntuaciones crudas de diferentes pruebas suelen expresarse en unidades distintas por lo que es imposible su comparación directa, pero las puntuaciones derivadas pueden expresarse en las mismas unidades y referirlas a muestras normativas iguales o muy similares en distintas pruebas, lo que sí permite comparación. Las puntuaciones derivadas se expresan en dos formas principales: el nivel de desarrollo alcanzado o la posición relativa dentro de un grupo específico. Estadística  propósito fundamental: organizar y resumir los datos cuantitativos para facilitar su comprensión. Distribución de frecuencias: tabla que agrupa las puntuaciones en intervalos de clase y marca cada una en el intervalo adecuado. Se cuentan las marcas para encontrar la frecuencia o el número de casos en cada intervalo de clase. La suma de las frecuencias es igual a N (número total de casos en el grupo). Curva de distribución: representación gráfica de la información que proporciona una distribución de frecuencias. Eje horizontal: puntuaciones agrupadas en intervalos de clase. Eje vertical: frecuencias o números de casos que caen en cada intervalo. Histograma: la altura de la columna sobre cada intervalo corresponde al número de sujetos localizados ahí. Polígono de frecuencia: un punto en el centro del intervalo y una línea(¿) a la frecuencia apropiada indica el número de sujetos de cada intervalo. Los puntos sucesivos se unen con líneas rectas. Tendencia central: ofrece la puntuación más común o representativa del desempeño de todo el grupo. Promedio o media (M): se obtiene al sumar todas las puntuaciones y dividir la suma entre el número de casos (N). Moda: puntuación más frecuente. Mediana: punto más cercano al centro de una distribución de puntuaciones ordenadas por tamaño. Medidas de variabilidad (de la extensión de las diferencias individuales alrededor de la tendencia central): otra descripción del conjunto de puntuaciones de un test.

Rango: forma más evidente y familiar de mostrar variabilidad entre la mayor y la menor puntuación  cruda e inestable. Diferencia entre la puntuación individual y la media del grupo  método más preciso. En la “desviación promedio”, la suma de las desviaciones siempre será igual a cero, porque las desviaciones positivas y las negativas alrededor de la media aritmética se equilibran o cancelan, por lo que su uso es inadecuado para posteriores análisis matemáticos. Desviación estándar: medida de variabilidad mucho más útil en las que los signos negativos se eliminan al elevar al cuadrado cada desviación. Varianza o media de los cuadrados de las desviaciones: suma de los datos dividida entre el número de casos. De gran utilidad para separar la contribución de diferentes factores a las diferencias individuales en el desempeño de una prueba. En la DE suele emplearse la raíz cuadrada de la varianza al comparar la variabilidad de distintos grupos. Las puntuaciones de las pruebas adquieren significado si indican qué tanto ha progresado el individuo en el patrón de desarrollo normal. Estas puntuaciones basadas en normas de desarrollo tienden a ser burdas en términos de la psicometría y no se prestan a un tratamiento estadístico preciso, pero resultan muy atractivas para propósitos descriptivos, en especial en el estudio clínico intensivo de individuos y para ciertos propósitos de investigación. La ejecución de los individuos mostraba cierto grado de dispersión, es decir, en algunas pruebas estaban por debajo de su edad mental y en otras por encima. Por esto se acostumbraba a calcular la “edad basal”  mayor edad en la que todas pruebas se pasaban. A esta se agregaban luego créditos parciales en meses por las pruebas pasadas en niveles superiores. La suma de éstas (edad basal + meses adquiridos como créditos) correspondía a la edad mental. Las normas de edad mental también han sido empleadas con pruebas que no se dividen en niveles de años. Primero se determina la puntuación del niño (número total de aciertos, tiempo, número de errores, etc.). El promedio de las puntuaciones crudas de los niños de la muestra de estandarización en cada grupo de edad constituye la norma de edad para esa prueba. La unidad de edad mental no permanece constante con la edad, sino que tiende a disminuir con los años, ya que el desarrollo intelectual avanza más rápido a edades tempranas y disminuye a medida que el individuo se aproxima a su límite de maduración. En las pruebas de aprovechamiento académico, los resultados suelen interpretarse como equivalentes a grados. Las normas de grado se encuentran calculando la puntuación cruda promedio de los niños de cada grado. Los equivalentes de grados intermedios (fracciones de grado) en general se encuentran por interpolación, aunque también pueden obtenerse examinando directamente a los niños en momentos diferentes del año escolar. Defectos de las normas de grado: Las unidades de grado son desiguales, tales desigualdades ocurren de manera irregular en diferentes áreas temáticas  el contenido de la instrucción varía

de un grado a otro, por lo que sólo son apropiadas para las materias enseñadas a lo largo de todos los niveles escolares cubiertos por la prueba (no sirve para la secundaria), pero incluso así, el énfasis puesto en diferentes temas puede varias, por lo que el progreso puede ser más rápido en una materia que en otra; Pueden ser objeto de malas interpretaciones, a menos que el usuario tenga siempre presente la manera en la que se derivaron; Tienden a ser consideradas en forma errónea como criterios de desempeño. Escalas ordinales: se diseñan para identificar la etapa alcanzada por el niño en el desarrollo de funciones conductuales específicas cuya progresión es uniforme, en etapas sucesivas que presuponen el dominio de la conducta característica de etapas previas. Ej: Programas de Desarrollo de Gesell  presentan en meses el nivel aproximado de desarrollo que ha alcanzado el niño en cuatro áreas principales de conducta (motora, adaptativa, lenguaje y personal-social), subrayando las uniformidades de las secuencias del desarrollo y la progresión ordenada de los cambios en la conducta. Otro ej: Piaget  desarrollo de los procesos cognoscitivos de la infancia a la adolescencia. Se interesaba en conceptos específicos más que en habilidades generales, como la permanencia del objeto (mirado desde distintos ángulos o cuando desaparece) y la conservación (un atributo permanece constante a pesar de los cambios en su apariencia). Alcanzar una etapa depende de haber completado las etapas anteriores en el desarrollo del concepto. Normas intragrupo: la ejecución del individuo se evalúa en términos del desempeño del grupo de estandarización más próximo. Las puntuaciones intragrupo tienen un significado cuantitativo uniforme y definido, pueden emplearse adecuadamente en casi todos los análisis estadísticos. Percentiles: calificaciones percentiles se expresan en términos del porcentaje de sujetos de la muestra de estandarización que caen bajo determinada puntuación cruda. Indican la posición relativa del individuo en la muestra de estandarización, también pueden verse como rangos en un grupo de 100 pero comenzando por el extremo inferior: más bajo el percentil, más pobre la posición del individuo. Percentil 50 = mediana. Percentiles 25 y 75 = primer y tercer puntos cuartiles, separan los cuartos inferior y superior de la distribución, proporcionan referencias convenientes para describir una distribución de puntuaciones y compararla con otras. Percentiles ≠ Porcentajes: porcentajes son puntuaciones crudas que se expresan en términos del porcentaje de los reactivos correctos y el total, percentiles son puntuaciones transformadas que se expresan en términos del porcentaje de individuos. Ventajas de los rangos percentiles: son sencillas de calcular y comprender (incluso por personas sin capacitación técnica), son de aplicación universal, pueden usarse en adultos y niños, son adecuados para cualquier prueba. Desventajas de los rangos percentiles: disparidad de sus unidades, especialmente en los extremos de la distribución. Carta de probabilidad aritmética: gráfica con secciones donde las líneas verticales muestran el mismo espaciamiento que los puntos de una distribución normal, mientras el espacio entre las

líneas horizontales es uniforme, o a la inversa. Brindan una imagen correcta de las diferencias entre las puntuaciones. Gráficas de percentiles normales: pueden usarse para mostrar las puntuaciones de varios individuos en la misma prueba o los resultados de la misma persona en diferentes pruebas. Para cualquiera, la diferencia real entre las puntuaciones aparecerá representada correctamente. Calificaciones estándares: el tipo más satisfactorio de puntuación derivada. Expresan la distancia del individuo de la media en términos de la desviación normal de la distribución normal. Pueden obtenerse por medio de transformaciones lineales o no lineales de las puntuaciones crudas originales. Las obtenidas por transformación lineal conservan las relaciones numéricas exactas de las puntuaciones originales porque se resta una constante de cada puntuación cruda y se divide el resultado entre otra constante. La magnitud relativa de las diferencias entre estas calificaciones estándares es exactamente la que existe entre las puntuaciones crudas. Las propiedades de la distribución original de las puntuaciones crudas se duplican en la distribución de calificaciones estándares. Para calcular una calificación estándar se encuentra la diferencia entre la calificación individual cruda y la media del grupo normativo, luego se divide por la DE del grupo normativo. Las puntuaciones estándares deben expresarse con al menos un decimal para permitir suficiente diferenciación. Para convertir una calificación estándar original en la nueva escala se multiplica por la DE deseada y se suma o resta el resultado de la media deseada. Las puntuaciones estándares derivadas linealmente sólo son comparables cuando provienen de distribuciones de más o menos la misma forma. Cuando la forma de las distribuciones es distinta, las calificaciones pueden hacerse comparables empleando transformaciones no lineales que las ajuste a cualquier curva de distribución. Ventajas de la curva normal: la mayoría de las distribuciones de puntuaciones crudas se aproxima a esta curva más que a cualquier otra; tiene muchas propiedades matemáticas útiles que facilitan los cálculos posteriores. Calificaciones estándares normalizadas: calificaciones estándares expresadas en términos de una distribución que da sido transformada para ajustarse a una curva normal. Se expresan de la misma forma que las calificaciones estándares derivadas linealmente, es decir, media igual a cero y DE igual a 1. Pueden adoptar cualquier forma conveniente....


Similar Free PDFs