Análisis estadístico

Libro: Research Methods in Human-Computer Interaction por Lazar, J., Feng, J. H., Hocheiser, H.

Los autores mencionan que antes de llevar acabo un análisis estadístico se deben preparar los datos por las siguientes razones:

  • Los datos recopilados que son introducidos manualmente pueden tener errores o pueden presentar formatos inconsistentes.
  • Los datos recolectados pueden ser demasiado primitivos y puede ser necesarios codificarlos en mayor nivel.
  • Pueden requerir que los datos se organicen en un formato predefinido para que puedan procesarse. 
Posterior a la preparación de los datos, y antes de el análisis estadístico, se deben seleccionar los datos para detectar posibles errores. Existen diversas estrategias que se pueden llevar a cabo:
  • Identificar errores mediante la realización de una verificación de razonabilidad.
  • Comprobar múltiples campos de datos.
  • Verificar si existe coherencia de tiempo o si el rendimiento está dentro de un rango razonable para los datos recogidos de forma automática.
Se menciona el termino codificación de datos, que consiste en transformar datos de texto en datos numéricos, se debe ser cuidadoso y verificar que la datos codificados tengan una correspondencia lógica con los originales. Es fundamental para asegurar que la codificación es consistente. 

Se deben organizar bien los datos para que al usar software estadísticos u otros software de procesamiento de datos, los datos se puedan establecer bien para los análisis estadísticos y finalmente se puedan ejecutar las pruebas estadísticas descriptivas para entender la naturaleza del conjunto de datos y saber su distribución.

Se habla de la tendencia central que es dónde se encuentra la mayor parte de los datos. Generalmente cuando se estudia un conjunto de datos se quiere averiguar esta característica.

El patrón de distribución normal es muy útil para el análisis ya que son muchos los atributos de diversos campos de estudio que se distribuyen normalmente. Para empezar la selección del tipo de pruebas de significación, se debe hacer una prueba de un conjunto de datos para determinar si se distribuye normalmente.

Existen dos tipos de variable:
  • Independiente. Representa una cantidad que se modifica en un experimento.
  • Dependientes. Representa una cantidad cuyo valor depende de cómo se modifica la variable independiente.
Para las pruebas, el procedimiento más adoptado para la comparación de dos medias es la T prueba. La prueba T de student para datos independientes se utiliza cuando deseamos comparar única y exclusivamente las medias entre dos grupos.

Se debe seleccionar los métodos de análisis estadísticos apropiados y se deben interpretar de forma precisa los resultados de las pruebas para poder generar un estudio correcto de los usuarios.

Comentarios

Entradas populares de este blog

Implementation

Conocimiento en la cabeza y conocimiento en el mundo

Statistical analysis