San Pablo   Informa
San Pablo   Informa

San Pablo Informa

Ciencia de Datos y Estadística: Saber "Lo que dicen los datos" a partir de sus tratamiento

Ciencia de Datos une la Matemática, Estadística y Ciencia de la Computación. Imagen: Internet.

Dr. Daniel Gutiérrez 2Por: Dr. Daniel Alexis Gutierrez Pachas, investigador asociado del Departamento de Ciencia de la Computación de la Universidad Católica San Pablo. Doctor en Ciencia de la Computación  y Matemática Computacional por la Universidad de Sao Paulo, Brasil.

El avance de la tecnología ha mejorado la manera de recolectar datos, pero a medida que la información aumenta, se hace cada vez más complejo organizarlos, manipularlos y comunicarlos. Diversos investigadores coinciden que la Ciencia de Datos es determinante para comprender grandes cantidades de ellos. Sus aplicaciones son diversas, varias de ellas, han sido exitosas para comprender modelos sociales, económicos, entre otros. Inclusive la crisis sanitaria provocada por el COVID-19.

La actual pandemia ha dejado en evidencia la importancia de datos confiables con la finalidad de tomar decisiones adecuadas que lleven a controlar el contagio de manera eficiente. Las decisiones durante la pandemia van desde asumir medidas de aislamiento social, fortalecimiento de los servicios en los centros de salud, apoyo social a personas vulnerables, entre otras. Incluso ahora con la disminución de los índices, los datos seguirán siendo importantes para la toma de decisiones en la reactivación económica.

La Ciencia de Datos es un campo multidisciplinar. El tratamiento de datos requiere el dominio de una variedad de habilidades y conceptos, incluidos muchos tradicionalmente asociados con los campos de Estadística, Matemáticas y  Ciencia de la Computación. La Ciencia de Datos no es la intersección de estas áreas, sino una integración efectiva de ellas. Por ejemplo, conceptos provenientes del  Álgebra Lineal, Cálculo, Optimización y Probabilidades son tópicos que son ampliamente usados en Ciencia de Datos.

El trabajo estadístico en el tratamiento de datos es darle sentido a la información para extraer patrones y tendencias importantes, y comprender  “lo que los datos dicen”. El aporte estadístico en la Ciencia de Datos comprende desde el análisis descriptivo de los mismos, así como el análisis e interpretación de cuadros y gráficos estadísticos. Además de técnicas de regresión aplicadas eficientemente en modelos predictivos. La validación de nuestras conclusiones son pruebas de inferencia estadística. Otro aporte de la Estadística son los modelos probabilísticos y bayesianos y que ayuda a comprender situaciones inciertas. También se estudian modelos para encontrar relaciones entre acciones y consecuencias como modo de comprender una situación y adaptarse a la misma, que son bien interpretadas usando modelos de causalidad.

El Departamento de Ciencia de la Computación de la UCSP desarrolla investigaciones en este campo. Uno de los proyectos es el de “Ciencia de Datos en la Educación”, el cual fue ganador de una convocatoria del Consejo Nacional de Ciencia, Tecnología e Innovación Tecnológica con fondos del Banco Mundial. Allí analizamos grandes volúmenes de datos usando métodos computacionales para detectar y prevenir la deserción universitaria. Realizamos el análisis de datos socioeconómicos para identificar a los estudiantes con riesgo de desertar y las causas de dicha decisión. El COVID-19 será un factor muy influyente en este campo, así hasta hay programas para evitar el abandono de los estudios superiores.

Otra iniciativa es el Monitor COVID-19, portal web que desde el inicio de la pandemia en nuestro país, ofrece las cifras del coronavirus en el país, las cuales son analizadas para poder ser presentadas de modo más amigable aprovechando distintas herramientas de visualización a fin de entender de mejor manera la incidencia del virus a través de los datos y las gráficas tanto a nivel nacional como por regiones (cs.ucsp.edu.pe/monitor-covid/).

En el ámbito académico brinda los diplomados de posgrado en Business Analytics y en Data Science. En ellos se imparten fundamentos estadísticos, además de otros cursos relacionados a Ciencia de la Computación para que más personas tengan la oportunidad de entender, aplicar y aprovechar las ventajas que ofrece la Ciencia de Datos.

Etiquetas

Este sitio web almacena cookies en tu PC, las cuales se utilizan para recopilar información acerca de tu interacción con nuestro sitio web y nos permite recordarte. Usamos esta información con el fin de mejorar y personalizar tu experiencia de navegación y para generar analíticas y métricas acerca de nuestros visitantes en este sitio web y otros medios de comunicación. Para conocer más acerca de las cookies, consulta nuestra política de privacidad y cookies.