Rapiminer Atipicos - Trabajo tutorial en la herramienta RapidMiner para la limpieza de datos PDF

Title Rapiminer Atipicos - Trabajo tutorial en la herramienta RapidMiner para la limpieza de datos
Author Edison Tamayo
Course Procesamiento de Datos
Institution Escuela Politécnica Nacional
Pages 8
File Size 683.4 KB
File Type PDF
Total Downloads 88
Total Views 133

Summary

Trabajo tutorial en la herramienta RapidMiner para la limpieza de datos...


Description

ESCUELA POLITÉCNICA NACIONAL

FACULTAD D DE INGENIERIA EN SISTEMAS INFORMATICOS Y COMPUTACION ANÁLITICA DE DATOS

TEMA: INSTALACION Y PRIMEROS PASOS EN RAPIDMINER

ALUMNO: EDISON TAMAYO

DOCENTE: CINDY LOEZ FECHA: 12/06/2019

1. OBJETIVOS  Instalar la herramienta de minería de datos RAPIDMINER y familiarizarse con su entorno.  Conocer acerca de la minería de datos y las utilidades y ventajas.  2. MARCO TEORICO RapidMiner (anteriormente, YALE, Yet Another Learning Environment) es un programa informático para el análisis y minería de datos. Permite el desarrollo de procesos de análisis de datos mediante el encadenamiento de operadores a través de un entorno gráfico. Se usa en investigación, educación, capacitación, creación rápida de prototipos y en aplicaciones empresariales. La versión inicial fue desarrollada por el departamento de inteligencia artificial de la Universidad de Dortmund en 2001. Se distribuye bajo licencia AGPL y está hospedado en SourceForge desde el 2004. RapidMiner proporciona más de 500 operadores orientados al análisis de datos, incluyendo los necesarios para realizar operaciones de entrada y salida, preprocesamiento de datos y visualización. También permite utilizar los algoritmos incluidos en Weka. [1] RapidMiner ha sido utilizada en más de cuarenta países y en compañías como Ford, Honda, E.ON, Nokia, IBM, Cisco, Hewlett Packard, Elexso, Akzo Nobel, PharmaDM, Bank of America, Merrill Lynch, entre muchas otras. [2] En la encuesta anual (2015) del prestigioso portal internacional de Minería de Datos KDnuggets, RapidMiner obtuvo el segundo lugar (despúes de R) como la herramienta de Data Mining más utilizada por expertos en Data Mining. La herramienta cuenta con dos componentes: 



RapidMiner Studio: Versión stand-alone para analistas. Implementa todos los operadores de data mining, modelos predictivos, modelos descriptivos, transformación de datos, series de tiempo, etc. RapidMiner Server: Versión Servidor de RapidMiner. Permite trabajo colaborativo, escalable y concurrente múltiples usuarios, capacidad de delegar en bases de datos (In-Database Mining) y otras mejoras de funcionalidad como: plataforma Web de publicación de reportes, implementación de sistemas de scoring, diseño y navegación Web de Reportes, Single-sign on, integración vía Servicios Web, entre otras.

En el mundo de la minería de datos (Data Mining) es imprescindible contar con software especializado que permita trabajar los datos para alcanzar los objetivos propuestos. En este contexto, este tutorial pretende acercar al lector al uso de RapidMiner, un sistema Open Source para Data Mining.[3]

3. DESARROLLO DE LA PRACTICA ¿Cómo cambiaría el proceso para que encuentre 20 valores atípicos en lugar de 10?

¿Cómo puede cambiar el proceso para que solo muestre valores atípicos en lugar de eliminarlos?

Reemplace el operador de detección de valores atípicos con Detect Outlier (LOF)y agregue un punto de interrupción después de este operador antes de ejecutar.

¿Cuál es la diferencia con el proceso anterior? La diferencia es que se muestran todos los registros ¿Cómo cambiar el filtro para mantener solo los valores atípicos superiores?

4. CONCLUSIONES  

Es importante realizar una limpieza y preparación de los datos antes de realizar cualquier tipo de procesamiento, para evitar resultados erróneos por culpa de valores atípicos. La herramienta rapidminer dispone de muchos operadores para realizar detección y limpieza de datos, con lo cual se puede realizar las tareas de procesamiento de mejor manera.

5. BIBLIOGRAFIA [1]"RapidMiner", Es.wikipedia.org, 2019. [Online]. Available: https://es.wikipedia.org/wiki/RapidMiner. [Accessed: 07- Jun- 2019]. [2]"RapidMiner | Sistemas de Minería de Datos | Software de Minería de Datos", Microsystem, 2019. [Online]. Available: https://www.microsystem.cl/plataforma/rapidminer/. [Accessed: 07- Jun- 2019]. [3]Users.dcc.uchile.cl, 2019. [Online]. Available: https://users.dcc.uchile.cl/~nbaloian/DSS-DCC/Software/Tutorial %20RapidMiner/Tutorial_I%20.pdf. [Accessed: 07- Jun- 2019]....


Similar Free PDFs