VASS
Visualizador de Algoritmos Semi-Supervisados
Un poco de teoría...
El aprendizaje semi-supervisado es la rama del aprendizaje automático referido al uso simultáneo de datos tanto etiquetados como no etiquetados para realizar tareas de aprendizaje. Se encuentra a caballo entre el aprendizaje supervisado y el no supervisado.
Dentro de todos los algoritmos semi-supervisados, el núcleo de este proyecto está basado en los métodos inductivos. Su idea es muy sencilla, tratan de crear un clasificador que prediga etiquetas para datos nuevos. Los algoritmos propuestos tienen este objetivo, Los conocidos métodos wrapper se basan en el pseudo-etiquetado (pseudo-labelling), es el proceso en el que los clasificadores entrenados con datos etiquetados generan etiquetas para los no etiquetados. Una vez completado este proceso, el clasificador se vuelve a entrenar pero añadiendo estos nuevos.
Dentro de todos los algoritmos semi-supervisados, el núcleo de este proyecto está basado en los métodos inductivos. Su idea es muy sencilla, tratan de crear un clasificador que prediga etiquetas para datos nuevos. Los algoritmos propuestos tienen este objetivo, Los conocidos métodos wrapper se basan en el pseudo-etiquetado (pseudo-labelling), es el proceso en el que los clasificadores entrenados con datos etiquetados generan etiquetas para los no etiquetados. Una vez completado este proceso, el clasificador se vuelve a entrenar pero añadiendo estos nuevos.
En las tarjetas que aparecen a continuación se presentan cuatro de los algoritmos más representativos del aprendizaje semi-supervisado: Self-Training, Co-Training, Tri-Training y Democratic Co-Learning.
Internamente cada algoritmo utiliza uno o varios clasificadores (métodos de envoltura). Y además, se distingue el número de vistas sobre los datos (una vista es el subconjunto de atributos del conjunto de datos que usa el algoritmo para aprender el modelo). Al contrario que Single-view, un algoritmo Multi-view verá el conjunto de atributos de los datos como varios subconjuntos. Por ejemplo, en el algoritmo Co-Training, el primer clasificador podría solo "ver" la mitad de atributos mientras que el segundo la otra mitad. Cada uno de ellos trabajará con su subconjunto de atributos concreto.
Internamente cada algoritmo utiliza uno o varios clasificadores (métodos de envoltura). Y además, se distingue el número de vistas sobre los datos (una vista es el subconjunto de atributos del conjunto de datos que usa el algoritmo para aprender el modelo). Al contrario que Single-view, un algoritmo Multi-view verá el conjunto de atributos de los datos como varios subconjuntos. Por ejemplo, en el algoritmo Co-Training, el primer clasificador podría solo "ver" la mitad de atributos mientras que el segundo la otra mitad. Cada uno de ellos trabajará con su subconjunto de atributos concreto.
Objetivo
El objetivo de esta herramienta es facilitar, mediante visualizaciones, la comprensión de cómo funcionan realmente los principales algoritmos semi-supervisados cuando se compagina con los conceptos teóricos.
Al seleccionar cualquiera de los algoritmos, será redireccionado a la carga del conjunto de datos. Posteriormente, podrá configurar el algoritmo con los parámetros deseados y finalmente obtener una visualización del entrenamiento.
Al seleccionar cualquiera de los algoritmos, será redireccionado a la carga del conjunto de datos. Posteriormente, podrá configurar el algoritmo con los parámetros deseados y finalmente obtener una visualización del entrenamiento.