Fecha: 15/05/2014 17:00
Lugar: Sala de Grados I de la Facultad de Ciencias.
Grupo: : Dpto. de Estadística e Investigación Operativa
Abstract:
El problema de encontrar subgrupos en un conjunto de datos
(Análisis Cluster) ha sido ampliamente estudiado por investigadores de diversos
campos, como la Estadística y las Ciencias de la Computación. A pesar de su
popularidad, en algunos artículos recientes se reconoce la falta de
profundización en aspectos teóricos en algunos de los enfoques existentes del
problema. Una de las razones para esta falta de resultados teóricos puede ser el
hecho de que, al contrario de lo que ocurre en problemas de Aprendizaje
Supervisado (Regresión o Clasificación), para algunas de las metodologías de
Análisis Cluster no parece estar claro cuál es el objetivo poblacional al que
deberían intentar acercarse los algoritmos de partición en subgrupos. En esta
charla definiremos claramente cuál es este objetivo poblacional en el caso del
Análisis de Subgrupos no paramétrico, cuya metodología está basada en las
regiones modales de la densidad. Además, propondremos dos maneras de
medir el comportamiento de un algoritmo de agrupamiento con respecto a
dicho óptimo teórico y proporcionaremos un resultado de consistencia para los
métodos basados en una estimación tipo núcleo de la densidad.