Agrupamentos Explicáveis e Agrupamentos Hierárquicos
Eduardo Laber (Informática, PUC-Rio)
As técnicas de agrupamento (clustering), de modo geral, consistem em agrupar objetos de
forma que os similares fiquem no mesmo grupo, enquanto os dissimilares fiquem em grupos
diferentes. Essas técnicas são amplamente utilizadas na análise exploratória de dados
e para acelerar diversas tarefas computacionais. Apesar de terem surgido há muito tempo,
ainda hoje há muita pesquisa nessa área. A palestra será dividida em duas partes. Na primeira,
apresento pesquisas recentes no tema de agrupamentos explicáveis, cujo objetivo é
construir agrupamentos que ofereçam garantias demonstráveis de desempenho e sejam facilmente
compreensíveis. Alguns dos principais resultados nessa área foram obtidos por meio
de elegantes argumentos probabilísticos.
Na segunda parte, discutiremos garantias teóricas para métodos de ligação, uma classe de
heurísticas bastante popular para a obtenção de agrupamentos hierárquicos. Embora essa
classe seja amplamente utilizada na prática há décadas, o conhecimento sobre suas propriedades
teóricas ainda é bastante limitado.