Dois conjuntos de dados (A e B) necessitam ser processados e analisados. O conjunto A contém os dados idade, rendimento mensal e quantidade de filhos de certa população, todos eles numéricos. O objetivo da análise do conjunto A é determinar quem está empregado, por meio de categorização (empregado ou não empregado). O conjunto B contém o texto completo de mensagens de vários emails, sendo todos os dados desse conjunto caracteres. O objetivo da análise do conjunto B é determinar se um email é spam, por meio de categorização (spam ou não spam).
Considerando essa situação hipotética, julgue
o próximo item.
Com base nos dados do conjunto A, caso se deseje agrupar as pessoas em empregado e não empregado, poderá ser utilizado, para essa finalidade, o algoritmo k-
nearest neighbors, que agrupa os dados em k
clusters, de forma não supervisionada.