A respeito de Big Data, julgue o item a seguir.
Na etapa de ingestão de um pipeline de dados de Big Data, os dados de diversas fontes são coletados e transportados para um armazenamento centralizado.
A respeito de Big Data, julgue o item a seguir.
Na etapa de ingestão de um pipeline de dados de Big Data, os dados de diversas fontes são coletados e transportados para um armazenamento centralizado.
A respeito de Big Data, julgue o item a seguir.
O armazenamento de Big Data em sistemas distribuídos, a exemplo do HDFS (Hadoop Distributed File System), melhora a tolerância a falhas e a escalabilidade ao distribuir dados entre múltiplos nós.
Acerca da arquitetura de sistemas analíticos e do ecossistema Apache Hadoop, julgue o próximo item.
O Hadoop é considerado ineficiente em cenários que exigem escalabilidade horizontal, sendo mais adequado para processamento em clusters pequenos.
No que se refere à ciência de dados, julgue o item seguinte.
Em big data, representações visuais, como gráficos e dashboards, permitem que padrões sejam rapidamente identificados.
Julgue o próximo item, a respeito de machine leaning.
Grandes volumes de dados frequentemente revelam padrões e tendências que são valiosos para análises preditivas e tomadas de decisão, facilitando a antecipação de comportamentos futuros e permitindo melhor alocação de recursos e planejamento.
Julgue o próximo item, a respeito de machine leaning.
Os algoritmos de regressão linear, por minimizarem a soma dos resíduos quadrados para ajustar os coeficientes, são sensíveis a outliers, que podem distorcer os coeficientes e comprometer a previsão do modelo.
Julgue o próximo item, a respeito de machine leaning.
Árvores de decisão são técnicas de modelagem preditiva que particionam iterativamente os dados em subconjuntos homogêneos baseados em variáveis explicativas.
Em relação a manipulação e limpeza de dados, julgue o item a seguir.
Local outlier factor é uma técnica de detecção de outliers que mede a anomalia de um dado com base na densidade local dos seus vizinhos.
Em relação a manipulação e limpeza de dados, julgue o item a seguir.
A normalização dos dados é importante na preparação de dados para modelos de aprendizado de máquina, pois garante que todas as variáveis estejam na mesma escala, independentemente de sua importância no modelo.
Em relação a manipulação e limpeza de dados, julgue o item a seguir.
A transformação de dados categóricos utilizando codificação one-hot sempre reduz a dimensionalidade do conjunto de dados.