Em uma pesquisa de mercado foi estimado que 50% das pessoas entrevistadas preferem a marca X de um produto. Se, com base no resultado dessa pesquisa, quisermos fazer outra para estimar novamente esta preferência, o tamanho de amostra aleatória simples necessário, para que tenhamos um erro amostral de 0,02 com probabilidade de 95%, deverá ser
Para a variável aleatória X, observou-se uma amostra aleatória de 6 elementos, a saber: 62, 63, 66, 70, 71 e 72. Considerando-se [63,71] um intervalo de confiança para a mediana de X, esse intervalo tem coeficiente de confiança dado, aproximadamente, por:
Instruções: Para responder às questões de números 55 a 57, considere as tabelas a seguir.
Elas fornecem alguns valores da função de distribuição F(x). A tabela 1 refere-se à variável normal padrão, as tabelas 2 e 3 referem-se à variável t de Student com 15 e 16 graus de liberdade, respectivamente:
Supondo-se que a porcentagem da receita investida em educação, dos 600 municípios de uma região, tem distribuição normal com média μ, deseja-se estimar essa média. Para tanto se sorteou dentre esses 600, aleatoriamente e com reposição, 16 municípios e se observou os percentuais investidos por eles em educação. Os resultados indicaram uma média amostral de 8% e desvio padrão amostral igual a 2%. Um intervalo de confiança ...
Instruções: Para responder às questões de números 55 a 57, considere as tabelas a seguir.
Elas fornecem alguns valores da função de distribuição F(x). A tabela 1 refere-se à variável normal padrão, as tabelas 2 e 3 referem-se à variável t de Student com 15 e 16 graus de liberdade, respectivamente:
Um engenheiro encarregado do controle de qualidade deseja estimar a proporção p de lâmpadas defeituosas de um lote, com base numa amostra de tamanho 400. Sabese, com base em experiências anteriores, que p deve estar próximo de 0,5. Usando o teorema central do limite para estimar a amplitude do intervalo de confiança de 90% para p, podemos afirmar que tal amplitude é, aproximadamente, igual a
A quantidade de itens certos é igual a

Com relação a data mining (mineração de dados), julgue os próximos itens.
Na análise de cluster, K-médias é uma técnica de clusterização hierárquica (aninhada), que visa encontrar o número de clusters (K) especificados pelo usuário, representados por seus centróides.
Com relação a data mining (mineração de dados), julgue os próximos itens.
Em modelos de classificação, ocorre overfitting quando o número de erros cometidos no grupo de dados usado para treinar (ajustar) o modelo é muito pequeno e o número de erros de generalização é grande.

A inclusão de regressores irrelevantes no modelo resulta em coeficientes estimados não-viciados, mas ineficientes.

Os coeficientes de inclinação não se alteram quando as unidades de medida de y e dos x são multiplicadas por uma constante, como ocorre, por exemplo, quando os valores dessas variáveis são convertidos de uma unidade para outra.