1121 Q1013087
Estatística Modelos lineares Projeções do modelo
Ano: 2022
Banca: FGV
Na avaliação de um modelo para detecção de fraude, foi utilizado um conjunto de dados conhecido que resultou na matriz de confusão abaixo.

Imagem associada para resolução da questão

É correto afirmar que o modelo apresenta:
1122 Q1013086
Estatística Estatística descritiva (análise exploratória de dados) Medidas de Posição - Tendência Central (Media, Mediana e Moda) Medidas de Dispersão (Amplitude, Desvio Médio, Variância, Desvio Padrão e Coeficiente de Variação)
Ano: 2022
Banca: FGV
Abaixo temos o gráfico quantil-quantil para distribuição normal onde estão desenhados os valores de duas amostras da distribuição Normal. A amostra 1, representada por círculos, e a amostra 2, representada por “x”.

Imagem associada para resolução da questão

Com base no gráfico, é correto afirmar que as duas distribuições têm:
1123 Q1013085
Estatística Estatística descritiva (análise exploratória de dados) Medidas de Dispersão (Amplitude, Desvio Médio, Variância, Desvio Padrão e Coeficiente de Variação)
Ano: 2022
Banca: FGV
Em um processo de descontaminação é importante manter um controle da variabilidade da contaminação residual que persiste após o processo. Sabe-se que a mensuração do resíduo tem distribuição normal, e que a partir de uma amostra aleatória, de 21 unidades, foi calculada a variância S2 = 54,25. Para estabelecer uma medida máxima de referência, decidiu-se utilizar o intervalo de confiança superior para o desvio padrão.
O valor desse limite a 95% de confiança é:
1124 Q1013084
Estatística Amostragem Estimação de proporção, razões e domínios
Ano: 2022
Banca: FGV
Uma empresa recebeu um lote muito grande, milhões de peças de refugo, e deseja saber quantas peças deverá examinar para estimar a proporção de itens defeituosos, de modo que o erro de estimação seja no máximo 2%. Será empregada uma seleção aleatória de itens onde cada um será classificado como defeituoso ou não defeituoso. Deseja-se extrair uma amostra aleatória de tamanho n.
Tendo como padrão um grau de confiança de 95%, o tamanho da amostra necessário para garantir o processo é:
1125 Q1013083
Estatística Inferência estatística Testes de hipóteses
Ano: 2022
Banca: FGV
Uma prefeitura recebeu uma denúncia de que o número de autuações feitas pela equipe de fiscalização variava conforme o dia da semana. Para verificar a procedência da denúncia, as autuações foram agregadas por dia de semana, como mostra a tabela a seguir.

Segundas      6     Terças       12   Quartas       9   Quintas       8     Sextas      15   Sábados    13 Domingos    7

Realizando um teste estatístico adequado para verificar se essas autuações ocorrem com a mesma frequência, teremos: 
1126 Q1013082
Estatística Conhecimentos de estatística
Ano: 2022
Banca: FGV
Em um trabalho de pesquisa, as idades das pessoas são: 23, 27, 32, 33, 34, 35, 36, 38, 42, 56 e 58. Deseja-se construir um boxplot similar ao gráfico a seguir. 

Imagem associada para resolução da questão

No boxplot acima, os valores das estatísticas nas posições indicadas pelas letras A, B, C, D, E e F são: 
1127 Q1013081
Estatística Calculo de probabilidades Probabilidade condicional, Teorema de Bayes e independência
Ano: 2022
Banca: FGV
Uma biblioteca está classificando os seus frequentadores em grupos literários para facilitar a aquisição e a organização dos livros. Isso foi feito aplicando o algoritmo KNN ao banco de dados de usuários da biblioteca, incluindo alguns dos campos de informação como atributos, tais como idade e nível de formação acadêmica. Em um experimento, uma segunda classificação foi feita usando um conjunto maior de atributos, incluindo ambos de maior ou menor relevância percebida com relação aos grupos definidos.
A segunda classificação tende a ser:
1128 Q1013080
Estatística Inferência estatística Métodos de estimação
Ano: 2022
Banca: FGV
O método random forests para classificação ou regressão potencializa alguns benefícios das árvores de decisão e por isso é preferido em certas situações.
O uso de random forests seria vantajoso em relação à árvore de decisão no seguinte caso:
1129 Q1013079
Estatística Conhecimentos de estatística
Ano: 2022
Banca: FGV
A aplicação do algoritmo AdaBoost, utilizando classificadores SVM, permitiu a obtenção de um modelo classificador de sinais sonoros com excelente precisão. Entretanto, esse modelo possui requisitos computacionais além da capacidade da plataforma onde se deseja aplicá-lo.
Considerando o problema acima descrito, a técnica a ser utilizada para contornar o problema é: 
1130 Q1013078
Estatística Conhecimentos de estatística
Ano: 2022
Banca: FGV
Para realizar o agrupamento de um conjunto de 4 observações (A, B, C e D) foi decidido usar o método de agrupamento hierárquico aglomerativo com ligação simples (single-linkage).
A matriz de distância inicial entre os elementos é apresentada a seguir.

Imagem associada para resolução da questão

Considerando essas informações, a matriz de distância obtida após o primeiro passo do agrupamento é: