Questões de Concurso de Estatística

91 Q1013098

Estatística Conhecimentos de estatística

Ano: 2022

Banca: FGV

Uma fábrica de tecidos está analisando os salários de seus empregados que trabalham em tempo integral. Quase todas as mulheres trabalham no setor escriturário, enquanto os homens, em sua maioria, trabalham na produção, o que faz com que as distribuições salariais difiram entre si. A tabela fornece o número e o percentual de mulheres e homens que se encontram em cada faixa salarial (em salários mínimos).

Imagem associada para resolução da questão

Imagem associada para resolução da questão

O salário mediano das mulheres e dos homens se encontram, respectivamente, nas faixas salariais:

A 2 a 4 salários mínimos; 2 a 4 salários mínimos; B 2 a 4 salários mínimos; 4 a 6 salários mínimos; C 4 a 6 salários mínimos; 4 a 6 salários mínimos; D 4 a 6 salários mínimos; 6 a 10 salários mínimos; E 6 a 10 salários mínimos; 6 a 10 salários mínimos.

92 Q1013088

Estatística Conhecimentos de estatística

Ano: 2022

Banca: FGV

Uma sociedade empresária precisa decidir sobre o uso de 3 algoritmos distintos em uma tarefa específica. Então, fez um experimento onde aplicou cada um dos algoritmos de forma aleatória em um conjunto de tarefas similares, medindo sua performance. Os resultados estão na tabela a seguir:

Imagem associada para resolução da questão

Se a performance é representada por Y e sabendo-se que
Imagem associada para resolução da questão

e os demais pressupostos inferenciais são atendidos, deseja-se saber se há evidências estatísticas que ao menos um algoritmo tenha perform...

A não há evidência de que as performances sejam diferentes, pois a estatística calculada f = 1 é menor que o valor tabelado; B há evidência de que ao menos uma das performances seja diferente das demais, pois a estatística calculada f = 1 é menor que o valor tabelado; C há evidência de que as performances sejam diferentes, pois a estatística calculada f = 2 é menor que o valor tabelado; D não há evidência de que as performances sejam diferentes, pois a estatística calculada f = 2 é menor que o valor tabelado; E não há evidência de que as performances sejam diferentes, pois a estatística calculada f = 3 é menor que o valor tabelado.

93 Q1013082

Estatística Conhecimentos de estatística

Ano: 2022

Banca: FGV

Em um trabalho de pesquisa, as idades das pessoas são: 23, 27, 32, 33, 34, 35, 36, 38, 42, 56 e 58. Deseja-se construir um boxplot similar ao gráfico a seguir.

Imagem associada para resolução da questão

No boxplot acima, os valores das estatísticas nas posições indicadas pelas letras A, B, C, D, E e F são:

A A=23, B=32, C=35, D=42, E=56, F=58; B A=-17, B=32, C=35, D=42, E=57, F=58; C A=23, B=32, C=37.6, D=42, E=57, F=58; D A=-17, B=23, C=35, D=56, E=57, F=59; E A=23, B=32, C=35, D=42, E=57, F=58.

94 Q1013079

Estatística Conhecimentos de estatística

Ano: 2022

Banca: FGV

A aplicação do algoritmo AdaBoost, utilizando classificadores SVM, permitiu a obtenção de um modelo classificador de sinais sonoros com excelente precisão. Entretanto, esse modelo possui requisitos computacionais além da capacidade da plataforma onde se deseja aplicá-lo.
Considerando o problema acima descrito, a técnica a ser utilizada para contornar o problema é:

A compressão; B boosting suavizado; C agregação (joining); D poda (pruning); E boosting parcial.

95 Q1013078

Estatística Conhecimentos de estatística

Ano: 2022

Banca: FGV

Para realizar o agrupamento de um conjunto de 4 observações (A, B, C e D) foi decidido usar o método de agrupamento hierárquico aglomerativo com ligação simples (single-linkage).
A matriz de distância inicial entre os elementos é apresentada a seguir.

Imagem associada para resolução da questão

Considerando essas informações, a matriz de distância obtida após o primeiro passo do agrupamento é:

A

Imagem associada para resolução da questão

B

Imagem associada para resolução da questão

C

Imagem associada para resolução da questão

D

Imagem associada para resolução da questão

E

Imagem associada para resolução da questão

96 Q1013077

Estatística Conhecimentos de estatística

Ano: 2022

Banca: FGV

A atividade de classificação de documentos envolve um grande número de tarefas de processamento de linguagem natural, o que pode levar a dúvidas quanto a sua aplicação.
A alternativa que contém apenas tarefas que sejam exemplos de classificação de documentos é:

A análise de sentimento, tokenização; B POS-tagging, reconhecimento de entidades nomeadas; C filtragem de SPAM, análise de sentimento; D análise sintática, POS-tagging; E filtragem de stopwords, reconhecimento de linguagem.

97 Q1013076

Estatística Conhecimentos de estatística

Ano: 2022

Banca: FGV

Um modelo semântico vetorial foi criado com a seguinte definição:

v(w)i = tf(w, di) ? idf(w, D)

onde v é o vetor correspondente à palavra w, di é o i-ésimo documento da coleção D de artigos da Wikipédia, ordenados alfabeticamente por título, e tf e idf são, respectivamente, as funções de frequência de termo e inverso da frequência em documentos.
A alternativa que classifica corretamente o modelo acima descrito e apresenta a razão correta para a classificação é:

A latente, pois v(w) descreve uma distribuição de tópicos em D; B latente, pois o modelo produz vetores densos; C explícito, pois há uma interpretação intrínseca ao modelo para cada dimensão dos vetores; D latente, pois o modelo é construído de forma não supervisionada; E explícito, pois a informação do modelo é específica a um corpus.

98 Q1013074

Estatística Conhecimentos de estatística

Ano: 2022

Banca: FGV

Um problema comum no processamento de texto é o tratamento de termos compostos por mais de um token, tais como “Ministério Público”, tal que represente uma unidade linguística distinta, em particular na construção de modelos de linguagem.
Considerando o problema acima descrito, a alternativa que apresenta uma técnica usada para sua resolução é:

A representação por entidade; B índice invertido; C embedding; D representação por n-gramas; E decomposição morfológica.

99 Q1013011

Estatística Conhecimentos de estatística

Ano: 2022

Banca: NC-UFPR

Considere a seguinte situação na área epidemiológica:
Durante os anos 1980, aproximadamente 22.000 médicos com mais de 40 anos concordaram em participar de um estudo de longo prazo chamado Physicians’ Health Study. Uma questão investigada foi se a aspirina ajuda a diminuir a ocorrência de enfarto. Os médicos foram aleatoriamente designados para tomar aspirina ou tomar placebo.

(Disponível em: Agresti, A.; Franklin, C. The Art and Science of Learning from Data. Pearson New International. Edição do Kindle.)

Sobre o delineamento do estudo apresentado, é correto afirmar:

A De acordo com a forma de obtenção dos dados, a variável resposta e a variável explicativa são, respectivamente, ocorrência de enfarto (sim; não) e faixa etária do médico (< 40 anos; ? 40 anos). B O estudo é do tipo observacional porque ambas as variáveis, resposta e explicativa, foram observadas. C Existem outras variáveis que se espera estarem associadas à variável resposta, como, por exemplo, hábito de fumar dos médicos; contudo, a aleatorização deveria tornar os grupos comparáveis. D Pela forma de obtenção dos dados para esse estudo, conclui-se que é um estudo transversal. E É um estudo grande e com resultados a longo prazo, portanto não faz sentido verificar a associação de duas variáveis que não devem estar relacionadas, pois se conhece que a aspirina é para aliviar dores de cabeça, febre e sintomas de resfriado.

100 Q1013007

Estatística Conhecimentos de estatística

Ano: 2022

Banca: NC-UFPR

Um estudo sobre a relação entre X: renda anual (em dólares) e Y: anos completos de estudo resultou em um coeficiente de correlação linear de Pearson entre X e Y, rXY = 0,907. Considerando as informações apresentadas, assinale a alternativa correta.

A O valor obtido do coeficiente r indica uma correlação linear forte e positiva entre X e Y, significando que, quando a variável X aumenta, Y tende a aumentar. B Se a renda anual fosse referida em reais, o valor de r poderia mudar, tanto que se a cotação do dólar for de 5 reais para 1 dólar, o valor de r poderia até quintuplicar. C O diagrama de dispersão entre Y e X apresentaria pontos próximos a uma reta de inclinação negativa; ou seja, uma reta com coeficiente angular negativo. D Com um valor de r próximo a 1, pode-se concluir que há uma indicação de causalidade entre anos de estudo e renda. E Se fosse calculado o coeficiente de correlação linear de Pearson entre Y e X, o valor resultante seria rYX = 1 ? 0,907 = 0,093.

Comentários

Comentários

Comentários

Comentários

Comentários

Comentários

Comentários

Comentários

Comentários

Comentários

Comentários

Comentários

Comentários

Comentários

Comentários

Comentários

Comentários

Comentários

Comentários

Comentários

Acesso Restrito

Estatísticas da Questão