1131 Q1013077
Estatística Conhecimentos de estatística
Ano: 2022
Banca: FGV
A atividade de classificação de documentos envolve um grande número de tarefas de processamento de linguagem natural, o que pode levar a dúvidas quanto a sua aplicação.
A alternativa que contém apenas tarefas que sejam exemplos de classificação de documentos é:
1132 Q1013076
Estatística Conhecimentos de estatística
Ano: 2022
Banca: FGV
Um modelo semântico vetorial foi criado com a seguinte definição:

 v(w)i = tf(w, di) ? idf(w, D)

onde v é o vetor correspondente à palavra w, di é o i-ésimo documento da coleção D de artigos da Wikipédia, ordenados alfabeticamente por título, e tf e idf são, respectivamente, as funções de frequência de termo e inverso da frequência em documentos.
A alternativa que classifica corretamente o modelo acima descrito e apresenta a razão correta para a classificação é: 
1133 Q1013075
Estatística Inferência estatística Métodos de estimação
Ano: 2022
Banca: FGV
O método Latent Dirichlet Allocation (LDA) é popularmente utilizado para a construção de modelos de tópicos devido a sua flexibilidade e robustez, particularmente em grandes quantidades de texto. Ao mencionar a escolha do LDA em um projeto, um analista foi questionado sobre que aspectos caracterizam a flexibilidade do modelo, especialmente em comparação a um modelo pLSA.
O analista respondeu corretamente:
1134 Q1013074
Estatística Conhecimentos de estatística
Ano: 2022
Banca: FGV
Um problema comum no processamento de texto é o tratamento de termos compostos por mais de um token, tais como “Ministério Público”, tal que represente uma unidade linguística distinta, em particular na construção de modelos de linguagem.
Considerando o problema acima descrito, a alternativa que apresenta uma técnica usada para sua resolução é:
1135 Q1013073
Estatística Programação Linear
Ano: 2022
Banca: FGV
No contexto da linguagem de programação R, analise o código a seguir.

for (x in 1:10) {    if (x >= 4) {        print(x)        next }    if (x == 8) {break} }

O número de linhas exibidas pela execução desse código é:
1136 Q1013072
Estatística Programação Linear
Ano: 2022
Banca: FGV
No contexto da linguagem de programação R, analise as afirmativas a seguir.

I. Vetores (vectors) são listas de itens que devem ter o mesmo tipo.
II. R trabalha com vários tipos de dados (data types), numéricos, lógicos e textuais, mas as variáveis podem mudar de tipo mesmo depois da instanciação.
III. Os itens de uma lista (list) não podem ser substituídos. São permitidas apenas a inserção e a remoção de itens.

Está correto somente o que se afirma em:
1137 Q1013071
Estatística Programação Linear
Ano: 2022
Banca: FGV
Analise o código Python a seguir.

s=0 for k in range(16,10, -2):          s -= k print (s)

O valor exibido pela execução desse trecho é:
1138 Q1013070
Estatística Programação Linear
Ano: 2022
Banca: FGV
A modelagem de bancos de dados passa pela análise das relações e comportamento dos dados que futuramente constituirão o conteúdo desses bancos. Para bancos de dados relacionais, essa modelagem passa pelo levantamento das dependências funcionais que eventualmente possam ser depreendidas em cada caso.
Como um exemplo, considere um banco de dados que armazena a data de nascimento, o CPF (Cadastro de Pessoas Físicas) e a CNH (Carteira Nacional de Habilitação) de um grupo de pessoas, no qual todas possuem CPF e CNH.
Dado que no Brasil o CPF e a CNH são individualizados, as dependências funcionais que devem ser consideradas, em conjunto, são: 
1139 Q1013069
Estatística Estatística descritiva (análise exploratória de dados) Modelos lineares Medidas de Dispersão (Amplitude, Desvio Médio, Variância, Desvio Padrão e Coeficiente de Variação) + 1
Ano: 2022
Banca: CESPE / CEBRASPE
    Com pertinência à situação hipotética 12A3-I, considere que amostras de 30 plantas nativas (chamadas de N), 30 plantas transgênicas (chamadas de T) e 30 plantas cultivadas em hidroponia (chamadas de H) tenham sido analisadas e tenha sido feita a quantificação da concentração em quantidade de matéria do peptídeo-alvo em cada amostra, com o objetivo de se determinar se há diferença estatisticamente significativa entre as plantas N, T e H. Observou-se que a distribuição dos valores de concentração do peptídeo é compatível com a distribuição normal, que as amostras foram obtidas de forma aleatória e independente e que há homogeneidade de variâncias.
Assinale a opção que corresponde ao teste estatístico que deve ser aplicado para detectar se há diferença significativa quanto à concent...
1140 Q1013030
Estatística Estatística descritiva (análise exploratória de dados) Medidas de Dispersão (Amplitude, Desvio Médio, Variância, Desvio Padrão e Coeficiente de Variação)
Ano: 2022
Banca: FGV

Considere as duas listas de números a seguir.


Lista 1: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11


Lista 2: 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15


Sejam D1 e D2 os desvios padrão das Listas 1 e 2, respectivamente.


É correto concluir que