A alternativa que contém apenas tarefas que sejam exemplos de classificação de documentos é:
1131
Q1013077
A atividade de classificação de documentos envolve um grande número de tarefas de processamento de linguagem natural, o que pode levar a dúvidas quanto a sua aplicação.
A alternativa que contém apenas tarefas que sejam exemplos de classificação de documentos é:
A alternativa que contém apenas tarefas que sejam exemplos de classificação de documentos é:
1132
Q1013076
Um modelo semântico vetorial foi criado com a seguinte definição:
v(w)i = tf(w, di) ? idf(w, D)
onde v é o vetor correspondente à palavra w, di é o i-ésimo documento da coleção D de artigos da Wikipédia, ordenados alfabeticamente por título, e tf e idf são, respectivamente, as funções de frequência de termo e inverso da frequência em documentos.
A alternativa que classifica corretamente o modelo acima descrito e apresenta a razão correta para a classificação é:
v(w)i = tf(w, di) ? idf(w, D)
onde v é o vetor correspondente à palavra w, di é o i-ésimo documento da coleção D de artigos da Wikipédia, ordenados alfabeticamente por título, e tf e idf são, respectivamente, as funções de frequência de termo e inverso da frequência em documentos.
A alternativa que classifica corretamente o modelo acima descrito e apresenta a razão correta para a classificação é:
1133
Q1013075
O método Latent Dirichlet Allocation (LDA) é popularmente utilizado para a construção de modelos de tópicos devido a sua flexibilidade e robustez, particularmente em grandes quantidades de texto. Ao mencionar a escolha do LDA em um projeto, um analista foi questionado sobre que aspectos caracterizam a flexibilidade do modelo, especialmente em comparação a um modelo pLSA.
O analista respondeu corretamente:
O analista respondeu corretamente:
1134
Q1013074
Um problema comum no processamento de texto é o tratamento de termos compostos por mais de um token, tais como “Ministério Público”, tal que represente uma unidade linguística distinta, em particular na construção de modelos de linguagem.
Considerando o problema acima descrito, a alternativa que apresenta uma técnica usada para sua resolução é:
Considerando o problema acima descrito, a alternativa que apresenta uma técnica usada para sua resolução é:
1135
Q1013073
No contexto da linguagem de programação R, analise o código a seguir.
for (x in 1:10) { if (x >= 4) { print(x) next } if (x == 8) {break} }
O número de linhas exibidas pela execução desse código é:
for (x in 1:10) { if (x >= 4) { print(x) next } if (x == 8) {break} }
O número de linhas exibidas pela execução desse código é:
1136
Q1013072
No contexto da linguagem de programação R, analise as afirmativas a seguir.
I. Vetores (vectors) são listas de itens que devem ter o mesmo tipo.
II. R trabalha com vários tipos de dados (data types), numéricos, lógicos e textuais, mas as variáveis podem mudar de tipo mesmo depois da instanciação.
III. Os itens de uma lista (list) não podem ser substituídos. São permitidas apenas a inserção e a remoção de itens.
Está correto somente o que se afirma em:
I. Vetores (vectors) são listas de itens que devem ter o mesmo tipo.
II. R trabalha com vários tipos de dados (data types), numéricos, lógicos e textuais, mas as variáveis podem mudar de tipo mesmo depois da instanciação.
III. Os itens de uma lista (list) não podem ser substituídos. São permitidas apenas a inserção e a remoção de itens.
Está correto somente o que se afirma em:
1137
Q1013071
Analise o código Python a seguir.
s=0 for k in range(16,10, -2): s -= k print (s)
O valor exibido pela execução desse trecho é:
s=0 for k in range(16,10, -2): s -= k print (s)
O valor exibido pela execução desse trecho é:
1138
Q1013070
A modelagem de bancos de dados passa pela análise das relações e comportamento dos dados que futuramente constituirão o conteúdo desses bancos. Para bancos de dados relacionais, essa modelagem passa pelo levantamento das dependências funcionais que eventualmente possam ser depreendidas em cada caso.
Como um exemplo, considere um banco de dados que armazena a data de nascimento, o CPF (Cadastro de Pessoas Físicas) e a CNH (Carteira Nacional de Habilitação) de um grupo de pessoas, no qual todas possuem CPF e CNH.
Dado que no Brasil o CPF e a CNH são individualizados, as dependências funcionais que devem ser consideradas, em conjunto, são:
Como um exemplo, considere um banco de dados que armazena a data de nascimento, o CPF (Cadastro de Pessoas Físicas) e a CNH (Carteira Nacional de Habilitação) de um grupo de pessoas, no qual todas possuem CPF e CNH.
Dado que no Brasil o CPF e a CNH são individualizados, as dependências funcionais que devem ser consideradas, em conjunto, são:
1139
Q1013069
Com pertinência à situação hipotética 12A3-I, considere que amostras de 30 plantas nativas (chamadas de N), 30 plantas transgênicas (chamadas de T) e 30 plantas cultivadas em hidroponia (chamadas de H) tenham sido analisadas e tenha sido feita a quantificação da concentração em quantidade de matéria do peptídeo-alvo em cada amostra, com o objetivo de se determinar se há diferença estatisticamente significativa entre as plantas N, T e H. Observou-se que a distribuição dos valores de concentração do peptídeo é compatível com a distribuição normal, que as amostras foram obtidas de forma aleatória e independente e que há homogeneidade de variâncias.
Assinale a opção que corresponde ao teste estatístico que deve ser aplicado para detectar se há diferença significativa quanto à concent...
Assinale a opção que corresponde ao teste estatístico que deve ser aplicado para detectar se há diferença significativa quanto à concent...
1140
Q1013030
Considere as duas listas de números a seguir.
Lista 1: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11
Lista 2: 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15
Sejam D1 e D2 os desvios padrão das Listas 1 e 2, respectivamente.
É correto concluir que