No contexto do desenvolvimento de chatbots baseados em prompt textuais, uma habilidade importante é a resolução de ambiguidades, visando à compreensão completa do texto. Assinale a técnica de NLP adequada nesse tipo de desenvolvimento.
As Redes Neurais _________ possuem uma arquitetura feed-forward que usam filtros e camadas de agrupamento para transformar os dados, enquanto as Redes Neurais _________ são preditivas, reutilizam funções de ativação de outros pontos de dados na sequência para gerar a próxima saída em uma série. Assinale a alternativa que preenche, correta e respectivamente, as lacunas do trecho acima.
Para evitar overfitting, uma prática comum é randomicamente dividir a base de dados em N conjuntos de dados de tamanhos aproximadamente iguais. O modelo é treinado com N-1 conjuntos e testado com o restante. Uma medida de erro é obtida. Esse processo é repetido um total de N vezes através das várias combinações dos N conjuntos de dados. Por fim, calcula-se a média de validação dos N experimentos para se obter a estimativa de erro. Qual é o nome dessa técnica descrita e utilizada para avaliar modelos de aprendizado de máquina?
Seja uma rede neural com camada de entrada com dimensão dois que recebe dados (x1 , x2 ). Essa rede aplica pesos w1 em x1 , w2 em x2 e adiciona um viés w0 . A função de ativação é dada pela função sinal s(z) = +1, se z ? 0, e s(z) = -1, se z < 0. Essa rede não tem nenhuma camada oculta e será utilizada para classificar observações em y=+1 ou y=-1. Para pesos w1 = 2, w2 = 3 e viés w0 = 1, a região de classificação é uma reta que passa nos pontos:
Uma organização está implementando um sistema de busca de informações interno, e a equipe de desenvolvimento resolveu avaliar diferentes modelos de linguagem vetoriais que ajudariam a conectar melhor documentos e consultas em departamentos que usam terminologias distintas em áreas de negócio que se sobrepõem. Um dos analistas ressaltou que seria interessante guardar os vetores de todo o vocabulário do modelo em um cache, de forma a aumentar a eficiência de acesso e reduzir certos custos de implantação. Das alternativas abaixo, aquela que lista apenas os modelos compatíveis com essa estratégia de caching é:
Durante o treinamento de uma rede neural artificial para classificação de imagens, foi observado o comportamento descrito pelo gráfico abaixo, que mostra a evolução do erro conforme o número de iterações.
O classificador em questão foi treinado em um conjunto de dados particionado (holdout) em 60%/30%/10% (treinamento/validação/ teste). Entretanto, os especialistas envolvidos consideraram o modelo obtido insatisfatório após analisarem o gráfico. Considerando essas informações, duas técnicas que poderiam ser utilizadas para contornar o problema encontrado são:
As métricas de avaliação de desempenho de um modelo de aprendizado de máquina, que é um componente integrante de qualquer projeto de ciência de dados, destinam-se a estimar a precisão da generalização de um modelo sobre os dados futuros (não vistos ou fora da amostra). Dentre as métricas mais conhecidas, estão a matriz de confusão, precisão, recall, pontuação, especificidade e a curva de características operacionais do receptor (ROC). Acerca das características específicas dessas métricas, julgue o próximo item.
A matriz de confusão a seguir apresenta três rótulos de classe; os elementos diagonais representam o número de pontos para os quais o rótulo previsto é igual ao rotulo verdadeiro, enquanto qualquer coisa fora da diagonal teve um rótulo atribuído erroneamente pelo c...
As métricas de avaliação de desempenho de um modelo de aprendizado de máquina, que é um componente integrante de qualquer projeto de ciência de dados, destinam-se a estimar a precisão da generalização de um modelo sobre os dados futuros (não vistos ou fora da amostra). Dentre as métricas mais conhecidas, estão a matriz de confusão, precisão, recall, pontuação, especificidade e a curva de características operacionais do receptor (ROC).
Acerca das características específicas dessas métricas, julgue o próximo item.
As curvas ROC a seguir mostram a taxa de especificidade (verdadeiros positivos) versus a taxa de sensibilidade (falsos positivo...