611
Q905856
Dados massivos são grandes grupos de dados que podem ser capturados, comunicados, agregados, armazenados e analisados. Uma das plataformas de processamento de dados massivos mais conhecidas é o Apache Hadoop. Sobre tal plataforma, assinale a afirmativa correta.
612
Q905855
A deduplicação objetiva identificar e combinar registros que representam a mesma entidade no mundo real. A etapa da deduplicação que tem por objetivo agregar registros que apresentam semelhança, reduzindo o domínio de pares a serem comparados nas etapas posteriores é:
613
Q905854
Os elementos ambientais básicos definem cada área de conhecimento ou função da Gestão de Dados presentes no guia DAMA-DMBOK. São considerados alguns destes elementos:
614
Q905853
Determinado analista de TI recebeu uma solicitação: criar um código em SQL com o objetivo de implementar, em um banco de dados relacional, uma tabela com o nome de SIGA, contendo os seguintes campos: cod_siga, descricao, data_acesso e id_pessoa. Considerando a situação hipotética, assinale o código SQL que deverá ser apresentado pelo referido analista.
615
Q905852
Na modelagem conceitual de dados, utilizando a abordagem Entidade-Relacionamento, são encontrados alguns padrões de relacionamentos. Trata-se do padrão de relacionamento que envolve conexões entre membros de um mesmo conjunto e que, às vezes, é chamado de relacionamento reflexivo:
616
Q905851
Pentaho Data Integration (PDI), também conhecido por Kettle (Kettle Extraction, Transport, Transformation and Loading Environment), é o conjunto de ferramentas open source responsável pelos processos de ETL da Pentaho Business Intelligence Suite. No PDI, os componentes de ligação entre os steps que definem a direção da execução da transformação são conhecidos como:
617
Q905850
A governança de dados é entendida como uma ação multidisciplinar que tem como finalidade tratar os dados como insumos ativos e tangíveis nas organizações. Em relação aos seus princípios, assinale a afirmativa correta.
618
Q905849
O Big Data, na sua grande maioria, é um conjunto de dados que a cada milésimo de segundo são inseridos novos; assim sendo, o mundo atual dos dados digitalizados contém uma inimaginável quantidade de informações, base que está em crescimento permanentemente. A característica do Big Data, que faz parte dos 3 Vs e que está relacionada à dinâmica de crescimento e processamento de dados e à necessidade de respostas em um curto prazo ou em tempo real, é:
619
Q905848
Considerando Data Lake, que geralmente é o armazenamento único de todos os dados corporativos, incluindo cópias brutas de dados do sistema de origem, assinale a afirmativa correta.
620
Q905847
Com relação às formas normais em bancos de dados relacionais, assinale a alternativa correta no que diz respeito à forma normal de Boyce/Codd, com relação à sua posição na hierarquia das formas normais.