Atualmente, conforme a tecnologia evolui, novos termos vão surgindo, particularmente com o aumento da importância dos dados na criação de estratégias de crescimento e tomadas de decisão. Nesse contexto, dois termos se destacam, descritos a seguir:
I. É um repositório central de informações que podem ser analisadas para tomar decisões mais adequadas. Os dados fluem de sistemas transacionais, bancos de dados relacionais e de outras fontes. Analistas de negócios, engenheiros de dados, cientistas de dados e tomadores de decisões acessam os dados por meio de ferramentas de inteligência de negócios (BI), clientes SQL e outros aplicativos de análise.
...
Os data warehouses existem para facilitar que analista e tomadores de decisão executem as consultas complexas e ocasionais, fazendo uso intensivo de dados por meio de processamento OLAP.
A operação analítica que se caracteriza por analisar dados em níveis de agregação progressivamente mais detalhados e de menor granularidade, é denominada
CRISP-DM é um modelo de referência não proprietário e tecnologicamente neutro que pode ser usado por iniciantes ou especialistas para descrever o ciclo de vida de projetos de Mineração de Dados em seis fases distintas.
A terceira fase do modelo corresponde
Ordene corretamente os 4 passos do processo de design dimensional de kimball:
( ) Identificar os fatos.
( ) Selecionar o processo de negócios.
( ) Identificar as dimensões.
( ) Declarar a granularidade.
Assinale a alternativa que indica a sequência correta, de cima para baixo.
No contexto de modificação de valores de atributos de dimensões em modelos multidimensionais e de data warehouse, identifique o valor correto dos tipos (0, 1, 2…n) de modificação de valores de atributos de dimensão, conforme as técnicas definidas por Kimball, para:
( ) Acrescentar um novo registro
( ) Sobrescrever
( ) Reter o valor original
( ) Adicionar um novo atributo
Assinale a alternativa que indica a sequência correta, de cima para baixo.
Na modelagem multidimensional de um Data Warehouse, há dois modelos que são mais utilizados. O primeiro deles é um schema no qual somente a tabela fato e as tabelas de dimensões a ela relacionadas estão nele contidas e não é usada normalização; nesse schema, poucas junções com chave estrangeira são usadas e há menos redundância de dados. O segundo é um schema no qual a tabela fato, bem como as tabelas de dimensões e as tabelas de outras hierarquias (subdimensões) relacionadas estão nele contidas; nesse schema há mais junções com chaves estrangeiras e pode haver uma maior redundância de dados.
O primeiro e o segundo schemas são, correta e respectivamente, denominados
I. Data Warehouse armazena dados em formato de séries históricas. Os dados são armazenados neste formato pois, por definição, são considerados voláteis.
Il. Um Data Mart consulta um subconjunto de dados de um Data Warehouse. Isso ocorre pois um Data Mart é focado em um tipo específico de usuário que não precisa de acesso a todos os dados de um Data War...