Um pesquisador estimou os parâmetros a, b e c do modelo estatístico de regressão linear y = a + bx + cz + u. Sabe-se que Y é um vetor coluna com os níveis educacionais dos filhos, X e Z são vetores colunas com os níveis educacionais dos pais e das mães e u é um vetor de variáveis aleatórias normais, independentes, de média zero e desvio padrão constante. A técnica usada foi de minimização da soma dos quadrados dos erros. A correlação positiva entre os dados em X e em Z pode gerar, para a estimação, um problema de
Suponha que X e Y sejam dois conjuntos ordenados de dados. Ajusta-se a reta de regressão linear simples, y = a + bx, a estes dados. Os parâmetros a e b são estimados pela minimização da soma dos quadrados dos erros. A reta estimada
Quais as suposições necessárias para aplicação do modelo de regressão linear simples?
Dos quatro gráficos de dispersão abaixo, quais os dois que dão maior indício de que o intercepto é nulo?

Considere, o seguinte gráfico de dispersão entre as variáveis X e Y

Observando o comportamento do gráfico, qual das retas de regressão abaixo representa melhor o comportamento deste conjunto de dados?
Para orientar os investimentos em educação em certo município, um analista foi contratado para criar um ranking das escolas públicas desse município. Para cada escola, as variáveis disponíveis são a quantidade de turmas, a quantidade de alunos, a quantidade de professores, a nota da Prova Brasil e a área do terreno.
A partir dessa situação, julgue os itens subsequentes.
A análise discriminante é técnica multivariada equivalente a um modelo de regressão linear múltiplo.
Para orientar os investimentos em educação em certo município, um analista foi contratado para criar um ranking das escolas públicas desse município. Para cada escola, as variáveis disponíveis são a quantidade de turmas, a quantidade de alunos, a quantidade de professores, a nota da Prova Brasil e a área do terreno.
A partir dessa situação, julgue os itens subsequentes.
A análise de componentes principais é uma técnica da análise multivariada que permite formar um ranking dessas escolas com base nesses dados.

O diagrama A de ramos e folhas acima mostra a distribuição do número de livros destruídos (Y) nas 20 escolas inundadas por causa das fortes chuvas em determinada cidade. O diagrama B mostra a distribuição dos tempos de duração dessas chuvas (X, em minutos) nos dias em que essas 20 escolas foram inundadas.
Com base nessas informações e considerando que o valor 100 é representado nesses diagramas como 10|0, julgue os itens que se seguem.
Computacionalmente, geralmente os softwares SAS, SPSS e Microsoft Excel produzem os mesmos resultados acerca da estimação dos coeficientes de um modelo de regressão lin...

O diagrama A de ramos e folhas acima mostra a distribuição do número de livros destruídos (Y) nas 20 escolas inundadas por causa das fortes chuvas em determinada cidade. O diagrama B mostra a distribuição dos tempos de duração dessas chuvas (X, em minutos) nos dias em que essas 20 escolas foram inundadas.
Com base nessas informações e considerando que o valor 100 é representado nesses diagramas como 10|0, julgue os itens que se seguem.
Na regressão linear simples de X em Y, considere os testes t de significância para o intercepto e o coeficiente angular e suponha que o erro padrão do intercepto foi ma...

O diagrama A de ramos e folhas acima mostra a distribuição do número de livros destruídos (Y) nas 20 escolas inundadas por causa das fortes chuvas em determinada cidade. O diagrama B mostra a distribuição dos tempos de duração dessas chuvas (X, em minutos) nos dias em que essas 20 escolas foram inundadas.
Com base nessas informações e considerando que o valor 100 é representado nesses diagramas como 10|0, julgue os itens que se seguem.
Considerando o teste t bilateral para a significância do coeficiente angular de um modelo de regressão linear simples na forma Y = aX + b + e, em que e representa o err...