Natasha, uma cientista de dados, está trabalhando com um c

Questão Q1047238

2022 FGV TCU

Prova: FGV - 2022 - TCU - Auditor Federal de Controle Externo • TCU

Natasha, uma cientista de dados, está trabalhando com um conjunto de dados sobre carros para fazer um modelo preditivo para uma companhia de seguros. A primeira versão do modelo utiliza apenas informações básicas sobre os carros: a marca e a cor.
Como esses dados são categóricos, Natasha faz um pré-processamento usando a biblioteca scikit-learn. Em um ambiente interativo, ela executa os comandos a seguir.
>>> from sklearn.preprocessing import OneHotEncoder >>> enc = OneHotEncoder() >>> X = [['Toyota', 'vermelho'], ['Toyota', 'verde'], ['BMW', 'vermelho']]
>>> enc.fit(X) >>> enc.get_feature_names() array(['x0_BMW', 'x0_Toyota', 'x1_verde', 'x1_vermelho'], dtype=object)
>>> X_prime = enc.transform(X).toarray() >>> X_prime array([[0., 1., 0., 1.], [0., 1., 1., 0.], [1., 0., 0., 1.]])

Para contar o número de carros da marca Toyota no conjunto de dados, obtendo corretamente o resultado 2, Natasha pode usar a seguinte linha de código:

A len([i for i in X if i == 'Toyota']) B len([i for i in X_prime if i[0] == 1]) C sum([i for i in X if 'Toyota' in i]) D sum(X_prime)[1] E sum(X_prime[:,0])

Comentários

Faça login para participar da discussão.

Cadastre-se Gratuitamente

Carregando comentários...

Natasha, uma cientista de dados, está trabalhando com um c

Comentários

Compartilhar Questão