Data Analytics
Tbl Modello Lineare
Analisi Multivariata---
title: "Data Analytics - TBL"
subtitle: Linear model
output:
html_document:
df_print: paged
geometry: margin=2cm
fontsize: 11pt
---
**Nome e cognome:**
**N. mat.:**
---
Riportare di seguito i comandi e le risposte necessarie allo svolgimento del test individuale.
Prima dello scadere del tempo, compilare un file html per il confronto delle risposte individuali con quelle di gruppo
1. Accertarsi che il file compili correttamente
2. Compilare spesso
3. Se non si riesce a risolvere l'errore di compilazione, utilizzare l'opzione `eval = F` nelle opzioni del chunk, ad esempio:
```{r, eval = FALSE}
```
## Analisi dei dati
Un'agenzia immobiliare ha raccolto dati su 117 abitazioni vendute nell'ultimo anno in una città statunitense. I dati sono disponibili nel file `case_sub.csv` che contiene le seguenti variabili: `Price` (il prezzo in migliaia di dollari), `SquareFeet` (la dimensione della casa) e `Northeast` (la zona in cui si trova la casa).
```{r}
# tilde
# ~
```
**1.** Quale variabile è opportuno considerare come variabile risposta? Rappresentarla graficamente e commentare brevemente.
```{r}
```
**2.** Valutare graficamente la relazione tra le tre variabili presenti nel dataset. Si notano pattern particolari?
```{r}
```
**3.** Stimare un modello di regressione lineare con un solo predittore continuo (`fit1`). Quale parte di variabilità della risposta viene spiegata dal modello?
```{r}
```
**4.** Valutare il modello osservando i residui ($\hat y_i$ vs residui e qqnorm dei residui). Emergono delle problematiche? Commentare.
```{r}
```
**5.** Considerare nel modello anche la variabile che indica la posizione della casa (`fit2`) e selezionare l'affermazione accettabile tra le seguenti
a. `[ ]` l'effetto della zona è importante perchè la variabilità spiegata dal modello è aumentata
b. `[ ]` l'effetto della zona è importante nello spiegare la variabilità del prezzo perchè il suo coefficiente è il più grande ottenuto
c. `[ ]` non possiamo escludere che la posizione abbia un effetto nullo sul prezzo
d. `[ ]` le case nella zona nord est della città costano in media meno delle case nelle altre zone
```{r}
```
**6** Calcolare la devianza dei residui della funzione di regressione per il modello `fit1`
```{r}
```
**7** Rispetto al modello `fit1`, quale delle seguenti affermazioni NON è supportata dalle analisi. La variabile `SquareFeet`:
a. `[ ]` è molto rilevante per spiegare il prezzo della casa
b. `[ ]` il plot della variabile vs residui suggerisce una relazione non lineare
c. `[ ]` all'aumentare della superficie di 10 piedi quadri, il prezzo aumenta di circa 614 mila dollari
d. `[ ]` per un appartamento di 100 piedi quadri, il prezzo previsto è di circa 10919 mila dollari
```{r}
```