Data Analytics
Script Lezione
Analisi Bivariata---
title: "Analisi dei Dati"
subtitle: "Analisi Bivariata"
author: "Gioia Di Credico, Vincenzo Gioia, Sara Trabucco"
date: "`r Sys.Date()`"
output:
html_document:
toc: true
toc_float: true
toc_depth: 3
theme: flatly
highlight: kate
number_sections: true
df_print: paged
code_folding: show
pdf_document:
toc: true
number_sections: true
highlight: kate
---
```{r setup, include=FALSE}
knitr::opts_chunk$set(
echo = TRUE,
warning = FALSE,
message = FALSE,
comment = "#>",
fig.align = "center"
)
```
---
# La Regressione Lineare Semplice
```{r minimi-quadrati}
```
```{r predetti-residui}
```
```{r retta-alternativa}
```
## Il Coefficiente di Determinazione $R^2$
```{r}
```
---
> **Esercizio 4**: Si carichi il data frame `gatti`, incluso nel file `gatti.csv`. Con riferimento alle variabili `peso` (in kg) e `cibo` (in g).
Si produca un diagramma di dispersione e si calcoli il coefficiente di correlazione. Si calcolino i coefficienti della retta di regressione dei minimi quadrati e la si aggiunga al grafico. Si ottenga il coefficiente di determinazione $R^2$.
```{r cat}
```
---
## Il Modello Statistico e la Funzione `lm()`
```{r lm-summary}
```
```{r cat2, echo = FALSE, eval = FALSE}
```
---
## Lisciamento della Curva di Regressione
```{r ksmooth-lowess}
```
---
### Curve di lisciamento con `ggplot()`
Con `ggplot2` le curve smoothed si ottengono con `geom_smooth()`:
```{r ggplot-smooth}
```
---
> **Esercizio 6** Si utilizzi il dataset `gatti` già caricato in precedenza. L'obiettivo è esplorare la relazione tra `peso` e `cibo` confrontando la retta dei minimi quadrati con due curve di lisciamento.
>
> a. Si sovrapponga al diagramma di dispersione: la retta dei minimi quadrati (in rosso), una curva `ksmooth()` con `bandwidth = 0.5` e una con `bandwidth = 2.5`. Come cambia la curva al variare del parametro? Quale dei due valori produce un lisciamento eccessivo? Quale sotto-adatta?
>
> b. Si sovrapponga invece una curva `lowess()` con `f = 0.3` e una con `f = 0.9`. Si commenti la differenza tra le due curve e si confronti il loro comportamento con le curve `ksmooth()` del punto precedente.
>
> c. Dato che la relazione tra peso e consumo di cibo è per costruzione quasi lineare, ci si aspetta che le curve di lisciamento si discostino molto dalla retta dei minimi quadrati? Si verifichi graficamente e si commenti.
```{r}
```