Data Analytics

Script Lezione

Analisi Bivariata
Script_lezione.Rmd
---
title: "Analisi dei Dati"
subtitle: "Analisi Bivariata"
author: "Gioia Di Credico, Vincenzo Gioia, Sara Trabucco"
date: "`r Sys.Date()`"
output:
  html_document:
    toc: true
    toc_float: true
    toc_depth: 3
    theme: flatly
    highlight: kate
    number_sections: true
    df_print: paged
    code_folding: show
  pdf_document:
    toc: true
    number_sections: true
    highlight: kate
---

```{r setup, include=FALSE}
knitr::opts_chunk$set(
  echo      = TRUE,
  warning   = FALSE,
  message   = FALSE,
  comment   = "#>",
  fig.align = "center"
)
```


---

# La Regressione Lineare Semplice


```{r minimi-quadrati}

```


```{r predetti-residui}

```


```{r retta-alternativa}

```

## Il Coefficiente di Determinazione $R^2$


```{r}

```

---

> **Esercizio 4**: Si carichi il data frame `gatti`, incluso nel file `gatti.csv`. Con riferimento alle variabili `peso` (in kg) e `cibo` (in g).
Si produca un diagramma di dispersione e si calcoli il coefficiente di correlazione. Si calcolino i coefficienti della retta di regressione dei minimi quadrati e la si aggiunga al grafico. Si ottenga il coefficiente di determinazione $R^2$. 

```{r cat}

```

---


## Il Modello Statistico e la Funzione `lm()`


```{r lm-summary}

```


```{r cat2, echo = FALSE, eval = FALSE}

```

---

## Lisciamento della Curva di Regressione


```{r ksmooth-lowess}

```

---

### Curve di lisciamento con `ggplot()`

Con `ggplot2` le curve smoothed si ottengono con `geom_smooth()`:

```{r ggplot-smooth}

```

---

> **Esercizio 6** Si utilizzi il dataset `gatti` già caricato in precedenza. L'obiettivo è esplorare la relazione tra `peso` e `cibo` confrontando la retta dei minimi quadrati con due curve di lisciamento.
>
> a. Si sovrapponga al diagramma di dispersione: la retta dei minimi quadrati (in rosso), una curva `ksmooth()` con `bandwidth = 0.5` e una con `bandwidth = 2.5`. Come cambia la curva al variare del parametro? Quale dei due valori produce un lisciamento eccessivo? Quale sotto-adatta?
>
> b. Si sovrapponga invece una curva `lowess()` con `f = 0.3` e una con `f = 0.9`. Si commenti la differenza tra le due curve e si confronti il loro comportamento con le curve `ksmooth()` del punto precedente.
>
> c. Dato che la relazione tra peso e consumo di cibo è per costruzione quasi lineare, ci si aspetta che le curve di lisciamento si discostino molto dalla retta dei minimi quadrati? Si verifichi graficamente e si commenti.

```{r}

```