Probabilidade
e
Estatística

1º semestre 2025/2026

1 Análise exploratória de dados

1.1 Meios computacionais

O é um ambiente de software livre para computação estatística e gráficos que inclui:

  1. uma linguagem de programação com as mais comuns estruturas de programação

  2. uma coleção integrada de ferramentas para análise de dados

O universo

1.2 Importação de dados

Estruturas básicas de dados

  1. Vetores, matrizes e arrays
  1. Data frames
  2. Listas

Leitura de dados retangulares

  1. Ficheiros de texto

    dados <- read.table(file, header = FALSE, sep = "",
                        dec = ".", . . .)
    
             read.csv(file, . . .)
             read.delim(file, . . .)
             . . .  
  1. Folhas de cálculo (.xls, .xlsx)

    library(readxl)
    dados <- read_excel(path, sheet = NULL, range = NULL,
                        col_names = TRUE, . . .)
    # Alternativa
    dados <- readxl::read_excel(path, sheet = NULL, range = NULL,
                                col_names = TRUE, . . .)

1.3 Gráficos com o ggplot

ggplot(data) +
  geom_xxxx(aes(...), ...) +
  geom_yyyy(aes(...), ...) + 
  ...
ggplot() +
  geom_xxxx(aes(...), data = ..., ...) +
  geom_yyyy(aes(...), data = ..., ...) + 
  ...
ggplot(mpg) +
  geom_point(aes(x = displ, y = hwy))

ggplot(mpg) +
  geom_point(aes(x = displ, y = hwy), color = "hotpink")

ggplot(mpg) +
  geom_point(aes(x = displ, y = hwy, color = class))

menu
fullscreen
aspect_ratio
visibility_off
zoom_out
zoom_in
grid_view

pages