1 Import danych

Środowisko R pozwala na import i export plików o różnych rozszerzeniach (txt, csv, xls, xlsx, sav, xpt, dta, itd.)3. W tym celu czasami trzeba zainstalować pakiety rozszerzające podstawowe możliwości R-a. Najnowsza4 wersja programu RStudio (v. 1.1.463)5 pozwala na wczytanie danych z popularnych źródeł za pomocą GUI.

Narzędzie do importu plików programu RStudio

Rysunek 1.1: Narzędzie do importu plików programu RStudio

Jeśli dane są zapisane w trybie tekstowym (np. txt, csv), to wczytujemy je w następujący sposób

library(tidyverse)
dane1 <- read.table("data/dane1.txt", header = T)
head(dane1)
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
## 2          4.9         3.0          1.4         0.2  setosa
## 3          4.7         3.2          1.3         0.2  setosa
## 4          4.6         3.1          1.5         0.2  setosa
## 5          5.0         3.6          1.4         0.2  setosa
## 6          5.4         3.9          1.7         0.4  setosa
dane2 <- read.csv2("data/dane1.csv", header = T)
head(dane2)
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
## 2          4.9         3.0          1.4         0.2  setosa
## 3          4.7         3.2          1.3         0.2  setosa
## 4          4.6         3.1          1.5         0.2  setosa
## 5          5.0         3.6          1.4         0.2  setosa
## 6          5.4         3.9          1.7         0.4  setosa
# funkcja pakietu readr wczytuje plik jako ramkę danych w formacie tibble
# pakiet readr jest częsią większego pakietu tidyverse, 
# który został wczytany wczsniej
dane3 <- read_csv2("data/dane1.csv")
dane3
## # A tibble: 150 × 5
##    Sepal.Length Sepal.Width Petal.Length Petal.Width Species
##           <dbl>       <dbl>        <dbl>       <dbl> <chr>  
##  1          5.1         3.5          1.4         0.2 setosa 
##  2          4.9         3            1.4         0.2 setosa 
##  3          4.7         3.2          1.3         0.2 setosa 
##  4          4.6         3.1          1.5         0.2 setosa 
##  5          5           3.6          1.4         0.2 setosa 
##  6          5.4         3.9          1.7         0.4 setosa 
##  7          4.6         3.4          1.4         0.3 setosa 
##  8          5           3.4          1.5         0.2 setosa 
##  9          4.4         2.9          1.4         0.2 setosa 
## 10          4.9         3.1          1.5         0.1 setosa 
## # ℹ 140 more rows

Jeśli dane są przechowywane w pliku Excel (np. xlsx), to importujemy je za pomocą funkcji read_excel pakietu readxl. Domyślnie jest wczytywany arkusz pierwszy ale jeśli zachodzi taka potrzeba, to można ustalić, który arkusz pliku Excel ma być wczytany za pomocą paramteru sheet, np. sheet=3, co oznacza, że zostanie wczytany trzeci arkusz pliku.

Fragment pliku Excel

Rysunek 1.2: Fragment pliku Excel

Ponieważ w pliku dane1.xlsx braki danych zostały zakodowane znakami BD oraz -, to należy ten fakt przekazać funkcji, aby poprawnie wczytać braki danych. W przeciwnym przypadku zmienne zawierające braki tak kodowane, będą wczytane jako zmienne znakowe.

library(readxl)
dane4 <- read_excel("data/dane1.xlsx", na = c("BD", "-"))
dane4
## # A tibble: 150 × 5
##    `Długość kielicha` `Szerokość kielicha` `Długość płatka` `Szerokość płatka`
##                 <dbl>                <dbl>            <dbl>              <dbl>
##  1                5.1                  3.5              1.4                0.2
##  2                4.9                  3                1.4                0.2
##  3                4.7                  3.2              1.3                0.2
##  4                4.6                  3.1              1.5                0.2
##  5                5                    3.6              1.4                0.2
##  6                5.4                  3.9              1.7                0.4
##  7               NA                   NA                1.4                0.3
##  8                5                    3.4              1.5                0.2
##  9                4.4                  2.9              1.4                0.2
## 10                4.9                  3.1              1.5                0.1
## # ℹ 140 more rows
## # ℹ 1 more variable: Gatunki <chr>

Istniej oczywiście jeszcze wiele innych fomatów danych, charakterystycznych dla programów, w których są traktowane jako domyślne.6 W szczególny sposób należy zwrócić uwagę na pliki o rozszerzeniu RData lub rda7 oraz pliki rds. Pliki rda służą do przechowywania obiektów programu R. Mogą to być pliki danych ale również obiekty graficzne (typu wyniki funkcji ggplot), modele (np. wynik funkcji lm()), zdefiniowane funkcje i wszystkie inne obiekty, które da się zapisać w środowisku R. Ponadto pliki rda pozawalają na zapisanie wielu obiektów w jednym pliku. Pliki o rozszerzeniu rds mają podobną funkcję z tym, że pozwalają na przechowywanie tylko jednego obiektu.

# wszystkie wczytane wcześniej pliki zapisuje w jednym pliku
save(dane1, dane2, dane3, dane4, file = "data/dane.rda")
# plik rda został zapisany
list.files(path = "data/")
## [1] "algae.csv"    "Analysis.txt" "dane.rda"     "dane.zip"     "dane1.csv"   
## [6] "dane1.txt"    "dane1.xlsx"   "dane4.rds"    "dane4.sav"
# usuwam dane ze środowiska R
rm(dane1, dane2, dane3, dane4)
# sprawdzam co jest wczytane do R
ls()
## character(0)
# wczytuję plik rda
load("data/dane.rda")
# jeszcze raz sprawdzam co jest wczytane do R
ls()
## [1] "dane1" "dane2" "dane3" "dane4"

Zapisując obiekty jako oddzielne pliki, można przy wczytywaniu nadawać im nazwy.

rm(dane1, dane2, dane3)
ls()
## [1] "dane4"
saveRDS(dane4, file = "data/dane4.rds")
nowe_dane <- readRDS("data/dane4.rds")
nowe_dane
## # A tibble: 150 × 5
##    `Długość kielicha` `Szerokość kielicha` `Długość płatka` `Szerokość płatka`
##                 <dbl>                <dbl>            <dbl>              <dbl>
##  1                5.1                  3.5              1.4                0.2
##  2                4.9                  3                1.4                0.2
##  3                4.7                  3.2              1.3                0.2
##  4                4.6                  3.1              1.5                0.2
##  5                5                    3.6              1.4                0.2
##  6                5.4                  3.9              1.7                0.4
##  7               NA                   NA                1.4                0.3
##  8                5                    3.4              1.5                0.2
##  9                4.4                  2.9              1.4                0.2
## 10                4.9                  3.1              1.5                0.1
## # ℹ 140 more rows
## # ℹ 1 more variable: Gatunki <chr>

Oprócz wielu zalet takiego sposobu importu i eksportu danych jest jedna poważna wada, pliki te można odczytać jedynie za pomocą R. Osobiście polecam stosować do importu i eksportu danych plików w takich formatach, które mogą przeczytać wszyscy. Jak dotąd widać do importu różnych formatów danych potrzebujemy różnych funkcji, czasami nawet z różnych pakietów. Istnieje rozwiązanie tej niedogodności 😃

library(rio)
dane1 <- import("data/dane1.txt")
head(dane1)
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
## 2          4.9         3.0          1.4         0.2  setosa
## 3          4.7         3.2          1.3         0.2  setosa
## 4          4.6         3.1          1.5         0.2  setosa
## 5          5.0         3.6          1.4         0.2  setosa
## 6          5.4         3.9          1.7         0.4  setosa
dane2 <- import("data/dane1.csv", dec = ",")
# dane1.csv miały , jako znak rozdzielający cechę i mantysę liczb
# dlatego włączamy parametr dec
head(dane2)
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
## 2          4.9         3.0          1.4         0.2  setosa
## 3          4.7         3.2          1.3         0.2  setosa
## 4          4.6         3.1          1.5         0.2  setosa
## 5          5.0         3.6          1.4         0.2  setosa
## 6          5.4         3.9          1.7         0.4  setosa
dane3 <- import("data/dane1.xlsx", na=c("BD","-"))
head(dane3)
##   Długość kielicha Szerokość kielicha Długość płatka Szerokość płatka Gatunki
## 1              5.1                3.5            1.4              0.2  setosa
## 2              4.9                3.0            1.4              0.2  setosa
## 3              4.7                3.2            1.3              0.2  setosa
## 4              4.6                3.1            1.5              0.2  setosa
## 5              5.0                3.6            1.4              0.2  setosa
## 6              5.4                3.9            1.7              0.4  setosa
dane4 <- import("data/dane4.rds")
dane4
##     Długość kielicha Szerokość kielicha Długość płatka Szerokość płatka
## 1                5.1                3.5            1.4              0.2
## 2                4.9                3.0            1.4              0.2
## 3                4.7                3.2            1.3              0.2
## 4                4.6                3.1            1.5              0.2
## 5                5.0                3.6            1.4              0.2
## 6                5.4                3.9            1.7              0.4
## 7                 NA                 NA            1.4              0.3
## 8                5.0                3.4            1.5              0.2
## 9                4.4                2.9            1.4              0.2
## 10               4.9                3.1            1.5              0.1
## 11               5.4                3.7            1.5              0.2
## 12               4.8                3.4            1.6              0.2
## 13               4.8                3.0            1.4              0.1
## 14               4.3                3.0            1.1              0.1
## 15               5.8                4.0            1.2              0.2
## 16               5.7                4.4            1.5              0.4
## 17               5.4                3.9            1.3              0.4
## 18               5.1                3.5            1.4              0.3
## 19               5.7                3.8            1.7              0.3
## 20               5.1                3.8            1.5              0.3
## 21               5.4                3.4            1.7              0.2
## 22               5.1                3.7            1.5              0.4
## 23               4.6                3.6            1.0              0.2
## 24               5.1                3.3            1.7              0.5
## 25               4.8                3.4            1.9              0.2
## 26               5.0                3.0            1.6              0.2
## 27               5.0                3.4            1.6              0.4
## 28               5.2                3.5            1.5              0.2
## 29               5.2                3.4            1.4              0.2
## 30               4.7                3.2            1.6              0.2
## 31               4.8                3.1            1.6              0.2
## 32               5.4                3.4            1.5              0.4
## 33               5.2                4.1            1.5              0.1
## 34               5.5                4.2            1.4              0.2
## 35               4.9                3.1            1.5              0.2
## 36               5.0                3.2            1.2              0.2
## 37               5.5                3.5            1.3              0.2
## 38               4.9                3.6            1.4              0.1
## 39               4.4                3.0            1.3              0.2
## 40               5.1                3.4            1.5              0.2
## 41               5.0                3.5            1.3              0.3
## 42               4.5                2.3            1.3              0.3
## 43               4.4                3.2            1.3              0.2
## 44                NA                3.5            1.6              0.6
## 45               5.1                3.8            1.9              0.4
## 46               4.8                3.0            1.4              0.3
## 47               5.1                3.8            1.6              0.2
## 48               4.6                3.2            1.4              0.2
## 49               5.3                3.7            1.5              0.2
## 50               5.0                3.3            1.4              0.2
## 51               7.0                3.2            4.7              1.4
## 52               6.4                3.2            4.5              1.5
## 53               6.9                3.1            4.9              1.5
## 54               5.5                2.3            4.0              1.3
## 55               6.5                2.8            4.6              1.5
## 56               5.7                2.8            4.5              1.3
## 57               6.3                3.3            4.7              1.6
## 58               4.9                2.4            3.3              1.0
## 59               6.6                2.9            4.6              1.3
## 60               5.2                2.7            3.9              1.4
## 61               5.0                2.0             NA              1.0
## 62               5.9                3.0            4.2              1.5
## 63               6.0                2.2            4.0              1.0
## 64               6.1                2.9            4.7              1.4
## 65               5.6                2.9            3.6              1.3
## 66               6.7                3.1            4.4              1.4
## 67               5.6                3.0            4.5              1.5
## 68               5.8                2.7            4.1              1.0
## 69               6.2                2.2            4.5              1.5
## 70               5.6                2.5            3.9              1.1
## 71               5.9                3.2            4.8              1.8
## 72               6.1                2.8            4.0              1.3
## 73               6.3                2.5            4.9              1.5
## 74               6.1                2.8            4.7              1.2
## 75               6.4                2.9            4.3              1.3
## 76               6.6                3.0            4.4              1.4
## 77               6.8                2.8            4.8              1.4
## 78               6.7                3.0            5.0              1.7
## 79               6.0                2.9            4.5              1.5
## 80               5.7                2.6            3.5              1.0
## 81               5.5                2.4            3.8              1.1
## 82               5.5                2.4            3.7              1.0
## 83               5.8                2.7            3.9              1.2
## 84               6.0                2.7            5.1              1.6
## 85               5.4                3.0            4.5              1.5
## 86               6.0                3.4            4.5              1.6
## 87               6.7                3.1            4.7              1.5
## 88               6.3                2.3            4.4              1.3
## 89               5.6                3.0            4.1              1.3
## 90               5.5                2.5            4.0              1.3
## 91               5.5                2.6            4.4              1.2
## 92               6.1                3.0            4.6              1.4
## 93               5.8                2.6            4.0              1.2
## 94               5.0                2.3            3.3              1.0
## 95               5.6                2.7            4.2              1.3
## 96               5.7                3.0            4.2              1.2
## 97               5.7                2.9            4.2              1.3
## 98               6.2                2.9            4.3              1.3
## 99               5.1                2.5            3.0              1.1
## 100              5.7                2.8            4.1              1.3
## 101              6.3                3.3            6.0              2.5
## 102              5.8                2.7            5.1              1.9
## 103              7.1                3.0            5.9              2.1
## 104              6.3                2.9            5.6              1.8
## 105              6.5                3.0            5.8              2.2
## 106              7.6                3.0            6.6              2.1
## 107              4.9                2.5            4.5              1.7
## 108              7.3                2.9            6.3              1.8
## 109              6.7                2.5            5.8              1.8
## 110              7.2                3.6            6.1              2.5
## 111              6.5                3.2            5.1              2.0
## 112              6.4                2.7            5.3              1.9
## 113              6.8                3.0            5.5              2.1
## 114              5.7                2.5            5.0              2.0
## 115              5.8                2.8            5.1              2.4
## 116              6.4                3.2            5.3              2.3
## 117              6.5                3.0            5.5              1.8
## 118              7.7                3.8            6.7              2.2
## 119              7.7                2.6            6.9              2.3
## 120              6.0                2.2            5.0              1.5
## 121              6.9                3.2            5.7              2.3
## 122              5.6                2.8            4.9              2.0
## 123              7.7                2.8            6.7              2.0
## 124              6.3                2.7            4.9              1.8
## 125              6.7                3.3            5.7              2.1
## 126              7.2                3.2            6.0              1.8
## 127              6.2                2.8            4.8              1.8
## 128              6.1                3.0            4.9              1.8
## 129              6.4                2.8            5.6              2.1
## 130              7.2                3.0            5.8              1.6
## 131              7.4                2.8            6.1              1.9
## 132              7.9                3.8            6.4              2.0
## 133              6.4                2.8            5.6              2.2
## 134              6.3                2.8            5.1              1.5
## 135              6.1                2.6            5.6              1.4
## 136              7.7                3.0            6.1              2.3
## 137              6.3                3.4            5.6              2.4
## 138              6.4                3.1            5.5              1.8
## 139              6.0                3.0            4.8              1.8
## 140              6.9                3.1            5.4              2.1
## 141              6.7                3.1            5.6              2.4
## 142              6.9                3.1            5.1              2.3
## 143              5.8                2.7            5.1              1.9
## 144              6.8                3.2            5.9              2.3
## 145              6.7                3.3            5.7              2.5
## 146              6.7                3.0            5.2              2.3
## 147              6.3                2.5            5.0              1.9
## 148              6.5                3.0            5.2              2.0
## 149              6.2                3.4            5.4              2.3
## 150              5.9                3.0            5.1              1.8
##        Gatunki
## 1       setosa
## 2       setosa
## 3       setosa
## 4       setosa
## 5       setosa
## 6       setosa
## 7       setosa
## 8         <NA>
## 9       setosa
## 10      setosa
## 11      setosa
## 12      setosa
## 13      setosa
## 14      setosa
## 15      setosa
## 16      setosa
## 17      setosa
## 18      setosa
## 19      setosa
## 20      setosa
## 21      setosa
## 22      setosa
## 23      setosa
## 24      setosa
## 25      setosa
## 26      setosa
## 27      setosa
## 28      setosa
## 29      setosa
## 30      setosa
## 31      setosa
## 32      setosa
## 33      setosa
## 34      setosa
## 35      setosa
## 36      setosa
## 37        <NA>
## 38      setosa
## 39      setosa
## 40      setosa
## 41      setosa
## 42      setosa
## 43      setosa
## 44      setosa
## 45      setosa
## 46      setosa
## 47      setosa
## 48      setosa
## 49      setosa
## 50      setosa
## 51        <NA>
## 52  versicolor
## 53  versicolor
## 54  versicolor
## 55  versicolor
## 56  versicolor
## 57  versicolor
## 58  versicolor
## 59  versicolor
## 60  versicolor
## 61  versicolor
## 62        <NA>
## 63  versicolor
## 64  versicolor
## 65  versicolor
## 66  versicolor
## 67  versicolor
## 68  versicolor
## 69        <NA>
## 70  versicolor
## 71  versicolor
## 72  versicolor
## 73  versicolor
## 74  versicolor
## 75  versicolor
## 76  versicolor
## 77  versicolor
## 78  versicolor
## 79  versicolor
## 80  versicolor
## 81  versicolor
## 82  versicolor
## 83  versicolor
## 84  versicolor
## 85  versicolor
## 86  versicolor
## 87  versicolor
## 88  versicolor
## 89  versicolor
## 90  versicolor
## 91  versicolor
## 92  versicolor
## 93  versicolor
## 94  versicolor
## 95  versicolor
## 96  versicolor
## 97  versicolor
## 98  versicolor
## 99  versicolor
## 100 versicolor
## 101  virginica
## 102  virginica
## 103  virginica
## 104  virginica
## 105  virginica
## 106  virginica
## 107  virginica
## 108  virginica
## 109  virginica
## 110  virginica
## 111  virginica
## 112  virginica
## 113  virginica
## 114  virginica
## 115  virginica
## 116  virginica
## 117  virginica
## 118  virginica
## 119  virginica
## 120  virginica
## 121  virginica
## 122  virginica
## 123  virginica
## 124  virginica
## 125  virginica
## 126  virginica
## 127  virginica
## 128  virginica
## 129  virginica
## 130  virginica
## 131  virginica
## 132  virginica
## 133  virginica
## 134  virginica
## 135  virginica
## 136  virginica
## 137  virginica
## 138  virginica
## 139  virginica
## 140  virginica
## 141  virginica
## 142  virginica
## 143  virginica
## 144  virginica
## 145  virginica
## 146  virginica
## 147  virginica
## 148  virginica
## 149  virginica
## 150  virginica

Lista możliwości jaką daje nam pakiet rio (Chan and Leeper 2018) jest niemal nieograniczona:8

  • Comma-separated data (.csv), using fread or, if fread = FALSE, read.table with row.names = FALSE and stringsAsFactors = FALSE
  • Pipe-separated data (.psv), using fread or, if fread = FALSE, read.table with sep = ‘|’, row.names = FALSE and stringsAsFactors = FALSE
  • Tab-separated data (.tsv), using fread or, if fread = FALSE, read.table with row.names = FALSE and stringsAsFactors = FALSE
  • SAS (.sas7bdat), using read_sas.
  • SAS XPORT (.xpt), using read_xpt or, if haven = FALSE, read.xport.
  • SPSS (.sav), using read_sav. If haven = FALSE, read.spss can be used.
  • Stata (.dta), using read_dta. If haven = FALSE, read.dta can be used.
  • SAS XPORT (.xpt), using read.xport.
  • SPSS Portable Files (.por), using read_por.
  • Excel (.xls and .xlsx), using read_excel. Use which to specify a sheet number. For .xlsx files, it is possible to set readxl = FALSE, so that read.xlsx can be used instead of readxl (the default).
  • R syntax object (.R), using dget
  • Saved R objects (.RData,.rda), using load for single-object .Rdata files. Use which to specify an object name for multi-object .Rdata files. This can be any R object (not just a data frame).
  • Serialized R objects (.rds), using readRDS. This can be any R object (not just a data frame).
  • Epiinfo (.rec), using read.epiinfo
  • Minitab (.mtp), using read.mtp
  • Systat (.syd), using read.systat
  • “XBASE” database files (.dbf), using read.dbf
  • Weka Attribute-Relation File Format (.arff), using read.arff
  • Data Interchange Format (.dif), using read.DIF
  • Fortran data (no recognized extension), using read.fortran
  • Fixed-width format data (.fwf), using a faster version of read.fwf that requires a widths argument and by default in rio has stringsAsFactors = FALSE. If readr = TRUE, import will be performed using read_fwf, where widths should be: NULL, a vector of column widths, or the output of fwf_empty, fwf_widths, or fwf_positions.
  • gzip comma-separated data (.csv.gz), using read.table with row.names = FALSE and stringsAsFactors = FALSE
  • CSVY (CSV with a YAML metadata header) using read_csvy.
  • Feather R/Python interchange format (.feather), using read_feather
  • Fast storage (.fst), using read.fst
  • JSON (.json), using fromJSON
  • Matlab (.mat), using read.mat
  • EViews (.wf1), using readEViews
  • OpenDocument Spreadsheet (.ods), using read_ods. Use which to specify a sheet number.
  • Single-table HTML documents (.html), using read_html. The data structure will only be read correctly if the HTML file can be converted to a list via as_list.
  • Shallow XML documents (.xml), using read_xml. The data structure will only be read correctly if the XML file can be converted to a list via as_list.
  • YAML (.yml), using yaml.load
  • Clipboard import (on Windows and Mac OS), using read.table with row.names = FALSE
  • Google Sheets, as Comma-separated data (.csv)

Przykład 1.1 Poniższa ilustracja przedstawia fragment pliku danych Analysis.txt zawierającego pewne błędy, które należy naprawić na etapie importu danych. Po pierwsze brakuje w nim nazw zmiennych (choć nie widać tego na rysunku). Poszczególne kolumny nazywają się następująco: season, size, speed, mxPH, mnO2, Cl, NO3, NH4, oPO4, PO4, Chla, a1, a2, a3, a4, a5, a6, a7. Naszym zadaniem jest import tego pliku z jednoczesną obsługą braków (braki danych są zakodowane przez XXXXXXX) oraz nadaniem nagłówków kolumn. Plik Analisis.txt jest umieszczony w kagalogu data/. Z racji, że plik dotyczy glonów, to dane zapiszemy pod nazwą algae.

Fragment pliku danych Analisis.txt

Rysunek 1.3: Fragment pliku danych Analisis.txt

algae <- import('data/Analysis.txt', header=F, 
                dec='.', 
                col.names=c('season','size','speed','mxPH','mnO2','Cl',
                            'NO3','NH4','oPO4','PO4','Chla','a1','a2',
                            'a3','a4','a5','a6','a7'),
                na.strings=c('XXXXXXX'))
head(algae)
##   season  size  speed mxPH mnO2     Cl    NO3     NH4    oPO4     PO4 Chla   a1
## 1 winter small medium 8.00  9.8 60.800  6.238 578.000 105.000 170.000 50.0  0.0
## 2 spring small medium 8.35  8.0 57.750  1.288 370.000 428.750 558.750  1.3  1.4
## 3 autumn small medium 8.10 11.4 40.020  5.330 346.667 125.667 187.057 15.6  3.3
## 4 spring small medium 8.07  4.8 77.364  2.302  98.182  61.182 138.700  1.4  3.1
## 5 autumn small medium 8.06  9.0 55.350 10.416 233.700  58.222  97.580 10.5  9.2
## 6 winter small   high 8.25 13.1 65.750  9.248 430.000  18.250  56.667 28.4 15.1
##     a2   a3  a4   a5   a6  a7
## 1  0.0  0.0 0.0 34.2  8.3 0.0
## 2  7.6  4.8 1.9  6.7  0.0 2.1
## 3 53.6  1.9 0.0  0.0  0.0 9.7
## 4 41.0 18.9 0.0  1.4  0.0 1.4
## 5  2.9  7.5 0.0  7.5  4.1 1.0
## 6 14.6  1.4 0.0 22.5 12.6 2.9
summary(algae)
##     season              size              speed                mxPH      
##  Length:200         Length:200         Length:200         Min.   :5.600  
##  Class :character   Class :character   Class :character   1st Qu.:7.700  
##  Mode  :character   Mode  :character   Mode  :character   Median :8.060  
##                                                           Mean   :8.012  
##                                                           3rd Qu.:8.400  
##                                                           Max.   :9.700  
##                                                           NA's   :1      
##       mnO2              Cl               NO3              NH4          
##  Min.   : 1.500   Min.   :  0.222   Min.   : 0.050   Min.   :    5.00  
##  1st Qu.: 7.725   1st Qu.: 10.981   1st Qu.: 1.296   1st Qu.:   38.33  
##  Median : 9.800   Median : 32.730   Median : 2.675   Median :  103.17  
##  Mean   : 9.118   Mean   : 43.636   Mean   : 3.282   Mean   :  501.30  
##  3rd Qu.:10.800   3rd Qu.: 57.824   3rd Qu.: 4.446   3rd Qu.:  226.95  
##  Max.   :13.400   Max.   :391.500   Max.   :45.650   Max.   :24064.00  
##  NA's   :2        NA's   :10        NA's   :2        NA's   :2         
##       oPO4             PO4              Chla               a1       
##  Min.   :  1.00   Min.   :  1.00   Min.   :  0.200   Min.   : 0.00  
##  1st Qu.: 15.70   1st Qu.: 41.38   1st Qu.:  2.000   1st Qu.: 1.50  
##  Median : 40.15   Median :103.29   Median :  5.475   Median : 6.95  
##  Mean   : 73.59   Mean   :137.88   Mean   : 13.971   Mean   :16.92  
##  3rd Qu.: 99.33   3rd Qu.:213.75   3rd Qu.: 18.308   3rd Qu.:24.80  
##  Max.   :564.60   Max.   :771.60   Max.   :110.456   Max.   :89.80  
##  NA's   :2        NA's   :2        NA's   :12                       
##        a2               a3               a4               a5        
##  Min.   : 0.000   Min.   : 0.000   Min.   : 0.000   Min.   : 0.000  
##  1st Qu.: 0.000   1st Qu.: 0.000   1st Qu.: 0.000   1st Qu.: 0.000  
##  Median : 3.000   Median : 1.550   Median : 0.000   Median : 1.900  
##  Mean   : 7.458   Mean   : 4.309   Mean   : 1.992   Mean   : 5.064  
##  3rd Qu.:11.375   3rd Qu.: 4.925   3rd Qu.: 2.400   3rd Qu.: 7.500  
##  Max.   :72.600   Max.   :42.800   Max.   :44.600   Max.   :44.400  
##                                                                     
##        a6               a7        
##  Min.   : 0.000   Min.   : 0.000  
##  1st Qu.: 0.000   1st Qu.: 0.000  
##  Median : 0.000   Median : 1.000  
##  Mean   : 5.964   Mean   : 2.495  
##  3rd Qu.: 6.925   3rd Qu.: 2.400  
##  Max.   :77.600   Max.   :31.600  
## 
export(algae, file = "data/algae.csv")

Bibliografia

Chan, Chung-hong, and Thomas J. Leeper. 2018. Rio: A Swiss-Army Knife for Data i/o. https://CRAN.R-project.org/package=rio.

  1. póki co nie jest mi znana funkcja pozwalająca na import plików programu Statistica↩︎

  2. na dzień 19.02.2019↩︎

  3. istnieją rownież nowsze wersje deweloperskie↩︎

  4. do ich wczytywania stosujemy funkcje pakietu foreign↩︎

  5. oznaczają to samo↩︎

  6. fragment pliku help funkcji import↩︎