- Excel 파일을 사용하기 위해서 Package 설치
- console 창에서 readxl 패키지 설치
> install.packages('readxl')
설치가 제대로 되지 않았을 경우 설치된 경로를 확인해 package를 삭제하고 다시 설치해야한다.
⌕ C:\Users\student\AppData\Local\Temp\RtmpCu2rjY\downloaded_packages
package 사용하기
library(package명)
사용할 데이터 파일 (Excel) 을 프로젝트 폴더 안에 붙여넣으면 R studio에서 확인할 수 있다.
- 데이터 로드하기
패키지를 매번 로드해 줘야 하기 때문에 함수로 만들었다.
exdata <- function(){
library(readxl);
# 같은 workspace 에 존재하는 파일이기 때문에 파일명만 명시해도 된다
data <- read_excel('excel_exam.xlsx');
return(data);
}
data <- exdata();
colnames(data) <- c('a','b','c','d','e')
mean(data$math)
read_excel 속성
# column명이 없는 데이터인 경우 첫 줄을 column명으로 만들지 않도록 col_names = F 설정
data <- read_excel('excel_exam_nohead.xlsx', col_names = F);
# Excel 파일의 2번째 sheet에 있는 데이터를 읽어온다
data <- read_excel('excep_exam_3.xlsx', sheet =2);
getcsv <- function() {
data<-read.csv('csv_exam3.csv', header = F);
data<-read.csv('csv_exam3.csv', header = F, stringsAsFactors = F);
# 인코딩방식
data<-read.csv('csv_exam3.csv', header=F, stringsAsFactors = F, encoding = 'UTF-8');
return(data);
}
writedata<-function(df) {
write.csv(df, file='result0328.csv');
}
data <- getcsv()
data$avg <- round(rowMeans(data[,c(4:6)]),2)
writedata(data)
# 원본파일을 가져와서 복제본을 만든 후에
# 그 파일로 분석해야 됌. 원본파일 건드리지 않기
newdata <- read.csv('result0328.csv', header = F, stringsAsFactors = F, encoding='UTF-8')
load('result0328.csv')
Troubleshooting
“Error: path does not exist”
> 폴더 이름, 파일 이름, 데이터 프레임의 열 이름 등의 원인이 있을 수 있다.
> 탐색기에서 이름을 복사, 붙여넣기만 하면 spelling 오류를 피할 수 있다. R에서는 대소문자를 정확하게 구분해야한다.
추가 정보는 아래 페이지에서 확인 가능하다.