R - Oracle JDBC 연동하기
Oracle JDBC 와 연동
library(rJava)
library(RJDBC)
library(DBI)
drvName <- 'oracle.jdbc.driver.OracleDriver';
id <- 'ruser'
pwd <- '111111'
url <- 'jdbc:oracle:thin:@localhost:1521:XE'
# 1. Driver Loading
drv <- JDBC(driverClass = drvName,
classPath = 'c:\\java_hive_lib\\ojdbc6.jar')
# 2. Connection
conn <- dbConnect(drv, url, id, pwd)
# 3. Statement
sqlstr <- 'SELECT MONTHS_BETWEEN(sysdate,hiredate) AS day, sal FROM emp'
# 4. ResultSet
emp <- dbGetQuery(conn, sqlstr);<
# 5. Close
dbDisconnect(conn)
library(ggplot2)
p <- ggplot(emp, aes(x = DAY, y = SAL)) + geom_line()
library(plotly)
ggplotly(p)
R - Hive 연동하기
R에서 hive에 접근하기 위해 Linux에서 Hive service를 실행시킨다.
# 하둡실행
> start-all.sh
# hive service 실행
> hive --service hiveserver
Driver와 URL 만 바꾸면 다른 database와 연동가능
library(rJava)
library(RJDBC)
library(DBI)
# Hive 연동 (Linux : server1)
drvName <- 'org.apache.hive.jdbc.HiveDriver';
id <- 'root'
pwd <- '111111'
url <- 'jdbc:hive2://192.168.111.100:10000'
# 폴더에 있는 jar들을 class path로 사용한다
hive_lib <- 'c:\\java_hive_lib'
.jinit();
.jaddClassPath(dir(hive_lib, full.names = T));
.jclassPath();
# 1. Driver Loading
drv <- JDBC(driverClass = drvName,
classPath = 'hive-jdbc-1.0.1.jar')
# 2. Connection
conn <- dbConnect(drv, url, id, pwd)
# 3. Statement
sqlstr <- 'SELECT * FROM airline_delay LIMIT 10'
# 4. ResultSet
cafe <- dbGetQuery(conn, sqlstr);
# 5. Close
dbDisconnect(conn)
java_hive_lib 폴더 안의 jar 파일