Eclipse에서 Hadoop 연동하기

Hive

Hadoop 과 Java project를 연결하는 역할
Hive를 사용하면 Java project에서 Hive SQL로 쉽게 Data를 요청할 수 있다
Hive는 SQL을 사용해 Hadoop으로 MapReduce를 요청한다

Linux OS 에서 Hadoop 준비하기

Hadoop Server 실행

Run the Linux OS on VMware.

Open a Linux terminal and run Hadoop.

Verifying the execution of a Java process with "jps"

# start-all.sh
# jps

Hive 실행

# hive

사용할 데이터

공공데이터 가져오는 방법

Linux에서 CSV파일 사용하는 방법

경기도에 있는 음식점정보 (까페)

Create Table

Field Delimited ',' Line Delimited '\n'

CREATE TABLE cafe (
  City STRING,
  PlaceName String,
  PermitDate Date,
  BusinessStatus String,
  MultipleFacilities String,
  TotalSize Double,
  HygieneIndustry String,
  HygieneName String,
  NumberAddress String,
  StreetAddress String,
  Zipcode Int,
  Latitude Double,
  Longitude Double
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n'
STORED AS TEXTFILE;

데이터 로드

load data local
inpath '/root/csv/cafe.csv'
overwrite into table cafe;

Hive 서비스 시작

# hive --service hiveserver2

Java Project 준비

Setting library

SLF4J

slf4j 다운로드

jar 파일 다운로드

jar 다운로드

Java project setting

Create java file

import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.ResultSet;
import java.sql.Statement;

import org.json.simple.JSONArray;

public class HiveTest {
 public static void main(String[] args) throws Exception {
  Class.forName("org.apache.hive.jdbc.HiveDriver");
  Connection conn = DriverManager.getConnection(
    "jdbc:hive2://192.168.111.101:10000/default", "root", "111111");
  Statement stmt = conn.createStatement();
  String cafe = 
    "select city, placename from cafe LIMIt 2";

  ResultSet rs = stmt.executeQuery(cafe);

  JSONArray ja = new JSONArray();
  while (rs.next()) {
   JSONArray data = new JSONArray();
   data.add(rs.getString(1));
   data.add(rs.getString(2));
   ja.add(data);
  }

  System.out.println(ja.toJSONString());
  System.out.println("Success....");
  conn.close();
 }
}

이 블로그 검색

develop

주식 자동매매 시스템

파이썬을 이용한 주식 자동매매 시스템

Eclipse에서 Hadoop 연동하기

Linux OS 에서 Hadoop 준비하기

Hadoop Server 실행

Hive 실행

사용할 데이터

Create Table

데이터 로드

Hive 서비스 시작

Java Project 준비

Setting library

Create java file

이 블로그의 인기 게시물

Linux에서 CSV파일 사용방법

파이썬을 이용한 주식 자동매매 시스템 3 - 계좌정보 조회

R에서 외부 데이터 이용하기 (Excel, csv)