전체 글 119

[Hadoop] 데이터 입력

데이터를 받을 수 있는 홈페이지    선생님이 올려주신 파일을 받을 것이다.    많은 양의 데이터를 읽을 수 있는 프로그램 다운로드    맨 위의 두 줄을 지워야 한다.    shift + 아래방향 키 + del-> 저장    bin 폴더의 리스트를 확인하다.    mkdir 명령을 사용해 air 폴더를 생성한다.    put 명령을 사용해 데이터 파일을 air 폴더 아래로 옮긴다.    localhost 50070으로 접속하면 하둡 파티션을 확인할 수 있다.    live nodes    데이터노드 정보를 볼 수 있다.    이런 저런 정보를 볼 수 있다.

[Hadoop] Wordcount

1234567891011121314151617181920212223242526272829package wikibooks.hadoop.chapter04; import java.io.IOException;import java.util.StringTokenizer; import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Mapper; public class WordCountMapper extendsMapperLongWritable, Text, Text, IntWritable> {//데이터 입력 객체 2..