- ⁄10.15(화)⁄
- ⁄빅데이터⁄
- 세션 3
- ⁄13:00 ~ 13:45
How Cloudera Impala has Pushed HDFS in New Ways 북마크
Cloudera Impala is the first system written on top of HDFS which is capable of providing
responses to interactive queries over large data sets in real time. Consequently, the performance characteristics
and aspirations of Impala are naturally quite different than those of traditional Map/Reduce workloads
which have been running on top of HDFS for years. This has prompted several new developments in HDFS to
allow Impala to take full advantage of the hardware resources of a cluster.
This talk will provide an introduction to Impala and describe some of the HDFS advancements that
we have implemented which were directly motivated by Impala.
클라우데라 임팔라는 HDFS 위에서 최초로 대규모 데이테 셋에서 실시간의 인터랙티브한 질의가 가능하게 한시스템이다.
따라서, HDFS를 사용하는 기존의 Map/Reduce 시스템과는 상당히 다른 성능 특징과 목적을 가진다.
이런 방향이 서버 클러스터내의 하드웨어들을 최대 가용하기 위한 몇 가지 새로운 기술 실험들을 촉진시켰다.
이 세션은 임팔라를 소개하고, 임팔라의 개발을 통해 구현한 HDFS에서의 진보를 소개한다.
- 발표자 소개
- Aaron T. Myers is a Software Engineer at Cloudera and an Apache Hadoop Committer.
Aaron’s work is primarily focused on HDFS and Hadoop Security. Aaron holds both an Sc.B. and Sc.M. in Computer Science
from Brown University.
클라우데라의 소프트웨어 엔지니어이며, 아파치 하둡 커미터이다. 그의 작업은 주로 HDFS와 하둡 보안에 촛점을 맞추고 있다. 브라운 대학에서 컴퓨터 공학을 전공했으며, 학사와 석사 학위를 가지고 있다. - 강의대상