바로가기 메뉴
메인 메뉴로 바로가기
본문으로 바로가기

프로그램 TRACK

DAY 2 09.30 (화) TRACK 1 세션 6 16:15 ~ 17:00

Web & Health 2.0. 회사에서의 data science란?

본 발표에서는 데이터 과학(Data Science)의 가장 기본적인 영역인 data preparation에 대해 집중적으로 다루려고 합니다. 먼저 집단지성을 통해 축적한 대용량의 데이터들을 pre-processing하는 것이 data product 개발에 왜 중요한가에 대해 알아보려고 합니다. Food cleaning & standardization 사례를 중심으로 검색, classification, recSys 개발에 data cleaning & standardization이 어떤 영향을 미치는지 알아보고 구체적으로 사용할 수 있는 방법에는 어떠한 것이 있는지 살펴보도록 하겠습니다. 이어서 대용량 기계학습이나 optimization에서 빼놓을 수 없는 training 데이터를 어떻게 실질적으로 만들어야 하는지에 대해 알아보도록 하겠습니다. Food classification 사례를 중심으로 대용량의 training 데이터를 어떻게 만들어서 사용할 수 있으며 그리고 이것이 어떻게 classifier의 성능을 개선할 수 있는지에 대해 살펴보도록 하겠습니다.

발표자 소개 이현철 MyFitnessPal
캐나다 토론토대학에서 전산학 박사를 취득한 후 캐나다 최대 통신회사인 로저스의 사내 벤처인 Thoora에서 CTO로 대용량 데이터 처리 기술 기반의 Social News Aggregtion Engine 개발을 이끌었습니다. 2년반전 에는 미국으로 이주하여 LinkedIn에서 뉴스 및 다양한 콘텐트쪽 relevance+data processing엔진들을 만드는 팀을 이끄는 팀장으로 일하다가 지금은 북미 헬스케어쪽 앱 1위인 MyFitnessPal에서 대용량 데이터 기술을 가지고 Data Products을 만드는 개발팀을 이끌고 있습니다.
강연 대상
data science에 관심있는 개발자
발표 자료
동영상