Excellence Sharing Growth

2018. 10. 11-12 COEX Grand Ballroom, Seoul

Scroll icon
Thank you!

참가 신청이 모두 마감되었습니다.

참석하지 못하신 분들을 위해
발표자료와 영상이 공개될 예정입니다.

SESSIONS

강연 목록

강연자 사진
강연 분야
  • 머신러닝
  • AI
강연 제목
Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기
강연 내용
이 세션에서는 딥러닝 모델을 실제 서비스하는 방법에 대해 실제 경험을 바탕으로 노하우와 팁을 공유합니다. 업데이트된 모델을 안정적으로 배포하는 방법과 롤백, 인퍼런스 오류를 어떻게 대처할지, CPU로 서빙할지 GPU로 서빙할지, 늘어나는 트래픽을 어떻게 대처할지, 서빙을 위한 플랫폼 설계 노하우와 성능 향상을 위한 모듈화, 구현하면서 맞닥뜨렸던 문제들과 고군분투하여 찾은 노하우들 그리고 몇 주간의 삽질로 찾은 안되는 설계와 엔지니어링 측면에서 범하기 쉬운 설계 오류와 실제 성능 테스트 결과 등을 알려드립니다.
목차
1. 문제
  • 모델은 있는데 서버가 없네
  • 다른 사람들은 어떻게 제공하고 있나
2. 해결을 위한 설계 - 학습과 서빙을 위한 시스템 설계 사례
  • 인퍼런스 요청 모듈화하기
  • 어떤 플랫폼을 사용해서 서빙할까 - 인퍼런스 서빙 시스템 아키텍처
  • 인퍼런스 시스템의 라이프사이클
3. AiSP(AI Serving Platform)를 만들어 해결해보기
  • 인퍼런스 서버 만들기
  • 인퍼런스 프로트엔드 만들기
  • 딥러닝 모델 배포 플로우
  • 인퍼런스 트래픽을 컨테이너로 스케일아웃 하기
  • 모델 관리하기와 데이터 관리하기
  • 인퍼런스 예외 처리
4. 만들어진 딥러닝 서빙 플랫폼은 이런 모습
  • 노트북/특정 장비에서 띄우기
  • 네이버의 IQE, C3 플랫폼을 사용해 띄우기
5. 딥러닝 인퍼런스 성능 측정 및 모니터링
  • 성능에 나타난 인퍼런스 요청의 특징
  • 실제로 모니터링하는 지표들 살펴보기
강연자
현동석 양은숙
전체 Schedule 보러가기

PARTNERS

  • baidu
  • carnegie mellon university
  • logo_coupang
  • google
  • hyper connect
  • imply
  • labs
  • labs europe
  • line
  • lunit
  • naver
  • naver business platform
  • nvidia
  • samsunginternet
  • superb ai
  • theori
  • udacity
  • urbanbase

LOCATION

장소
코엑스 그랜드볼룸 (Coex Grand Ballroom)
주소
서울 강남구 영동대로 513 코엑스, (지번) 삼성동 159 코엑스
연락처
02-6000-0114

그랜드볼룸은 봉은사 맞은편 코엑스 1층 북문 쪽에 위치해 있습니다.
지하철 이용 시 9호선 봉은사역 7번 출구를 이용하시거나 삼성역 6번 출구를 이용하시면 됩니다.

교통정보 더보기 >

DEVIEW 2018에 관하여 더 궁금한 점이 있다면?

FAQ 보러가기