프로그램
Tweet-
- DAY 2(SDEC)
- ⁄10.15(화)⁄
-
- TRACK 1
- ⁄빅데이터⁄
-
- 세션 2
- ⁄11:00 ~ 11:45
- 김영진
구글의 검색 수집 로봇 최적화 북마크
매일 매일 전세계에는 수많은 웹페이지가 생겨나고 있습니다.
넘쳐나는 정보의 바다가운데 구글이나 네이버와 같은 검색엔진이 없는 삶은 태평양에서 내가 길렀던 니모 한마리를 찾는 것과 비슷하겠지요.
현재까지 전 세계에는 약 60조(60,000,000,000,000)개가 존재하는 것으로 알려져있습니다.
매일 1억개의 페이지를 수집해도 10년이 걸리는 그 양을, 그리고 또 더 많이 늘어나고 있는 그 웹페이지들을,
구글은 어떻게 찾아내고 수집해서 여러분들이 찾는 정보를 보여주는 것일까요?
분산 시스템과 머신 러닝을 이용하여 최적화 되어있는 구글의 검색 수집 로봇 시스템을 함께 알아보고자 합니다.
- 발표자 소개
- 처음으로 여자친구를 사귀기 전에 먼저 Machine Learning과 사귀기 시작하였습니다. KAIST를 졸업하고, 병역특례 회사에서 일하면서, Hand Written Character Recognition으로 Machine Learning과 처음으로 만났습니다. Washington University in St. Louis에서 전산학과 석사를 마치고, 구글에서 Machine Translation팀에서 처음으로 프로젝트를 시작하였고, 지금은 분산 시스템과 Machine Learning이 함께 살아가는 시스템을 만들고 있습니다.
- 강의대상
- 검색 엔진의 시작인 수집 로봇에 대해서 궁금하신 분, 분산 시스템과 머신 러닝에 관심 있으신 분들.