스터디 일정 & 커리큘럼 & 발표자료

진행 중 : PART II

PART II

  • 2015년 8월 20일~ 2015년 9월 17일
회차 일시 내용 발표자 발표자료
1 8/20 pySpark 설치 및 기초 최창순 발표자료
pySpark를 이용한 간단한 실습(Word count) 최창순 발표자료
2 9/3 Numpy module 소개 및 Linear regression 최창순 발표자료
Linear Regression and Distributed ML Principles 최홍용 발표자료
3 9/10 실습 : Millionsong Regression Pipelin 김가경 발표자료
Logistic Regression and Click-through Rate Predictione 김동완
4 9/17
실습 : Click-through Rate Prediction Pipeline
5 9/24 PCA and Neuroimaging
실습 : Neuroimaging Analysis via PCA

PART I

  • 2015년 7월 2일~ 2015년 7월 30일
회차 일시 내용 발표자 발표자료
1 7/2 Introduction to Big Data and Data Science 최창순 발표자료
pySpark 설치 (ipython notebook) 최창순
2 7/9 Spark Essentials 김학우 발표자료
3 7/16 Semi-Structured / Structured Data 조혁준 발표자료
4 7/30 pySpark를 이용한 Word Count 최창순 발표자료
정규표현식 살펴보기 김동완 발표자료
5 8/6 pySpark를 이용한 Web Server Log Analysis 최창순 발표자료
pySpark를 이용한 Text Analysis와 Entity Resolution(1) 김동완 발표자료
6 8/13 pySpark를 이용한 Text Analysis와 Entity Resolution(2) 김동완 발표자료
Introduction to Machine Learning with Apache Spark 임성광
Written on August 25, 2015