스터디 일정 & 커리큘럼 & 발표자료
진행 중 : PART II
PART II
- 2015년 8월 20일~ 2015년 9월 17일
| 회차 | 일시 | 내용 | 발표자 | 발표자료 |
|---|---|---|---|---|
| 1 | 8/20 | pySpark 설치 및 기초 | 최창순 | 발표자료 |
| pySpark를 이용한 간단한 실습(Word count) | 최창순 | 발표자료 | ||
| 2 | 9/3 | Numpy module 소개 및 Linear regression | 최창순 | 발표자료 |
| Linear Regression and Distributed ML Principles | 최홍용 | 발표자료 | ||
| 3 | 9/10 | 실습 : Millionsong Regression Pipelin | 김가경 | 발표자료 |
| Logistic Regression and Click-through Rate Predictione | 김동완 | |||
| 4 | 9/17 | |||
| 실습 : Click-through Rate Prediction Pipeline | ||||
| 5 | 9/24 | PCA and Neuroimaging | ||
| 실습 : Neuroimaging Analysis via PCA |
PART I
- 2015년 7월 2일~ 2015년 7월 30일
| 회차 | 일시 | 내용 | 발표자 | 발표자료 |
|---|---|---|---|---|
| 1 | 7/2 | Introduction to Big Data and Data Science | 최창순 | 발표자료 |
| pySpark 설치 (ipython notebook) | 최창순 | |||
| 2 | 7/9 | Spark Essentials | 김학우 | 발표자료 |
| 3 | 7/16 | Semi-Structured / Structured Data | 조혁준 | 발표자료 |
| 4 | 7/30 | pySpark를 이용한 Word Count | 최창순 | 발표자료 |
| 정규표현식 살펴보기 | 김동완 | 발표자료 | ||
| 5 | 8/6 | pySpark를 이용한 Web Server Log Analysis | 최창순 | 발표자료 |
| pySpark를 이용한 Text Analysis와 Entity Resolution(1) | 김동완 | 발표자료 | ||
| 6 | 8/13 | pySpark를 이용한 Text Analysis와 Entity Resolution(2) | 김동완 | 발표자료 |
| Introduction to Machine Learning with Apache Spark | 임성광 |
Written on August 25, 2015
