์ ์ฒด ๊ธ + 29

Chapter 8. Linear Algebra
2023.04.13
Linear Algebra / ์ ํ๋์ํ - matrix์ ์ํ - ๋ฐ์ดํฐ ๊ณผํ์์ ์ค์ํ ์ญํ n * m matrix๊ฐ ๋ํ๋ผ ์ ์๋ ๊ฒ row column Data object features Geometric Point Sets point dimensions Systems of equations equations ๊ฐ ๋ณ์์ coefficient - Graphs/Networks: M[i, j] = vertex i -> vertex j edge ๊ฐ์ - Vectors: any row, column or d*1 matrix Vector ์ฌ์ด์ ๊ฐ - ๋ฒกํฐ A์ B ์ฌ์ด์ ๊ฐ๋ - cos(0) = 1 ---> perfect similarity = 0 - cos(pi/2) = 0 ---> ๊ด๋ จ์ด ์๋ค - ..

Chapter 7. Mathematical Models
2023.04.12
Data Science Analysis Pipeline - Modeling: ์์ธก์ ํ ์ ์๋ ๋๊ตฌ๋ก ์ ๋ณด๋ฅผ ๊ฐ์ธ๋ ๊ณผ์ - ํต์ฌ ๊ณผ์ : building, fitting, validating the model Philosophies of Modeling 1. Occam's Razor - 14์ธ๊ธฐ ์๊ตญ ์๋์น - ๋ป: ๊ฐ์ฅ ๋จ์ํ ์ค๋ช
์ด ๊ฐ์ฅ ์ข๋ค. - ๊ฐ์ฅ ์ ์ ๊ฐ์ ์ ๋ง๋๋ ๋ต์ ์ ํํด์ผ ํ๋ค. -> ๋ชจ๋ธ์์ parameter์ ์๋ฅผ ์ค์ฌ์ผ ํจ์ ์๋ฏธ - LASSO/ridge regression ๋ฑ์ ๋จธ์ ๋ฌ๋ ๊ธฐ๋ฒ์ ํผ์ณ๋ฅผ ์ต์ํํ๊ธฐ ์ํด penalty function์ ์ฌ์ฉ -> ๋ถํ์ํ coefficient๋ฅผ ์ต์ํ 2. Bias-Variance Tradeoffs - "๋ชจ๋ ๋ชจ๋ธ์ ํ๋ฆฌ๋ค. ๊ทธ๋ ์ง..

Chapter 6. Visualizing Data
2023.03.27
Exploratory Data Analysis - ๋ฐ์ดํฐ๋ฅผ ์์ธํ ์ดํด๋ณด๋ ๊ฒ์ด ์ค์ํ ์ด์ * ๋ฐ์ดํฐ ์์ง, ์ ์ฒ๋ฆฌ์์์ ์ค์ ๊ตฌ๋ณ * ํต๊ณ์ ๊ฐ์ ์ ์ด๊ธฐ๋ ๊ฒฝ์ฐ๋ฅผ ํ์
* ๋ฐ์ดํฐ ํจํด ํ์ * ๊ฐ์ค ์ค์ Anscombe's Quartet - ๊ฐ์ ํ๊ท , ํธ์ฐจ, ์๊ด๊ด๊ณ, ํ๊ท์ง์ ์ ๊ฐ์ง์ง๋ง ๋ฐ์ดํฐ์ ๋ถํฌ ๋ชจ์ ์์ฒด๊ฐ ๋งค์ฐ ๋ฌ๋ผ์ง ์ ์์. Mapping Data to Image - ํจ์จ์ฑ ์์: ์์น > ๊ธธ์ด > ๊ธฐ์ธ๊ธฐ, ๊ฐ๋ > ๋ฉด์ > ์ ์งํ๊ธฐ > ์, ๋ชจ์ - ๋ฉด์ , ์ ์งํ๊ธฐ ๋ฐ์ดํฐ๋ ordinal data์ ์ฌ์ฉ ๊ฐ๋ฅ - ์๊ทธ๋ํ๋ ๋ฉด์ ๊ณผ ๊ฐ๋๋ฅผ ๊ฐ์ด ์ฌ์ฉํ์ง๋ง, ๋๋ ๊ทธ๋ํ๋ ๊ฐ์ด๋ฐ๊ฐ ๋น์ด์์ผ๋ฏ๋ก ๊ฐ์ด ์๋ต๋ ํํ๋ค. - ๊ฐ์ฅ ๋นํจ์จ์ ์ธ ์๊ฐํ ์ฌ๋ก - ์์ ์ฐ์ ์์๋ฅผ ๊ฒฐ์ - ์ง๋์น๊ฒ ..

Chapter 5. Statistical Analysis
2023.03.26
Central Dogma of Statistics Statistical Data Distributions - ๋ชจ๋ random variable์ ํน์ ๋น๋/ํ๋ฅ ๋ถํฌ๋ฅผ ๊ฐ๋๋ค. - ์ข
๋ฅ: binomial distribution, normal distribution, poisson distribution, power law distribution Classical Distribution์ ์ค์์ฑ - ์ค์ ๋ก ์ฌ์ฉํ๋ ๊ฒฝ์ฐ๋ ์์ - Closed-form formula(cdf, pdf), test(t-test) ๋ฑ์ ์ด์ฉ ๊ฐ๋ฅ - ๋ชจ์์ด ๋น์ทํ๋ค๊ณ ์ด๋ฌํ ๋ถํฌ์ ๊ฐ๋ค๊ณ ์๊ฐํ๋ฉด ์ ๋๋ค. Binomial Distribution - n๊ฐ์ independent trial๋ก ์ด๋ฃจ์ด์ง ์คํ -> 2๊ฐ์ง์ ๊ฒฐ๊ณผ๋ฅผ ๊ฐ..

Chapter 4. Scores and Rankings
2023.03.25
Scores and Rankings - Scoring functions: ๋ค์ฐจ์ ๋ฐ์ดํฐ๋ฅผ ๋จ์ผ ๊ฐ์ผ๋ก ๋ณ๊ฒฝํ์ฌ ํน์ ์ฑ์ง์ ๊ฐ์กฐํ๋ ๋ฐฉ๋ฒ - Rankings: ์ ์๋ฅผ ์ ๋ ฌํ์ฌ ํญ๋ชฉ์ ์์๋ฅผ ๋งค๊น Assigning Grades - ํ์ ์ scoring function์ผ๋ก ๋ถ์ฌ๋๋ค. - ํน์ง: ์์์ฑ (๊ต์๋๋ง๋ค ๊ธฐ์ค์ด ๋ค๋ฆ), validation data ์์ ("์ณ์" ๋ฑ๊ธ์ ์์), general robustness (๋ค๋ฅธ ์์
์ด์ด๋ ํ์๋ง๋ค ํ์ ์ ๋น์ท๋น์ทํจ) Scoring vs. Regression - gold standard/right answer๊ฐ ์๋ค. - ๋จธ์ ๋ฌ๋์์ ์ ํ ํ๊ท ๊ฐ์ ๊ฒฝ์ฐ๋ scoring function์ ํ์ต์ํฌ ์ ์์ง๋ง ๋ณดํต ๊ทธ๋ฌ์ง ์๋๋ค. BMI ์ง์ - BMI = m..