목록Coursera (10)
무냐의 개발일지
1. Stacks (LIFO) 쌓여있는 형태 (책을 쌓아놓은 형태) 나중에 들어간게 먼저 나온다 Abstract data type - Push (Key) : adds key to collection - Key Top() : returns most recently-added key - Key Pop() : removes and returns most recently-added key - Boolean Empty() : are there any elements? stack은 이 balance를 track 하기 좋은 방법이다 이용 : compiler, 많은 알고리즘에 사용된다 모든 짝이 맞을 때 pop하면서 사라지는 코드 Push(a) - Push(b) - Top() : b - Push(c) - Pop() :..
1. Array - 특징 : Contiguous area of memory, equal-size elements, Indexed by contiguous integers (보통은 0에서 시작하지만, 이렇게 1에서 시작도 가능) - 장점 : We have Constant time access to elements, either read or write. 언제든 특정 칸을 읽을수도, 쓸수도 있음 - address가 있음 EX) Address of the Element i ? = array address + ( element_size * (i - first index)) = array address + 7*(4 - 1) 이렇게 하면 4번의 access 를 얻을 수 있다 Q) A) 1000 + 8*(6-0) =..
1. Decision Trees - 과제에 따라 분류를 시작할거임 - 왼쪽으로 갈지, 오른쪽으로 갈지 결정을 하는 거임 - 가장 최적의 decision tree를 선택하는 게 우리의 과제임 - features : few discrete values - labels : binary | 결정할 중요한 요인 1. How to choose what feature to split on at each node? (to Maxize purity - 순수하게 하나의 클래스만 하위결과로 나오도록) 2. When do you stop splitting? (When node is 100% one class, When splitting a note will result in tree exceeding a max depth 너..
1. 머신러닝 팁 (Advice for applying Machine Learning) 머신러닝을 더 효율적으로 구축하는 방법 * Diagnostic : learning 알고리즘에서 어떤 게 작동하고, 안하는지 확인하고, 성능을 높일 수 있는 가이드를 얻기 위한 작업 | Model Evaluation 모델 성능 확인하는 방법을 배워보자! (아는거) * Train 데이터와 Test 데이터 나누는 거 (기본) - 현재 training set에 완벽하게 맞았다고 해도, 새로운 형태의 데이터에는 안 맞을 수 있잖아. - 데이터를 train, test로 나눠서 을 나눈다 - 훈련에 사용되지 않은 데이터로 테스트하여 맞는 모델을 잘 선택하는 방법 (기본) 1) Regression 문제에서의 활용 : cost fun..
1. Neural Network Training | 훈련 단계 1) 모델을 지정해준다 (주어진 파라미터 w,b 를 가지고 output을 어떻게 계산할지 결정한다) 2) 특정 손실함수 지정해서 모델을 compile(엮어준다) (숫자 확인 시, binary classification 문제가 된다. *compile 단계 : 사용할 손실함수(오차함수)를 정해준다 *비용함수, 손실함수의 차이 - loss function : single trianing에서 계산한 오차함수 - cost function : 전체 훈련 세트에 대해 계산된 loss function의 평균 * binary cross entropy loss function (교차 엔트로피 함수임, 이진분류 문제인 걸 강조하려고 binary를 써줌) 3) 모..
| Time series data의 유형, 예시, 특징 seasonality, trends, noise 등을 감안하여 예측 데이터 예시) 태양의 흑점(sun spot), 날씨 온도, 주식 등 | 목차 1주차 : Time series 확인하기 2주차 : dense모델 3주차 : RNN(recurrent neural network) 4주차 : Convolution * Multivariate Time Series : 다양한 변수를 동시에 확인 (시간대별로 출생률, 사망률을 동시에 보는 식으로 다변량으로 확인) | Time Series에 머신러닝 적용하는 방법 1) 미래 수치를 예측하기 2) Imputation : 과거 데이터를 분석해서, 어떻게 현재 상황이 생겼는지 추론/ 누락된 데이터를 대체를 통해 채울 수..
| 목차 Neural Networks -inference(prediction) -training -practival advice for building machine learning systems -Decision Trees 1. Neural Network 가 무엇인가? | Neurons and the brain 시작 : 인간의 뇌를 모방한 software algorithms 를 만들자! 적용 : speech recognition -> image (computer vision) 에 적용되기 시작했다 -> text (NLP) 까지 오고 있다. 뇌의 작동원리 : 뉴런에서 다른 뉴런으로 전류자극을 보낸다. Neural network가 사용되는 예시를 살펴보자! | EX1) Demand prediction in..
| Classification (분류, Supervised Learning의 또 다른 타입) : Linear Regression이 적절하지 않은 데이터 타입에 사용한다 : Use Classification where your output variable y can take on only one of a small handful of possible values instead of any number in an infinite range of numbers. (ex. Binary classification 같은 Yes or No 문제) - negative class (false, 0) - positive class (true, 1) >> Classification 문제는 linear regression이 ..