본문 바로가기
반응형

Study/Machine&Deep Learning17

[ML] Training and Test datasets 수 많은 data가 있으면 그 모든 데이터를 학습하는데 사용하지 않고 일부분은 따로 떼어 test하는 곳에 사용하게 된다. data를 학습하는 것을 training, training한 data를 사용하여 결과를 확인해보는 data를 test라고 한다. 소스 코드를 보고 이해해 보자. 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152import tensorflow as tf x_data = [[1, 2, 1], [1, 3, 2], [1, 3, 4], [1, 5, 5], [1, 7, 5], [1, 2, 5], [1, 6, 6], [1, 7, 7]]y_data = [[0, 0, 1], [0.. 2018. 6. 3.
[ML] Overfitting and Regularization Overfitting - Our model is very goot with training data set (with memomrization), but not good at test dataset or in real use model 1은 일반적인 model이지만, model2는 가지고 있는 데이터에만 적합한 model이다. model2와 같은 것을 overfitting이라고 한다. 그러면 overfitting을 어떻게 줄일까? - training data를 늘린다. - features의 수를 줄인다 - Regularization(일반화) Regularization cost function 뒤에 term을 붙여준다. regularization strength가 0이 되면 regularization을 쓰.. 2018. 6. 3.
[ML] Learning rate Learning rate Large learning rate : overshooting learning rate의 값이 너무 커버리면 이동을 매우 많이 하게 된다. 그렇게 되면 cost값이 숫자가 아닌 값들이 출력될 수 있다. Small learning rate : takes too long, stops at local minimum learning rate의 값이 너무 적으면 이동이 매우 적게 된다. 그렇게 되면 시간이 너무 많이 걸리거나, 이동을 하다가 시작이 지나면 cost가 최저점이 아닌데도 불구하고 멈추게 된다. 그럼 어떻게 해야할까? learning rates을 여러번 시도해보자. (시작은 0.01이 정도~~) 2018. 6. 3.
[ML] Fancy Softmax Classifier Fancy Softmax Classifier 우선 one_hot과 reshape에 대해서 알아보자. one_hot encoding은 softmax로 구한 값 중 가장 큰 값을 1, 그 외의 값을 0으로 encoding한다. reshape은 무엇일까? 위 그림을 보자. 맨 끝에 Y값을 보면 0~6 까지의 값이 나와있다. 이것은 one_hot의 형태가 아니다. 그러므로 이 값을 reshape을 사용하여 one_hot 형태로 바꿔줄 수 있다. 예를들어 0은 1000000 으로, 3은 00010000 으로 말이다. [[0], [3]]은 [[1000000], [0001000]]이 된다. 다시 한번 보면, 처음 Y의 값은 shape(?, 1)이 된다. 행은 ? 열은 1 one_hot을 한번 하게 되면 [[[1000.. 2018. 5. 31.
[ML] Softmax classifier Softmax의 기본 Scores --> probabilities Softmax 'ONE-HOT' Encoding을 통해 가장 큰 값을 제외한 값을 0으로 바꾸고 가장 큰 값을 1로 바꿈. Softmax Classifier의 Cost function 값이 일치하면 0, 그렇지 않으면 무한대로 간다. arg_max : 새로운 값(리스트)를 던져주고 함수의 인자에 따라 몇 번째 인덱스에 존재하는지를 반환해주는 함수. arg_max(a, 1)의 뜻은 a에서 1번째 값, 즉 가장 큰 값을 찾으라는 것을 말한다. [1, 11, 7, 9]에서 가장 큰 값의 인덱스는 1이기 때문에 1을 반환하게 된다. 소스 코드 1234567891011121314151617181920212223242526272829303132333.. 2018. 5. 29.
[ML] Logistic Classification 소스 코드 logistic_regression.py123456789101112131415161718192021222324252627282930313233343536373839404142434445464748# Lab 5 Logistic Regression Classifierimport tensorflow as tf x_data = [[1, 2], [2, 3], [3, 1], [4, 3], [5, 3], [6, 2]]y_data = [[0], [0], [0], [1], [1], [1]] # placeholders for a tensor that will be always fed.X = tf.placeholder(tf.float32, shape=[None, 2])Y = tf.placeholder(tf.flo.. 2018. 5. 20.
반응형