Bias와 Variance
·
ML_DL/딥러닝 공부하기
Bias란? 편향이라는 뜻의 Bias는 (실제값 - 예측값)의 평균이다. $[\hat{f}(x)] = E[\hat{f}(x) - f(x)]$ Variance란? 분산이라는 뜻의 variance는 예측값의 변화 정도이다. $Var[\hat{f}(x)]=E[(\hat{f}(x)−E[\hat{f}(x)])^2]=E[\hat{f}(x)^2]−E[\hat{f}(x)]^2$ Bias와 Variance의 관계 low bias & low variance : 예측값이 정답에 가깝고(편향 낮음) 그 값들이 모여있다(분산 낮음). low bias & high variance : 예측값이 정답에 가깝고(편향 낮음) 그 값들이 퍼져있다(분산 높음). high bias & low variance : 예측값이 정답과 멀고(편향 높..
MUJAKJUNG - 개와 고양이 분류
·
ML_DL/MUJAKJUNG (무작정 시리즈)
1. 라이브러리 정의 import pandas as pd import numpy as np import matplotlib.pyplot as plt import os import tensorflow from tensorflow import keras 2. 데이터 확인 # 데이터 확인하기 data_path = "./cats_and_dogs/" for idx in range(1,5): plt.subplot(2,2,idx) img = plt.imread(data_path + "cats/cat_" + f"{idx}.jpg") plt.imshow(img) 3. 이미지 데이터 전처리 각 이미지를 image.load_img를 통해 PIL.Image.Image 형태로 불러온다. image를 img_to_array를 통..
무작정 시리즈의 시작
·
ML_DL/MUJAKJUNG (무작정 시리즈)
개와 고양이를 분류하는 모델은 예제로 많이 다루었잖아! 쉽잖아! 바로 할 수 있지? 무작정 시리즈의 시작은 이 질문이었다. 과연 나는, 비어있는 jupyternotebook의 마지막에, 개와 고양이를 분류한 결과를 출력할 수 있을까. 단숨에 MUJAKJUNG이라는 파일 이름을 정하고는 코드를 작성하기 시작했다. 무언가를 하려면, 또 무언가를 안다고 말하려면 아이러니하게도 '아는 것과 모르는 것'을 명확히 해야 한다. 목표를 이루기 위해 코드 작성을 이어나가면서, 새로 배운것과 더해지는 지식들은 별도로 정리해보려고 한다.