분류 전체보기
-
representation learning은 최근 딥러닝 관련 논문들을 보다보면 쉽게 접할 수 있는 표현이다. 데이터로부터 의미 있는 표현(Representation)을 자동으로 학습하는 과정을 의미하는데, 데이터의 특징이나 패턴을 포착하고 추상화하여 보다 의미 있는 방식으로 표현하는 것을 목표로 한다. 기본적으로 표현이란 데이터의 특징, 속성, 구조 등을 나타내는 방법을 말한다. 예를 들어, 이미지에서 얼굴을 인식하는 작업(face recognition)을 수행한다면, 여기서 representation learning은 얼굴의 특징을 잘 표현하는 방법을 학습하는 것이다. 이렇게 학습된 표현은 특정 작업에 유용하게 활용될 수 있다. 이 방법은 전통적인 방법에 비해 데이터에서 자동으로 학습된 특징을 사용하..
[DL] representation learning?representation learning은 최근 딥러닝 관련 논문들을 보다보면 쉽게 접할 수 있는 표현이다. 데이터로부터 의미 있는 표현(Representation)을 자동으로 학습하는 과정을 의미하는데, 데이터의 특징이나 패턴을 포착하고 추상화하여 보다 의미 있는 방식으로 표현하는 것을 목표로 한다. 기본적으로 표현이란 데이터의 특징, 속성, 구조 등을 나타내는 방법을 말한다. 예를 들어, 이미지에서 얼굴을 인식하는 작업(face recognition)을 수행한다면, 여기서 representation learning은 얼굴의 특징을 잘 표현하는 방법을 학습하는 것이다. 이렇게 학습된 표현은 특정 작업에 유용하게 활용될 수 있다. 이 방법은 전통적인 방법에 비해 데이터에서 자동으로 학습된 특징을 사용하..
2023.07.07 -
제 1종 오류 귀무가설이 참임에도 귀무가설을 기각함으로써 발생되는 오류 제 1종 오류를 범할 확률의 최대허용한계를 유의수준 또는 위험률이라 하며, $\alpha$로 표시 제 2종 오류 귀무가설이 거짓임에도 불구하고 귀무가설을 채택함으로써 발생되는 오류 제 2종 오류를 범할 확률을 $\beta$로 나타내며, $(1-\beta)$를 검정력함수라 한다. 검정력함수의 값을 검정력이라 하는데, 이는 귀무가설이 틀린 경우에 이를 기각할 확률을 의미 제 1종 오류와 제 2종 오류의 예 한 관리자가 공장에서 나온 제품의 불량을 비교하려고 한다. 귀무 가설과 대립 가설은 다음과 같다. 귀무 가설(H0): μ1= μ2 제품이 정상이다. 대립 가설(H1): μ1≠ μ2 제품이 불량이다. 제 1종 오류 : 제품이 정상이지만 ..
[가설검정] 오류제 1종 오류 귀무가설이 참임에도 귀무가설을 기각함으로써 발생되는 오류 제 1종 오류를 범할 확률의 최대허용한계를 유의수준 또는 위험률이라 하며, $\alpha$로 표시 제 2종 오류 귀무가설이 거짓임에도 불구하고 귀무가설을 채택함으로써 발생되는 오류 제 2종 오류를 범할 확률을 $\beta$로 나타내며, $(1-\beta)$를 검정력함수라 한다. 검정력함수의 값을 검정력이라 하는데, 이는 귀무가설이 틀린 경우에 이를 기각할 확률을 의미 제 1종 오류와 제 2종 오류의 예 한 관리자가 공장에서 나온 제품의 불량을 비교하려고 한다. 귀무 가설과 대립 가설은 다음과 같다. 귀무 가설(H0): μ1= μ2 제품이 정상이다. 대립 가설(H1): μ1≠ μ2 제품이 불량이다. 제 1종 오류 : 제품이 정상이지만 ..
2023.07.05 -
skip connection이란 하나의 레이어의 output을 몇몇 layer를 건너 뛰고 input에 추가하는 것을 의미한다. 이런 구조가 제안된 이유는 신경망의 층이 깊어질 수록 나타나는 문제 때문이다. 신경망 모델의 층이 깊어지면 학습효과가 상승하지만 동시에 Vanishing Gradient 문제와 Exploding Gradient 문제가 발생한다. 갈 수록 이전 층의 정보를 잃기 때문에 일어나는데 이를 방지하기 위해 이전 층의 정보를 이후 레이어에 연결해준다.skip connection이 있는 블럭을 Residual block이라고 한다. skip connection을 이용한 대표적인 모델에는 Resnet이 있다. Autogluon(아마존에서 만든 autoML 라이브러리)에서 다층 스태킹 앙상블 ..
[DL] skip connection(스킵 커넥션)skip connection이란 하나의 레이어의 output을 몇몇 layer를 건너 뛰고 input에 추가하는 것을 의미한다. 이런 구조가 제안된 이유는 신경망의 층이 깊어질 수록 나타나는 문제 때문이다. 신경망 모델의 층이 깊어지면 학습효과가 상승하지만 동시에 Vanishing Gradient 문제와 Exploding Gradient 문제가 발생한다. 갈 수록 이전 층의 정보를 잃기 때문에 일어나는데 이를 방지하기 위해 이전 층의 정보를 이후 레이어에 연결해준다.skip connection이 있는 블럭을 Residual block이라고 한다. skip connection을 이용한 대표적인 모델에는 Resnet이 있다. Autogluon(아마존에서 만든 autoML 라이브러리)에서 다층 스태킹 앙상블 ..
2023.07.04 -
경사하강법 기반 분류 알고리즘 Logistic Regression 독립변수의 선형 결합을 이용하여 사건의 발생 가능성을 예측하는데 사용되는 통계기법이다. 사건의 발생 가능성(=확률)을 예측 하기 때문에 0과 1사이로 output 값이 제한된다. 종속변수가 범주형 데이터를 대상으로 하며, 입력 데이터가 주어졌을 때 해당 데이터의 결과가 특정 분류로 나뉘기 때문에 일종의 분류(classification)기법이다. Logistic Regression 과정 모든 피처들의 coefficients와 intercept 을 0으로 초기화 각 속성들의 값에 coefficients 를 곱해서 log-odds를 구함 Log-odds를 sigmoid 함수에 넣어서 [0, 1] 범위의 확률을 구함 계산한 확률값과 실제 labe..
[ML] Logistic Regression(로지스틱 회귀)경사하강법 기반 분류 알고리즘 Logistic Regression 독립변수의 선형 결합을 이용하여 사건의 발생 가능성을 예측하는데 사용되는 통계기법이다. 사건의 발생 가능성(=확률)을 예측 하기 때문에 0과 1사이로 output 값이 제한된다. 종속변수가 범주형 데이터를 대상으로 하며, 입력 데이터가 주어졌을 때 해당 데이터의 결과가 특정 분류로 나뉘기 때문에 일종의 분류(classification)기법이다. Logistic Regression 과정 모든 피처들의 coefficients와 intercept 을 0으로 초기화 각 속성들의 값에 coefficients 를 곱해서 log-odds를 구함 Log-odds를 sigmoid 함수에 넣어서 [0, 1] 범위의 확률을 구함 계산한 확률값과 실제 labe..
2023.07.03 -
머신러닝에서 분류 모델(Classification Model)은 입력 데이터를 사전에 정의된 클래스 레이블로 분류하는 작업을 수행하는 모델이다. 분류 모델은 지도학습(Supervised Learning)의 한 종류로, 입력 데이터와 해당 데이터의 클래스 레이블이 주어지는 학습 데이터를 사용하여 모델을 학습시킨다. 그리고 학습된 모델을 사용하여 새로운 입력 데이터의 클래스 레이블을 예측하거나 분류한다. 분류 모델은 다양한 알고리즘과 기법을 사용하여 구현될 수 있다. 다양한 분류 모델 경사하강법 기반 알고리즘 Logistic Regression SGD Classifier Artificial Neural Networks(ANNs): 신경망 확률 기반 알고리즘 LDA(Linear Discriminant Anal..
[ML] 분류 모델(Classification Model)머신러닝에서 분류 모델(Classification Model)은 입력 데이터를 사전에 정의된 클래스 레이블로 분류하는 작업을 수행하는 모델이다. 분류 모델은 지도학습(Supervised Learning)의 한 종류로, 입력 데이터와 해당 데이터의 클래스 레이블이 주어지는 학습 데이터를 사용하여 모델을 학습시킨다. 그리고 학습된 모델을 사용하여 새로운 입력 데이터의 클래스 레이블을 예측하거나 분류한다. 분류 모델은 다양한 알고리즘과 기법을 사용하여 구현될 수 있다. 다양한 분류 모델 경사하강법 기반 알고리즘 Logistic Regression SGD Classifier Artificial Neural Networks(ANNs): 신경망 확률 기반 알고리즘 LDA(Linear Discriminant Anal..
2023.07.03 -
여러 가지 데이터타입이 혼합된 데이터프레임에서 int로 구성된 열만 추출하고 싶을 때 예시 코드 import pandas as pd # 예시 데이터프레임 df = pd.DataFrame({ '이름': ['Alice', 'Bob', 'Charlie'], '나이': [25, 30, 35], '성별': ['여성', '남성', '남성'], '키': [160, 175, 180] }) # int로 구성된 열만 추출 int_columns = df.select_dtypes(include='int').columns # 결과 출력 print(int_columns)
[pandas] 데이터프레임에서 int로 구성된 열만 추출여러 가지 데이터타입이 혼합된 데이터프레임에서 int로 구성된 열만 추출하고 싶을 때 예시 코드 import pandas as pd # 예시 데이터프레임 df = pd.DataFrame({ '이름': ['Alice', 'Bob', 'Charlie'], '나이': [25, 30, 35], '성별': ['여성', '남성', '남성'], '키': [160, 175, 180] }) # int로 구성된 열만 추출 int_columns = df.select_dtypes(include='int').columns # 결과 출력 print(int_columns)
2023.07.03