반응형

AI 6

3탄: 차원의 저주 해결법! 고차원 문제를 극복하는 방법

3탄: 차원의 저주 해결법! 고차원 문제를 극복하는 방법 자, 이제 차원의 저주에 대해서도 알아보았으니 차원의 저주 해결 방법에 대해서도 알아보도록 하자.  혹시나 차원의 저주에 대해서 보지 않은 분은 아래 링크로 GoGo~~https://jerrykim91.tistory.com/65 2탄: 차원의 저주란? 고차원 데이터에서 발생하는 문제자, 이제 진짜 차원의 저주에 대해서 설명하고자 한다. 차원의 저주저차원과는 달리 고차원의 경우 우리가 직관적으로 이해하는 저차원 공간과 매우 다른 성질*을 나타내는데 이걸 차원의 저주jerrykim91.tistory.com    차원의 저주 해결 방법차원의 저주를 해결하는 방법에는 다양한 방법이 있다. 차원 축소, 특성선택 등 여러방법이 있다. 가볍게 살펴보도록 하자..

AI 2025.02.28

2탄: 차원의 저주란? 고차원 데이터에서 발생하는 문제

2탄: 차원의 저주란? 고차원 데이터에서 발생하는 문제 자, 이제 진짜 차원의 저주에 대해서 설명하고자 한다. 차원의 저주저차원과는 달리 고차원의 경우 우리가 직관적으로 이해하는 저차원 공간과 매우 다른 성질*을 나타내는데 이걸 차원의 저주라고 한다.차원의 저주는 데이터의 차원이 증가하면서 성능이 안 좋아 지는 현상을 말하는 것이다.매우 다른 성질*거리 균등화, 데이터 희소성, 차원 간 상호작용의 복합성, 모델의 과적합 위험, 시각화의 어려움    그럼, 차원이 많아지면 왜 어려워질까?우리가 문제를 생각할 때 보통 2D(종이) 위에서 점을 찍거나 선을 그리면서 생각을 한다.근데 만약 이걸 3D(입체 공간) 으로 확장하면? 머릿속에서 상상하기가 조금 어려워진다. 물론! 쉬운 사람도 있지만 대체적으로는 어..

AI 2025.02.27

1탄 : 차원이란 무엇인가? 차원의 저주를 보기전 차원의 개념부터 이해하기

오늘은 차원의 저주에 대해서 이야기하고자 한다. 하지만 차원을 처음 접하는 독자들을 위해 1탄은 기본적인 개념 설명을 위주로 진행할 것이며 최대한 이해하기 쉽게 설명하려고 하니 혹시나 궁금한 것이 있다면 댓글 남겨주세요. 기본 지식을 알고 있어 세세한 설명이 필요 없는 사람들은 아래 링크로 GoGo~~https://jerrykim91.tistory.com/65 2탄: 차원의 저주란? 고차원 데이터에서 발생하는 문제자, 이제 진짜 차원의 저주에 대해서 설명하고자 한다. 차원의 저주저차원과는 달리 고차원의 경우 우리가 직관적으로 이해하는 저차원 공간과 매우 다른 성질*을 나타내는데 이걸 차원의 저주jerrykim91.tistory.com     미리 보는 차원의 저주AI를 공부한다면 다들 한 번쯤은 들어본..

AI 2025.02.27

[AI] Generalization / Overfitting / Underfitting

머신러닝에서의 Overfitting과 Underfitting, 그 균형 잡기머신러닝 모델을 학습할 때, 두 가지 큰 문제를 만날 수 있습니다. 바로 Overfitting (과대적합)과 Underfitting (과소적합)인데요. 이 두 현상은 모델의 성능에 중요한 영향을 미치기 때문에, 이를 잘 이해하고 해결하는 방법을 아는 것이 중요합니다.자 그럼, 하나씩 알아보겠습니다. 1. 일반화란?먼저, '일반화(Generalization)'라는 개념부터 짚고 넘어가죠. 일반화란, 모델이 훈련 데이터뿐만 아니라 보지 못한 새로운 데이터에 대해서도 잘 예측할 수 있는 능력을 말합니다.훈련 데이터를 통해 모델을 학습한다고 해서, 그 모델의 성능이 진짜 잘 만든 모델이라고 할 수는 없습니다. 중요한 것은, 훈련 데이터에..

AI 2025.01.09

[AI] machine learning_회귀 분석 모델

회귀 분석 모델 (Regression Models) 1) Ridge Regression (릿지 회귀) Ridge 회귀는 L2 정규화를 사용하여 과적합을 방지하는 회귀 분석 기법으로선형 계수를 작게 만들어서 과대적합을 완화, 비교적 효과가 좋다.좀 더 쉽게 말하면,모델의 복잡도를 줄이기 위해 가중치에 대한 패널티를 부여하는 것이다.  (특히 다중 공선성 문제를 해결할 때 유용)여기서 L2 정규화는 가중치의 제곱합을 최소화하는 방식이다. 자세한건 다음에 추가로 설명하겠다. from sklearn.linear_model import Ridgeridge = Ridge()ridge.fit(x, y)print(ridge.score(x, y))릿지와 라쏘모델 사용할 때 규제의 양을 임의로 조절 가능하다.alpha는 ..

AI 2025.01.09

[AI] machine learning_오차 측정 지표

machine learning 각 지표에 대해서 알아보고자 한다.(글 보정 후 분리 예정)오차 측정 지표 (Error Metrics)1) Mean Absolute Error - MAE(평균 절대 오차)실제 값과 예측 값의 차이를 절대값으로 변환해 평균화 한 것 으로 회귀 모델의 평균 절대 오차값을 계산 한다.그렇기 때문에 결과가 MAE값 만큼 평균적으로 target 데이터와 다르다.해당 함수의 첫번째 매개변수는 타겟, 두번째 매개변수는 예측값 전달된다.에러에 절대값을 취하기때문에 에러의 크기가 그대로 반영된다.에러에 따른 손실이 선형적으로 올라 갈때 적합하다.이상치가 많을 때 사용한다. MAE = np.mean(np.abs(y - y_pred)) sklearn 사용from sklearn.metrics i..

AI 2025.01.08
반응형