오늘은 차원의 저주에 대해서 이야기하고자 한다. 하지만 차원을 처음 접하는 독자들을 위해 1탄은 기본적인 개념 설명을 위주로 진행할 것이며 최대한 이해하기 쉽게 설명하려고 하니 혹시나 궁금한 것이 있다면 댓글 남겨주세요.
기본 지식을 알고 있어 세세한 설명이 필요 없는 사람들은 아래 링크로 GoGo~~
https://jerrykim91.tistory.com/65
2탄: 차원의 저주란? 고차원 데이터에서 발생하는 문제
자, 이제 진짜 차원의 저주에 대해서 설명하고자 한다. 차원의 저주저차원과는 달리 고차원의 경우 우리가 직관적으로 이해하는 저차원 공간과 매우 다른 성질*을 나타내는데 이걸 차원의 저주
jerrykim91.tistory.com
미리 보는 차원의 저주
AI를 공부한다면 다들 한 번쯤은 들어본 말, 차원의 저주.
우선은 아주 간단하게 차원의 저주가 무엇인지 설명하고 넘어가려고 한다.
위키백과에 따르면 '차원의 저주는 데이터의 차원이 높아질수록 알고리즘의 실행이 아주 까다로워지는 일이다.'라고 말한다.
우선, 차원의 저주를 잘 알기 위해서는 위에 보이는 어려운 단어(데이터의 차원, 알고리즘)들을 좀 짚고 넘어갈 필요가 있다.
알고리즘
알고리즘은 어떠한 문제를 풀기 위한 계산 방법이다. 데이터를 분석하거나 처리하는 방법이 알고리즘이라고 생각하면 쉽다.
예를 퍼즐로 들어보면
퍼즐 조각들은 데이터, 사람은 알고리즘, 완성된 퍼즐 그림은 사람이라는 알고리즘을 통해 나온 결과이다.
사람이 데이터(퍼즐 조각)들을 패턴이 맞는 조각과 결합해 하나의 그림(결과)을 만드는 것이다.
데이터의 차원
데이터면 데이터지... 도대체 데이터의 차원은 무슨 말일까?
쉽게 말하면 데이터의 차원은 데이터가 가지고 있는 정보의 종류가 몇 개인지를 의미한다고 보면 된다.
사람의 관한 정보들을 예로 들어 설명하자면
음, 아래와 같다.
'키' ➡️ 1차원(데이터 정보가 1개)
'키' + '몸무게' ➡️ 2차원(데이터 정보가 2개)
'키' + '몸무게'+'나이' ➡️ 3차원(데이터 정보가 3개)
위에서 언급한 퍼즐로 연계해서 설명을 하자면, (중요) 퍼즐조각이 데이터라는 것을 기억하면서
10조각짜리 퍼즐은 낮은 차원 ➡️ 낮다는 건 고려해야 할 변수가 적다는 의미
1,000조각짜리 퍼즐은 높은 차원 ➡️ 높다는 건 고려해야할 변수가 많다는 의미
라고 생각하면 될 것 같다.
차원이라는 것은 각각의 변수(특징)라고 보면 된다.
근데 왜 굳이 차원이라고 하는 것인지 궁금할 수도 있다. 차원이라는 것은 원래도 공간을 나타내는 개념이다.
우리가 흔히 알고 있는 1차원은 직선, 2차원은 평면, 3차원은 공간 이렇게 데이터도 여러 개의 정보를 가지고 있어서 차원으로 표현한다.
그 의미는 변수는 축이라고도 볼 수 있다는 의미이다.
위에서 언급한 사람의 정보를 기반해서 추가로 설명하자면
'키' ➡️ 1차원(데이터 정보가 1개) ➡️ 선으로 표현가능 ➡️ 'x축' 하나만 있는 선
'키' + '몸무게' ➡️ 2차원(데이터 정보가 2개) ➡️ 평면으로 표현가능 ➡️ 'x'축, 'y축'이 있는 평면 그래프
'키' + '몸무게' + '나이' ➡️ 3차원(데이터 정보가 3개) ➡️ 입체 그래프로 표현가능 ➡️ 'x'축, 'y축', 'z 축'이 있는 입체 그래프
여기서 우리가 잊지 말아야 하는 것은 '키'라고 해서 한 사람의 키의 정보가 아니라는 것이다. 데이터 역시 마찬가지이다.
만약에 '키' + '몸무게' + '나이'뿐 아니라 '성별' + '발사이즈'를 추가한다면 5차원이 될 것이다.
그러면 이제 공간의 확장된 개념이 될 것이다. 아, 여기서 빠진 것이 있는데, 그 4차원 이상의 경우 눈에 보이는 그래프로 표현하는 것이 어렵다.
그래프 상에서 4차원 이상의 데이터를 시각화하는 것은 불가능하지는 않지만, 직관적으로 파악하고 이해하기가 매우 어려워진다.
예를 들어, 5차원 이상의 데이터는 우리가 일반적으로 상상할 수 있는 3차원 공간에 맞춰서 보여주기가 불가능하다.
그래서 우리는 고차원 데이터를 시각적으로 표현하기 위해 다양한 기법들을 사용하지만, 그럼에도 불구하고 결국 데이터의 구조나 패턴을 이해하는 데 많은 시간이 걸리게 된다.
이렇게 데이터의 차원과 알고리즘에 대해 이해했으니, 이제는 본론인 차원의 저주에 대해서 알아보도록 하자.
>> 2탄으로
https://jerrykim91.tistory.com/65
2탄: 차원의 저주란? 고차원 데이터에서 발생하는 문제
자, 이제 진짜 차원의 저주에 대해서 설명하고자 한다. 차원의 저주저차원과는 달리 고차원의 경우 우리가 직관적으로 이해하는 저차원 공간과 매우 다른 성질*을 나타내는데 이걸 차원의 저주
jerrykim91.tistory.com
'AI' 카테고리의 다른 글
3탄: 차원의 저주 해결법! 고차원 문제를 극복하는 방법 (0) | 2025.02.28 |
---|---|
2탄: 차원의 저주란? 고차원 데이터에서 발생하는 문제 (0) | 2025.02.27 |
[AI] Generalization / Overfitting / Underfitting (7) | 2025.01.09 |
[AI] machine learning_회귀 분석 모델 (0) | 2025.01.09 |
[AI] machine learning_오차 측정 지표 (0) | 2025.01.08 |