머신러닝을 공부하다 보면
선형 회귀(Linear Regression) 와 로지스틱 회귀(Logistic Regression) 를
가장 먼저 만나게 됩니다.
이름을 보면 둘 다 "회귀"라는 단어가 붙어 있어서 헷갈리기 쉬운데요.
대체 왜 둘 다 회귀라 부를까요?
그리고 둘의 차이는 무엇일까요?

왜 둘 다 "회귀"일까?
"회귀"라는 말은 입력 데이터와 출력값 사이의 관계를 수학적으로 찾아내는 것을 뜻합니다.
즉, 두 알고리즘 모두 데이터 안의 패턴을 찾고 "예측"을 수행한다는 공통점이 있습니다.
하지만 결정적인 차이는 "무엇을 예측하는가" 에 있습니다.
바로 이 부분에서 선형 회귀와 로지스틱 회귀가 갈라지죠.
선형 회귀: 숫자를 예측하는 계산기
선형 회귀는 말 그대로 연속적인 수치 값을 예측합니다.
여러 가지 특징(변수)을 바탕으로 직선을 그려서, 그 직선에 가장 가까운 값을 뽑아내는 방식이죠.
예시를 들어 볼까요?
- 집값은 얼마일까? → 1억 123만원
- 오늘 기온은 몇 도일까? → 32.12도
- 학생의 시험 점수는 몇 점일까? → 87점
이처럼 결과는 언제나 숫자로 나옵니다.
그래서 선형 회귀는 흔히 "직선을 그려서 값을 예측하는 모델" 로 불립니다.
로지스틱 회귀: 분류하는 확률기
반면 로지스틱 회귀는 숫자 그 자체보다는 분류(classification)가 목적입니다.
겉보기에는 선형 회귀처럼 특징을 보고 점수를 계산하지만,
그 점수를 그대로 쓰지 않습니다.
대신 시그모이드 함수(Sigmoid function) 라는 것을 사용해서
값을 0과 1 사이의 확률로 변환합니다.
자, 여기서 시그모이드 함수는
S자 모양 곡선으로, 입력값을 확률로 "압축"해 주는 역할을 합니다.
시그모이드를 적용하게 되면 값의 확률이 0.5 이상이면 ‘Yes’,
0.5 미만이면 ‘No’ 같은 식으로 이분화가 가능합니다.
예를 들어볼까요?
- 이 이메일은 스팸일까, 아닐까?
- 이번 시험에 합격일까, 불합격일까?
- 사진 속 동물은 강아지일까, 고양이일까?
로지스틱 회귀는 단순히 “강아지다!” 하고 대답하는 게 아니라
“강아지일 확률: 80%” 처럼 가능성(확률) 을 알려주는 모델인 겁니다.
정리하자면 같은 회귀, 다른 결과
- 선형 회귀: 데이터를 보고 연속적인 숫자를 예측 (예: 집값, 기온, 점수)
- 로지스틱 회귀: 데이터를 보고 범주(클래스) 를 확률 기반으로 분류 (예: 스팸 여부, 합격 여부, 동물 종류)

즉, 둘 다 관계를 찾아내는 "회귀"지만,
선형 회귀는 수치 예측, 로지스틱 회귀는 확률 기반 분류라는 점에서 큰 차이가 있습니다.
| 특징 | 선형 회귀 (Linear Regression) | 로지스틱 회귀 (Logistic Regression) |
|---|---|---|
| 목표 | 연속적인 값(예: 주택 가격, 온도)을 예측합니다. | 이산적인 범주(예: 합격/불합격, 0/1)로 분류합니다. |
| 종속 변수 | 연속적인 실수 값 | 범주형 값 (보통 이진 값: 0 또는 1) |
| 함수 형태 | 직선 형태 (Linear) | 시그모이드 함수 (Sigmoid function)를 사용합니다. |
이제 우리는 선형 회귀와 로지스틱 회귀를 이렇게 알면 됩니다.
선형 회귀는 예측선을 따라 숫자를 알려주는 모델이고
로지스틱 회귀는 시그모이드를 통해 범주(분류) 를 말해주는 모델이라는 것이지요.
비슷해 보이지만 쓰임새는 완전히 다르죠.
이제는 구분이 쉽겠죠?
혹시 ‘왜 로지스틱 회귀가 필요했을까?’ 궁금하지 않으세요?
저도 공부하면서 정말 그 이유가 궁금했답니다.
아래 링크에서 그 탄생 배경을 찬찬히 살펴보세요
https://jerrykim91.tistory.com/84
확률로 세상을 해석한 첫 모델, 로지스틱 회귀
로지스틱 회귀가 생긴 이유 머신러닝을 공부하다 보면선형 회귀(Linear Regression) 와 로지스틱 회귀(Logistic Regression) 라는두 모델을 자주 만나게 됩니다.이름이 비슷하다 보니 “둘 다 회귀 아닌가?
jerrykim91.tistory.com
로지스틱 회귀가 생긴 이유 머신러닝을 공부하다 보면선형 회귀(Linear Regression) 와 로지스틱 회귀(Logistic Regression) 라는두 모델을 자주 만나게 됩니다.이름이 비슷하다 보니 “둘 다 회귀 아닌가?
자, 마지막으로 정리해보자면
- 선형 회귀: 연속적인 숫자 예측에 적합
- 로지스틱 회귀: 선형 회귀의 한계를 극복하고 확률 기반 분류를 위해 탄생
즉, 선형 회귀가 분류 문제에 실패했기 때문에, 로지스틱 회귀가 만들어진 것입니다.
이제는 더 이상 헷갈리지 않겠죠? 🙂
Reference.
- [KR] 딥러닝 텐서플로 교과서 → https://thebook.io/080263/0099/
'AI' 카테고리의 다른 글
| 확률로 세상을 해석한 첫 모델, 로지스틱 회귀 (0) | 2025.10.16 |
|---|---|
| 비전 AI에서 자주 만나는 ‘백본(Backbone)’ 이야기 (0) | 2025.09.29 |
| 인공 신경망(ANN / NN), 딥러닝의 심장!! (0) | 2025.09.25 |
| 3탄: 차원의 저주 해결법! 고차원 문제를 극복하는 방법 (0) | 2025.02.28 |
| 2탄: 차원의 저주란? 고차원 데이터에서 발생하는 문제 (0) | 2025.02.27 |