something else

정밀도(Precision)와 재현율(Recall)이 헷갈린다면?

게으른 the lazy 2022. 12. 13. 21:31

 

두줄요약

정밀도: 모델의 결과를 믿을 수 있는가? (모델이 Positive라고 말한 걸 얼마나 믿을 수 있는가?)

재현율: 모델의 결과가 재현성이 있는가? (Positive를 모델에 넣으면 Positive라고 나오는가?)

 


 

정밀도

- 모델의 결과가 얼마나 정밀(precise)한가?

- 모델의 결과가 정확하고 치밀하고 빈틈이 없는가?

- 모델의 결과를 믿어도 되는가?

- 모델이 Positive라고 말하는 것은 정말 Positive인가?

- 정밀도가 낮은 경우: False Positive가 많은 경우 (예: 의심스러우면 무조건 암이야!)

- 즉, 모델 결과물의 신뢰도가 낮으면 정밀도가 낮다.

 

 

재현율

- 모델이 얼마나 일관적인가?

- 모델에 비슷한 입력을 넣으면 비슷한 결과가 나오는가?

- 모델 자체가 재현성을 갖는가?

- Positive를 넣으면 정말 Positve로 나오는가?
- 재현율이 낮은 경우: False Negative가 많은 경우 (예: 완전 확실한 것만 암이야!)

- 즉, 모델이 놓치는 것이 많으면 재현율이 낮다.

 


 

일반적으로 정밀도보다 재현율이 더 중요하다.

예를 들어,

건강한 사람을 암환자로 의심하는건 그럴 수 있지만 (재검해보면 되니까)

암환자를 놓치면 큰일난다.

즉, 쓸데없이 잡아내는 게 많을지언정 놓치는 것은 없어야 한다. (법은 둘다 못하던데)

 

 

- 게으른

 

 

같이 읽기

숨니의 무작정 따라하기 - 분류성능평가지표 - Precision(정밀도), Recall(재현율) and Accuracy(정확도)

Data berry - 정밀도(precision)와 재현율(recall) 오차행렬 안 헷갈리는 방법, 분류모델 평가지표

공돌이의 수학정리노트 - 1종 오류와 2종 오류

다크프로그래머 - precision, recall의 이해