읽記 (데이터 과학, IT 분야)/Head First Data Analysis

[HFDA] 3. 최적화 / 최대한 가져가기

Light Pillar 2019. 11. 18. 13:48

데이터는 두 가지로 분류할 수 있다. 통제할 수 있는 것, 통제할 수 없는 것.

 

제약은 통제 가능한 변수를 제한한다. 이러한 고려 사항을 제한 조건이라고 한다.

왜냐하면 제한이 문제에 대한 인자를 조절하기 때문이다.

제약은 최적화를 위한 방법을 알려주지 않는다. 다만 최적화를 위해 할 수 없는 것들을 알려줄 뿐이다.

반면 결정 변수는 통제할 수 있는 변수이다. 제한 조건을 충족하는 범위 내에서 최적화 방안을 선택할 수 있다.

 

다른 값들을 변경해 가며, 원하는 값을 가능한 크게(또는 작게)하고 싶어 하는 것을 최적화 문제라 한다.

최적화 문제를 해결하려면 결정 변수, 제한 조건, 그리고 최대화할 것을 목적 함수로 정리할 필요가 있다.

최대화 또는 최소화할 '무엇'을 목적이라 하고, 이 목적에 대한 최적의 결과를 찾아내기 위해 목적 함수를 사용한다.

 

 목적 함수

( C1 · X1 )  +  ( C2· X2 )  =  P     ( C : 제약,  X : 결정 변수,  P : 목적 )

제한 조건에 각각의 결정 변수를 곱하여 최대의 P를 얻어야 한다.

 


수학에서의 최적화는 어떤 제약조건이 있을 수도 있는 상황에서 함수의 최대치와 최소치를 찾는 것이다.

보통 이 최적화 문제는 우리 일상에서 당연한 듯이 사용하고 있는 개념이다. 흔하게 사용하는 '최대의 효과', '최소의 비용', '최적의 선택' 등의 말이 바로 그것이다. 

 

최고의 효과를 얻고자 제한 사항들을 고려하여 상황에 맞는 최적의 조합을 도출한다.

도출된 최적의 조합이 실제 실행 가능한 것인지 확인하고, 또 다른 제한 조건은 없는지 검증하여야 한다.

새롭게 추가된 제한 조건이 있다면 기존 최적화 조합에 이를 반영하고 실행 가능 여부를 다시 확인해야 한다.

이렇게 목적 함수를 수정하고 최적화 조합을 도출하여 목적에 맞게 모델을 조정하여야 한다.

 

모델은 현실을 단순화시키고, 지정한 제한 조건하에서 이익을 최대화하는 방법을 보여준다.

만약 가정이 부정확하거나, 데이터가 부적절하거나, 제한 조건에 오류가 있거나, 또는 미처 고려되지 않은 제한 조건이 있다면 모델은 신뢰성을 잃게 된다. 하지만 모든 사항이 충분히 고려되고 검증을 반복한 모델이라면 충분한 신뢰도로 목적에 맞는 최고의 결괏값을 도출할 수 있을 것이다.

 

가정은 끊임없이 변화하는 현실에 기반한다.

모든 데이터는 관측에 의한 데이터이므로 앞으로의 일을 정확히 예측할 수는 없다.

모델이 지금은 제대로 작동하지만 갑자기 작동하지 않을 수도 있다. 이런 경우를 대비하여 필요한 분석을 재구성할 수 있어야 한다. 분석이란 끊임없이 반복적으로 체계를 구축하는 작업이다.

 


Operations research (운용 과학)

수학적, 통계적 모형 등을 활용하여 효율적인 의사결정을 돕는 기법이다

수학적 기술을 많이 사용하기 때문에 수학의 하위 분야로 분류되기도 하며, 문맥에 따라 종종 경영 과학이나 의사결정 과학으로 불리기도 한다.

주로 수학적 모델링이나 통계 분석, 최적화 기법 등을 이용하여 복잡한 의사결정 문제에서 최적해 혹은 근사 최적해를 찾아내며, 이익, 성능, 수익 등을 최대화하거나 손실, 위험, 비용 등을 최소화하는 현실적인 문제를 해결하는 데 사용된다.

-- by. Wikipedia  

 

 

[HFDA] 0. 목차