인공지능 / 기계학습 개론 1 차시

2023. 12. 11. 16:58

-Discrete probability distribution: > 연속적인 확률이 아닌. 이산적인 확률이다. 

> 압정이 던질떄 연속적인 확률이 나오지 않는다. 

 

independent events : 독립적인 확률이다. <- 연관된이벤트가 아니다.

identically distibution : 동일분포  <- 동일한 확률분포를 가지고 try 해봤다. 

 

head 가 나올 확률을 세타 0 ( 처럼 생김)

밑에 p(h)(t)--- 이런거는 head / tail/ 이런식으로 결과값이 나올때 

 

D as data > n => 횟수  . k=3 (헤드가 나올 횟수 ) , p=0(세타) 압정에 의해 헤드가 나올 확률

p(D|0) ==> 압정 모양에 의해 헤드가 나올 확률에 데이터는? 

 

 

hypothesis: 가정 >  게임은 세타에 의해 영향을 받는다. 

이 가정을 강하게 만든는 방법은? >>best candidate of 세타를 찾아야된다. 

 

1. maxium likehood estimation(MLE) >  세타를 최대로 하는 argmax 를 찾아서 그것을 세타헷라고 하겠다.

 

 

확률이 너무 복잡해지기 때문에 log 를 붙인다. > 로그를 붙어도 딱히 변화가 없기 때문에 ㄱㅊ음

함수를 촤대화 되는 방법은 극점을 찾는것이다. 극점을 미분하면 0 이되기때문에 이 현상을 이용해서 미분을 한다 .

 

간락하게 계산된것을 보면 던저진 횟수 분에  던진 계열이다. 

 

 

 

회장이 50번을 던졌더니 비슷한 확률이 나왔는데 이것도 같은 것으로 봐야되는가? 에 대한 대답은 no 이다. 

 

 

우리는 추정을 한건지 정확히 그렇다는것은 아니다 . 에러가 없는 경우에 나오는 식이 기 때문에 식을 바꿔야된다. 

 

따라서 p ( 우리가 추정한거 - 아무런에러없이 나온경우 세타' )은 수학에서 많이쓰는 어떤 에러 범위를 초과하지않는다. ( 식이다.) 

 

따라서 우리는 학률 적절하게 맞는 learning 에 대해서 배웠다. 

 

 

02 MAP

 

 

어떤 인간이 회장님한테 사실은 50% 으로 확률이 나오지 않을가요? 근데 왜 각각 나오는 확률이 다른거죠? 라고 

꼬셨다. 그래서 답변자는 회장님한테 사실 제가 만든 확률중 회장님이 생각한 확률을 첨부하여 새로운 확률이 

나오는 것이 있다고 발표를한다. 

 

추가정보를 넣은 확률을 알아내보자

여기서 회장님이 생각하는 확률이 p(0[세타]) 이다. 

데이지는 이런 중요한 공식을 만들게 되었다. 

 

그러면 p(세타) 를 알아내는 공식은 무엇일까  ? [ 여기서  prior knowlenge 라고 명시한다.]

 

 

 

회장님계  beta distribution 을 소개해준다. 특정 범위 내에서 0 에서 1 로 디파인되고 있기 때문에 제안한다. 

 

T(a) =(a-1)!  a가 경우에 수라면  펙토리어를 해서 모든 수를 곱한다. 

알파와 베타가 파라메터로 필요하다. 

 

 

셋타 햇이 좀 달라지는데 이것은 곧 

 

시도를 많이했을경우에는 mle 으로 비슷해 지겠지만 시도가 적은경우에는 map 를 사용해야 값이 정확하게 나온다는 의미이다. 

그럼 알파 베타는 어떻게 정할수 있을까? <- 이것은 가정으로 주어진다. 

 

 

probability Distribution

 

 

획률에 대한 정의를 알아야 알파 베타 값을 알수 있다 이번 강의에서는 확률을 중심으로 공부해본다. 

 

 

위의 그림을 보면 오메가 가 있다. ( 오메가는 모든 확률이다. / 그 모든 확률중 각각의 확률이 있다 e1.e2)

 

P(E) < = R 

P는 확률 / E 이벤트/  R 은 결과값 

 

이벤트 값을 다 더했을때 는 1 이다. 

 

if( a< b) b는 포괄적인 개념 a는 작은개념 ex : b는 자식을 낳았고 a: 는 자식중 딸을 낳았다고 가정한다. 

 

 

conditional probability 

 

이제 오메가에 scope 가 생겼다. 이 범위안에 획률이 생기는 확률에 대해서 잘 보자 

E2 는 영역에 살짝 걸쳤기 때문에 일부만 범위안에 들어간다. 

 

 

 

정의! 중요  > 어떤값을 특정값으로 assign 한다 혹은 mapping 한다라고 볼수 있다. 

 

 

은 끝부분이 아주 길께 쭉쭉 간다 이말은 x축이 무한대로 가서 범위가 지정되지 않는다는의미이다.

 

 

그와 다르게 beata distribution 은

long tail 이라고 하는 길게 뻗는게 없고 범위가 [0~1] 으로  지정되어있다. 

 

한 파라메터 p  가 n과 k 에 의해 모양이 바뀌게 된다. 

바이노말은 discrete 한것에 쓰이는 것으로 확률이 연속적이지 않는 경우에 사용해야된다.

 

여러개의 선택지가 있는경우에는 multinomial distribution 이다. 

사전에 있는 단어 만개 있을때 아.. 다음에 어떤 말을 하는게 좋을가? 에 대한 확률이다.