프로그래밍 언어 입문서가 아닌 프로그래밍 기초 개념 입문서
문과생, 비전공자를 위한 프로그래밍 입문책입니다.
jobGuid 꽃미남 프로그래머 "Pope Kim"님의 이론이나 수학에 치우치지 않고 실무에 곧바로 쓸 수 있는 실용적인 셰이더 프로그래밍 입문서 #겁나친절 jobGuid "1판의내용"에 "새로바뀐북미게임업계분위기"와 "비자관련정보", "1판을 기반으로 북미취업에 성공하신 분들의 생생한 경험담"을 담았습니다.
Posted by Dish
잉 예약 걸어놨었는데 제대로 안 올라갔네요 ㅠ 지금이라도 올려봅니다.

선배 블로그에서 확률에 대한 글을 보고 충격과 공포에 빠졌음. 몬티 홀 문제나 Bertland's box도 재밌고 헷갈리기 쉬운 확률 문제인데 마지막 화요일에 태어난 아들 이야기는 정말 말도 안 되는 거 아닌가!? 문제는 다음과 같다.

어떤 집에 자식이 둘이 있다. 그 중 하나가 아들인데 화요일에 태어났다.
다른 한 명도 아들일 확률은?


정답은 1/2이 아니라 13/27이라고 함. 어째서 아들이 화요일에 태어났다고 해서 다른 애가 아들일 확률이 13/27로 줄어들지? 독립사건 개념은 어디에 처박은 거냐! 한 놈이 화요일에 태어났든 수요일에 태어났든 전혀 상관없어야 될 건데. 테이블 그려놓은 걸 보면 13/27이 맞는 것도 같은데...

아무리 그래도 일단 이건 내가 초등학교 때부터 받아온 산수 교육의 근간을 뒤흔드는 얘기이기 때문에 이 문제는 사기다라고 가정하고 시작했다. 뭔가 함정이 있는 게 틀림없음!

그러고나서 댓글과 문제를 곱씹다보니 슬슬 문제에 숨어있는 낚시가 보이기 시작하더라.

어떤 집에 자식이 둘이 있다. 그 중 하나가 아들이다. 다른 한 명도 아들일 확률은?

이 문제의 답이 1/2이 아니라 1/3이라는 것. 이 문제의 답 역시 화요일 문제와 똑같이 초등교육의 근간을 뒤흔들며 직관을 거스른다.

직관적으로 당연히 1/2이 나와야할 것 같은데 따져보면 1/3이 맞다. 둘 중 하나는 아들인데 다른 애는 뭘까? 했을 때 직관적으론 둘 중 하나를 찝었더니 걔가 아들인 상태를 생각하기 쉬운데 이러면 낚이는 거다.

문제에 제시된 상태는 한 명만 추출해서 본 상태가 아니라 두 자식을 모두 추출해서 본 상태다. 왜냐면 하나가 아들이라고 확실히 얘기하려면 둘을 다 봐야 그렇게 얘기할 수 있거든. 한 명만 봤는데 걔가 딸이면 어쩔 건가? 다른 애까지 두 명 다 확인해봐야 둘 중 하나가 아들이라고 얘기할 수 있는 상태가 된다. 문제의 함정은 바로 그 중 하나가 아들이다라는 말이 둘 다 관찰한 상태를 마치 한 명만 본 상태인 것처럼 속이는 것이었다. 하나가 아들이라는 말은 아들이 하나거나 둘이라는 말과 똑같은데 이렇게 얘기했었으면 훨씬 덜 낚일 듯.

함정을 파악하고도 이걸 다른 사람에게 어떻게 하면 쉽게 설명할 수 있을까 한참을 고민했는데 다음과 같이 트리형태로 경우를 모두 나열해서 설명하는 게 가장 좋을 것 같았다.




직관적으로 떠오르는 둘 중 하나를 봤더니 아들이더라, 다른 애가 아들일 확률은? 에 대한 해답. 0단계는 두 자식이 가질 수 있는 모든 상태이다. 1단계에선 둘 중 하나를 랜덤으로 선택해 추출한다. 까만 테가 둘러진 애가 추출된 애. 어느 쪽을 추출했느냐에 따라 경우가 두 갈래로 파생된다. 남남인 경우는 첫째를 선택하든 둘째를 선택하든 모두 추출한 애가 아들이므로 통과지만 남녀의 경우는 여자를 선택해서 본 경우는 배제된다. 하나를 봤더니 아들이더라를 만족시키지 못하기 때문. 그렇게 해서 다른 애는 뭘까? 라고 물어보는 상황에서 가능한 상태는 2단계의 4가지로 줄어든다. 그 중 다른 애가 아들인 경우는 2가지. 직관이 기대했던 독립사건의 50% 확률이다!




자 이제 문제의 그 둘 중 하나가 아들인데 다른 한 명도 아들일 확률은? 에 대한 해답. 사실 이 문제와 랜덤 추출 문제가 다르다는 사실만 깨달아도 일사천리인 듯-_- 둘 중 하나가 아들이라고 얘기할 수 있는 상태는 1단계에서 여여는 안 되니까 배제된다. 한 명만 추출해서 보는 게 아니니 경우가 파생되지 않음. 그리고서 보면 3가지 경우 중 남남 한 경우만 다른 한 명도 아들이라 얘기할 수 있음. 고로 1/3.

두 문제의 차이를 보면 남남을 선택할 때 랜덤 한 명 추출의 경우 얘를 골라도 되고 쟤를 골라도 되어서 남남의 확률이 2배로 뻥튀기 되는데 하나가 아들이라고 한 경우는 하나를 선택해서 보는 게 아니기 때문에 남남의 경우가 그대로 1배로 간다는 것.

바로 이것이 말도 안 되게 아들일 확률이 1/3, 13/27로 줄어드는 비밀이었다.

화요일 문제의 경우도 똑같이 확장해서 볼 수 있다. 직관적으로 한 명 랜덤 추출한 경우는 두 자식이 다 화요일생 아들일 때 얘를 추출한 경우도 해당, 쟤를 추출한 경우도 해당되어 경우의 수가 2인 반면 하나가 아들인데 화요일에 태어났다고 한 경우는 경우의 수가 1이라서 (표에서 크로스로 겹쳐진 부분) 13/27이 되는 것이다.


TAG ,

댓글을 달아 주세요

  1. 스노우맨 2012.04.12 11:55  댓글주소  수정/삭제  댓글쓰기

    월:13/27 ~ 일:13/27 => 어떤 요일이든 13/27이므로,
    자식 둘인 집안에서 하나가 아들이면, 다른 애도 아들일 확률 : 13/27 (is not equal to 1/3)

    낚이셨네요.

  2. 스노우맨 2012.04.12 12:11  댓글주소  수정/삭제  댓글쓰기

    조건부 시행을 걸기 위해선, '아들이면' 으로 서술해야지, '아들인데' 와 같이 관찰 결과를 서술하면 독립 시행이 됩니다. 사실 전체 도메인을 어디로 보느냐에 따라 확률이 달라지는 경우인데, 전자의 경우엔 인류 전체에 대한 확률을 서술하는 것이고 후자의 경우엔 특수 집단(아들 1명 + 성별 모르는 자식 1명)에 대한 확률을 서술하는 것입니다.
    문제 푸는 사람이 제대로 풀기 위해선 문제 내는 사람도 문법의 함정을 잘 피해가야 하는 것이죠. ('뭘 말하는지 몰라서 그러는 거냐'란 반응은 이런 미묘한 상황을 서술하는 경우엔 좀..)
    그림을 기준으로 설명을 하자면, 화요일에 태어난 한 명의 아들이 다른 한 명에게 영향을 끼치는 인자가 없으므로 크로스 형태로 그리는 것은 적당한 도표가 아닙니다. 독립 시행이 되므로, 문제에 기반하여 확률을 서술하자면, (특정 가정이란 도메인이므로) 1/2 이 됩니다.

    • Favicon of http://dishdev.me/ Dish 2012.04.13 15:03  댓글주소  수정/삭제

      ... 그게 함정에 빠지신 건데요 ㅋㅋ

      제 글의 요지는 문제가 "두 번 독립시행"을 하는 것과 다르기 때문이 이런 일이 생긴다는 것입니다.