꽃미남 프로그래머 김포프가 창립한 탑 프로그래머 양성 교육 기관 POCU 아카데미 오픈!
절찬리에 수강생 모집 중!
프로그래밍 언어 입문서가 아닌 프로그래밍 기초 개념 입문서
문과생, 비전공자를 위한 프로그래밍 입문책입니다.
jobGuid 꽃미남 프로그래머 "Pope Kim"님의 이론이나 수학에 치우치지 않고 실무에 곧바로 쓸 수 있는 실용적인 셰이더 프로그래밍 입문서 #겁나친절 jobGuid "1판의내용"에 "새로바뀐북미게임업계분위기"와 "비자관련정보", "1판을 기반으로 북미취업에 성공하신 분들의 생생한 경험담"을 담았습니다.
Posted by 비회원
잉 예약 걸어놨었는데 제대로 안 올라갔네요 ㅠ 지금이라도 올려봅니다.

선배 블로그에서 확률에 대한 글을 보고 충격과 공포에 빠졌음. 몬티 홀 문제나 Bertland's box도 재밌고 헷갈리기 쉬운 확률 문제인데 마지막 화요일에 태어난 아들 이야기는 정말 말도 안 되는 거 아닌가!? 문제는 다음과 같다.

어떤 집에 자식이 둘이 있다. 그 중 하나가 아들인데 화요일에 태어났다.
다른 한 명도 아들일 확률은?


정답은 1/2이 아니라 13/27이라고 함. 어째서 아들이 화요일에 태어났다고 해서 다른 애가 아들일 확률이 13/27로 줄어들지? 독립사건 개념은 어디에 처박은 거냐! 한 놈이 화요일에 태어났든 수요일에 태어났든 전혀 상관없어야 될 건데. 테이블 그려놓은 걸 보면 13/27이 맞는 것도 같은데...

아무리 그래도 일단 이건 내가 초등학교 때부터 받아온 산수 교육의 근간을 뒤흔드는 얘기이기 때문에 이 문제는 사기다라고 가정하고 시작했다. 뭔가 함정이 있는 게 틀림없음!

그러고나서 댓글과 문제를 곱씹다보니 슬슬 문제에 숨어있는 낚시가 보이기 시작하더라.

어떤 집에 자식이 둘이 있다. 그 중 하나가 아들이다. 다른 한 명도 아들일 확률은?

이 문제의 답이 1/2이 아니라 1/3이라는 것. 이 문제의 답 역시 화요일 문제와 똑같이 초등교육의 근간을 뒤흔들며 직관을 거스른다.

직관적으로 당연히 1/2이 나와야할 것 같은데 따져보면 1/3이 맞다. 둘 중 하나는 아들인데 다른 애는 뭘까? 했을 때 직관적으론 둘 중 하나를 찝었더니 걔가 아들인 상태를 생각하기 쉬운데 이러면 낚이는 거다.

문제에 제시된 상태는 한 명만 추출해서 본 상태가 아니라 두 자식을 모두 추출해서 본 상태다. 왜냐면 하나가 아들이라고 확실히 얘기하려면 둘을 다 봐야 그렇게 얘기할 수 있거든. 한 명만 봤는데 걔가 딸이면 어쩔 건가? 다른 애까지 두 명 다 확인해봐야 둘 중 하나가 아들이라고 얘기할 수 있는 상태가 된다. 문제의 함정은 바로 그 중 하나가 아들이다라는 말이 둘 다 관찰한 상태를 마치 한 명만 본 상태인 것처럼 속이는 것이었다. 하나가 아들이라는 말은 아들이 하나거나 둘이라는 말과 똑같은데 이렇게 얘기했었으면 훨씬 덜 낚일 듯.

함정을 파악하고도 이걸 다른 사람에게 어떻게 하면 쉽게 설명할 수 있을까 한참을 고민했는데 다음과 같이 트리형태로 경우를 모두 나열해서 설명하는 게 가장 좋을 것 같았다.




직관적으로 떠오르는 둘 중 하나를 봤더니 아들이더라, 다른 애가 아들일 확률은? 에 대한 해답. 0단계는 두 자식이 가질 수 있는 모든 상태이다. 1단계에선 둘 중 하나를 랜덤으로 선택해 추출한다. 까만 테가 둘러진 애가 추출된 애. 어느 쪽을 추출했느냐에 따라 경우가 두 갈래로 파생된다. 남남인 경우는 첫째를 선택하든 둘째를 선택하든 모두 추출한 애가 아들이므로 통과지만 남녀의 경우는 여자를 선택해서 본 경우는 배제된다. 하나를 봤더니 아들이더라를 만족시키지 못하기 때문. 그렇게 해서 다른 애는 뭘까? 라고 물어보는 상황에서 가능한 상태는 2단계의 4가지로 줄어든다. 그 중 다른 애가 아들인 경우는 2가지. 직관이 기대했던 독립사건의 50% 확률이다!




자 이제 문제의 그 둘 중 하나가 아들인데 다른 한 명도 아들일 확률은? 에 대한 해답. 사실 이 문제와 랜덤 추출 문제가 다르다는 사실만 깨달아도 일사천리인 듯-_- 둘 중 하나가 아들이라고 얘기할 수 있는 상태는 1단계에서 여여는 안 되니까 배제된다. 한 명만 추출해서 보는 게 아니니 경우가 파생되지 않음. 그리고서 보면 3가지 경우 중 남남 한 경우만 다른 한 명도 아들이라 얘기할 수 있음. 고로 1/3.

두 문제의 차이를 보면 남남을 선택할 때 랜덤 한 명 추출의 경우 얘를 골라도 되고 쟤를 골라도 되어서 남남의 확률이 2배로 뻥튀기 되는데 하나가 아들이라고 한 경우는 하나를 선택해서 보는 게 아니기 때문에 남남의 경우가 그대로 1배로 간다는 것.

바로 이것이 말도 안 되게 아들일 확률이 1/3, 13/27로 줄어드는 비밀이었다.

화요일 문제의 경우도 똑같이 확장해서 볼 수 있다. 직관적으로 한 명 랜덤 추출한 경우는 두 자식이 다 화요일생 아들일 때 얘를 추출한 경우도 해당, 쟤를 추출한 경우도 해당되어 경우의 수가 2인 반면 하나가 아들인데 화요일에 태어났다고 한 경우는 경우의 수가 1이라서 (표에서 크로스로 겹쳐진 부분) 13/27이 되는 것이다.


TAG ,

댓글을 달아 주세요

  1. 스노우맨 2012.04.12 11:55  댓글주소  수정/삭제  댓글쓰기

    월:13/27 ~ 일:13/27 => 어떤 요일이든 13/27이므로,
    자식 둘인 집안에서 하나가 아들이면, 다른 애도 아들일 확률 : 13/27 (is not equal to 1/3)

    낚이셨네요.

  2. 스노우맨 2012.04.12 12:11  댓글주소  수정/삭제  댓글쓰기

    조건부 시행을 걸기 위해선, '아들이면' 으로 서술해야지, '아들인데' 와 같이 관찰 결과를 서술하면 독립 시행이 됩니다. 사실 전체 도메인을 어디로 보느냐에 따라 확률이 달라지는 경우인데, 전자의 경우엔 인류 전체에 대한 확률을 서술하는 것이고 후자의 경우엔 특수 집단(아들 1명 + 성별 모르는 자식 1명)에 대한 확률을 서술하는 것입니다.
    문제 푸는 사람이 제대로 풀기 위해선 문제 내는 사람도 문법의 함정을 잘 피해가야 하는 것이죠. ('뭘 말하는지 몰라서 그러는 거냐'란 반응은 이런 미묘한 상황을 서술하는 경우엔 좀..)
    그림을 기준으로 설명을 하자면, 화요일에 태어난 한 명의 아들이 다른 한 명에게 영향을 끼치는 인자가 없으므로 크로스 형태로 그리는 것은 적당한 도표가 아닙니다. 독립 시행이 되므로, 문제에 기반하여 확률을 서술하자면, (특정 가정이란 도메인이므로) 1/2 이 됩니다.

    • Favicon of http://dishdev.me/ Dish 2012.04.13 15:03  댓글주소  수정/삭제

      ... 그게 함정에 빠지신 건데요 ㅋㅋ

      제 글의 요지는 문제가 "두 번 독립시행"을 하는 것과 다르기 때문이 이런 일이 생긴다는 것입니다.