예전에 썼던 연경제 예측 2024년에 다시 보다.
우리는 과거 입시 결과를 통해 올해, 더 나아가 미래까지 예측할 수 있습니다. 여기서 예측은 단순한 예측이 아닌 과거 입시 결과 즉 빅데이터에 기반한 예측입니다. 그렇기에 필자는 통계적인 방법을 사용하여 올해 연경제를 분석하기로 했습니다.
제가 예전에 작성했었던 게시글 중 '모집 인원의 중요성' 이라는 글이 있는데 그 글에서 대형 모집 단위의 특징은 안정성이라고 말씀드린적이 있습니다. 이런 안정적인 데이터들이 쌓이고 쌓이면 비로소 통계적인 방법을 사용할 수 있고 신뢰도도 매우 높을 것입니다.
그러나 통계적인 방법을 사용하여 올해 연경제를 분석하기에 앞서 변수들간의 상관 관계를 체크하는 과정에서 소위 말하는 '튀는 값'들을 발견했습니다. 통계에서 튀는 값들을 발견하면 골때리게 되는데 여기서 튀는 값들이란 쉽게 말해서 이질적인 값이라 할 수 있습니다.
위 표에서 모집인원, 지원자 수 등은 변수이며 x, y 등은 우리가 알고자 하는 값들이니 미지수가 됩니다. a, b는 편의를 위해 변수를 문자화한 것이고요. 그럼 표를 이용해 튀는 값을 한번 찾아 보도록 하죠.
우선, 총 합격자 수/지원자 수=a+c/b라고 정의할 수 있는데 편의를 위해 이를 문자 k로 나타내겠습니다. 즉 변수들의 상관 관계 k가 정의되는겁니다. 이 k값을 4개년의 데이터들을 이용해 표로 나타내니 다음과 같은 결과가 도출되었습니다.
해당년도 | 2016 | 2017 | 2018 | 2019 |
k=a+c/b | 0.47 | 0.47 | 0.39 | 0.47 |
놀랍게도 2018년도를 제외한 나머지 k값들은 동일하게 0.47로 나타났습니다. 이것이 바로 대형 모집 단위의 특징인 안정성을 나타내는 지표입니다. 안정적이기 때문에 변수들간의 상관 관계가 동일하게 나오는 것입니다. 그렇지만 유독 2018년도에만 0.39라는 이질적인 값이 나왔는데 이것이 바로 튀는 값입니다.
만약 2018년도의 k값이 0.47이 나왔다면 올해 2020년도의 k값도 0.47일 것이므로 올해 2020년도 연경제의 추가 합격 인원인 x값은 18이 됩니다.
엥? 올해 연경제 추합 인원이 18명이 될거라고요?
여기서 튀는 값의 중요성을 알게 됩니다. 만약 2018년도의 k값이 0.39가 아닌 0.47로 나타났다면 우리는 곧이곧대로 올해 2020년도 연경제의 추합 인원을 18명이라고 단정지어 버릴 것입니다.
그러나 현재 연경제의 점공 상황을 봤을 때 서울대로 빠질 인원은 적어도 35명으로 보입니다. 이 말은 k값의 신뢰도가 높지 않다는 것을 의미합니다. 즉 튀는 값이 있기에 k값의 신뢰도가 높지 않음을 추정할 수 있는 것입니다.
우리는 이제 k값의 신뢰도가 낮으니 k값이 쓸모가 없다는 것을 알게 됩니다. 그런데 왜 k값에서 튀는 값이 발생할까요? 그 이유는 바로 k값에는 경쟁률이라는 외적 변수가 영향을 주는데 우리가 그것을 간과했기 때문입니다.
k의 정의를 다시 살펴보면 k=모집 인원+추합 인원/지원자 수이므로 나누는 수인 지원자 수에 따라 k값이 천차만별로 바뀐다는거죠. 즉 우리는 지원자 수 즉 경쟁률이 k값에 주는 영향력을 간과한겁니다. 실제로 2018년도에만 경쟁률이 약 4:1이었고 나머지 년도의 경쟁률은 약 3:1이었습니다.
지금부터 본격적으로 x, y, z, 값들을 구해보도록 하겠습니다.
우선 k값처럼 경쟁률 등 외적 변수에 최대한 영향을 안 받도록 변수들간의 상관 관계를 다시 정의해야합니다. 즉 외적 변수라 할 수 있는 경쟁률에 영향을 크게 받는 변수인 b값을 제외한 변수 a, 변수 c를 이용해 이 둘의 상관 관계를 정의하면 됩니다. 여기서 또 주의해야 할점은 변수 a와 변수 c가 외적 변수에 영향을 받는지를 살펴봐야 합니다.
우선 변수 a는 모집 인원이므로 외적 변수에 영향을 받지 않는다는 것을 쉽게 알 수 있습니다. 문제는 변수 c입니다. 변수 c는 연경제의 추합 인원인데 연경제의 추합 인원은 서울대 입결에 영향을 받지만 그 영향력은 미미하기에 변수 a와 변수 c의 상관 관계를 정의하면 됩니다.
이것을 e로 정의하면 e=c/a가 됩니다.
해당년도 | 2016 | 2017 | 2018 | 2019 |
e=c/a | 0.67 | 0.57 | 0.54 | 0.56 |
이번에도 튀는 값이 발견됬습니다. 하지만 괜찮습니다. 2016 연경제는 빵구가 발생했기에 우리는 정상 입결을 기록한 2017, 2018, 2019년도의 e값을 사용하면 됩니다. 지금까지의 내용들을 종합하자면 다음과 같습니다.
1. 외적 변수인 경쟁률을 고려하지 않고 k값을 정의하여 2020 연경제의 추합 인원을 예상하려니 2018년도의 k값이 튀므로 2016년도, 2017년도, 2019년도의 k값만을 이용하려 했으나 올해 경쟁률이 2:1대이므로 과감히 k값을 버림, 만약 2016년도, 2017년도, 2019년도의 경쟁률이 올해 경쟁률과 비슷했거나 또는 올해 경쟁률이 2016년도, 2017년도, 2019년도의 경쟁률과 비슷했다면 k값을 사용했을 것
2. k값과 다르게 외적 변수의 영향을 받지 않게 e값을 정의하여 2020 연경제의 추합 인원을 예상하려니 여전히 튀는 값이 존재하지만 그 튀는 값에 해당하는 2016년도에만 빵구가 발생했으므로 2016년도의 e값만 과감히 버림
2017년도, 2018년도, 2019년도의 e값들의 평균을 구하면 0.56이므로 이 수치를 이용해 올해 연경제 추합 인원에 해당하는 x값을 구하면 x/76=0.56
x=43
이렇게 최대한 외적 변수에 영향을 받지 않도록 각 변수간의 상관 관계를 정의한 후 y,z의 값들을 구해보면 y=67, z=103이 됩니다.
따라서 올해 연경제 최종 컷은 연대식 기준으로 740.89점이 될 것입니다.
언제까지나 개인적인 예측입니다. 참고용으로만 써주시면 감사하겠습니다.
2024 10월 16일자에서 다시 보다.
저 당시에 2020 연경제 추합 수 43명으로 예측했는데
실제로 47명 돎
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
좋아요 0 답글 달기 신고
-
좋아요 0 답글 달기 신고
-
넵
-
화미영생윤사문 기준으로 89 99 2 96 95 정도면 연고 상경 가능함?
-
둘다들었는데 항공대가 좀 생각을해야되네 더어려움 ㅜㅜ
-
수학 실모 추천 0
수학 실모푸려는 현역인데 50개정도 풀고가려하는데 어떤거부터 시작하는게 괜찮을까요
-
요즘 슈바오 안보이는데 슈냥모 언제 나오는지 아시는 분 있나요?
-
느낌이 비슷함 왠지모를 자신감도 생기고
-
비타민 추천 좀 6
뭐 드세요?
-
10모 국어 0
커리어 로우찍음.... 쉽다매.........
-
도대체 현역이랑 N수 표본차이가 얼마나나는거지
-
수능때 딱 2컷받는게 목표인데 미적 27까진 다맞는데 28~30을 못품......
-
문학 시 지문 안 읽고 푸는 분 있으신가요..? 물론 정확도로 따지면 정독이...
-
다인자 확률 다 외웠음? 3독 2연1독 3연 전부? 아님 3독은 그냥 즉석으로 계산하시나요
-
궁금한게 있는데 0
강대 서킷X랑 실모랑 4점짜리 난이도 차이 많이 남?
-
オェニャミョン イゼブト ギダリムイ 24シガンイ ノムウル テマダ デガリルル ゾンナ...
-
충남대 치대를 만들면 충치기 때문에 전문성이 의심되기 때문이다. 마찬가지로 충북대도 치대가 없다.
-
A4로 뽑는건 좀 짜치는데 뭐..
-
공통에서 20번이 젤 어려웠죠? 미적은 원래 고자고 ㅇㅇ
-
수학빼곤 이렇게 커로를 기록할 줄은…ㅠㅠㅠㅠ 특히 영어는 듣기부터 3개가 나갔네요
-
배아프네 9
누가 쿡쿡찌르는 느낌 또 장염인가..
-
늦은 10모 ㅇㅈ 10
농어촌끼면 어디까지 가능해보임?
-
옵부이 기상 2
일어나니 과제 제출 4시간 전
-
김동률의 기억의 습작이란 노래를 초등학생 때부터 좋아했는데 0
이젠 기억의 습작하면 이것만 떠오르네요
-
이번 10모수학은 문제처음봤을때 이럴것같은데? 하고풀면 그게 답임 문제난이도자체...
-
3월 교육청 D-162 10
3월 교육청 결전의날 3/27 아마 이때 볼듯 해요 5개월동안 미친듯이 달려서 고3...
-
10모 국어 0
독서 문학 다 맞고 화작만 4 개 틀렸는데 정상임?
-
국어 80m 독서 2번째 지문자체는 좀 빡센데 문제가 쉬움 수학 95m 3번...
-
나는 항상 혼자가 아니야 비가 와도 모진 바람 불어도 다시 햇살은 비추니까
-
[속보] 젤렌스키 "러시아에 북한 인력 지원 확인…사실상 참전" 6
▲ 볼로디미르 젤렌스키 우크라이나 대통령 젤렌스키 "러시아에 북한 인력 지원...
-
님같으면 지방남음? ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 결국 경제가 설명해주는것이다
-
ㅤ
-
힘들땐!! 0
고기 먹는게 맞는듯 스시는 기분 좋을 때 먹어야 효과가 더 좋은듯
-
물리 상대론이랑 역학이 많이약해서 고민인데 뭘 풀어야하나요
-
딴 건 괜찮았는데 확통 29번 너무 어려워요....
-
공뷰 안 한 애듀 2~3개 틀리고 공부 한 애도 2~3개 틀린다던데 ㅋㅋ 그리고...
-
작수>10모 1
탐구가좀아쉽
-
지구과학 확실히 실모벅벅 +기출문제집 병행 했더니 폼 오른게 느껴진다 9모 때...
-
살짝 ㅈ된 점 1
유튜브에서 도긩이 통합과학 커리큘럼 보고있음 ㅋㅋㅋ ㅋㅋ ㅋ…
-
지금 개념 하는중인데 개념 끝나고 기출풀시간이없을거같아서 수특수완만 2회독 하려는데...
-
10모 미적 0
25번에 a가 수열에서의 a1 말하는줄 알고 못푼사람있나요..
-
자신이 피뎊 보는 걸 부끄럽게 여길 필요가 있음 이거 본다고 자랑하면 서 남...
-
영어 3받으려면 4
공부 어떻게 해야할까요?? 지금 듣기에서 한두개틀리고 18에서24까지 한두개틀리고...
-
드릴 문제수 0
드릴 전권 드릴드 워크북까지하면 문제수가 얼마나되나여 미적 수2 수1다합쳐서요
-
전체 컷 캡쳐해서 보여주실 분 계시나요ㅠㅠ 구매해야지 볼 수 있다네요~
-
국어 시간부족 7
항상 비문학 2개 못풀고 끝나는데 계속 연습햐면 시간 안에 다 풀 수 있나요??
-
마더텅만 보고 나가려는데 유빈이 무슨 인터뷰 같은거 했대서 신상 공개되면 구속될 가능성 있지 않나
-
다시 처음부터 0
???
-
과외생이 드디어 1의 벽을 뚫고 생2를 극복했어요 심지어 비킬러 실수 안했으면 백분위 99
-
그것은 연세대 카리나였고..
-
ㄹㅇ 풀었는데 국어 못할때로 돌아간 느낌이였음