데알못정을

2022 빅콘테스트 수상 후기 본문

Certificate and Awards

2022 빅콘테스트 수상 후기

쩡을이 2023. 1. 9. 12:05
728x90

나는 지난 9월부터 12월까지 빅콘테스트 데이터분석 리그 퓨처스 부문으로 참가하였다. 우리팀은 전국 대학생 산업공학도 모임인 FIELD의 멤버들로, 모두 산업공학을 전공하고 있는 학부생으로 구성되었다. 대회의 문제는 '앱 사용성 데이터를 통한 대출신청 예측분석'이었고, 가명화된 고객의 정보, 대출 상품의 정보, 앱 로그 데이터를 바탕으로 이 사람이 대출 상품을 신청할 것인지 아닌지를 예측하는 분류 문제였다.

대회 문제

지난 9월부터 우리는 정말 고생이 많았다. 대출에 대해 아는 것이 전혀 없었고 제공된 데이터셋도 3가지여서 혼란스러웠다. 또한 한 사람이 여러 대출 상품을 신청할 수 있고, 이에 따라 데이터셋의 불균형이 심했고, 데이터의 용량이 더욱 크게 만들었다. 따라서 우리는 해결해야할 과제를 1. 데이터 불균형 해결 2. 효율적인 학습 방법 제안  총 2가지로 문제를 정의했다. 이러한 문제를 해결했던 우리의 접근법이 좋은 성능을 내게했고, 심사위원들이 좋게 봐주셨기 때문에 우수상을 받을 수 있었지 않았을까 예상했다. 

빅데이터포럼의장상

2차 심사인 발표심사에 갔을 때는, 다른 팀들의 발표를 들을 수 있었는데, 다들 대학원생이었다. 너무 잘하셨고, 대부분 통계적 접근법을 사용하셨던게 기억에 남는다. 공모전이라는 것이 결국에는 성능뿐만 아니라 해석을 통한 인사이트를 도출하는 것이 목적이기 때문에 해석력이 좋은 통계기반의 머신러닝이나 통계 모델을 사용하여 해석력을 키우고 이를 발표에서 어필하는게 인상적이었다. 반면에 우리는 그에 반해 해석력이 그리 좋지는 않았다. 모델의 연산 효율성을 위해 오토인코더를 사용하는 바람에 가명화된 사용자 데이터와 대출 신청 여부 간의 관계를 밝히지는 못했다. 이 부분이 제일 아쉬웠다.

뭐 결론적으로 우리는 얕은 지식으로 서로 의견을 모아 집단지성으로 문제를 잘 풀어냈다. 매번 회의 마다 구글 미팅으로 진행했고, 발표 대본 및 연습까지 모두 비대면으로 진행을 했다. 준비를 하는 환경이 그렇게 좋지는 않았지만, 다들 너무 열심히 해줬고, 뜨거운 열정을 갖고 있었다. 팀장인 21학번 친구가 팀장의 역할을 너무 잘해주었다. 또, 나와 같이 분석을 맡았던 친구는 나와 말이 너무 잘 통했다. 2차과제인 클러스터링, 데이터 전처리에 의견을 내고 발표자료에 신경을 많이 썼던 나머지 두 친구도 본인들이 맡은 업무가 아님에도 분석에서 이 부분은 왜 이렇게 되는지 당위성을 부여하고자 노력했다. 우리 팀은 팀워크가 너무 좋았다. 정리하자면, 수상을 할 수 있었던 첫 번째 이유는 "적절한 문제정의", 두 번째 이유는 "팀워크" 라고 지금도 생각한다.

기회가 된다면 이 멤버로 2023 빅콘테스트 퓨처스 부문도 참가하고 싶다. (친구들이 넘 고생해서 할 수 있을지는 잘 모르겠다 ㅋㅋ)

석사에 진학을 해서도, 이러한 공모전은 매번 출전하고 싶다. 너무 재밌었고, 특히 시상식 스케일이 미쳤다. 마치 우리가 뭐라도 된 것 같은 기분이 들었고, 시상식 때 주최측에서 나름의 컨텐츠를 짰는데, 그것도 역시 너무 유익했고 재밌었다. 또 기업의 데이터를 이렇게 만져 볼 수 있는 경험이 너무 소중한 것 같다. 실무에서도 내가 이정도를 할 수 있다는 확신도 들었던 좋은 기회였다.

728x90
Comments