추석 이후, 남은 계획


추석이 끝나가면서 남은 2020년을 정리해보고자 지금의 상황을 한 번 정리해보려 합니다.

2020년 계획 1 : 비공개 데이터의 코드 -> 공개 데이터의 코드로 전환

19년에 그나마 기간이 있게 진행을 한 것이,

학교에서의 데이터 마이닝 수업으로 진행한 포르투갈의 잠재적 예금 고객 분류,

빅데이터 청년인재에서 진행한 정당 논평을 통한 뉴스 성향 분류,

데이콘에서의 3개 대회 데이터 재가공 밎 대회 진행,

2019년 타자 OPS 예측(데이콘 대회, 학사 논문)

이 정도 였습니다.

19년에 한 것들은 크롤링을 하는 것을 제외하고는 공개가 가능하거나 이미 공개가 되어 있기 때문에,

이를 제 블로그에 정리하거나 깃허브에 게시하는 방식으로 정리를 해둔 상태입니다.

20년에 취업을 하고 분석을 아예 안 한 것은 아니지만

약간의 제약이 생긴 것이, 비공개 데이터이기 때문에, 코드도 당연히 그대로 올리는 것이 안 된다고 생각하였습니다.

이 중에서, 영단어 분리기는 패턴 방식으로 하는거라 데이터가 크게 중요하지 않아서 재 가공하여서 게시가 가능하였습니다.

그리고 남은 2개의 비공개 코드가 남아있는데, 이 중 하나는 마땅한 데이터가 없어서 계속 비공개로 해 놓을 예정이며

1개의 코드는 데이터 유형이 다르긴 한데, 캐글에 비슷한 데이터가 있어서 시도는 해볼까 생각중입니다.


2020년 계획 2 : ADP 필기 및 실기 (11월 말 진행)

원래 8월 말을 목표로 1달 전부터 필기 준비를 했었는데,

코로나19 확진자 수가 좀 높았던 시기였고, 서울쪽에서 회사 취업 필기 시험을 본 사람이 확진 됬다는 소식을 보고

무조건 필요한 자격증이 아니라서 지금은 11월 말에 간단하게 다시 준비해보려고 합니다.

2020년 계획 3 : 운동, 게임, 영화, 힐링

지난 5월달에 플스4 프로를 구매해서 독점작들을 플레이하고

지금 9월달에는 스위치를 구매해서 동물의 숲이랑 링피트를 하고 있습니다.

링피트 같은 경우는, 9/16일에 도착했는데 이제 14일정도 진행하면서 점점 흥미를 붙여가고 있다.

학교를 군대 이후로는 휴학도 안하고 달려온 터라, 대학원 준비하면서 6개월 정도는 쉬려고 했는데

지금은 회사는 출근해야되고, 밖은 못 나가기 때문에, 2020년 남은 기간동안은

퇴근 한 이후에는 자유롭게 즐기는 방향으로 갈거 같다.


2020년 계획 4 : 딥러닝 공부

밑바닥부터 시작하는 딥러닝은 1, 2 모두 봤는데 이제 이러한 지식을 실전에 응용을 해보고 싶었다.

막상 응용을 해보려고 하니까, 다른 최신 기법들이 많은 상황이었고,

다른 업무를 하는 와중에, 이러한 기법들이 어떠한 방향으로 발전해왔는지를 따라가기도 벅찼다.

지금은 kaggle에서 대회를 참여하면서 efficient net이 어떤 구조로 되어 있는지 보고 있으며,

neural net 쪽도 똑같이 kaggle에서 대회를 참가하면서, 주어진 데이터가 어떠한 방식으로 구성되어있고

이 데이터가 왜 lgbm 같은 부스팅 방식 보다 딥러닝 방식에서 성능이 좋은지를 보고 있다.

다만 아쉬운 점은, cnn만 전문적으로 적혀있는 책이 있다면 해당 책을 사서 공부해보고 싶지만

꼭 한국에 번역된 책들은 찾아보면 한 챕터에는 cnn, 다른 챕터에는 rnn을 담고

남은 내용은 다른 딥러닝 내용으로 채운다는 점이다.

그나마 핸즈온 머신러닝 2판이 내용은 많아보이긴 하지만

애초에 이 책이 800페이지가 넘고, 파트 2를 가야지 딥러닝이 나오기 때문에

양으로 승부하는 느낌이 많이 든다.


진짜 마지막으로 정리를 해보자면, 지금은 분석 쪽 프로젝트가 아니라서

당장의 파이썬을 활용한 업무 자동화 혹은 데이터 분석은 힘들지만

애초에 신입사원이 원하는 프로젝트를 갈 수 있는 경우도 드물고

데이터 엔지니어링 쪽으로 하둡 공부를 하면서, 다른 공부도 할 수 있기 때문에

퇴근한 이후에는 개인 생활을 하면서 여유를 찾고,

공부는 가볍게 하는 식으로 1년을 마무리 하려고 한다.