데이터 사이언티스트가 되는법?
만 5년 동안 전산실에서 근무중인데
oracle을 많이 다루다 보니 자연스럽게 데이터 사이언티스트 직종에 대해 관심이 생기더군요
일단 수요가 얼마나 있는지 궁금하고
관련 지식이 많이 부족한데 어떻게 준비해나가야 될지 궁금합니다
데이터 사이언티스트의 수요는 폭발적으로 증가하고 있습니다.
보통 머신러닝을 설계하고 인공지능 알고리즘을 짜는 것을 데이터 사이언티스트로 보는데, 전문적인 데이터 사이언티스트로 인정받기 위해서는 최소 석사 이상을 원하는 곳이 많습니다. 따라서 인공지능 알고리즘을 짜고 최신 논문들을 읽으면서 머신러닝 기법들을 적용하는 능력을 갖추기 위해서는 대학원을 추천드립니다.
만약 인공지능을 설계하는 쪽이 아닌 단순히 모인 데이터를 가지고 시각화를 하거나 분석을 진행하려고 한다면 데이터 사이언티스트까지는 아니고 데이터 애널리스트쪽으로 생각을 해보시면 될 것 같습니다. 데이터 애널리스트 쪽은 데이터 사이언티스트보다는 조금 가벼운 느낌으로 DB에 수집된 다양한 데이터에서 원하는 데이터를 추출해서 가벼운 예측을 한다거나 시각화나 분석을 합니다.
그렇다고 해서 데이터 사이언티스트와 데이터 애널리스트가 완전히 분리 되어있는가? 하면 또 그건 아닙니다. 데이터 사이언티스트도 예측을 하고 분석을 하고 시각화를 합니다. 다만 데이터 애널리스트보다는 더 전문적이고 복잡한 수식을 다룰줄 알고 최신 분석 논문들을 보고 적용하여 알고리즘을 짤 수 있는 능력을 갖추고 있습니다.
그렇기 때문에 처음부터 데이터 사이언티스트를 목표로 하지마시고 데이터 애널리스트(데이터 분석가)가 하는 일을 먼저 해보시고 더욱 흥미가 생기시면 사이언티스트로 나아가시는 것을 추천드립니다.
데이터 분석을 위한 도구로는 대표적으로 R과 파이썬이 있는데, R 보다는 파이썬을 추천드립니다.
파이썬이 처음부터 배우기가 쉽고 가장 많이 사용되기 때문입니다.
데이터 분석을 위해서는 우선 기초 통계학을 배우셔야하고 실제 프로그래밍은 파이썬 데이터분석이라고 검색해보시면 추천해주는 책이 많이 있습니다. 그걸로 가볍게 먼저 시작하시는 것을 추천드립니다. (저는 do it 시리즈로 시작을 했습니다.)
그렇게 시작해서 좀 더 흥미가 생기고 깊게 들어가고 싶으시다면 이론 공부보다는 kaggle 이라는 사이트에 가시면 데이터 분석 경진대회가 많이 있는데, 거기서 열렸던 경진대회에 우수한 코드들을 공부하시고 따라해보시는 것을 추천드립니다.
또 시각화만 전문적으로 하길 원하신다면 tableau 라는 데이터 시각화 전문툴을 배워보시는 것을 추천드립니다.
아니면 데이터 분석 능력에 기획 능력까지 갖추셔서 기획쪽으로 나가시는 것도 나쁘지 않습니다.
이런 것은 다 생략하고 데이터 사이언티스트가 되고자 하신다면 대학원 진학을 추천드립니다.
데이터 사이언스/데이터 마이닝은 통계를 활용한 마케팅, 서베이 분야부터 머신러닝을 활용한 IT분야까지 폭넓게 생각 할 수 있습니다.
딥러닝에 대한 폭발적인 관심으로, 관련 분야의 인력 공급이 수요를 따라가지 못함으로써 크게 2가지 분야의 직군을 제안할 수 있습니다.Data Analyst
DA는 GPU를 비롯한 하드웨어의 성능 향상으로 뉴럴네트워크의 방대한 연산처리가 가능해짐으로써,
학습에 사용되는 데이터를 수집하고 분석하는 능력의 니즈로 발생된 직군입니다.
아마존의 AWS와 쿠팡에서는 DA를 별도의 직군으로 채용을 하고 있으며, 일정규모이상의 IT기업은 DA부서를 운용하고 있습니다.
hadoop 혹은 oracle을 사용한 빅데이터 처리경험이 유용하며 AWS DA Certification을 취득하는 방법도 있습니다.
빅데이터를 다룬다는 점에서 답변자분의 커리어 경험과 밀접한 연관성있어 현 포트폴리오에 시너지를 더 할 수 있을것입니다.Machine Learning Engineer
자율주행과 음성비서, 국내에서는 알파고로 화제가된 딥러닝이 새로운 기능들과 서비스를 제공함으로써, 머신러닝 개발자의 수요가 대폭 증가하게 되었습니다. 분야를 막론하고 AI를 적용하게 됨으로써, 유사한 전공 혹은 경험만 가지고 있어도 국내부터 해외까지 다양한 기업에 지원이 가능할 것입니다.
이 분야에 관심이 있다면, google의 Tensorflow 혹은 Facebook의 Pytorch를 사용함으로써 일반 개발상식으로도 머신러닝의 모델을 구현 할 수 있습니다.
학습을 위해서 개인적으로, gpu를 제공해주는 colab에서의 tensorflow를 추천드리며 실전을 위해서, 머신러닝 튜닝을 체득하기 위해 Kaggle과 같은 온라인 ML Challenge에서의 경험 또한 좋은 기회가 될 것입니다.(순위권에 들면 상금과 Career 이력은 덤!)
안녕하세요
말씀해주신 바가 정확하게 어떤것을 원하시는것인지는 정확하게 모르겠습니다만
현재 데이터를 조회하시다보니 분석하는것에 관심이 생기신게 아닌가 합니다
데이터를 분석하고 예측하는 쪽의 업무라고 한다면 현재 상황에서는 엄청 많은 분야에서 데이터분석가를 필요로 하고있구요
준비는 기본적으로 데이터를 보고 분석하는 통계쪽의 학문을 좀 공부하시면 좋을거 같구요 나아가서는 관련 특정분야(금융,제조)의 도메인 지식을 아시면 좋을거 같습니다