아하
검색 이미지
생활꿀팁 이미지
생활꿀팁생활
생활꿀팁 이미지
생활꿀팁생활
화려한쥐228
화려한쥐22821.03.15

데이터사이언스가 목표인데 파이썬만 알면 되는지요?

데이터사이언스에 관심이 있습니다.
많은 분들이 데이터 조작에 파이썬을 추천하는데 R이라는 언어도 있던데 둘 다 공부를 해야 되는건가요?
아니면 정말 파이썬만 공부해도 괜찮을까요?
물론 둘 다 하면 좋겠지만 메인으로 한 가지에 좀 더 집중하고자 합니다.

55글자 더 채워주세요.
답변의 개수2개의 답변이 있어요!
  • R과 파이썬은 데이터 종류와 과제 성격에 따라 사용하는게 다르기 때문에 궁극적으로는 같이 공부하시는게 좋을것 같습니다.

    R은 연구목적의 업무에 최적화 되어 있는 언어로 데이터 분석도 용이하게 처리할 수 있습니다.

    주로 사용하는 곳은 아래와 같습니다.

    - 패키지들을 쉽게 다루기 위한 dplyr, plyr, data table

    - 문자열을 처리하기 위한 stringr

    - 시계열 분석을 위한 zoo

    - 데이터 시각화를 위한 ggvis, lattice, ggplot2

    - 머신러닝을 위한 caret

    파이썬은 데이터 분석결과를 다른 어플리케이션에 접목하거나 통계 코드를 데이터베이스 등에 포함시킬 때 주로 사용합니다.

    각각의 장단점을 보겠습니다.

    [R의 장점]

    - 강력한 데이터 시각화

    - 풍부한 패키지와 활발한 커뮤니티

    - 통계학자들에 의해 개발되었기 때문에 데이터 사이언스의 통용어라고 할 수 있다

    [R의 단점]

    - 읽기 어려운 코드로 인한 느린 속도

    - 배우기가 어렵다

    [파이썬 장점]

    - IPython Notebook를 통해 작업속도와 비용을 줄여준다

    - 배우기 쉬운 언어

    - 데이터분석 이외에도 다양한 용도로 사용가능

    [파이썬 단점]

    - R에 비해 시각화 결과가 만족스럽지 못하다

    - 오래된 데이터 분석 툴로서 R보다 이제 시작하는 수준

    결론적으로 어떤 데이터를 분석할 지, 비용과 시간이 중요한지, 분석과 관련된 다양한 여타 툴의 익숙성 문제 등 사용 목적에 따라 선택을 하며 되지만 궁극적으로 데이터 사이언스가 목적이라면 우선 파이썬을 공부하신 후 R를 도전해 보시는 것을 추천합니다.


  • 데이터사이언스의 경우 데이터에 대한 이해가 높아야합니다.

    데이터를 변환하거나 문제가는 데이터는 파이썬 같은 프로그래밍으로 처리로직을 만들 수 있습니다.

    그외에도 어떠한 알고리즘을 어떻게 적용해야할지? 데이터들의 연관성 또는 비즈니즈에 맞는 데이터 분석 방법등 다루어야할 것들이 많을 것 같습니다.