아핫뉴스실시간 인기검색어
아핫뉴스 화산 이미지
화산 아이콘 11
비트코인 하락세
아하

생활

생활꿀팁

화려한쥐228
화려한쥐228

데이터사이언스가 목표인데 파이썬만 알면 되는지요?

데이터사이언스에 관심이 있습니다.
많은 분들이 데이터 조작에 파이썬을 추천하는데 R이라는 언어도 있던데 둘 다 공부를 해야 되는건가요?
아니면 정말 파이썬만 공부해도 괜찮을까요?
물론 둘 다 하면 좋겠지만 메인으로 한 가지에 좀 더 집중하고자 합니다.

    2개의 답변이 있어요!
    • 소탈한상사조84
      소탈한상사조84

      R과 파이썬은 데이터 종류와 과제 성격에 따라 사용하는게 다르기 때문에 궁극적으로는 같이 공부하시는게 좋을것 같습니다.

      R은 연구목적의 업무에 최적화 되어 있는 언어로 데이터 분석도 용이하게 처리할 수 있습니다.

      주로 사용하는 곳은 아래와 같습니다.

      - 패키지들을 쉽게 다루기 위한 dplyr, plyr, data table

      - 문자열을 처리하기 위한 stringr

      - 시계열 분석을 위한 zoo

      - 데이터 시각화를 위한 ggvis, lattice, ggplot2

      - 머신러닝을 위한 caret

      파이썬은 데이터 분석결과를 다른 어플리케이션에 접목하거나 통계 코드를 데이터베이스 등에 포함시킬 때 주로 사용합니다.

      각각의 장단점을 보겠습니다.

      [R의 장점]

      - 강력한 데이터 시각화

      - 풍부한 패키지와 활발한 커뮤니티

      - 통계학자들에 의해 개발되었기 때문에 데이터 사이언스의 통용어라고 할 수 있다

      [R의 단점]

      - 읽기 어려운 코드로 인한 느린 속도

      - 배우기가 어렵다

      [파이썬 장점]

      - IPython Notebook를 통해 작업속도와 비용을 줄여준다

      - 배우기 쉬운 언어

      - 데이터분석 이외에도 다양한 용도로 사용가능

      [파이썬 단점]

      - R에 비해 시각화 결과가 만족스럽지 못하다

      - 오래된 데이터 분석 툴로서 R보다 이제 시작하는 수준

      결론적으로 어떤 데이터를 분석할 지, 비용과 시간이 중요한지, 분석과 관련된 다양한 여타 툴의 익숙성 문제 등 사용 목적에 따라 선택을 하며 되지만 궁극적으로 데이터 사이언스가 목적이라면 우선 파이썬을 공부하신 후 R를 도전해 보시는 것을 추천합니다.

    • 데이터사이언스의 경우 데이터에 대한 이해가 높아야합니다.

      데이터를 변환하거나 문제가는 데이터는 파이썬 같은 프로그래밍으로 처리로직을 만들 수 있습니다.

      그외에도 어떠한 알고리즘을 어떻게 적용해야할지? 데이터들의 연관성 또는 비즈니즈에 맞는 데이터 분석 방법등 다루어야할 것들이 많을 것 같습니다.