아핫뉴스실시간 인기검색어
아핫뉴스 화산 이미지
화산 아이콘 11
비트코인 대폭락 경고
아하

학문

기계공학

강력한가위
강력한가위

논문 작성시 데이터 처리를 어떻게 해야할까요?

학위 논문 처음으로 쓰고 있습니다

데이터 처리시 의문점이 있어 질문합니다

1 실험 결과중 편차를 많이 벗어난 값의 처리

ㅡ 삭제 혹은 재측정 하기엔 어려운 상황입니다

2 여러 데이터의 통계처리

ㅡ 시작점이 실험마다 다른데 변화의 추세는 비슷한 데이터를 어떻게 표현하는게 좋은지 궁금합니다

3 엑셀 외에 주로 사용하는 프로그램이 어떤게 있는지 궁금합니다

2개의 답변이 있어요!
  • 안녕하세요. 서종현 전문가입니다.

    • 편차를 많이 벗어난 값(이상치) 처리 : 삭제나 재측정이 어려운 경우, 학위 논문에서는 해당 값을 단순히 없애기보다는 다음 방법을 고려하는것이 좋습니다.

      1. 명확히 기술 및 근거 제시 : 논문에 해당 데이터가 이상치임을 밝히고, 왜 삭제하거나 재측정하지 않았는지, 그리고 이러한 이상치가 분석 결과에 어떤 영향을 미칠수 있는지 솔직하게 기술하는 것이 중요합니다.

      2. 강건 통계 활용 : 평균 대신 중앙값을 사용하거나, 이상치의 영향을 덜 받는 통계 분석 방법을 적용하는것을 고려 해볼수있습니다.

      3. 데이터 변환 : 로그 변환 등을 통해 데이터 분포의 왜곡을 줄이는 방법도 있지만, 변환된 데이터의 해석에 유의해야 합니다.

    • 여러 데이터의 통계 처리 : 시작점이 다른 여러 데이터의 변화 추세를 비교할때는 상대적인 변화를 보여주는 것이 효과적입니다.

      1. 시작점 대비 변화율 계산 : 각 시점의 값을 해당 실험의 시작점 값으로 나누어 백분율 변화로 표시하면, 시작점의 절대적인 차이와 관계없이 추세의 유사성을 명확하게 비교하고 시각화할수있습니다.

      2. 정규화 또는 표준화 : 데이터를 동일한 척도로 변환하여 비교하는 방법도 있습니다.(예:0과 1사이로 스케일링 또는 평균0, 표준 편차 1로 맞추기)

    • 엑셀 외 주로 사용하는 프로그램 : 심화된 통계 분석 데이터 처리를 위해서는 엑셀 외에 다음 프로그램들을 주로 사용합니다.

      1. R : 통계 분석 및 시각화에 특화된 오픈 소스 프로그래밍 언어로, 다양한 통계 패키지가 있어 학술 연구에서 매우 널리 활용됩니다.

      2. 파이썬 : Pandas, NumPy,Matplotlib 등의 라이브러리를 통해 데이터 처리, 분석, 시각화 까지 폭넓게 활용되며, 특히 데이터 과학 분야에서 강력한 도구입니다.

      3. SPSS,SAS,STATA : 이들은 상업용 통계 소프트웨어로, 사용자 친화적인 인터페이스를 제공하여 복잡한 통계 분석을 수행할수있습니다.

      4. GraphPad Prism : 생명 과학 분야에서 주로 사용 되며, 그래프 작성과 통계 분석에 특화 되어 있습니다.

  • 탈퇴한 사용자
    탈퇴한 사용자

    안녕하세요. 조일현 전문가입니다.

    이상치가 결과 해석에 중요 하거나 분석 가정에 큰 영향을 줄 수 있다면 삭제하는 것이 좋을 듯합니다.

    이에 따라 삭제 이유와 삭제 전 후 결과를 기록할 필요가 있으며 만약 삭제가 어렵다면 로그나 제곱근 등 방법을 통해 이상치를 줄일 수 있어야합니다. 각 실험의 시작점이 다르더라도 변화량,증감비 등 값을 비교하는 방법이 유용하며

    데이터 특성에 따라 적합한 통계 기법을 선택하는 것이 바람직합니다.

    엑셀 외 자주 쓰이는 프로그램으로는 R/Python/SPSS/SAS/Tableau 등이 있겠습니다.