아하
생활
깔끔한올빼미80
깔끔한올빼미80
20.10.20

랜덤포레스트 사용한 코드인데요 오류찾기 부탁드립니다 ㅠㅠ

피싱사이트 검출 프로젝트입니다.

위가 실제 제프로젝트 코드인데요

https://google.com으로 실험할 url을 넣고 predict_proba 돌렸을때 매번 다른 값이 나옵니다.

왜그런건가요?

같은 기준으로 돌리면 매번 같은 결과가나와야한다고 생각하는데 ...

55글자 더 채워주세요.
1개의 답변이 있어요!
  • 소탈한라마28
    소탈한라마28
    20.10.22

    안녕하세요,

    랜덤 포레스트 알고리즘은 이름에서 보이듯이 난수(random number)를 이용하는 알고리즘 입니다.

    난수 값을 이용해서 랜덤 샘플링을 하고 분류기를 학습하기 때문에 매번 다른 값이 나오게 됩니다.

    즉, 오류는 아닙니다.

    만약 매번 동일한 결과를 얻고 싶으시다면, 난수 생성 시 seed 값을 고정하시면 됩니다.

    import random seed_number = 21 random.seed(seed_number) # or RandomForestClassifier(n_estimator=1000, random_state = random.seed(seed_number))

    위 코드를 참조하시면 됩니다.

    감사합니다.