반응형
질문
나는 데이터프레임 형태로 상당히 큰 데이터셋을 가지고 있고, 데이터프레임을 훈련용과 테스트용으로 무작위로 두 개의 샘플(80%와 20%)로 분할하는 방법이 궁금합니다.
감사합니다!
답변
Scikit Learn의 train_test_split
은 좋은 것입니다. 이것은 numpy 배열과 데이터프레임 모두를 분할할 수 있습니다.
from sklearn.model_selection import train_test_split
train, test = train_test_split(df, test_size=0.2)
반응형
'Python > Python FAQ' 카테고리의 다른 글
Python 변수 변수를 어떻게 생성하나요?, How do I create variable variables? (0) | 2023.10.07 |
---|---|
Python 파이썬으로 새로운 사전을 만들기, Creating a new dictionary in Python (0) | 2023.10.07 |
Python 열에 계층적 인덱스를 평평하게 만드는 방법, How to flatten a hierarchical index in columns (0) | 2023.10.07 |
Python 파이썬 진행 바, Python Progress Bar (0) | 2023.10.07 |
Python PyCharm에서 미해결된 참조 문제, Unresolved reference issue in PyCharm (0) | 2023.10.07 |
댓글