본문 바로가기
Python/Python FAQ

Python 판다스를 사용하여 하나의 데이터프레임에서 테스트와 트레인 샘플을 어떻게 생성하나요?, How do I create test and train samples from one dataframe with pandas?

by 베타코드 2023. 10. 7.
반응형

질문


나는 데이터프레임 형태로 상당히 큰 데이터셋을 가지고 있고, 데이터프레임을 훈련용과 테스트용으로 무작위로 두 개의 샘플(80%와 20%)로 분할하는 방법이 궁금합니다.

감사합니다!


답변


Scikit Learn의 train_test_split은 좋은 것입니다. 이것은 numpy 배열과 데이터프레임 모두를 분할할 수 있습니다.

from sklearn.model_selection import train_test_split

train, test = train_test_split(df, test_size=0.2)
반응형

댓글