본문 바로가기

pandas3.4

Python 데이터프레임의 열을 정규화하십시오., Normalize columns of a dataframe 질문 나는 각 열이 다른 값 범위를 가진 판다스 데이터프레임을 가지고 있습니다. 예를 들면: df: A B C 1000 10 0.5 765 5 0.35 800 7 0.09 이 데이터프레임의 열을 정규화하여 각 값이 0과 1 사이에 있도록 하는 방법이 있을까요? 원하는 출력은 다음과 같습니다: A B C 1 1 1 0.765 0.5 0.7 0.8 0.7 0.18(즉, 0.09/0.5) 답변 하나의 쉬운 방법은 Pandas를 사용하는 것입니다: (여기에서 평균 정규화를 사용하고 싶습니다) normalized_df=(df-df.mean())/df.std() min-max 정규화를 사용하려면: normalized_df=(df-df.min())/(df.max()-df.min()) 편집: 일부 우려 사항을 해결하기.. 2023. 11. 13.
Python 문자열에서 판다스 데이터프레임 생성하기, Create Pandas DataFrame from a string 질문 기능을 테스트하기 위해 문자열에서 DataFrame을 만들고 싶습니다. 테스트 데이터가 다음과 같다고 가정해 봅시다: TESTDATA="""col1;col2;col3 1;4.4;99 2;4.5;200 3;4.7;65 4;3.2;140 """ 그 데이터를 Pandas의 DataFrame으로 읽어들이는 가장 간단한 방법은 무엇인가요? 답변 이를 수행하는 간단한 방법은 StringIO.StringIO (python2) 또는 io.StringIO (python3)를 사용하여 pandas.read_csv 함수에 전달하는 것입니다. 예: import sys if sys.version_info[0] < 3: from StringIO import StringIO else: from io import StringI.. 2023. 11. 2.
Python 판다스 데이터프레임의 열 또는 행에서 목록을 가져오는 방법은 무엇인가요?, Get list from pandas dataframe column or row? 질문 나는 다음과 같이 엑셀 문서에서 가져온 데이터프레임 df를 가지고 있습니다: cluster load_date budget actual fixed_price A 1/1/2014 1000 4000 Y A 2/1/2014 12000 10000 Y A 3/1/2014 36000 2000 Y B 4/1/2014 15000 10000 N B 4/1/2014 12000 11500 N B 4/1/2014 90000 11000 N C 7/1/2014 22000 18000 N C 8/1/2014 30000 28960 N C 9/1/2014 53000 51200 N 나는 for루프를 실행하고 각 클러스터마다 엑셀 워크시트를 생성하기 위해 열 1의 내용인 df['cluster']을 리스트로 반환하고 싶습니다. 또한, 전.. 2023. 10. 5.
Python SQL과 같이 'in' 및 'not in'을 사용하여 Pandas 데이터프레임을 필터링하는 방법, How to filter Pandas dataframe using 'in' and 'not in' like in SQL 질문 SQL의 IN과 NOT IN과 동일한 결과를 어떻게 얻을 수 있을까요? 필요한 값들로 이루어진 리스트가 있습니다. 다음은 시나리오입니다: df = pd.DataFrame({'country': ['US', 'UK', 'Germany', 'China']}) countries_to_keep = ['UK', 'China'] # 의사 코드: df[df['country'] not in countries_to_keep] 현재 제가 이 작업을 수행하는 방법은 다음과 같습니다: df = pd.DataFrame({'country': ['US', 'UK', 'Germany', 'China']}) df2 = pd.DataFrame({'country': ['UK', 'China'], 'matched': True}) # I.. 2023. 7. 3.