본문 바로가기

csv5

Python Pandas 데이터프레임을 디스크에 반전 가능하게 저장하고 로드하는 방법은 무엇인가요?, How to reversibly store and load a Pandas dataframe to/from disk 질문 지금은 스크립트를 실행할 때마다 상당히 큰 CSV를 데이터프레임으로 가져오고 있습니다. 스크립트가 실행되는 동안 그 데이터프레임을 계속 사용할 수 있는 좋은 해결책이 있을까요? 그렇게 하면 스크립트가 실행되는 동안 시간을 기다리는 데에 모든 시간을 보내지 않아도 될 것 같습니다. 답변 가장 쉬운 방법은 pickle을 사용하여 to_pickle으로 저장하는 것입니다: df.to_pickle(file_name) # 저장할 위치, 일반적으로 .pkl 형식으로 저장합니다. 그런 다음 다음을 사용하여 다시 불러올 수 있습니다: df = pd.read_pickle(file_name) 참고: 0.11.1 이전에는 save와 load가 이 작업을 수행하는 유일한 방법이었습니다 (지금은 각각 to_pickle과 r.. 2023. 11. 24.
Python 오류 "(유니코드 오류) 'unicodeescape' 코덱은 위치 2-3의 바이트를 디코드 할 수 없습니다: 잘린 \UXXXXXXXX 이스케이프" [중복], Error "(unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: trunc.. 질문 I'm trying to read a CSV file into Python (Spyder), but I keep getting an error. My code: import csv data = open("C:\Users\miche\Documents\school\jaar2\MIK\2.6\vektis_agb_zorgverlener") data = csv.reader(data) print(data) I get the following error: SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape I have tried to replace the \ w.. 2023. 10. 18.
Python으로 작성된 CSV 파일은 각 행 사이에 빈 줄이 있습니다., CSV file written with Python has blank lines between each row 질문 import csv with open('thefile.csv', 'rb') as f: data = list(csv.reader(f)) import collections counter = collections.defaultdict(int) for row in data: counter[row[10]] += 1 with open('/pythonwork/thefile_subset11.csv', 'w') as outfile: writer = csv.writer(outfile) for row in data: if counter[row[10]] >= 504: writer.writerow(row) 이 코드는 thefile.csv를 읽어 변경을 수행하고 결과를 thefile_subset1에 작성합니다. 그러나 Mi.. 2023. 7. 24.
Python 저장된 CSV 파일에서 판다스가 인덱스를 생성하는 것을 피하는 방법은 무엇인가요?, How to avoid pandas creating an index in a saved csv 질문 나는 파일을 편집한 후에 csv 파일을 폴더에 저장하려고 시도하고 있습니다. 매번 pd.to_csv('C:/파일 경로.csv')를 사용할 때마다 csv 파일에 별도의 인덱스 열이 생성됩니다. csv에 인덱스를 출력하지 않고 싶습니다. 다음을 시도해 보았습니다: pd.read_csv('C:/편집할 파일 경로.csv', index_col = False) 그리고 파일을 저장하기 위해... pd.to_csv('C:/편집된 파일을 저장할 경로.csv', index_col = False) 하지만 여전히 원치 않는 인덱스 열이 나타납니다. 파일을 저장할 때 이를 어떻게 피할 수 있을까요? 답변 Use index=False. df.to_csv('your.csv', index=False) index=False를 사.. 2023. 7. 20.