본문 바로가기

NumPy4.4

Python 기존 열을 기반으로 값을 선택하여 새로운 열을 생성하는 방법은 무엇인가요?, How do I create a new column where the values are selected based on existing columns? 질문 다음 데이터프레임에 color 열을 어떻게 추가하면, Set == 'Z'인 경우에는 color='green'이고, 그렇지 않은 경우에는 color='red'이 되도록 할 수 있을까요? Type Set 1 A Z 2 B Z 3 B X 4 C Y 답변 만약 두 가지 선택지만 있다면 np.where를 사용하세요: df['color'] = np.where(df['Set']=='Z', 'green', 'red') 예를 들어, import pandas as pd import numpy as np df = pd.DataFrame({'Type':list('ABBC'), 'Set':list('ZZXY')}) df['color'] = np.where(df['Set']=='Z', 'green', 'red') print.. 2023. 10. 25.
Python NumPy에서 CSV 데이터를 레코드 배열로 어떻게 읽을 수 있나요?, How do I read CSV data into a record array in NumPy? 질문 CSV 파일의 내용을 레코드 배열로 직접 가져올 수 있는 방법이 있을까요? 마치 R의 read.table(), read.delim(), read.csv() 함수가 데이터를 R 데이터프레임으로 가져오는 것처럼 말이죠. 아니면 csv.reader()를 사용한 다음에 numpy.core.records.fromrecords()를 적용해야 할까요? 답변 다음과 같은 HTML을 한국어로 번역하되, HTML 태그와 태그 안의 텍스트는 영어로 보존하세요. numpy.genfromtxt()를 사용하여 delimiter 인수를 쉼표로 설정하세요: from numpy import genfromtxt my_data = genfromtxt('my_file.csv', delimiter=',') 2023. 9. 19.
Python 특정 항목이 ndarray에서 몇 번 발생하는지 어떻게 세나요?, How do I count the occurrence of a certain item in an ndarray? 질문 다음 배열에서 0과 1의 개수를 어떻게 세나요? y = np.array([0, 0, 0, 1, 0, 1, 1, 0, 0, 0, 0, 1]) y.count(0)은 다음을 반환합니다: numpy.ndarray 객체에는 count 속성이 없습니다. 답변 numpy.unique를 사용하여: import numpy a = numpy.array([0, 3, 0, 1, 0, 1, 2, 1, 0, 0, 0, 0, 1, 3, 4]) unique, counts = numpy.unique(a, return_counts=True) >>> dict(zip(unique, counts)) {0: 7, 1: 4, 2: 1, 3: 2, 4: 1} Non-numpy 방법으로 collections.Counter를 사용하여: impo.. 2023. 9. 10.
Python NumPy를 사용하여 유클리드 거리를 어떻게 계산할 수 있나요?, How can the Euclidean distance be calculated with NumPy? 질문 나는 3D 공간에서 두 점을 가지고 있습니다: a = (ax, ay, az) b = (bx, by, bz) 나는 그들 사이의 거리를 계산하고 싶습니다: dist = sqrt((ax-bx)^2 + (ay-by)^2 + (az-bz)^2) NumPy로 이것을 어떻게 할 수 있을까요? 나는 다음과 같이 가지고 있습니다: import numpy a = numpy.array((ax, ay, az)) b = numpy.array((bx, by, bz)) 답변 numpy.linalg.norm를 사용하세요: dist = numpy.linalg.norm(a-b) 이 작업은 유클리드 거리가 l2 norm이기 때문에 numpy.linalg.norm의 ord 매개변수의 기본값이 2인 것입니다. 더 많은 이론은 데이터 마.. 2023. 7. 10.