본문 바로가기

punctuation2

Python 파이썬에서 문자열에서 영숫자 문자만 남기고 모두 제거하기, Stripping everything but alphanumeric chars from a string in Python 질문 파이썬을 사용하여 문자열에서 모든 영숫자가 아닌 문자를 제거하는 가장 좋은 방법은 무엇인가요? 이 질문의 PHP 버전에서 제시된 해결책들은 약간의 조정을 거치면 작동할 것 같지만, '파이썬 다운' 느낌이 들지 않습니다. 기록을 위해, 저는 마침표와 쉼표(및 기타 구두점)뿐만 아니라 따옴표, 괄호 등도 제거하려고 합니다. 답변 저는 그냥 호기심으로 몇 가지 함수를 시간 측정해 보았습니다. 이 테스트에서는 내장된 string 모듈의 string.printable에서 비알파벳 및 숫자가 아닌 문자를 제거합니다. '[\W_]+'와 pattern.sub('', str)의 사용이 가장 빠르다는 것을 알게 되었습니다. $ python -m timeit -s \ "import string" \ "''.join(c.. 2023. 11. 16.
Python 여러 단어 경계 구분자로 문자열을 단어로 나누세요., Split Strings into words with multiple word boundary delimiters 질문 나는 내가 하려는 것이 꽤 흔한 작업인 것 같지만 웹에서는 참조를 찾을 수 없었습니다. 저는 문장부호와 함께 텍스트를 가지고 있고, 단어들의 목록을 원합니다. "Hey, you - what are you doing here!?" 다음과 같이 되어야 합니다. ['hey', 'you', 'what', 'are', 'you', 'doing', 'here'] 하지만 파이썬의 str.split()은 하나의 인자만 작동하기 때문에, 공백으로 나눈 후에는 모든 단어들이 문장부호와 함께 있습니다. 아이디어가 있으신가요? 답변 re.split() re.split(pattern, string[, maxsplit=0]) Split string by the occurrences of pattern. If capturin.. 2023. 6. 30.