반응형

정규표현식 3

정규표현식(3) [Python]

반복 패턴 검사하기 다음은 반복 단어를 찾는 검색 패턴이다. (\w+) \1 이 패턴은 w 문자(글자, 숫자 혹은 언더스코어) 중 1개 이상으로 나열된 단어와 일치한 후 빈칸 다음에 동일한 단어가 반복되는 것을 찾는다. 이 패턴은 다음 문장과는 일치하지 않는다. the dog the와 dog는 모두 단어 조건(\w+)에 부합되지만, 두 번째 단어가 첫 번째 단어와 동일하지 않다. 단어 the는 태그되었지만, 이 경우에는 반복되지 않았다. 반면 다음 문장은 이 패턴과 일치한다. 태그된 부분 문자열인 the가 반복되기 때문이다. the the 동일 패턴을 사용한 전체 코드를 살펴보자. 대상 문자열을 the the로 설정했다. import re s = 'The cow jumped over the the moo..

Python 2022.11.28

정규표현식(2) [Python]

import re pat = r'\d{1,3}(,\d{3})*(\.\d*)?' lst = re.findall(pat, '12,000 monkeys on 55.5 cats.') print(lst) # 출력 # [(',000', ''), ('', '.5')] 역추적, 탐욕적 수량자와 게으른 수량자 정규표현식 예시 import re pat1 = r'(\w|[@#$%^&*!]){8,}$'# 문자와 언더스코어, @#$%^&*! 중 하나를 허용하며, 8개의 문자를 요구한다. pat2 = r'.*\d'# 0개부터 여러 개의 문자와 일치한 후 하나의 숫자와 일치한다. pat3 = r'.*[a-zA-Z]'# 0개부터 여러 개의 문자와 일치(.*)한 후 대문자 혹은 소문자 글자와 일치한다. pat4 = r'.*[@#$%^..

Python 2022.11.17

정규표현식(1) [Python]

정규표현식 더하기 기호(+)는 최소 1개 이상의 문자를 의미한다. ex) ab+c abc abbc abbbc ... 곱하기 기호(*)는 더하기 기호와 비슷하지만 0개의 경우도 포함한다. ex) ab*c ac abc abbc abbbc ... 전화번호를 검증하는 함수를 함수를 작성해보자. 숫자를 의미하는 #을 사용하는 경우 다음과 같이 패턴을 작성할 수도 있다. ###-###-#### 정규표현식 문법으로는 다음과 같이 작성할 수 있다. \d\d\d-\d\d\d-\d\d\d\d 이 경우 역스리시(\)는 이스케이프 시퀀스로 동작하지만 d를 리터럴 문자로 만들지 않고, 특별한 의미를 부여한다. 부분표현식 \d는 하나의 숫자와 일치하는 것을 의미한다. 다음 부분표현식으로도 숫자를 표현할 수 있다. [0-9] 반면..

Python 2022.11.16
반응형