Skip to main content

31장 RegExp

1. 정규 표현식이란?

Regular Expression은 일정한 패턴을 가진 문자열의 집합을 표현하기 위해 사용하는 형식 언어이다 (formal language).

자바스크립트의 고유 문법이 아니며, 대부분의 프로그래밍 언어, 코드 에디터에 저장되어 있다. 자바스크립트는 Perl의 정규 표현식 문법을 도입한다.

정규 표현식은 문자열을 대상으로 패턴 매칭 기능을 제공: 특정 패턴과 일치하는 문자열을 검색하거나 추출, 치환할 수 있는 기능

예) 입력받은 휴대폰 전화번호가 유효한 전화번호인지 체크하는 경우

2. 정규 표현식의 생성

정규 표현식 리터럴: /regexp/i

RegExp 생성자 함수: new RegExp(/is/i) - 변수를 사용해 동적으로 regExp 객체를 생성할 수 있다.

3. RegExp 메서드

  • RegExp.prototype.exec

인수로 전달받은 문자열에 대해 정규 표현식의 패턴을 검색하여 매칭 결과를 배열로 반환 (무조건 첫번째 매칭 결과만 반환)

  • RegExp.prototype.test

패턴 매칭 결과를 불리언값으로 반환

  • String.prototype.match

대상 문자열과 인수로 전달받은 정규 표현식과의 매칭결과를 배열로 반환 - 매칭되는 모든 결과

4. 플래그

정규 표현식의 검색 방식을 설정하기 위해 사용한다.

  • i: ignore case 대소문자 구별하지않고 패턴 검색

  • g: global 대상 문자열내에서 패턴과 일치하는 모든 문자열을 전역 검색한다

  • m: multi line 문자열의 행이 바뀌더라도 패턴 검색 계속

  • 플래그 사용 안할시: 대소문자 구별, 첫번째 매칭 대상만 검색 후 종료

5. 패턴

정규 표현식은 패턴과 플래그로 구성.

패턴은 / 로 열고 닫으며 문자열 따옴표는 생략. 특별한 의미를 가지는 메타 문자 또는 기호로 표현.

  • 문자열 검색

패턴에 문자 또는 문자열을 지정하면 검색 대상 문자열에서 패턴으로 지정한 문자 또는 문자열을 검색. - 메서드 사용

  • 임의의 문자열 검색

.은 임의의 문자 한개를 의미.

const regExp = /.../g; //임의의 3자리 문자열을 대소문자를 구별하여 전역 검색
  • 반복 검색

{m,n}은 앞선 패턴이 최소 m번, 최대 n번 반복되는 문자열을 의미

{n} = {n,n} : n번 반복

{n,} : 최소 n번 이상

+={1,} 최소 1번 이상

?: 최대 한번 (0번 포함)이상 반복되는 문자열

const target = ‘color colour’;
const regExp = /colou?r/g;
target.match(regExp) // [’color’, ‘colour’]
  • OR 검색

|은 or의 의미한다.

const regExp = /A|B/g;

[ ] 내의 문자는 or로 동작. 그 뒤에 +를 사용하면 앞선 패턴을 한번 이상 반복.

const regExp = /[AB]+/g;

범위를 지정하려면 [ ]내에 -를 사용.

const regExp = /[A-Z]+/g;
const regExp = /[A-Za-z]+/g;

숫자표현

const regExp = /[0-9,]+/g;

\d는 숫자를 의미, \D는 숫자가 아닌 문자를 의미한다.

ex. let regExp = /[\d,]+/g; 
regExp = /[\D,]+/g;

\w는 알파벳, 숫자, 언더스코어를 의미하고, \W는 그 세개가 아닌 문자를 의미.

  • NOT 검색

[ ] 내의 ^은 not의 의미를 갖는다. 0-9 는 숫자를 제외한 문자를 의미. 즉 \D와 같음

  • 시작위치로 검색

[ ] 밖의 ^은 문자열의 시작을 의미한다.

  • 마지막 위치로 검색

$는 문자열의 마지막을 의미

const regExp = /^https/;
//https로 시작하는지 검사

const regExp = /com$/;
//com으로 끝나는지 검사

31.6 자주 사용하는 정규 표현식