r 정규표현식 예제

기본 구성 요소는 단일 문자와 일치하는 정규 표현식입니다. 모든 문자와 숫자를 포함한 대부분의 문자는 자신과 일치하는 정규 표현식입니다. 특별한 의미를 가진 모든 메타문자는 백슬래시와 함께 선행하여 인용될 수 있습니다. 확장 정규식의 메타 문자는 . | ) [ { ^ * * + ?,하지만 이러한 특별한 의미를 가지고 있는지 여부는 문맥에 따라 달라집니다. 기본적으로 정규식은 문자열의 모든 부분과 일치합니다. 정규식을 문자열의 시작 또는 끝에서 일치하도록 고정하는 것이 유용한 경우가 많습니다. 시작 및 끝 위치가 있는 문자열의 일부를 추출하는 데 사용할 수 있습니다. 예를 들어 dplyr_topic에서 처음 세 글자를 추출하려면 괄호는 1, 2 등과 같은 백리참조로 참조할 수 있고 str_match()로 추출할 수 있는 “그룹”을 정의합니다.

예를 들어 다음 정규식에서는 반복되는 문자 쌍이 있는 모든 과일을 찾습니다. “escape”를 사용하여 특수 한 동작을 사용하지 말고 정확하게 일치시키고 싶은 정규식을 알려야합니다. 문자열과 마찬가지로 정규식은 백슬래시를 사용하여 특수 동작을 이스케이프합니다. 따라서 .를 일치시키기 위해서는 정규어 .가 필요합니다. 불행히도 이것은 문제를 일으킵니다. 정규식을 나타내기 위해 문자열을 사용하고 는 문자열의 이스케이프 기호로도 사용됩니다. 그래서 정규식 을 만듭니다. 문자열 “\”이 필요합니다.

정규식(정규식 또는 정규법)은 특정 검색 패턴(예: ASCII 또는 유니코드 문자의 특정 시퀀스)의 하나 이상의 일치 항목을 검색하여 텍스트에서 정보를 추출하는 데 매우 유용합니다. 실제로 문자열에서 이중 백슬래시를 찾으면 다른 이중 백슬래시로 접두사를 지정해야 감지됩니다. 다음은 `정규식`이 문자열 집합을 설명하는 패턴입니다. 두 가지 유형의 정규식이 R, 확장 된 정규식 (기본값) 및 perl = TRUE에서 사용되는 Perl과 같은 정규식에 사용됩니다. 또한 리터럴 정규식을 사용하는 것으로 간주될 수 있는 고정 = TRUE가 있습니다. 하위 함수에는 정규식이 있는 문자열, 대체 텍스트가 있는 문자열 및 입력 벡터의 세 가지 필수 매개 변수가 있습니다. sub는 입력 벡터와 길이가 같은 새 벡터를 반환합니다. 정규식 일치가 문자열 요소에서 찾을 수 있으면 대체 텍스트로 바뀝습니다.

This entry was posted in Uncategorized. Bookmark the permalink.

Comments are closed.