유틸리티 가져오기

정규 표현식 (TMS)

컨텐츠는 영어 텍스트를 Phrase Language AI를 이용해 기계 번역한 것입니다.

정규식(regex 또는 regexp로 약칭)은 주로 문자열과의 패턴 일치 또는 문자열 일치에 사용하기 위해 검색 패턴을 형성하는 일련의 문자입니다. 기능은 더 복잡하고 특이성이 있는 찾기 및 바꾸기 작업과 유사하거나 정의된 콘텐츠를 제외하는 방법입니다. 정규 표현식에 대한 자세한 설명과 사용 된 문자 표는 wikipedia 항목을 참조하십시오.

한 번에 여러 정규 표현식을 사용하려면 그 사이에 파이프라인 문자 |를 삽입합니다.

정규 표현식은 CAT 데스크톱 편집기의 필터, 검색 및 바꾸기 필드, 콘텐츠 검색 기능의 소스 및 대상 필드, 가져오기 설정태그로 변환 기능 및 세그멘테이션 규칙을 사용자 정의하는 데 사용할 수 있습니다.

중요하다

Phrase는 Java 정규 표현식을 지원하지만 시스템을 과부하로부터 보호하기 위해 복잡한 정규식을 거부합니다. 복합 정규 표현식은 다른 한정자(소유격 제외)를 포함하는 그룹에 한정자(소유격 제외)가 있는 정규식입니다.

일반적인 예

파일을 가져올 때 텍스트를 태그로 변환하고 검색 및 바꾸기 기능을 위해 편집기에서 regexp를 사용하는 예:

본보기

설명

<[^>]+>

represents <html_tag>

\{[^\}]+\}

{variable}을(를) 나타내고,

\[[^\]]+\]

[변수]를 나타내고,

\[\[.+?\]\]

는 [[aa[11]bb]]를 나타냅니다.

\$[^\$]+\$

$operator_Name1$을 나타냅니다.

\d+

숫자를 나타냅니다. Also, [0-9]+

[A-Za-z0-9]

영숫자를 나타냅니다.

.+\@.+\..+

email address name@domain.com

\d{4}[-]\d{2}[-]\d{2}

등록일 2018-08-01

\s$

세그먼트 끝의 공백

^\s

세그먼트 시작 부분의 공백

\s\s

이중 공백

^\d

세그먼트 시작 부분의 숫자

\w+\s\s\w+

단어 사이의 이중 공백

\s\n

공백 문자가 앞에 오는 줄 바꿈

\S\n

공백이 아닌 문자가 앞에 오는 줄 바꿈

<[^>]+>|\$[^=]+=

PHP 변수와 HTML 코드를 변환합니다 ($svariable['name'] =)

^\s*\'[^:]+:

JavaScript의 필드 키를 줄 시작 부분에 공백이 추가된 상태로 변환합니다( 'key' :)

\{\{[^\}]+\}\}|\'[^']+\'

'{{text here}} 콘텐츠를 번역 {{text here}} 하지 않고 태그로 변환합니다.

TXT 가져오기

특정 텍스트를 가져올 때 정규식의 예:

  1. ## ErrorMessage ##1## 숫자는 0보다 커야 합니다. ##Z##

    ##1##과 ##Z## 사이의 텍스트를 가져오려면 regexp: (?<=##1## ).*(?= ##Z##)를 사용하십시오.

  2. ErrorMessage("숫자는 0보다 커야 합니다.")

    ( "와 ") 사이의 텍스트를 가져 오려면 regexp : (?<=\(").*(?="\))

  3. 'errorMessage' = '숫자는 0보다 커야 합니다.'

    = 기호 뒤와 '와 ' 사이의 텍스트를 가져오려면 regexp: (?<=\= ').*(?=')를 사용합니다.

  4. errorMessage = "번역할 내용입니다."

    = 기호 뒤와 'and' 사이의 텍스트를 가져오려면 regexp: (?<=\= ").*(?=")를 사용하십시오.

  5. msgstr ("숫자는 0보다 커야 합니다.")

    TXT 필터를 사용하여 단일 언어 PO 파일에서 msgstr 문자열을 가져오려면 regexp: (?<=msgstr ").*(?=")를 사용합니다.

  6. # 참고: 이것은 메모입니다

    #으로 시작하는 줄을 제외하려면 regexp: (^[^#].*)를 사용합니다.

  7. 값 '126', 'DCeT', '텍스트(en)'

    Text (en)'와 같이 따옴표와 (en)이 있는 텍스트만 가져오려면 regexp: (?<=')[^']*\(en\)(?=')를 사용하십시오.

JSON 가져오기

JSON 구조 예제:

{
"list": {
        "id": "1",
        "value": "text 1 for translation."
        },
"text": {
        "id": "2",
        "value": "text 2 for translation."
        },
"메뉴": {
        "id": "3",
        "value": "text 3 for translation."
         },"array": ["blue","green"],"arrays": [{        "color": "blue",        "title": "BLUE"
         },         {        "color": "green",        "title": "녹색" } ]}
  • 레벨에 관계없이 모든 값을 가져오려면 (^|. */)값

  • 목록에서 하나의 값만 가져오려면 list/value를 사용합니다.

  • 목록 및/또는 메뉴에서 값을 가져오려면 | (OR) 연산자: list/value|menu/value

  • 메뉴에서 값의 첫 번째 인스턴스만 가져오려면 menu\[1\]/value를 사용합니다.

  • 특정 키 다음에 JSON 배열의 내용을 가져오려면 (^|. */)배열\[.*\]

  • 특정 객체 배열의 내용을 가져오려면 (^|. */)배열\[.*\].*

YAML 가져오기

YAML 플라이 예 :

타이틀: A
text: 번역 A
카테고리:
  타이틀: B
  text: 번역 B
카테고리:
  타이틀: C
  text: C 번역
카테고리:
  콘텐츠:
      타이틀: D
      text: D 번역

가져오기를 위한 정규 표현식:

  • '번역 A'만 : 텍스트

  • 'C 번역'만 : categories\[2\]/text

  • 'D 번역'만 : categories\[\d+\]/content[\1\]/text

  • 모든 텍스트: text|categories\[\d+\]/text|categories\[\d+\]/content[\d+\]/text

세그멘테이션 규칙

Okapi, JavaUnicode 는 의 세그멘테이션 규칙에 사용됩니다. SRX 파일.

에서 정규 표현식 사용 . SRX 파일은 복잡하므로 작업을 시도하기 전에 정규식 사용에 대한 기본 지식을 사용하는 것이 좋습니다.

Nobreak 규칙(약어 등) 및 Break 규칙(점이 있는 문장 끝 등)은 에 있습니다. SRX 파일.

본보기

설명

[\p{C}]

보이지 않는 제어 문자.

[\p{Z}]

공백

[\p{Lu}]

소문자 변형이 있는 대문자입니다.

[\p{N}]

모든 종류의 숫자입니다.

\Q ... \E

인용문의 시작과 끝 - (\QApprox.\E). 약어에 사용됩니다.

\t

집계

\n

줄 바꿈

\u2029

단락 구분 기호

\u200B

너비가 0인 공간

\u3002

표의 문자 마침표

\ufe52

작은 마침표

\uff0e

전폭 마침표

\uff61

반자 표의 문자 마침표

\ufe56

작은 물음표

\uff1f

전각 물음표

\u203c

이중 느낌표

\u2048

물음표 느낌표

\u2762

굵은 느낌표 장식

\u2763

무거운 마음 느낌표 장식

\ufe57

작은 느낌표

\uff01

전각 느낌표

일반적인 커스텀 QA 검사

QA 확인

소스 정규 표현식

대상 정규 표현식

대상의 추가 번호

\d

\d

태그 순서(페어링 해제)

^.*\{1\}.*\{2\}.*$

^.*\{1\}.*\{2\}.*$

태그 순서(페어링 해제)

^.*\{1\}.*\{2\}.*\{3\}.*$

^.*\{1\}.*\{2\}.*\{3\}.*$

태그 순서(페어링 해제)

^.*\{1\}.*\{2\}.*\{3\}.*\{4\}.*$

^.*\{1\}.*\{2\}.*\{3\}.*\{4\}.*$

태그 순서(페어링)

^.*\{1\&gt;.*\&lt;1\}.*\{2\&gt;.*\&lt;2\}.*$

^.*\{1\&gt;.*\&lt;1\}.*\{2\&gt;.*\&lt;2\}.*$

태그 순서(페어링)

^.*\{1\&gt;.*\&lt;1\}.*\{2\&gt;.*\&lt;2\}.*\{3\&gt;.*\&lt;3\}.*$

^.*\{1\&gt;.*\&lt;1\}.*\{2\&gt;.*\&lt;2\}.*\{3\&gt;.*\&lt;3\}.*$

태그 앞의 공백

\s(\{[1-9][0-9]*\}|\{[1-9][0-9]*>|< [1-9] [0-9]*\}|\{[biu_\^]{1,4}>|< [biu_\^] {1,4}\})

\s(\{[1-9][0-9]*\}|\{[1-9][0-9]*>|< [1-9] [0-9]*\}|\{[biu_\^]{1,4}>|< [biu_\^] {1,4}\})

태그 뒤의 공백

(\{[1-9][0-9]*\}|\{[1-9][0-9]*>|< [1-9] [0-9]*\}|\{[biu_\^]{1,4}>|< [biu_\^] {1,4}\})\s

(\{[1-9][0-9]*\}|\{[1-9][0-9]*>|< [1-9] [0-9]*\}|\{[biu_\^]{1,4}>|< [biu_\^] {1,4}\})\s

태그 앞에 공백 없음

\S(\{[1-9][0-9]*\}|\{[1-9][0-9]*>|< [1-9] [0-9]*\}|\{[biu_\^]{1,4}>|< [biu_\^] {1,4}\})

\S(\{[1-9][0-9]*\}|\{[1-9][0-9]*>|< [1-9] [0-9]*\}|\{[biu_\^]{1,4}>|< [biu_\^] {1,4}\})

대괄호 누락

[^\[\]]*\[[^\[\]]*\][^\[\]]*

[^\[\]]*\[[^\[\]]*\][^\[\]]*

누락된 원형 대괄호

[^\(\)]*\([^\(\)]*\)[^\(\)]*

[^\(\)]*\([^\(\)]*\)[^\(\)]*

도움이 되었습니까?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.