유틸리티 가져오기

정규식 (TMS)

컨텐츠는 영어 텍스트를 Phrase Language AI를 이용해 기계 번역한 것입니다.

정규식(정규식 또는 Regexp로 약칭)은 주로 문자열 또는 문자열 일치를 통한 패턴 일치에 사용하기 위해 검색 패턴을 형성하는 일련의 글자입니다. 기능은 더 복잡하고 구체적인 찾기 및 바꾸기작업과 유사합니다 . Regexp에 대한 자세한 설명과 사용 된 글자 표는 wikipedia 항목을 참조하십시오.

끝 한 번에 여러 개의 정규 표현식을 사용삽입 그 사이에 파이프라인 문자 | 를 사용합니다.

정규 표현식은 CAT 데스크톱 편집기의 필터, 검색 및 바꾸기 필드, 컨텐츠 기능에, 대한 검색의 소스 및 대상 필드 파일 가져오기 설정의 태그로 변환 기능 및 사용자 지정에 사용할 수 있습니다 세그멘테이션 규칙.

일반적인 예

파일을 가져올 때 텍스트를 태그로 변환하고 검색 및 바꾸기 기능을 위해 편집기에서 Regexp 사용하는 예:

본보기

묘사

<[^>]+>

represents <html_tag>

\{[^\}]+\}

는 {variable}을 나타내고,

\[[^\]]+\]

는 [variable]을 나타냅니다.

\[\[.+?\]\]

는 [[aa[11]bb]]를 나타냅니다.

\$[^\$]+\$

$operator_Name1$을 나타냅니다.

\d+

숫자를 나타냅니다. Also, [0-9]+

[A-Za-z0-9]

영숫자 문자를 나타냅니다.

.+\@.+\..+

email address name@domain.com

\d{4}[-]\d{2}[-]\d{2}

날짜 2018-08-01

\s$

세그먼트 끝에 있는 여백

^\s

세그먼트 초반의 여백

\s\s

더블 여백

^\d

세그먼트 시작 부분의 숫자

\w+\s\s\w+

단어 사이의 이중 여백

\s\n

여백 문자 앞에 줄 바꿈

\S\n

여백 문자가 아닌 문자가 앞에 오는 줄 바꿈

<[^>]+>|\$[^=]+=

PHP 변수 및 HTML 코드 변환 ($svariable['name'] =)

^\s*\'[^:]+:

줄의 시작 부분에 공백이 추가됨 JavaScript의 필드 키를 변환합니다( 'key' :)

\{\{[^\}]+\}\}|\'[^']+\'

'{{text here}} 컨텐츠를 번역 {{text here}} 하지 않고 태그로 변환합니다.

TXT 가져오기

특정 텍스트를 가져올 때의 정규 표현식의 예:

  1. ## 오류 메시지 ##1## 숫자는 0보다 커야 합니다. # #Z##

    ##1##과 ##Z## 사이의 텍스트 끝 가져오기 Regexp: (?<=##1## ).*(?= ##Z##) ,

  2. ErrorMessage("숫자는 0보다 커야 합니다.")

    ("와 ") 사이의 텍스트끝 가져오기 Regexp 사용합니다: (?<=\(") , .*(?="\))

  3. 'errorMessage' = '숫자는 0보다 커야 합니다.'

    = 기호 뒤 와 '와 ' 사이의 텍스트끝 가져오기 Regexp: (?<=\= ').*(?=' , )

  4. errorMessage = "번역할 예정입니다"

    = 기호 뒤와 'and'사이의 텍스트끝 가져오기 Regexp 사용합니다: (?<=\= ").*(?=")

  5. msgstr ("숫자는 0보다 커야 합니다.")

    TXT 필터를 사용하는 단일 언어 PO 파일에서 msgstr 문자열 끝 가져오기 Regexp : (?<=msgstr ").*(?=")를 사용합니다.

  6. # 참고: 이것은 참고입니다

    # , 으로 시작하는 줄을 제외끝 Regexp: (^[^#].*)를 사용합니다.

  7. 값 '126', 'DCeT', '텍스트(en)'

    Text (en)' use Regexp: (?<=')[^']*\(en\)(?=')와 같이 따옴표로 묶인 텍스트만 끝 가져오기.,

JSON 가져오기

JSON 구조 예제:

{
"list": {
        "id": "1",
        "value": "번역을 위한 텍스트 1."
        },
"text": {
        "id": "2",
        "value": "번역을 위한 텍스트 2."
        },
"메뉴": {
        "id": "3",
        "value": "번역을 위한 텍스트 3."
         },"array": ["blue","green"],"arrays": [{        "color": "blue",        "title": "블루"
         },         {        "color": "green",        "title": "녹색" } ]}
  • 레벨에 관계없이 모든 값을 가져오려면 (^|. */)값

  • 목록에서 하나의 값만 가져오려면 list/value를 사용합니다.

  • 목록 및/또는 메뉴에서 값을 가져오려면 | (OR) 연산자: list/value|menu/value

  • 메뉴에서 값의 첫 번째 인스턴스만 가져오려면 menu\[1\]/value를 사용합니다.

  • 특정 키 다음에 오는 JSON 배열의 컨텐츠 가져오려면 (^|. */)배열\[.*\]

  • 특정 객체 배열의 컨텐츠 가져오기하려면 (^|. */)배열\[.*\].*

YAML 가져오기

YAML 플라이 예제:

타이틀: A
텍스트: A 번역
카테고리:
  타이틀: B
  텍스트: B 번역
카테고리:
  타이틀: C
  텍스트: C 번역
카테고리:
  컨텐츠:
      타이틀: D
      텍스트: D 번역

가져오기 Regexp:

  • ' translate A' 만 : 텍스트

  • 'translate C': categories\[2\]/text

  • '번역 D': categories\[\d+\]/content[\1\]/text

  • all text: text|categories\[\d+\]/text|categories\[\d+\]/content[\d+\]/text

세그멘테이션 규칙

Okapi, JavaUnicode 는 의 세그멘테이션 규칙에 사용됩니다. SRX 파일.

에서 Regexp 사용합니다. SRX 파일은 복잡하며 작업 시도하기 전에 정규식 사용에 대한 기본 지식을 사용하는 것이 좋습니다.

줄 바꿈 규칙(약어 등)과 줄 바꿈 규칙(점이 있는 문장 끝 등)은 에 있습니다. SRX 파일.

본보기

묘사

[\p{C}]

보이지 않는 제어 문자.

[\p{Z}]

공백

[\p{Lu}]

소문자 변형이 있는 대문자입니다.

[\p{N}]

모든 종류의 숫자입니다.

\Q ... \E

따옴표의 시작과 끝 - (\QApprox.\E). 약어에 사용됩니다.

\t

표 작성기

\n

줄 바꿈

\u2029

단락 구분 기호

\u200B

너비가 0인 공간

\u3002

표의 문자 전체 중지

\ufe52

작은 풀 스톱

\uff0e

전체 너비 전체 정지

\uff61

반자 표의 문자 마침표

\ufe56

작은 물음표

\uff1f

전체 너비 물음표

\u203c

이중 느낌표

\u2048

질문 느낌표

\u2762

무거운 느낌표 장식

\u2763

무거운 하트 느낌표 장식

\ufe57

작은 느낌표

\uff01

전체 너비 느낌표

일반적인 사용자 지정 QA 검사

QA 확인

출처: 정규 표현식

대상 정규표현식

대상의 추가 숫자

\d

\d

태그 : 순서 (unpaired)

^.*\{1\}.*\{2\}.*$

^.*\{1\}.*\{2\}.*$

태그 : 순서 (unpaired)

^.*\{1\}.*\{2\}.*\{3\}.*$

^.*\{1\}.*\{2\}.*\{3\}.*$

태그 : 순서 (unpaired)

^.*\{1\}.*\{2\}.*\{3\}.*\{4\}.*$

^.*\{1\}.*\{2\}.*\{3\}.*\{4\}.*$

태그 : 순서 (paired)

^.*\{1\&gt;.*\&lt;1\}.*\{2\&gt;.*\&lt;2\}.*$

^.*\{1\&gt;.*\&lt;1\}.*\{2\&gt;.*\&lt;2\}.*$

태그 : 순서 (paired)

^.*\{1\&gt;.*\&lt;1\}.*\{2\&gt;.*\&lt;2\}.*\{3\&gt;.*\&lt;3\}.*$

^.*\{1\&gt;.*\&lt;1\}.*\{2\&gt;.*\&lt;2\}.*\{3\&gt;.*\&lt;3\}.*$

태그 앞의 공백

\s(\{[1-9][0-9]*\}|\{[1-9][0-9]*>|<[ 1-9][0-9]*\}|\{[biu_\^]{1,4}>|<[ biu_\^]{1,4}\})

\s(\{[1-9][0-9]*\}|\{[1-9][0-9]*>|<[ 1-9][0-9]*\}|\{[biu_\^]{1,4}>|<[ biu_\^]{1,4}\})

태그 후의 공백

(\{[1-9][0-9]*\}|\{[1-9][0-9]*>|<[ 1-9][0-9]*\}|\{[biu_\^]{1,4}>|<[ biu_\^]{1,4}\})\s

(\{[1-9][0-9]*\}|\{[1-9][0-9]*>|<[ 1-9][0-9]*\}|\{[biu_\^]{1,4}>|<[ biu_\^]{1,4}\})\s

태그 전에 공간이 없습니다.

\S(\{[1-9][0-9]*\}|\{[1-9][0-9]*>|<[ 1-9][0-9]*\}|\{[biu_\^]{1,4}>|<[ biu_\^]{1,4}\})

\S(\{[1-9][0-9]*\}|\{[1-9][0-9]*>|<[ 1-9][0-9]*\}|\{[biu_\^]{1,4}>|<[ biu_\^]{1,4}\})

누락 대괄호

[^\[\]]*\[[^\[\]]*\][^\[\]]*

[^\[\]]*\[[^\[\]]*\][^\[\]]*

누락 둥근 괄호

[^\(\)]*\([^\(\)]*\)[^\(\)]*

[^\(\)]*\([^\(\)]*\)[^\(\)]*

도움이 되었습니까?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.