> For the complete documentation index, see [llms.txt](https://docs.panther.com/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.panther.com/ko/data-onboarding/custom-log-types/transformations.md).

# 변환

## 개요

변환은 Panther로 수집될 때 데이터의 형태를 수정하기 위해 사용자 지정 로그 소스 스키마에서 사용할 수 있는 함수입니다. 그러면 데이터는 새 형식으로 저장됩니다.

변환은 저장된 데이터를 디택션 및 쿼리 로직의 요구에 맞게 정렬해 주며, 즉석 데이터 조작이 필요 없도록 하고 디택션 작성과 검색을 더 빠르게 합니다.

다음 변환을 사용할 수 있습니다:

* [`복사`](#copy)
* [`이름 변경`](#rename)
* [`연결`](#concat)
* [`분할`](#split)
* [`마스킹`](#mask)
* [`isEmbeddedJSON`](#isembeddedjson)

{% hint style="info" %}
다음을 사용하여 수집 시 데이터를 추가로 조작할 수 있습니다: [스크립트 로그 파서](/ko/data-onboarding/custom-log-types/script-parser.md).
{% endhint %}

### 변환 실행 순서

변환은 특정 순서에 따라 수행되며, 이를 통해 변환이 예측 가능한 방식으로 하나씩 적용됩니다. 실행 순서는 [위의 개요에 있는 변환 목록에 제공된 순서입니다](#overview).

정의된 순서를 따라 데이터를 정확하게 변환하세요. 순서의 각 변환은 이전 변환 후 남아 있는 상태의 데이터에 대해 작동합니다. 이 순서를 알면 일관성을 유지하고 예상치 못한 결과를 방지할 수 있습니다.

#### 변환 결합

개별 변환은 더 복잡한 데이터 변환을 달성하기 위해 쌍 또는 연속된 순서로 결합할 수 있습니다. 이를 통해 특정 데이터 요구 사항을 충족하고 효율적인 디택션 생성 및 검색 작업을 지원하기 위한 유연성과 사용자 지정이 향상됩니다.

필드에 개인 식별 번호(PIN)가 포함되어 있다고 가정해 보겠습니다. 보안상의 이유로 PIN을 마스킹하여 가리면서 필드 이름은 덜 드러나는 이름으로 바꾸고 싶습니다.

이를 위해 다음 변환을 사용할 수 있습니다: `이름 변경` 변환을 사용하여 필드 이름을 추상적인 이름으로 변경합니다. 예를 들어 필드 이름을 다음으로 바꿀 수 있습니다: `userId`.

다음으로 `마스킹` 다음 변환을 `userId` 필드에 적용하여 PIN의 숫자를 미리 정의된 개수의 별표로 바꿉니다. 이렇게 하면 PIN이 숨겨져 데이터 프라이버시가 보장됩니다.

필드 스키마를 다음과 같이 둘 다 포함해 정의할 수 있습니다 `이름 변경` 및 `마스킹` 다음과 같습니다:

```yaml
- name: userId
  type: string
  rename:
    from: PIN
  mask:
    type: redact
    to: "*****"
```

다음과 같은 페이로드를 변환하게 됩니다:

```json
{
  "PIN": "1234"
}
```

다음과 같이:

```json
{
  "userId": "*****"
}
```

## `복사`

다음 `복사` 변환은 중첩 필드의 값을 다른 최상위 필드로 복사합니다. 이는 데이터의 JSON 구조를 평탄화하려는 경우 유용할 수 있습니다. 원하는 경우 새로 정의한 필드를 나중에 [`지표`](/ko/search/panther-fields.md#indicator-fields).

다음과 같은 지시문이 있는 필드 스키마를 정의하면 `복사` 지시문을 사용하여, 예를 들면:

```yaml
- 이름: message
  type: string
  copy:
    from: attributes.message
- 이름: attributes
  type: json
```

다음과 같은 페이로드를 변환하게 됩니다:

```json
{
  "attributes": {
      "message": "hello there", 
      "user": "someone"
  }
}
```

다음과 같이:

```json
{
  "message": "hello there",
  "attributes": {
      "message": "hello there", 
      "user": "someone"
  }
}
```

## `이름 변경`

다음 `이름 변경` 변환은 필드 이름을 변경합니다. 이는 데이터 소스 전반에서 필드 이름을 표준화하거나, 데이터 구조의 명확성을 높이거나, 잘못된 문자가 포함된 필드 이름이나 예약 키워드가 포함된 필드 이름을 조정하려는 경우에 유용합니다.

다음과 같은 지시문이 있는 필드 스키마를 정의하면 `이름 변경` 지시문을 사용하여, 예를 들면:

```yaml
- 이름: user
  type: string
  rename: 
    from: "@user"
- name: role
  유형: object
  fields:
   - 이름: level
     type: string
     rename:
       from: type
```

다음과 같은 페이로드를 변환하게 됩니다:

```json
{
  "@user": "john"
  "role": {
    "type": "admin"
  }
}
```

다음과 같이:

```json
{
  "user": "john"
  "role": {
    "level": "admin"
  }
}
```

## `연결`

다음 `연결` 변환을 사용하면 여러 필드의 값을 새 필드의 값으로 연결할 수 있습니다. 이렇게 생성된 결합 필드는 예를 들어 보강(enrichment)의 키로 사용할 수 있습니다.

다음 조건을 가진 필드는 `유형` 이 `timestamp` 연결 작업에 사용할 수 없습니다.

다음을 사용하려면 `연결`, `string` 연결 결과를 저장할 필드를 선언합니다. 다음 안에서 `연결`다음을 정의합니다 `경로`, 그리고 선택적으로 `구분자`. 다음 안에서 `경로`, 결합하려는 기존 스키마 필드를 지정하려면 절대 경로를 사용해야 합니다. 이 필드들의 순서가 연결 순서를 결정합니다. 만약 `구분자` 가 정의되지 않으면 기본 구분자는 빈 문자열(`""`).

다음과 같은 지시문이 있는 필드 스키마를 정의하면 `연결` 지시문을 사용하여, 예를 들면:

```yaml
- 이름: ip
  type: string
- name: ports
  유형: object
  fields:
   - name: https
     type: int
- name: socket
  type: string
  concat:
   separator: ":"
   paths: 
    - ip
    - ports.https
```

다음과 같은 페이로드를 변환하게 됩니다:

```json
{
  "ip": "192.168.0.1"
  "ports": {
    "https": 443
  }
}
```

다음과 같이:

```json
{
  "ip": "192.168.0.1"
  "ports": {
    "https": 443
  },
  "socket": "192.168.0.1:443"
}
```

## `분할`

다음 `분할` 변환을 사용하면 구분자를 기준으로 문자열 필드를 분리하여 특정 값을 추출할 수 있습니다. 이렇게 분리된 필드는 개별 스키마 필드로 취급할 수 있어, 이를 다음으로 지정할 수 있습니다 [지표](/ko/search/panther-fields.md#indicator-fields). 분할 변환은 데이터를 표준화된 필드로 정규화하는 데도 도움이 되어, 비정형 데이터 형식을 더 쉽게 처리할 수 있습니다.

유형이 다음인 필드만 `string` 다른 필드로 분할할 수 있습니다(즉, `split:from:` 는 다음을 포함하는 필드여야 합니다 `type: string`).

다음을 사용하려면 `분할`, 결과를 저장할 필드로 어떤 기본형이든 선언합니다(즉, object, array, JSON 제외). 다음 `분할` 지시문에는 다음 필수 필드를 포함하세요:

* `from`: 분할할 필드의 절대 경로를 제공하세요.
* `구분자`: 분할 기준 문자를 제공하세요.
* `index`: 분할로 생성된 결과 배열에서 값의 위치를 제공하세요.

다음과 같은 지시문이 있는 필드 스키마를 정의하면 `분할` 지시문을 사용하여, 예를 들면:

```yaml
- name: socket
  type: string
- 이름: ip
  type: string
  split:
   from: socket
   separator: ":"
   index: 0
- name: port
  type: int
  split:
   from: socket
   separator: ":"
   index: 1  
```

다음과 같은 페이로드를 변환하게 됩니다:

```json
{
  "socket": "192.168.0.1:443"
}
```

다음과 같이:

```json
{
  "socket": "192.168.0.1:443",
  "ip": "192.168.0.1",
  "port": 443
}
```

다음을 사용하여 `분할` 배열 요소를 분할할 수도 있습니다. 예를 들어 다음 스키마를 사용하면:

```yaml
- name: traffic
  type: array
  element: 
    유형: object
    fields:
      - name: socket
        type: string
      - 이름: ip
        type: string
        indicators: [ip]
        split: 
          from: traffic.socket
          separator: ":"
          index: 0
      - name: port
        type: int
        split: 
          from: traffic.socket
          separator: ":"
          index: 1
       
```

다음과 같은 페이로드를 변환하게 됩니다:

```json
{
  "traffic": [
   {
     "socket": "192.168.0.1:443"
   },
   {
     "socket": "192.168.0.2:80"
   } 
  ]
}
```

다음과 같이:

```json
{
  "traffic": [
   {
     "socket": "192.168.0.1:443",
     "ip": "192.168.0.1",
     "port": 443
   },
   {
     "socket": "192.168.0.2:80",
     "ip": "192.168.0.2",
     "port": 80
   } 
  ]
}
```

## `마스킹`

다음 `마스킹` 변환을 사용하면 로그의 민감한 정보를 숨길 수 있습니다. 마스킹은 특정 데이터의 기밀성을 보호해야 할 때 유용합니다.

마스킹에는 두 가지 기법이 있습니다:

* [난독화](#obfuscation-hashing) (해싱이라고도 함): 이 기법은 선택적 salt 값을 사용하여 데이터를 해시합니다. 이 기법에서는 값의 참조 무결성이 유지됩니다.
* [삭제](#redaction): 이 기법은 민감한 값을 다음으로 바꿉니다 `REDACTED`또는 사용자가 제공하는 다른 문자열로 바꿉니다. 이 기법에서는 값의 참조 무결성이 사라집니다.

특정 필드를 마스킹하면 나중에 Panther의 [검색 도구](/ko/search.md) 를 사용해 원래 값을 조회할 수는 없지만, 해시된 값은 검색할 수 있습니다.

### 난독화(해싱)

들어오는 데이터를 해시하면 보안을 강화하면서도 나중에 사용할 수 있는 유용성은 유지할 수 있습니다. 해싱이 제공하는 보호를 강화하려면 salt를 포함할 수 있습니다.

난독화를 사용하려면 스키마의 대상 필드에 다음을 포함하세요: `마스킹`. 다음 아래에 `마스킹`, 다음을 포함하세요 `유형`, 필요에 따라 `salt`.

값은 `유형` 사용하려는 해싱 알고리즘입니다. 지원되는 값은 다음과 같습니다:

* `sha256`
* `md5`
* `sha1`
* `sha512`

선택적 `salt` 의 값은 사용자가 선택한 문자열입니다. 이 값은 해시되기 전에 필드 값 뒤에 추가됩니다.

를 사용할 때 `마스킹`, 대상 필드의 `유형` 는 항상 다음으로 설정해야 합니다 `string`. 실제 입력 데이터는 어떤 유형이든 될 수 있지만, `type: string` 필수입니다. 값이 마스킹된 후에는 데이터 레이크에 문자열로 저장되기 때문입니다.

다음과 같은 지시문이 있는 필드 스키마를 정의하면 `마스킹` 다음과 같은 지시문:

```yaml
- 이름: username
  type: string # Must be set as string (though all data types allowed)
  mask:
    type: sha256 
    salt: random_salt # Optional
```

다음과 같은 페이로드를 변환하게 됩니다:

```json
{
  "username": "john"
}
```

다음과 같이:

```json
{
  "username": "98b4ceb956e9ed4539b0721add25cab0bacce4307cf3140c4430c1513476a3e4"
}
```

### 삭제

들어오는 데이터를 삭제하면 미리 정의된 값으로 대체하게 됩니다. 이 기법은 민감한 정보에 접근할 수 없게 하거나 복구할 수 없게 하려는 경우에 유용합니다.

삭제를 사용하려면 스키마의 대상 필드에 다음을 포함하세요: `마스킹`. 다음 아래에 `마스킹`, 다음을 포함하세요 `type: redact`, 필요에 따라 `에서`.

선택적 `에서` 키는 실제 이벤트 값을 대체할 문자열 값을 사용합니다. 만약 `에서` 가 포함되지 않으면 기본값인 `REDACTED`가 사용됩니다.

를 사용할 때 `마스킹`, 대상 필드의 `유형` 는 항상 다음으로 설정해야 합니다 `string`. 실제 입력 데이터는 어떤 유형이든 될 수 있지만, `type: string` 필수입니다. 값이 마스킹된 후에는 데이터 레이크에 문자열로 저장되기 때문입니다.

다음과 같은 지시문이 있는 필드 스키마를 정의하면 `마스킹` 다음과 같은 지시문:

```yaml
- 이름: username
  type: string # Must be set as string (though all data types allowed)
  mask:
    type: redact 
    to: "XXXX" # Optional, default: "REDACTED"
```

다음과 같은 페이로드를 변환하게 됩니다:

```json
{
  "username": "john"
}
```

다음과 같이:

```json
{
  "username": "XXXX"
}
```

## `isEmbeddedJSON`

때때로 JSON 값은 문자열 안에 포함된 형태로 전달됩니다.

Panther가 문자열 내부의 이스케이프된 JSON을 구문 분석하도록 하려면 다음을 사용하세요: `isEmbeddedJSON: true` 플래그. 이 플래그는 유형이 다음인 값에 유효합니다 `object`, `array` 및 `json`.

다음과 같은 지시문이 있는 필드 스키마를 정의하면 `isEmbeddedJSON` 다음과 같은 지시문:

```yaml
- 이름: message
  유형: object
  isEmbeddedJSON: true
  fields:
    - name: foo
      type: string
```

다음과 같은 페이로드를 변환하게 됩니다:

```json
{
  "timestamp": "2021-03-24T18:15:23Z",
  "message": "{\"foo\":\"bar\"}"
}
```

다음과 같이:

```json
{
  "timestamp": "2021-03-24T18:15:23Z",
  "message": {
    "foo": "bar"
  }
}
```


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://docs.panther.com/ko/data-onboarding/custom-log-types/transformations.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.