최적의 검색 성능을 위한 Snowflake 구성
검색 성능을 최적화하기 위해 Panther가 Snowflake 설정을 활용하는 방법 알아보기
개요
Panther는 최적의 검색 성능을 얻기 위해 Snowflake를 구성하는 방법을 결정했습니다. 이러한 구성 설정에는 웨어하우스 크기, 쿼리 가속및 검색 최적화이 포함됩니다. 이러한 지침은 SaaS Snowflake 인스턴스의 구성 결정에 사용되며, 다음의 참조 자료로 활용될 수 있습니다: Cloud Connected Snowflake 인스턴스.
일부 Panther 기능은 Enterprise Edition 이상인 Snowflake 인스턴스로 제한됩니다.
Snowflake Enterprise 이상이 필요한 Panther 기능
다음 Panther 기능을 사용하려면 다음 버전 이상의 Enterprise Edition of Snowflake 가 필요합니다:
웨어하우스 크기
웨어하우스 크기 는 Snowflake에서 작업(예: Snowflake 테이블 검색)을 수행할 때 사용되는 컴퓨팅 리소스의 양을 결정합니다.
검색 성능 및 비용 기대치
일반적으로 웨어하우스가 클수록 쿼리가 더 빠르게 실행됩니다. 웨어하우스 크기 증가로 전반적인 쿼리 속도가 향상되지만, 컴퓨트 비용 또한 전반적으로 증가합니다. 예를 들어, SMALL 웨어하우스는 일반적으로 X-SMALL 웨어하우스보다 쿼리를 두 배 빠르게 실행하지만 실행 비용도 두 배가 됩니다.
아래는 Panther의 수집량을 기준으로 한 고수준 웨어하우스 크기 권장 사항입니다. 이러한 수집량/웨어하우스 크기 조합은 모두 유사한 검색 성능을 제공합니다.
< 8
X-SMALL
8-15
SMALL
16-31
MEDIUM
32-63
LARGE
64-127
X-LARGE
128-255
2X-LARGE
256-512
3X-LARGE
웨어하우스 크기에 대해 자세히 알아보려면 Snowflake의 Warehouses 개요 문서.
쿼리 가속
쿼리 가속은 다음에서만 사용할 수 있습니다: Snowflake의 Enterprise Edition.
쿼리 가속 은 유휴 Snowflake 웨어하우스를 사용하여 느리게 실행되는 쿼리를 가속화하는 Snowflake 서비스입니다.
스케일 팩터
쿼리 가속은 스케일 팩터로 구성되며, 이는 쿼리 가속을 위해 빌려올 수 있는 컴퓨트 리소스의 상한을 설정하는 비용 제어 메커니즘입니다. Panther는 Panther가 관리하는 Snowflake 인스턴스에 대해 스케일 팩터를 결정합니다.
예를 들어, SMALL 스케일 팩터가 10 인 웨어하우스는 10 더 많은 SMALL 웨어하우스를 특정 쿼리에 할당할 수 있음을 의미합니다.
스케일 팩터에 대해 자세히 알아보려면 Snowflake의 스케일 팩터 조정(Adjusting the Scale Factor) 문서.
검색 성능 및 비용 기대치
쿼리 가속은 실행 중인 쿼리가 "느리다"고 판단될 때에만 작동합니다. 일반적으로 1분 이상 실행되는 쿼리가 가속 대상이 됩니다.
가속을 사용해 쿼리를 실행하는 비용은 추가 웨어하우스 비용이 감소된 실행 시간으로 상쇄되므로 가속 없이 실행할 때와 대체로 비슷합니다. 그러나 이론적 최대 비용은 스케일 팩터에 의해 결정됩니다 — 그래서 스케일 팩터가
10인 웨어하우스는 최악의 경우 기본 웨어하우스 비용보다 열 배 더 비용이 들 수 있습니다.
쿼리 가속에 대해 자세히 알아보려면 Snowflake의 쿼리 가속 서비스 사용 문서(Using the Query Acceleration Service).
검색 최적화
검색 최적화는 다음에서만 사용할 수 있습니다: Snowflake의 Enterprise Edition.
이 기능은 Panther Enterprise 고객만 이용할 수 있습니다.
검색 최적화 은 수집된 데이터를 인덱싱하여 '건초 더미 속 바늘' 검색(즉, 백만 분의 일 수준의 이벤트)을 수행할 때 속도를 극적으로 향상시키는 Snowflake 서비스입니다.
검색 성능 및 비용 기대치
검색 최적화를 사용하면 쿼리 실행 속도가 10배에서 100배까지 빨라질 수 있습니다.
값이 더 고유할수록 검색 최적화의 영향이 커집니다.
예를 들어, 다음을 검색하는 경우
isHuman = True와50%인 이벤트가본문에서인 경우 검색 최적화는 성능을 전혀 향상시키지 않지만; 그러나 만약 이벤트의 단지.0001%만이본문에서인 경우, 검색 최적화는 상당한 영향을 미칠 것입니다.
검색 최적화 비용은 다음에 따라 달라질 수 있습니다:
검색 최적화 초기화 시점과 이후 데이터가 수집될 때 모두 인덱싱되는 테이블 및 필드의 수와 크기에 의해 비용이 영향을 받습니다. 테이블과 필드가 많고 크기가 클수록 비용이 더 많이 듭니다.
검색 최적화가 초기화될 때 기존의 모든 데이터를 인덱싱해야 하므로 인덱싱되는 과거 데이터 양에 비례하는 초기 비용이 발생합니다.
초기화 이후에는 검색 최적화 인덱스를 생성하는 데 필요한 컴퓨트에 따라 데이터 수집 시 비용이 계산됩니다.
검색을 가속하기 위해 인덱스가 사용될 때 추가 비용은 발생하지 않습니다. 이는 검색이 더 빠르게 실행되므로 비용이 저렴해질 수 있음을 의미합니다.
검색 최적화에 대해 자세히 알아보려면 Snowflake의 검색 최적화 서비스 사용 문서(Using the Search Optimization Service).
Last updated
Was this helpful?

