Spotfire(스팟파이어) 사용설명서 (한글메뉴얼)
스팟파이어를 사용하다보면 궁금한 점이 항상 생깁니다.
특히 저는 "Edit >> Column Properties >> Insert >> Insert Calculated Column "을 사용할 때 함수 설명을 필요로 합니다. 이때 필요한게 바로 "Spotfire(스팟파이어) 한글 설명서(한글메뉴얼)" 입니다.
특히 Spotfire에서 사용하는 함수는 "저장함수, 변환함수, 캐스트, 날짜 및 시간함수, 논리함수, 산술함수, OVER 함수, 속성 함수, 순위함수, 공간 함수, 통계함수, 데이터함수"로 나뉠수 있는데 각각 표현식에 대해 이해를 해야 합니다. 이 부분은 메뉴얼을 보면 자세히 나와 있습니다. 예를 들면 통계함수는 아래와 같습니다.
---------------------------------------------------
통계 함수
목록에는 표현식에 사용할 수 있는 통계 함수가 나와 있습니다.
함수설명
Avg(Arg1, ...) | 인수의 평균(산술 평균)을 반환합니다. 인수 및 결과는 실수 형식입니다. 인수를 한 개 지정한 경우 결과는 모든 행의 평균이 됩니다. 인수를 여러 개 지정한 경우 결과는 각 행의 평균이 됩니다. Null 인수는 무시되므로 합계에 영향을 주지 않습니다.
예: Avg([Column]) Avg(2,-3,4) -> 1 Avg(-1) -> -1 Avg(1.5, -2, 3.5) -> 1 Avg(1, null, 3) -> 2 Avg(null) -> (Empty) |
ChiDist(Arg1) | 인수의 (위 꼬리) 카이제곱 p 값을 반환합니다.
예: ChiDist(x, deg_freedom) ChiDist(7.377759, 2) =0.025 |
ChiInv(Arg1) | 인수의 (위 꼬리) 카이제곱 변위치 값을 반환합니다.
예: ChiInv(p, deg_freedom) ChiInv(0.025, 2) =7.377759 |
Count(Arg1) | 인수 컬럼에서 비어 있지 않은 값 수를 계산합니다. 인수를 지정하지 않은 경우 행의 총수를 계산합니다.
예: Count([Column]) |
CountBig(Arg1) | 인수 컬럼에서 비어 있지 않은 값 수를 계산합니다. 인수를 지정하지 않은 경우 행의 총수를 계산합니다. 이 함수는 LongInteger를 반환합니다.
예: CountBig([Column]) |
Covariance(Arg1, Arg2) | 인수로 지정된 두 컬럼의 공분산을 계산합니다.
예: Covariance([Column1], [Column2]) |
FDist(Arg1) | 인수의 위 꼬리 F p 값을 반환합니다.
예: FDist(x, deg_freedom1, deg_freedom2) FDist(6.936728, 1, 10) =0.025 |
FInv(Arg1) | 인수의 위 꼬리 F 변위치 값을 반환합니다.
예: FInv(p, deg_freedom1, deg_freedom2) FInv(0.025, 1, 10) =6.936728 |
First(Arg1) | 인수 컬럼에서 데이터 행의 물리적 순서를 기반으로 첫 번째 유효 값을 반환합니다.
예: First([Column]) |
GeometricMean() | 기하학적 평균 값을 계산합니다. 입력 값이 음수이면 결과는 "비어 있음"입니다. 입력 값이 0이면 결과는 0입니다.
예: GeometricMean([Sales]) |
IQR(Arg1) | 값 차이 Q3-Q1 또는 75번째 백분위수 - 25번째 백분위수를 계산합니다. IQR을 H 분포라고도 합니다.
예: IQR([Column]) |
L95(Arg1) | 95% 신뢰 구간의 하위 끝점을 계산합니다.
예: L95([Column]) |
Last(Arg1) | 인수 컬럼에서 데이터 행의 물리적 순서를 기반으로 마지막 유효 값을 반환합니다.
예: Last([Column]) |
LAV(Arg1) | 인접한 하위 값을 계산합니다.
예: LAV([Column]) |
LIF(Arg1) | 하위 내부 펜스를 계산합니다. Q1 - (1.5*IQR)에 있는 임계값입니다.
예: LIF([Column]) |
LOF(Arg1) | 하위 외부 펜스를 계산합니다. Q1 - (3*IQR)에 있는 임계값입니다.
예: LOF([Column]) |
Sum(Arg1, ...) | 최대값을 계산합니다. 인수를 한 개 지정한 경우 결과는 전체 컬럼의 최대값입니다. 인수를 여러 개 지정한 경우 결과는 각 행의 최대값이 됩니다. 인수 및 결과는 실수 형식입니다. Null 인수는 무시됩니다.
예: Max([Column]) Max(-1) -> -1 Max (1.5, -2, 3) -> 3 Max (1, null, 3) -> 3 Max (null) -> (Empty) |
MeanDeviation(Arg1, ...) | 평균 편차값(평균 절대 편차, AAD)을 계산합니다. 인수를 한 개 지정한 경우 결과는 모든 행의 평균 편차가 됩니다. 인수를 여러 개 지정한 경우 결과는 각 행의 평균 편차가 됩니다.
예: MeanDeviation([Column]) MeanDeviation(2,-3,4) -> 2.67 |
Median(Arg1) | 인수의 중앙값을 계산합니다. 인수를 한 개 지정한 경우 결과는 모든 행의 중앙값이 됩니다. 인수를 여러 개 지정한 경우 결과는 각 행의 중앙값이 됩니다.
예: 중앙값([Column]) 중앙값(2,-3,4) |
MedianAbsoluteDeviation(Arg1, ...) | 중앙값 절대 편차(MAD)를 계산합니다. 인수를 한 개 지정한 경우 결과는 모든 행의 중앙값 절대 편차가 됩니다. 인수를 여러 개 지정한 경우 결과는 각 행의 중앙값 절대 편차가 됩니다.
예: MedianAbsoluteDeviation([Sales]) MedianAbsoluteDeviation(2,-3,4) |
Min(Arg1, ...) | 최소값을 계산합니다. 인수를 한 개 지정한 경우 결과는 전체 컬럼의 최소값입니다. 인수를 여러 개 지정한 경우 결과는 각 행의 최소값이 됩니다. 인수 및 결과는 실수 형식입니다. Null 인수는 무시됩니다.
예: Min([Column]) Min(-1) -> -1 Min (1.5, -2, 3) -> -2 Min (1, null, 3) -> 1 Min (null) -> (Empty) |
NormDist(Arg1) | 인수의 (위 꼬리) 일반 p 값을 반환합니다. 이 값을 지정하지 않으면 결과는 평균=0, 표준 편차=1이 됩니다.
예: NormDist(x, mean, standard_dev) NormDist(1.96) =0.025 |
NormInv(Arg1) | 인수의 (위 꼬리) 일반 변위치 값을 반환합니다. 이 값을 지정하지 않으면 결과는 평균=0, 표준 편차=1이 됩니다.
예: NormInv(p, mean, standard_dev) NormInv(0.025) =1.96 |
NthLargest(Arg1, Arg2) | n번째 가장 큰 값입니다. 첫 번째 인수는 분석할 컬럼이며 두 번째 인수는 n의 값입니다.
n이 컬럼의 값 수보다 큰 경우 가장 작은 값이 반환됩니다. 예: NthLargest([Column], 10) |
NthSmallest(Arg1, Arg2) | n번째 가장 작은 값입니다. 첫 번째 인수는 분석할 컬럼이며 두 번째 인수는 n의 값입니다.
n이 컬럼의 값 수보다 큰 경우 가장 큰 값이 반환됩니다. 예: NthSmallest([Column], 10) |
Outliers(Arg1) | 외부 값 계산. 상위 인접한 값보다 크거나 하위 인접한 값보다 작은 값의 개수를 계산합니다.
예: Outliers([Column]) |
P10(Arg1) | 10번째 백분위수는 데이터 값의 10%가 값보다 작거나 같은 값입니다.
예: P10([Column]) |
P90(Arg1) | 90번째 백분위수는 데이터 값의 90%가 값보다 작거나 같은 값입니다.
예: P90([Column]) |
PctOutliers(Arg1) | 외부 값 백분위수. 상위 인접한 값보다 크거나 하위 인접한 값보다 작은 값의 비율을 계산합니다.
예: PctOutliers([Column]) |
Percent(Arg1, Arg2) | 백분율은 값 범위(최대값 - 최소값) 내에서 최소값을 초과하는 특정 비율을 계산한 값입니다. 첫 번째 인수는 분석할 컬럼이며 두 번째 인수는 백분율입니다.
예: Percent([Column], 15.0) |
Percentile(Arg1, Arg2) | 백분위수는 데이터 값의 특정 비율이 값보다 작거나 같은 값입니다. 첫 번째 인수는 분석할 컬럼이며 두 번째 인수는 백분율입니다.
예: Percentile([Column], 15.0) |
Q1(Arg1) | 첫 번째 사분위수를 계산합니다.
예: Q1([Column]) |
Q3(Arg1) | 세 번째 사분위수를 계산합니다.
예: Q3([Column]) |
Range(Arg1) | 컬럼에서 가장 큰 값과 가장 작은 값 사이의 범위입니다.
결과는 인수의 데이터 형식에 따라 실수 또는 시간대로 반환됩니다. 예: Range([Column]) |
StdDev(Arg1) | 표준 편차를 계산합니다.
예: StdDev([Column]) |
StdErr(Arg1) | 표준 오차를 계산합니다.
예: StdErr([Column]) |
TDist(Arg1) | 인수의 (위 꼬리) t p 값을 반환합니다.
예: TDist(x, deg_freedom) TDist(4.302653, 2) =0.025 |
TInv(Arg1) | 인수의 (위 꼬리) t 변위치 값을 반환합니다.
예: TInv(p, deg_freedom) TInv(0.025, 2) =4.302653 |
TrimmedMean(Arg1, Arg2) | 잘라낸 평균값(잘라낸 평균)을 계산합니다. 첫 번째 인수는 분석할 컬럼이고 두 번째 인수는 계산에서 제외할 값의 수(%)입니다. 자르기 값을 10%로 설정한 경우 가장 큰 5%의 값과 가장 작은 5%의 값이 계산된 평균에서 제외됩니다.
예: TrimmedMean([Sales], 10) |
U95(Arg1) | 95% 신뢰 구간의 상위 끝점을 계산합니다.
예: U95([Column]) |
UAV(Arg1) | 인접한 상위 값을 계산합니다.
예: UAV([Column]) |
UIF(Arg1) | 상위 내부 펜스를 계산합니다. Q3 + (1.5*IQR)에 있는 임계값입니다.
예: UIF([Column]) |
UniqueCount(Arg1) | 인수 컬럼에서 비어 있지 않은 고유한 값의 수를 계산합니다.
예: UniqueCount([Column]) |
UOF(Arg1) | 상위 외부 펜스를 계산합니다. Q3 + (3*IQR)에 있는 임계값입니다.
예: UOF([Column]) |
ValueForMax(Arg1, Arg2) | column 1의 최대값에 대한 column 2의 값을 반환합니다.
컬럼 1 최대값이 둘 이상인 경우 결과는 첫 번째 최대 행의 값이 됩니다. 예: ValueForMax([Column 1], [Column 2]) |
ValueForMin(Arg1, Arg2) | column 1의 최소값에 대한 column 2의 값을 반환합니다.
컬럼 1 최소값이 둘 이상인 경우 결과는 첫 번째 최소 행의 값이 됩니다. 예: ValueForMin([Column 1], [Column 2]) |
Var(Arg1) | 차이를 계산합니다.
예: Var([Column]) |
WeightedAverage(Arg1, Arg2) | 두 컬럼의 가중 평균을 계산합니다. Arg1은 가중 컬럼이고 Arg2는 값 컬럼입니다.
예: WeightedAverage([Column1],[Column2]) |
팁: DISTINCT 키워드를 사용하면 고유한 값만 사용하여 결과를 반환할 수 있습니다. 예를 들어 Avg(DISTINCT[Column])는 지정된 컬럼에 있는 모든 값의 평균이 아니라 고유한 값의 평균을 반환합니다. UniqueCount([Column])는 Count(DISTINCT[Column])와 같습니다.
※ 출처 : tibco docs, manual
Spotfire의 함수를 포함한 다양한 사용법을 메뉴얼을 통해 확인하시기 바랍니다.
'IT' 카테고리의 다른 글
Spotfire(스팟파이어) 통계분석 - 상관관계 분석 (0) | 2020.04.25 |
---|---|
TIBCO Spotfire(스팟파이어) Cloud 사용 (0) | 2020.04.25 |
cmd 글씨체 바꾸기 (윈도우+R 실행, 커맨드창 글씨 폰트 변경) (0) | 2020.04.08 |
개인PC 윈도우10(WINDOWS 10) 리눅스(LINUX) 설치 (0) | 2020.04.08 |
공개된 알고리즘 강의 노트 - 알고리즘 교육자료 (0) | 2019.06.27 |
댓글