본문 바로가기
IT

Spotfire(스팟파이어) 통계분석 - 상관관계 분석

by TORI NET 2020. 4. 25.

Spotfire(스팟파이어) 통계분석 - 상관관계 분석

Spotfire에서 상관관계를 보거나 간단한 회귀분석을 돌리는데 Insert Calculated Column을 통해 직접 수식을 써서 구현할 수 있으나 자체 기능인 Tools의 Data Relationships을 통해서도 가능하다.

 

■ Spotfire 실행 >> Tools >> Data Relationships 

 

위 메뉴에 들어가면 아래와 같이 팝업화면이 뜬다.

이때 Data Table을 지정하고, Calculation Name을 지정한 후 아래 Comparision method를 선택할 수 있다.

 

 

Comparison method는 분석할 데이터의 형태에 따라 달라지며 데이터의 분포 확인과 전처리를 한 후 결정한다.

Spotfire에서 제공하는 5가지 유형별로 사용해야 하는 데이터 타입과 사용 예시 및 상세설명은 아래와 같다.

Method Data Type Detail Example
Linear Regression 숫자 와 숫자 간 두 숫자형 변수 간 관계 확인. 데이터가 정규 분포를 따르면 선형회귀. 비정규 분포를 따르면 Spearman R 사용. 또는 이상점이 있거나 표본 크기가 작을 경우에도 Spearman R 사용 키가 클수록 몸무게도 증가할 것이다. (키 vs 몸무게)
Spearman R 숫자 와 숫자 간 환율과 주가는 정의 관계가 있을 것이다. (환율 vs 주가)
ANOVA 숫자 와 범주 간 범주(그룹) 간 숫자 변화를 확인. 3개 이상의 집단에 대한 평균을 비교함. 모집단 분포가 정규 분포를 따르면 ANOVA를 사용. 비정규 분포일 경우 Kruskai-Wallis 사용) 학급별로 성적의 차이가 있을 것이다.
(성적 vs 학급)
Kruskai-Wallis 숫자 와 범주 간 차종별 연비효율의 차이가 있을 것이다. (연비효율 vs 차종)
Chi-Square 범주 와 범주 간 두 범주형 변수 간 상관관계 확인 국가별 자동차 선호 브랜드는 차이가 있을 것이다.
(국가 vs 자동차 선호 브랜드)

 

샘플로 두번째 Spearman R로 분석을 해보았다. Investing닷컴에서 주가와 원자재, 가상화폐 가격을 다운로드한 후 Spotfire로 Clipboard Data로 붙여넣기를 하였다. Data는 2019년 일일 Summary Data를 사용하였다.

https://kr.investing.com/

 

주식시장 시세와 금융뉴스 - Investing.com

Investing.com은 무료 실시간 시세, 포트폴리오, 챠트, 최신 금융 뉴스, 주식시장 데이터 및 기타를 제공.

kr.investing.com

 

데이터를 다운로드는 방법은 위 사이트에 접속한 후 아래와 같이 "외환, 지수, 암호화폐 등"을 클릭하면 상세정보를 볼 수 있는데 기간은 Summary 단위를 뜻하는데 일/주/월 중 "일간"으로 선택한다.

우측 달력에서 기간을 선택한 후 데이터 다운로드를 하면 엑셀 자료를 다운로드 할 수 있다. 귀찮을 경우 첨부파일로 엑셀로 붙여놓으니 다운로드 하면 된다.

test.xlsx
0.04MB

 

 

Spotfire를 실행한 후 Add Data Table에서 File로 붙여넣기 후 컬럼 형식을 지정한다.

 

상단 차트를 클릭하여 Line Chart를 그려서 육안으로 비교해본다. 

 

Line Chart는 "대한항공, 한국쉘석유, 삼성전자" 3개 국내기업으로 그렸고 비교 환율은 달러로 선택했다.

아래에 Rawdata가 표시되고 선택한 국내기업 주가 3개가 나란히 표시된다.

클릭 몇번으로 아주 간단하게 차트를 그리고 시각화가 가능하다.

 

그런데 육안으로 보는것과 통계적으로 분석해서 관계가 있는지 비교를 한번 해본다. 물론 위에서 나열한 5가지 중 숫자형 데이터를 사용한 Spearman R 돌려보기로 했다.

Spotfire >> Tools >> Data Relationships >> X/Y Columns 선택 >> OK 버튼 클릭

 

상단에 X/Y 간의 계산값들을 보여주고 시각화를 통해 관계를 알 수 있다. Test Data로는 삼성전자와 한국쉘석유 기업은 환율(달러)와 상관관계가 없고, 대한항공은 강한 음의 상관관계를 나타냈다. 이와 같이 어렵지 않은 클릭 몇번으로 Spotfire에서 통계적인 분석기능을 간단하게 사용할 수 있다.

 

샘플 데이터의 특성에 맞게 Comparison method를 선택하여 Data Relationships 기능을 사용해서 시각화 해보세요.

댓글