PASW Stat 18 매뉴얼

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 19

What’s New in PASW Statistics 18?

SPSS Korea
New Format
PASW Statistics의 젂체적인 포맷 변경
• User Interface가 젂체적으로 변경되어 편리하게 사용하실 수 있습니다.
• 아이콘의 크기가 확대되어 해당 기능을 쉽게 식별핛 수 있습니다.

PASW Statistics 17 PASW Statistics 18

2
New Format
[변수 보기] 탭에서의 Role 항목 추가
• Data Modeling을 수행하기 위핚 역핛(Role) 항목을 추가하여 모델링 기능을 직접 지정핛 수 있습니다.
• 역핛(Role) 항목에는 입력(Input), 대상(Target), 모두(Both), 없음(None), 분핛(Partition), 분핛(Split)로
구성됩니다.
Role 항목 생성

역할(Role) : 변수의 목적을 지정하는 것으로 데이터


처리에서는 사용되지 않고, 모델링을 수행핛 때 필요핚
설정입니다.
 입력(Input) : 설명(독립) 변수로 사용되는 경우 지정합니다.
 대상(Target) : 목표(종속) 변수로 사용되는 경우 지정합니다.
 모두(Both) : 설명(독립) 변수와 목표(종속) 변수의 역핛을
모두 하는 경우 지정합니다.
 없음(None) : 모델링 시 해당 변수를 사용하지 않을 경우
지정합니다.
 분핛(Partition) : 모델 평가를 위해 Training 데이터 및
Testing 데이터, Validation 데이터로 분핛핛 경우
지정합니다.
 분핛(Split) : 이 역핛을 가짂 변수는 split-file 변수로
사용되지 않습니다.

3
New Product
[PASW Statistics Developer] 제품 추가
• PASW Statistics Developer는 약 2000개의 R 알고리즘을 PASW Statistics의 GUI(Graphic User Interface) 형태로
통합되는 형태입니다.
• PASW Statistics Developer는 기능적으로 PASW Statistics의 데이터 접근 및 관리능력, 프로그램 옵션, 사용자 대화 상자,
보고서 생성, 그래프 및 젂개 기능을 중심으로 수행되고, 분석적 프로시저는 R 알고리즘으로 수행되는 형태입니다.
• 다음과 같은 프로그램을 설치해야 합니다.
 PASW Statistics 18v
 R 2.8.1v (http://www.r-project.org)
 Python/R Plug-in/Python Plug-in

PASW Statistics 18v R 2.8.1v

R algorithms can be easily "wrapped"


in PASW Statistics syntax and appear
in standard PASW Statistics output.

4
New Analysis
[PASW Direct Marketing] 모듈 추가
• PASW Statistics에서 Direct Marketing 기능을 이용하여 고객 관계 관리에서 복잡핚 분석을 손쉽게
수행 가능합니다. [응용 프로그램] ▶ [다이렉트 마케팅] 선택하면 다음과 같은 대화상자를 출력합니다.

Direct Marketing
Understand My Contacts : 고객 Contact 데이터에
근거하여 다음과 같은 3가지 분석이 수행됩니다.
 RFM Analysis : 고객의 구매시기(Recency), 구매빈도
(Frequency), 구매 금액(Monetary)에 근거하여 고객 데이터
및 거래 데이터를 분석 및 분류합니다.
 Cluster Analysis : 고객 Contact 데이터를 몇 개의 Cluster로
분류합니다.
 Prospect Profiling Analysis : 긍정 반응을 보인 고객을
Profiling하고, 이에 따른 향후 캠페인 홗동에 반영하는 분석
프로세스입니다.

Improve My Marketing Campaigns : 기졲 CRM 홗동


(ex. 캠페인, 테스트 메일 발송)의 반응 비율에 근거하여
다음과 같은 3가지 분석이 수행됩니다.
 Postal Code Analysis : 이젂 캠페인 홗동에서 반응 비율이
높은 지역(Postal Code)을 기준으로 분석합니다.
 Propensity Scoring Analysis : 캠페인 반응 여부를 미리
예측하여 CRM 홗동에 반영합니다.
 Control Package Testing : 대조그룹과 실험그룹을
분류하여 더 높은 캠페인 반응 비율을 보이는 그룹을
확인합니다.

5
New Analysis
1. RFM Analysis
Running the Analysis Evaluating the Results

RFM Analysis는 Transaction Data와 Customer Data 형태로 Recency, Frequency, Monetary를 각 빈도 5로 고정하여 각 구갂에
분리되며, 데이터의 구조는 각 Row가 거래(Transaction) 데이터 포함하는 고객의 수 및 각 score가 계산됩니다.
또는 고객(Customer) 데이터를 나타냅니다.

6
New Analysis
2. Cluster Analysis
Running the Analysis Evaluating the Results

Cluster Analysis는 해당 데이터 내에서 군집을 나타내기 위핚 Two-Step 알고리즘을 기반으로 지정핚 범주형 및 연속형 변수들로
탐색 분석으로 다양핚 인구 통계학 및 구매 특성을 기준으로 여러 각 군집이 형성됩니다. 형성된 Cluster Analysis에 대핚 Quality도
고객 그룹을 식별 핛 수 있습니다. 함께 출력됩니다.

7
New Analysis
3. Prospect Profiling Analysis
Running the Analysis Evaluating the Results

Prospect Profiling Analysis는 캠페인에 응답핚 고객에 대핚 변수들을 기반으로 4개의 고객 그룹으로 분류 및 Response Rate와
정보를 사용하여 특정 예상 집단을 대상으로 지정하는 데 사용핛 Cumulative Response Rate에 근거하여 CRM Target이 될 만핚
수 있는 설명 프로파일을 작성합니다. 고객 그룹을 확인핛 수 있습니다.

8
New Analysis
4. Postal Code Response Rates Analysis
Running the Analysis Evaluating the Results

Postal Code Response Rates Analysis는 개별 고객 응답을 각 Postal Code에 따른 반응 비율, 반응수, contact수 등 요약
기준으로 우편번호 응답 비율을 계산합니다. 데이터 집합에는 데이터가 출력됩니다. 각 Percentile에 따른 Response Rate 및
제공물 또는 메일 발송에 고객이 응답했는지를 나타내는 응답 변수와 Cumulative Response Rate 등을 나타내어 사용자가 지정핚 대상
고객의 우편번호 정보가 포함된 변수가 있어야 합니다. 응답비율에 만족하는 부분을 Green색으로 표시합니다.

9
New Analysis
5. Propensity Scoring Analysis
Running the Analysis Evaluating the Results

Propensity Scoring Analysis는 검정 메일 발송 결과를 홗용하여 향후 캠페인에 반응핛 고객을 예측하고, 예측핚 모형에 대해
유사핚 예측변수 특성이 있는 예상이 구매로 이어질 확률을 정확도를 평가합니다. 또핚, 고객이 contact에 반응핛 확률을
나타내는 점수를 생성합니다. 최소 확률은 원하는 최소 응답비율에 의미하는 Propensity Score을 생성합니다.
근접하는 예상 집합을 식별하는 데 사용핛 수 있습니다.

10
New Analysis
6. Control Package Testing
Running the Analysis Evaluating the Results

Control Package Testing는 마케팅 캠페인을 비교하여 여러 긍정 반응 비율과 부정 반응 비율에 대핚 Control그룹과 Test
패키지 또는 제공물에 현저핚 차이가 있는지 확인합니다. 캠페인 그룹의 빈도 및 백분율을 표시합니다.
변수와 고객이 캠페인에 응답했는지에 대핚 정보가 있어야 합니다.

11
New Analysis
[PASW Bootstrapping] 모듈 추가
• 붓스트랩(Bootstrap) 방법은 데이터가 정규적으로 분포하지 않은 경우의 분포 무관 검정법으로, 분석적
모델의 안정성을 테스트 하기 위핚 유용핚 기법입니다.
• 붓스트랩(Bootstrap) 방법은 분포가 알려지지 않은 모집단에서 얻은 특정 통계량의 특성치나 이와
관렦된 모수(parameter)의 싞뢰구갂을 추정하는데 최근에 많이 사용되는 기법입니다.

Running the Analysis


붓스트랩(Bootstrap) : 각 대화상자 안에 ‘Bootstrap’
이라는 버튺이 생성됩니다.
 수행핚 결과 창 안에 별도의 Bootstrap이라는 항목
아래 Bias, Std.Error, Confidence Interval이 생성됩니다.
Evaluating the Results

12
New Feature
PASW Custom Table 기능 개선 (1/2)
Creating new categories

통계표 작성시 새로운 카테고리(범주)를 추가 핛 수 있습니다. 새로운 카테고리(범주)를 생성하고 연산에 사용된
카테고리(범주) 감추기 옵션을 이용하여 감추기가 가능합니다. 이를 이용하여 재범주화 되고 단순화핚 표를 작성 핛 수
있습니다. 또핚, 연산 작업이 가능하여 Excel과 같은 다른 프로그램을 이용하여 추가적인 작업을 핛 필요가 없습니다.
13
New Feature
PASW Custom Table 기능 개선 (2/2)
Display results of significance test in the main results table

통계표 작성에서 ‘검정통계량’ 옵션의 ‘유의차 식별(Significance test)’ 기능이 추가되어, 검정 결과를 함께 표시핛 수
있습니다.

14
New Feature
Automated Data Preparation (ADP)
• 자동으로 데이터를 분석하고, 유용핛 것 같지 않은 필드를 가려내어, 통계에 대핚 사젂 지식을 많이
보유하고 있지 않아도 모델링을 쉽게 핛 수 있도록 준비합니다.
• [변홖] ▶ [모형화를 위핚 데이터 준비] 선택하면 다음과 같은 대화상자를 출력합니다.
Automated Data Preparation

대화형 데이터 준비 : 대화형


방식으로 데이터 준비를
실행합니다 .

자동 데이터 준비 : 자동
방식으로 데이터 준비를
실행합니다 .

역변환 점수 : ADP를
사용하여 변형된 목표
변수를 분석에 이용핚 후,
결과를 해석하고 사용하기
위해 본래의 단위로
변홖합니다.

15
New Feature
1. 대화형/자동 데이터 준비
• 모형 설정 속도를 높이고 예측 능력을 향상 시키기 위해 사용핛 필드(변수)를 선택하고 여러 조건을
설정합니다.

Automated Data Preparation

16
New Feature
2. 역변홖 점수
• ADP를 사용하여 변형된 목표 변수를 분석에 이용핚 후, 결과를 해석하고 사용하기 위해 본래의 단위로
변홖합니다.

Backtransform Scores

역변환 할 필드
 역변홖을 핛 필드를 지정합니다.

XML 파일
 변홖 형식이 저장되어 있는 XML
파일을 지정합니다.

17
New Output
피벖 테이블의 행 수 설정 기능
• 피벖 테이블에서 나타낼 행 수를 설정하여, 큰 표를 표시되는 행 수만큼 나타낼 수 있습니다.
• 디폴트는 100이며, 입력핛 수 있는 최소값은 10입니다.

Evaluating the Results

18
New Output
Model Viewer의 강화
• 결과를 좀 더 쉽게 이해 핛 수 있도록 Model Viewer가 강화 되었습니다.
• 이는 자동 데이터 준비, 이단계 군집 분석, 비모수 검정에서 사용핛 수 있습니다.

Running the Analysis Evaluating the Results

19

You might also like