Welcome to Scribd!

Alteryx Inspire Conference

Uploaded by

0% found this document useful (0 votes)

32 views3 pages

The document discusses techniques for exploring, preparing, and modeling time series and other types of data using Alteryx tools. Key points include using field summaries, scatter plots, and other exploratory techniques to understand data; imputing missing values; performing regression analysis and assessing significance of predictors; creating classification models like decision trees; and evaluating different model performance metrics.

Original Description:

Original Title

AlteryxInspireNotes

Copyright

Available Formats

DOCX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as docx, pdf, or txt

0% found this document useful (0 votes)

32 views3 pages

Alteryx Inspire Conference

Uploaded by

Ishan Sane

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as docx, pdf, or txt

Jump to Page

You are on page 1of 3

Search inside document

Alteryx Inspire Conference

 Field summary used to investigate data type & statistical dist.

 Scatter plots & plot of means can be used for exploratory data analysis
 Impute tool (handles missing or zero values) with mean as an option
 Are 0 values included in the mean calculation?
 P-value analysis on target variable (lower the value more significant the result)
 Association measure (analysis only relevant for linear/logistic regression)
 Create samples tool: creates a training/testing set
 Linear regression (interactive tool provides breakdown of results). Especially look for lowest
p value indicating most relevance (statistical significance)
 Intercept value (value if every other variable is zero)
 OLS analysis (spread of errors will reveal model bias)
 Stepwise regression (re-selects predictor variables depending on their significance)
 Oversample tool (selects samples biased to a certain value)
 Log normalisation (dealing with skewed data)
Log([value]+1), regression deals easier with linearised data
 Confusion matrix will give values of false positives/negatives
 Using false positives, we can oversample that to 50% split to train the model

 Decision Tree (green: path to failure, orange represents success, Tree Classification browse
tool, if it is a yes (go to the left otherwise right)
Accuracy at each node can be shown
 Union tool can also combine model objects together

Understanding Time Series

 Always start with a field summary (describe())

 Find any missing periods
 MUST have consecutive periods between beginning and ending periods

 TS Filler fills missing gaps

 Green bar represents population of numeric vs. null values
 TS Plots allows you to analyse time series data in terms of decomposition, auto-correlation,
partial auto-correlation

 Log frequency/sample to look at relative basis over time

 Clustering is an un-supervised learning technique
 Udacity (predictive analytics course). Can do

Cache & run workflow (caching up till a certain point in a workflow)

Insights tool – has a built in viz platform

Putler’s Predictive Analytics Pyramid

 Determine information needed to address problem/issue

 Find & engineer appropriate and meaningful predictors
 Relationship between predictors & target
 Determine type of models needed

Meaningful metrics for prediction

Decision makers can tend to jump to a solution too soon rather than determining what information
is really needed to inform the problem/solution.

Comparing metrics from different types of models

Is it providing signal or creating noise in the model

Which predictor matters the most when making a prediction

Different modelling methods use different measures of effect size

How does predicted value change as level of numeric predictor increases or as the category changes
for a categorical predictor

For classification models – predicted probability for each possible target classes

Regression models (predicted numeric value of target)

Metrics - Regression

1. MAPE (%)
2. RMSE
3. Correlation between actual & predicted values

Metrics - Binary or Multi-Class Models

- Area under receiver operator curve (AUC) only for binary, can have multi-class extension to
it
- Confusion matrix
- Log-loss (penalise based on count)

Partial dependency plot (fitted values across range of a focal predictor)

Multi-collinearity only starts affecting the model when number of records are a lot

Reverse-causality

Efficiency

 Performance
 Memory
 Hard drive space
 Load on servers during production

Develop Efficiency

Caching

 Right-click & cache to avoid re-running workflow

Reduce by sampling

Ctrl+f (in all caps, can search for values within tools)

Can load games (in ‘about’ section)

HIPPO (Highest Paid Person’s Opinion)

ProblemSet Notebook17-18
Document97 pages
ProblemSet Notebook17-18
ALİ CAN ERTÜRK
100% (1)
Naked Money
Document341 pages
Naked Money
Ishan Sane
No ratings yet
Tornado Diagram Sensitivity Chart
Document6 pages
Tornado Diagram Sensitivity Chart
Alexandru
No ratings yet
Sub026 - Grain Trade Australia
Document38 pages
Sub026 - Grain Trade Australia
Ishan Sane
No ratings yet
Case Study On Business Mathematics
Document10 pages
Case Study On Business Mathematics
Rahul Mahajan
No ratings yet
Six Sigma Tools
Document56 pages
Six Sigma Tools
landersjc
100% (1)
Data Analysis and Presentation: Carey Williamson Department of Computer Science University of Calgary
Document11 pages
Data Analysis and Presentation: Carey Williamson Department of Computer Science University of Calgary
wangoh david
No ratings yet
Ds
Document8 pages
Ds
ifgabhay
No ratings yet
Data Science Interview Guide
Document23 pages
Data Science Interview Guide
Mary Koko
No ratings yet
Data Science Notes
Document37 pages
Data Science Notes
Balvinder Dhillon
No ratings yet
Exam PA Knowledge Based Outline
Document22 pages
Exam PA Knowledge Based Outline
Trong Nghia Vu
No ratings yet
Minitab 2003 Quality - Planning - Tools
Document23 pages
Minitab 2003 Quality - Planning - Tools
Rafa Moncada
No ratings yet
AI & ML Notes
Document22 pages
AI & ML Notes
karthik singarao
No ratings yet
Data Science Statistics Mathematics Cheat Sheet
Document13 pages
Data Science Statistics Mathematics Cheat Sheet
preethamkrishna
100% (1)
Applied Business Analytics Using R & PYTHON: 3 Credits, 24 Sessions, 30 Hours
Document42 pages
Applied Business Analytics Using R & PYTHON: 3 Credits, 24 Sessions, 30 Hours
Rahul B 2B.ComSec 2
No ratings yet
Machine Learning Techniques Assignment-7: Name:Ishaan Kapoor Rollno:1/15/Fet/Bcs/1/055
Document5 pages
Machine Learning Techniques Assignment-7: Name:Ishaan Kapoor Rollno:1/15/Fet/Bcs/1/055
bharti goyal
No ratings yet
Lecture 1 Inferential Statistics
Document32 pages
Lecture 1 Inferential Statistics
Juliet
No ratings yet
Using Genetic Programming To Evolve Detection Strategies For Object-Oriented Design Flaws
Document9 pages
Using Genetic Programming To Evolve Detection Strategies For Object-Oriented Design Flaws
davidmaya2006
No ratings yet
Buslytc Reviewer Terms For Quiz One
Document6 pages
Buslytc Reviewer Terms For Quiz One
Jeff Clinton Lim
No ratings yet
Data Science Cat - 1
Document14 pages
Data Science Cat - 1
DHEEVIKA SURESH
No ratings yet
Overview Six Sigma Phases
Document3 pages
Overview Six Sigma Phases
hans_106
No ratings yet
Exploratory Data Analysis: Datascience Using Python Topic: 3
Document32 pages
Exploratory Data Analysis: Datascience Using Python Topic: 3
KALYANI KIRAN
No ratings yet
Tools and Techniques of Total Quality Management
Document60 pages
Tools and Techniques of Total Quality Management
SweeetMimi
64% (11)
Recap Lecture 3: Measured Data and Statistics
Document60 pages
Recap Lecture 3: Measured Data and Statistics
Wei Huai
No ratings yet
Cluster Analysis
Document13 pages
Cluster Analysis
Abhishek Kumar Tiwari
No ratings yet
Decision Tree and Sensitivity Analysis
Document18 pages
Decision Tree and Sensitivity Analysis
Anonymous Gn9MI0V
No ratings yet
Mastering Data Analytics - Data Science Terms
Document7 pages
Mastering Data Analytics - Data Science Terms
Phong Nguyen
No ratings yet
A Process For Implementing Industrial Predictive Maintenance - Part II - Google Cloud Blog
Document11 pages
A Process For Implementing Industrial Predictive Maintenance - Part II - Google Cloud Blog
Hernn
No ratings yet
Exploratory Data Analysis in ML
Document7 pages
Exploratory Data Analysis in ML
Suresh Kumar
No ratings yet
BA File
Document68 pages
BA File
Sweety 12
No ratings yet
Machine Learning Algorithm
Document8 pages
Machine Learning Algorithm
Shivaprakash D M
No ratings yet
WWW Qualityfoundation in Sqc7 Basic Qctools HTML
Document14 pages
WWW Qualityfoundation in Sqc7 Basic Qctools HTML
fahadfiaz
No ratings yet
Data Science Interview Q's - I
Document11 pages
Data Science Interview Q's - I
Raja
No ratings yet
Applications of Statistical Software For Data Analysis
Document5 pages
Applications of Statistical Software For Data Analysis
DrBabita Singla
No ratings yet
7 QC Tools
Document40 pages
7 QC Tools
suhas
No ratings yet
Business Statistics: Qualitative or Categorical Data
Document14 pages
Business Statistics: Qualitative or Categorical Data
Sweety 12
No ratings yet
Missing Data
Document7 pages
Missing Data
fasilistheo
No ratings yet
Intro To Statistics
Document37 pages
Intro To Statistics
yasmine hussein
No ratings yet
Statistics For Data Science
Document30 pages
Statistics For Data Science
ArminSayadi
No ratings yet
Machine Learning
Document6 pages
Machine Learning
Pravin Sakpal
No ratings yet
8614 (1) - 1
Document17 pages
8614 (1) - 1
Saqib Khalid
No ratings yet
Excel Statistical Formulas
Document17 pages
Excel Statistical Formulas
ankitshah21
100% (2)
FMD PRACTICAL FILE
Document61 pages
FMD PRACTICAL FILE
Muskan Arora
No ratings yet
Control of Experimental Error: Bull's Eye Represents The True Value of The Parameter You Wish To Estimate
Document27 pages
Control of Experimental Error: Bull's Eye Represents The True Value of The Parameter You Wish To Estimate
Ismael Neu
No ratings yet
Data Analytics Lab
Document46 pages
Data Analytics Lab
Anupriya Jain
No ratings yet
Spss Notes
Document19 pages
Spss Notes
Veronica_1990
No ratings yet
Unit 3
Document47 pages
Unit 3
Sai priyadarshini S
No ratings yet
Lecture 1: Introducton To The Use of Statistics in Empirical Research in The Social Sciences
Document5 pages
Lecture 1: Introducton To The Use of Statistics in Empirical Research in The Social Sciences
Zydney Wong
No ratings yet
MBA-620 Asad Masood
Document7 pages
MBA-620 Asad Masood
TECH CENTRAL
No ratings yet
TQM Unit 4
Document44 pages
TQM Unit 4
Kandula Krishnarjun
No ratings yet
Introduction To Statistics: "There Are Three Kinds of Lies: Lies, Damned Lies, and Statistics." (B.Disraeli)
Document32 pages
Introduction To Statistics: "There Are Three Kinds of Lies: Lies, Damned Lies, and Statistics." (B.Disraeli)
Priyanka
No ratings yet
Artificial Intelligence
Document13 pages
Artificial Intelligence
Gadget
No ratings yet
Time Series
Document67 pages
Time Series
jose
No ratings yet
Problem-Solving and Design AS - 1
Document97 pages
Problem-Solving and Design AS - 1
do0020
No ratings yet
2012 Pls-Sem Workshop 5-26-2012 Initial Revised - 2
Document25 pages
2012 Pls-Sem Workshop 5-26-2012 Initial Revised - 2
katon
No ratings yet
Problem-Solving and Design AS - 1
Document96 pages
Problem-Solving and Design AS - 1
Lisa
No ratings yet
Pattern Recognition
Document9 pages
Pattern Recognition
AjayChandrakar
No ratings yet
A Check Sheet Is Used For
Document13 pages
A Check Sheet Is Used For
Fahad Waheed
No ratings yet
Exercises in Quantitative Techniques
Document30 pages
Exercises in Quantitative Techniques
Andy B
No ratings yet
1.0 Modeling: 1.1 Classification
Document5 pages
1.0 Modeling: 1.1 Classification
Banujan Kuhaneswaran
No ratings yet
Is Audit Report - Chapter 9
Document49 pages
Is Audit Report - Chapter 9
Mary Grace Caguioa Agas
No ratings yet
Summary
Document7 pages
Summary
Jaja Nie Si Yao
No ratings yet
Statistical Classification: Fundamentals and Applications
From Everand
Statistical Classification: Fundamentals and Applications
Fouad Sabry
No ratings yet
Process Performance Models: Statistical, Probabilistic & Simulation
From Everand
Process Performance Models: Statistical, Probabilistic & Simulation
Vishnuvarthanan Moorthy
No ratings yet
CBOT-Understanding Basis
Document26 pages
CBOT-Understanding Basis
Ishan Sane
No ratings yet
The Future Predictions of The Blind Mystic
Document13 pages
The Future Predictions of The Blind Mystic
Ishan Sane
No ratings yet
About The First Home Buyers Assistance Scheme
Document2 pages
About The First Home Buyers Assistance Scheme
Ishan Sane
No ratings yet
19-00351 DATA61 REPORT AgricultureWorkforce WEB 191031
Document80 pages
19-00351 DATA61 REPORT AgricultureWorkforce WEB 191031
Ishan Sane
No ratings yet
Crown Sydney Cirq Food Menu
Document3 pages
Crown Sydney Cirq Food Menu
Ishan Sane
No ratings yet
Pierian Data - Python For Finance & Algorithmic Trading Course Notes
Document11 pages
Pierian Data - Python For Finance & Algorithmic Trading Course Notes
Ishan Sane
No ratings yet
2019 Salary Guide: Hudson Analytics
Document7 pages
2019 Salary Guide: Hudson Analytics
Ishan Sane
No ratings yet
The Vessel Scheduling Problem in A Liner Shipping
Document17 pages
The Vessel Scheduling Problem in A Liner Shipping
Ishan Sane
No ratings yet
Chickpea Marketing India
Document19 pages
Chickpea Marketing India
Ishan Sane
No ratings yet
The Nomenclature of Jewelry Part 3 - Rings - International Gem Society IGS
Document4 pages
The Nomenclature of Jewelry Part 3 - Rings - International Gem Society IGS
Ishan Sane
No ratings yet
Mahesh Gowande: Contact
Document2 pages
Mahesh Gowande: Contact
Ishan Sane
No ratings yet
Sample: For Your Information
Document28 pages
Sample: For Your Information
Ishan Sane
No ratings yet
Making Money Investing in Gems - International Gem Society IGS
Document9 pages
Making Money Investing in Gems - International Gem Society IGS
Ishan Sane
No ratings yet
SeniorResearchAnalystCOFCO MichaelMosca
Document3 pages
SeniorResearchAnalystCOFCO MichaelMosca
Ishan Sane
No ratings yet
Continuous Futures Data Series For Back Testing and Technical Analysis
Document6 pages
Continuous Futures Data Series For Back Testing and Technical Analysis
Ishan Sane
No ratings yet
The Nomenclature of Jewelry Part 1 - Settings - International Gem Society IGS
Document9 pages
The Nomenclature of Jewelry Part 1 - Settings - International Gem Society IGS
Ishan Sane
No ratings yet
ACF Supply and Demand Report - October 18
Document6 pages
ACF Supply and Demand Report - October 18
Ishan Sane
No ratings yet
Commodity Trading Goes Back To The Future
Document10 pages
Commodity Trading Goes Back To The Future
Ishan Sane
No ratings yet
Performance Management Procedure
Document6 pages
Performance Management Procedure
Ishan Sane
No ratings yet
Backwardation Returns Commodity Fut
Document30 pages
Backwardation Returns Commodity Fut
Ishan Sane
No ratings yet
Education Lesson Inventory: Courses
Document21 pages
Education Lesson Inventory: Courses
Ishan Sane
No ratings yet
A Quantitative Analysis of Managed Futures Strategies: Lintner Revisited
Document40 pages
A Quantitative Analysis of Managed Futures Strategies: Lintner Revisited
Ishan Sane
No ratings yet
Lecture1
Document51 pages
Lecture1
Kimberley Oh
100% (1)
Chapt 6
Document30 pages
Chapt 6
Roba Abdujebar
No ratings yet
Part14 Survival Analysis
Document22 pages
Part14 Survival Analysis
Sri Mulyati
No ratings yet
Example 1: One Way ANOVA in Excel: 2010 Adi-Nv, Inc. 1
Document7 pages
Example 1: One Way ANOVA in Excel: 2010 Adi-Nv, Inc. 1
Juan Manuel Solar
No ratings yet
Syllabus PDF
Document4 pages
Syllabus PDF
April Kim
No ratings yet
Standards - ETSI Compliance
Document17 pages
Standards - ETSI Compliance
Linh Le
No ratings yet
Decison Model Case-Study
Document26 pages
Decison Model Case-Study
Umt Bbis
No ratings yet
(Download PDF) Ise Elementary Statistics A Step by Step Approach A Brief Version 8E 8Th Edition Allan G Bluman Full Chapter PDF
Document69 pages
(Download PDF) Ise Elementary Statistics A Step by Step Approach A Brief Version 8E 8Th Edition Allan G Bluman Full Chapter PDF
arreytjondu
100% (6)
Chapter 4 Introduction To Probability
Document68 pages
Chapter 4 Introduction To Probability
G Gጂጂ Tube
No ratings yet
Lesson 3
Document22 pages
Lesson 3
camilleescote562
No ratings yet
Inferential Statistics
Document101 pages
Inferential Statistics
Naseer Khan
No ratings yet
Error Analysis Final
Document3 pages
Error Analysis Final
Daniel Dube
No ratings yet
Chapter 4
Document5 pages
Chapter 4
gjsporque
100% (1)
TESDA TM Pre Test
Document8 pages
TESDA TM Pre Test
johnlycas
No ratings yet
MI2026 Problems of Chapter 6
Document6 pages
MI2026 Problems of Chapter 6
Cẩm Nhung Nguyễn
No ratings yet
Microfinancebanking and Economic Growth of Nigeria
Document5 pages
Microfinancebanking and Economic Growth of Nigeria
Adekanbi oluwaseun
No ratings yet
BusStat W02 Hypothesis Test
Document18 pages
BusStat W02 Hypothesis Test
Stevie Sean
No ratings yet
2.5 the Negative Binomial Distribution 習題
Document2 pages
2.5 the Negative Binomial Distribution 習題
sandywu930510
No ratings yet
Flood Frequency Analysis of Annual Maximum Stream Flows For Kuantan River Basin
Document7 pages
Flood Frequency Analysis of Annual Maximum Stream Flows For Kuantan River Basin
eny
No ratings yet
Statistics: Data Management
Document22 pages
Statistics: Data Management
Gritzen Odias
No ratings yet
CHAPTER 3 PPT Ornanisation - of - Data Class 11
Document28 pages
CHAPTER 3 PPT Ornanisation - of - Data Class 11
Yashshvi
No ratings yet
Lab 8
Document8 pages
Lab 8
Aman Bansal
No ratings yet
Stat... ICS Part-II 2022
Document52 pages
Stat... ICS Part-II 2022
Nasir
No ratings yet
Rev 5 Hypothesis Tests STPM T3
Document3 pages
Rev 5 Hypothesis Tests STPM T3
KwongKH
50% (2)
Mba-1-Sem-Business-Statistics-Mba-Aktu-Previous Year Paper
Document2 pages
Mba-1-Sem-Business-Statistics-Mba-Aktu-Previous Year Paper
Nishant Tripathi
50% (2)
ES303 HW 1
Document5 pages
ES303 HW 1
Ümmehan Mert
No ratings yet
BIOSTAT Random Variables & Probability Distribution
Document37 pages
BIOSTAT Random Variables & Probability Distribution
Anonymous Xlpj86la
No ratings yet
The Power of CLV-Managing Customer Lifetime Value at IBM
Document7 pages
The Power of CLV-Managing Customer Lifetime Value at IBM
87bb
No ratings yet