Welcome to Scribd!

Datadidak First Session

Uploaded by

0% found this document useful (0 votes)

10 views15 pages

This document provides an introduction to data analytics concepts. It defines data analytics as the computational analysis of data to discover meaningful patterns and insights that can be used for effective decision making. Some example real-world applications of data analytics mentioned are marketing, HR, risk, and news analytics. The document then outlines common analytics flows and tools, and provides more detailed explanations of key concepts in data analytics including cohort retention, customer segmentation using RFM and other methods, A/B testing fundamentals and sample size calculations. It concludes by mentioning there will be hands-on exercises using Excel formulas in Google Sheets and interactive data visualizations in Google Data Studio.

Original Description:

data

Original Title

Datadidak First Session (2)

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

0% found this document useful (0 votes)

10 views15 pages

Datadidak First Session

Uploaded by

Birin Muhammad

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

Jump to Page

You are on page 1of 15

Search inside document

Datadidak

Introduction to
Data Analytics
Datadidak

What is Data Analytics?

“Analytics is the systematic computational
Posing a Question
analysis of data or statistics.It is used for
Start with problem
statements or hypothesis
the discovery, interpretation, and
communication of meaningful patterns in
data. It also entails applying data patterns
towards effective decision making.” (Wikipedia)
Delivering Insights Getting Data

Communicating your Retrieve/Clean/Wrangle

ﬁndings your data into a format
you can use Example of real world applications:
● Marketing/Digital Analytics
● People/HR Analytics
Making Conclusions Exploring Data

Drawing conclusions Finding patterns in it, and

● Risk Analytics
and/or making building your intuition
predictions about it ● News Analytics
Datadidak

Analytics Flows & Tools

● Internal web-app logging (Node.js, Python,

01 Data Logging ●
●
Java)
Pub/Sub (GCP, AWS)
Firebase (app analytics)

02
● Files
Data Persistence ● NoSQL (MongoDB, CouchDB, HBase)
● RDBMS (MariaDB, PostgreSQL, SQL Server)

03 Data Retrieval
●
●
SQL*
BigQuery (GCP)

04
● Excel
Data Processing ● R
● Python

05
● Powerpoint
Data “Storytelling” ● Tableau
● Google Data Studio
SAMPLE CONCEPTS
Datadidak

Concept -- Cohort Retention (New Customers)

Datadidak

Concept -- Cohort Retention (ROI)

Datadidak

Concept -- Customer Segmentation

● WHAT to offer ?
● WHEN to offer ?
● HOW to offer ?
● WHOM to offer ?
a.k.a : Segmentation

source: smartinsights.com
Datadidak

Concept -- Customer Segmentation

Psychographic Segmentation
03 - Activities, Interests
- Values, Attitudes

Demographic Segmentation
Quantitative
- Age, Gender, Location &
- Marital status, Education, Religion, Qualitative
Income
01 02
.
Behavioral Segmentation
- Habits, Patterns, Preferences
- RFM (Recency, Frequency, Monetary)
Datadidak

Concept -- Customer Segmentation (RFM)

Datadidak

Concept -- Customer Segmentation (RFM)

● *AA -- Champions
○ AAA -- Loyal Champions
○ CAA -- Hibernating Champions
64 ● AAD -- Low-spender
groups
● DDD -- Lost
● (and so on)
Datadidak

Concept -- A/B Testing

A/B tests consist of a randomized
experiment with two variants, applying
statistical hypothesis testing

Create/Split Determine
Focus on ONE thing Run the test Evaluate
Sample groups Sample size
- Pick one variable - Control vs. Variant - How long (duration)? - Test both variants - Is there a winner?
- Identify a goal - Equally & randomly - What’s your simultaneously - So what?
significant-threshold? - Don’t do other test - Plan for next test(s)
concurrently
Datadidak

Concept -- A/B Testing

Let’s try starting with 2000 visitors for each variant

The chi-square statistic is 5.3249. The p-value is .021023. Significant at p < 0.05

Let’s add another 1000 for each ...

Variant A Variant B
The chi-square statistic is 2.7238. The p-value is .098865. Not significant at p > 0.05

50% visitors 50% visitors

… so, how many unique-visitors (each variant)
Sample split method: should we run this test against?
Even/Odd by IP address : 202.124.32.16
Even/Odd by Timestamp : 2020-02-23T13:23:27
Datadidak

Concept -- A/B Testing

Parameters when calculating our example A/B test
sample-size, based on statistical hypothesis testing
(i.e: reject/accept Null hypothesis -- diff A & B equals to zero)

● CR Var A, B, min diff A & B

● chosen Confidence Level
○ 95% -- most common
● chosen Statistical Power
○ 80% -- most common
● One or Two-tailed Test
○ One-tailed test -- in this
example, we only care
positive diff, and not negative
diff.
We need at least 6,130 unique visitors per variant, to have a
statistically significant result
(with 95% confidence level & 80% statistical power)
Datadidak

</ Intro >

Datadidak

<hands-on>
● Excel Formula in Google Sheet
● Interactive Visual in Google Data Studio

</hands-on>

Merritt's Bakery
Document1 page
Merritt's Bakery
Nardine Farag
0% (1)
En 12604 (2000) (E)
Document7 pages
En 12604 (2000) (E)
Carlos Lanzillotto
No ratings yet
Data Mining Overview
Document14 pages
Data Mining Overview
Anjana Udhayakumar
No ratings yet
URC Business Review
Document75 pages
URC Business Review
anon_728683458
No ratings yet
2 - BBDS - Decisions Management & Problem Framing
Document78 pages
2 - BBDS - Decisions Management & Problem Framing
rafayel
No ratings yet
Internship Report Data Science
Document58 pages
Internship Report Data Science
Nexgen Technology
No ratings yet
Beginners Guide To Data Science - A Twics Guide 1
Document41 pages
Beginners Guide To Data Science - A Twics Guide 1
Jeffin Varghese
No ratings yet
Polong Lin Presentation
Document34 pages
Polong Lin Presentation
Anıl Erbay
No ratings yet
Data Driven Decision Making
Document27 pages
Data Driven Decision Making
Alfred Wijaya
No ratings yet
Data Analysis - Version 2
Document12 pages
Data Analysis - Version 2
Taufiq us Samad Tonmoy
No ratings yet
Strategies For Predictive Analytics - Dean Abbott Feb2014 PDF
Document75 pages
Strategies For Predictive Analytics - Dean Abbott Feb2014 PDF
cblue
No ratings yet
Lecture 1-Data Mining (Introduction)
Document30 pages
Lecture 1-Data Mining (Introduction)
ruba
No ratings yet
Rameshwari Patil
Document3 pages
Rameshwari Patil
Rameshwari Patil
No ratings yet
DM BS Lec1 Intro
Document20 pages
DM BS Lec1 Intro
Ejaz Ahmed
No ratings yet
Data Mining and BI - Student Notes 2
Document40 pages
Data Mining and BI - Student Notes 2
Kunal Kubal
No ratings yet
Total Documentation
Document21 pages
Total Documentation
Sowmya Lakshmi
No ratings yet
BDA Unlocked
Document69 pages
BDA Unlocked
nikita jagtap
100% (1)
Data Analysis From Theoretical To Implementation Using Excel, Python, Flourish
Document30 pages
Data Analysis From Theoretical To Implementation Using Excel, Python, Flourish
mohamed
No ratings yet
Data Analytics
Document346 pages
Data Analytics
hsz9qk7hgn
100% (2)
Data Mining - IMT Nagpur-Manish
Document82 pages
Data Mining - IMT Nagpur-Manish
Sumeet Gupta
No ratings yet
CV 2024022913094316
Document3 pages
CV 2024022913094316
info4nirbhay
No ratings yet
Data Mining Concept (MMU)
Document38 pages
Data Mining Concept (MMU)
Rex Low
No ratings yet
Clustering For Marketing
Document37 pages
Clustering For Marketing
Esteban Nieves
No ratings yet
Introduction To Data Science: Week 1 Unit 1
Document69 pages
Introduction To Data Science: Week 1 Unit 1
qwerty_qwerty_2009
No ratings yet
OpenSAP Ds1 Week 1 Unit 1 INTRODS Presentation
Document16 pages
OpenSAP Ds1 Week 1 Unit 1 INTRODS Presentation
श्रीकांत शरमा
No ratings yet
Certification Program in Data Science - 184 Hours
Document26 pages
Certification Program in Data Science - 184 Hours
Kavin Sahasran
No ratings yet
Crisp DM
Document30 pages
Crisp DM
Kautilya Parmar
100% (1)
Data Science
Document6 pages
Data Science
anthony
No ratings yet
Predictive Modelling-Week-1
Document39 pages
Predictive Modelling-Week-1
prepareforexamz
No ratings yet
Wk1 Intro To Data Analytics
Document39 pages
Wk1 Intro To Data Analytics
Justin Co
No ratings yet
IME 672-Chapter 1 PDF
Document41 pages
IME 672-Chapter 1 PDF
prince
No ratings yet
Advanced Analytics Introduction
Document8 pages
Advanced Analytics Introduction
Anubhav Sinha
No ratings yet
LPR - Week 1 070253 Final
Document18 pages
LPR - Week 1 070253 Final
Adilah Rummanah Gani
No ratings yet
02 Crispdm
Document25 pages
02 Crispdm
samia
No ratings yet
Marketing Analytics Session-I&II S
Document45 pages
Marketing Analytics Session-I&II S
tarun
No ratings yet
Into Insight For Making Better Decisions, Offering New Opportunities For A Competitive Advantage
Document19 pages
Into Insight For Making Better Decisions, Offering New Opportunities For A Competitive Advantage
nami vast
No ratings yet
WS1UNR
Document13 pages
WS1UNR
Abiy Mulugeta
No ratings yet
Data Mining Fall-2019 Qs Ans
Document10 pages
Data Mining Fall-2019 Qs Ans
Happy Plants BD
No ratings yet
A Step-by-Step Guide To Begin With Your Analytics Initiative
Document7 pages
A Step-by-Step Guide To Begin With Your Analytics Initiative
ranga.raman
No ratings yet
BDS Session 3
Document56 pages
BDS Session 3
Sudeb Das
No ratings yet
Silabus Data Science & Machine Learning JakartaLabs 2022
Document13 pages
Silabus Data Science & Machine Learning JakartaLabs 2022
luthfighinabarka
No ratings yet
Business Analytics
Document42 pages
Business Analytics
Thành Cao Đức
No ratings yet
Building A Career in Data Science
Document15 pages
Building A Career in Data Science
Sebastian Jara
No ratings yet
Materials
Document30 pages
Materials
Gowsik G
No ratings yet
CV 202403071730503
Document2 pages
CV 202403071730503
info4nirbhay
No ratings yet
BDS Session 3
Document63 pages
BDS Session 3
Swati Bhagavatula
No ratings yet
Data Science I: Lesson #01 - Outline Presentation
Document20 pages
Data Science I: Lesson #01 - Outline Presentation
alesy
No ratings yet
Slide - INTRODUCTION BUSINESS ANALYTICS & SIMULATION
Document47 pages
Slide - INTRODUCTION BUSINESS ANALYTICS & SIMULATION
Kiều Nhi Nguyễn
No ratings yet
Data - Science - Methodology - and - Use - Case
Document31 pages
Data - Science - Methodology - and - Use - Case
regita wijaya
No ratings yet
Class 1 - Intro To Data Science
Document75 pages
Class 1 - Intro To Data Science
Alejandra Endara
No ratings yet
Frame 176
Document1 page
Frame 176
Kanhaiya Verma
No ratings yet
S2 - Datascience Lifecycle
Document19 pages
S2 - Datascience Lifecycle
mmtharindu
No ratings yet
Week 1
Document50 pages
Week 1
t na
No ratings yet
Lecture 2 Data Mining Functions
Document40 pages
Lecture 2 Data Mining Functions
ruba
No ratings yet
What Is Data Mining?: Dama-Ncr
Document36 pages
What Is Data Mining?: Dama-Ncr
Gobi Gothandan
No ratings yet
Method Key Points Bottom Line Dmaic
Document43 pages
Method Key Points Bottom Line Dmaic
Naga Chaitanya
No ratings yet
Module 1 Ppt1
Document59 pages
Module 1 Ppt1
Rashmi Sehgal
No ratings yet
The Future Growth of A Career As A Business Analyst Its Role and Responsibilities
Document23 pages
The Future Growth of A Career As A Business Analyst Its Role and Responsibilities
learningrow
No ratings yet
Lab 19 - Network Analysis
Document36 pages
Lab 19 - Network Analysis
Uno de Madrid
No ratings yet
Data Mining: Business Intelligence
Document68 pages
Data Mining: Business Intelligence
aaaaaaaaaaaaaaaaaa
No ratings yet
DM 1
Document78 pages
DM 1
Aditya Srivastava
No ratings yet
OMDC Data Group Read-Out Presentation
Document18 pages
OMDC Data Group Read-Out Presentation
David Aryan
No ratings yet
Mastering Data Warehouse Design: Relational and Dimensional Techniques
From Everand
Mastering Data Warehouse Design: Relational and Dimensional Techniques
Claudia Imhoff
Rating: 4 out of 5 stars
4/5 (1)
Priemus, Zonneveld - What Are Corridors and What Are The Issues. Introduction To Special Issue - The Governance of Corridors
Document11 pages
Priemus, Zonneveld - What Are Corridors and What Are The Issues. Introduction To Special Issue - The Governance of Corridors
Branko
No ratings yet
Service Manual: Vito - Cucina Juice Extractor HR 2828 /CC /FC
Document4 pages
Service Manual: Vito - Cucina Juice Extractor HR 2828 /CC /FC
pukymotto
No ratings yet
Orocobre Limited
Document12 pages
Orocobre Limited
karma Sherpa
No ratings yet
The Definitive Guide To Ielts Academic: Preparation and Practice
Document3 pages
The Definitive Guide To Ielts Academic: Preparation and Practice
Shaurya Arya
No ratings yet
Ajp 1
Document15 pages
Ajp 1
Yuva Neta Ashish Pandey
No ratings yet
Chapter Four: Information Systems To Support Population Health Management
Document19 pages
Chapter Four: Information Systems To Support Population Health Management
amir nabil
No ratings yet
Delonix Regia
Document6 pages
Delonix Regia
Jesus Miguel
No ratings yet
2022 Acl-Long 524
Document18 pages
2022 Acl-Long 524
katono7302
No ratings yet
5-Interfacing IO Devices - Student Version
Document43 pages
5-Interfacing IO Devices - Student Version
api-3721164
75% (4)
Siemens Iso C
Document6 pages
Siemens Iso C
Francisco Diaz
100% (2)
Laboratory Cover Letter Examples
Document5 pages
Laboratory Cover Letter Examples
e7648d37
100% (1)
Circular Design Challenge2 PDF
Document3 pages
Circular Design Challenge2 PDF
Maurya Dave
No ratings yet
Why Is Biodiversity Important
Document28 pages
Why Is Biodiversity Important
Aarthi Padmanabhan
No ratings yet
World Magazine Trends 2010
Document268 pages
World Magazine Trends 2010
Nivedita Singh
No ratings yet
SMART Ventilation 101 2023
Document20 pages
SMART Ventilation 101 2023
umar anka
No ratings yet
Chemical Kinetics
Document45 pages
Chemical Kinetics
Natish Jaglan
No ratings yet
Daily Irradiance Data: PVGIS-5 Geo-Temporal Irradiation Database
Document1 page
Daily Irradiance Data: PVGIS-5 Geo-Temporal Irradiation Database
Jasmina F.
No ratings yet
TISS Empanelment Form
Document42 pages
TISS Empanelment Form
Ravindra
No ratings yet
ENG ป.4-6 ชุด2
Document18 pages
ENG ป.4-6 ชุด2
Laksami Chaitrintawat
No ratings yet
RPH W6
Document9 pages
RPH W6
ggjamal
No ratings yet
Bintang Tap
Document29 pages
Bintang Tap
Ari Sumantri
No ratings yet
Nominal Interest Rates vs. Real Interest Rates: Deflation
Document8 pages
Nominal Interest Rates vs. Real Interest Rates: Deflation
Kr Prajapat
No ratings yet
7227 Lrdi3
Document4 pages
7227 Lrdi3
Gang Bhasin
No ratings yet
Part 1 Mil-Legal, Ethical and Societal Issues and Information Part1
Document60 pages
Part 1 Mil-Legal, Ethical and Societal Issues and Information Part1
Aian Cortez
86% (7)
Manual Cable Yale
Document56 pages
Manual Cable Yale
Juan Carlos Palomares Beltran
No ratings yet
Book1phone List Icu
Document3 pages
Book1phone List Icu
api-312025021
No ratings yet
CUDA Installation Guide Linux
Document45 pages
CUDA Installation Guide Linux
karlhue
No ratings yet