Ecositema de Datos

You might also like

Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 28

VIDEO # 1

What is the data ecosystem?

Hello again. You've already learned about being a data analyst and how this program will help
prepare you for your future career. Now, it's time to explore the data ecosystem, find out
where data analytics fits into that system, and go over some common misconceptions you
might run into in the field of data analytics. To put it simply, an ecosystem is a group of
elements that interact with one another. Ecosystems can be large, like the jungle in a tropical
rainforest or the Australian outback. Or, tiny, like tadpoles in a puddle, or bacteria on your
skin. And just like the kangaroos and koala bears in the Australian outback, data lives inside
its own ecosystem too. Data ecosystems are made up of various elements that interact with
one another in order to produce, manage, store, organize, analyze, and share data. These
elements include hardware and software tools, and the people who use them. People like you.
Data can also be found in something called the cloud. The cloud is a place to keep data online,
rather than on a computer hard drive. So instead of storing data somewhere inside your
organization's network, that data is accessed over the internet. So the cloud is just a term we
use to describe the virtual location. The cloud plays a big part in the data ecosystem, and as a
data analyst, it's your job to harness the power of that data ecosystem, find the right
information, and provide the team with analysis that helps them make smart decisions. For
example, you could tap into your retail store's database, which is an ecosystem filled with
customer names, addresses, previous purchases, and customer reviews. As a data analyst, you
could use this information to predict what these customers will buy in the future, and make
sure the store has the products and stock when they're needed. As another example, let's think
about a data ecosystem used by a human resources department. This ecosystem would include
information like postings from job websites, stats on the current labor market, employment
rates, and social media data on prospective employees. A data analyst could use this
information to help their team recruit new workers and improve employee engagement and
retention rates. But data ecosystems aren't just for stores and offices. They work on farms, too.
Agricultural companies regularly use data ecosystems that include information including
geological patterns in weather movements. Data analysts can use this data to help farmers
predict crop yields. Some data analysts are even using data ecosystems to save real
environmental ecosystems. At the Scripps Institution of Oceanography, coral reefs all over the
world are monitored digitally, so they can see how organisms change over time, track their
growth, and measure any increases or declines in individual colonies. The possibilities are
endless. Okay, now let's talk about some common misconceptions you might come across.
First is the difference between data scientists and data analysts. It's easy to confuse the two,
but what they do is actually very different. Data science is defined as creating new ways of
modeling and understanding the unknown by using raw data. Here's a good way to think about
it. Data scientists create new questions using data, while analysts find answers to existing
questions by creating insights from data sources. There are also many words and phrases
you'll hear throughout this course, that are easy to get mixed up. For example, data analysis
and data analytics sound the same, but they're actually very different things. Let's start with
analysis. You've already learned that data analysis is the collection, transformation, and
organization of data in order to draw conclusions, make predictions, and drive informed
decision-making. Data analytics in the simplest terms is the science of data. It's a very broad
concept that encompasses everything from the job of managing and using data to the tools and
methods that data workers use each and every day. So when you think about data, data
analysis and the data ecosystem, it's important to understand that all of these things fit under
the data analytics umbrella. All right, now that you know a little more about the data
ecosystem and the differences between data analysis and data analytics, you're ready to
explore how data is used to make effective decisions. You'll get to see data-driven decision-
making, in action.

VIDEO # 1

¿Qué es el ecosistema de datos?

Hola de nuevo. Ya aprendió sobre cómo ser un analista de datos y cómo este
programa lo ayudará a prepararse para su futura carrera. Ahora es el momento de
explorar el ecosistema de datos, descubrir dónde encaja el análisis de datos en ese
sistema y repasar algunos conceptos erróneos comunes con los que podría encontrarse
en el campo del análisis de datos. En pocas palabras, un ecosistema es un grupo de
elementos que interactúan entre sí. Los ecosistemas pueden ser grandes, como la
jungla en una selva tropical o el interior de Australia. O diminutos, como renacuajos
en un charco o bacterias en la piel. Y al igual que los canguros y los osos koala en el
interior de Australia, los datos también viven dentro de su propio ecosistema. Los
ecosistemas de datos están compuestos por varios elementos que interactúan entre sí
para producir, administrar, almacenar, organizar, analizar y compartir datos.
Estos elementos incluyen herramientas de hardware y software, y las personas que
las utilizan. Gente como tú. Los datos también se pueden encontrar en algo llamado la
nube. La nube es un lugar para mantener los datos en línea, en lugar de en el disco
duro de una computadora. Entonces, en lugar de almacenar datos en algún lugar
dentro de la red de su organización, se accede a esos datos a través de Internet.
Entonces, la nube es solo un término que usamos para describir la ubicación virtual.
La nube juega un papel importante en el ecosistema de datos y, como analista de
datos, es su trabajo aprovechar el poder de ese ecosistema de datos, encontrar la
información correcta y proporcionar al equipo un análisis que les ayude a tomar
decisiones inteligentes. Por ejemplo, puede acceder a la base de datos de su tienda
minorista, que es un ecosistema lleno de nombres de clientes, direcciones, compras
anteriores y reseñas de clientes. Como analista de datos, podría usar esta información
para predecir lo que estos clientes comprarán en el futuro y asegurarse de que la tienda
tenga los productos y las existencias cuando se necesiten. Como otro ejemplo,
pensemos en un ecosistema de datos utilizado por un departamento de recursos
humanos. Este ecosistema incluiría información como publicaciones de sitios web de
empleo, estadísticas sobre el mercado laboral actual, tasas de empleo y datos de redes
sociales sobre posibles empleados. Un analista de datos podría usar esta información
para ayudar a su equipo a reclutar nuevos trabajadores y mejorar las tasas de
participación y retención de los empleados. Pero los ecosistemas de datos no son solo
para tiendas y oficinas. También trabajan en granjas. Las empresas agrícolas utilizan
regularmente ecosistemas de datos que incluyen información que incluye patrones
geológicos en los movimientos del clima. Los analistas de datos pueden usar estos
datos para ayudar a los agricultores a predecir el rendimiento de los cultivos. Algunos
analistas de datos incluso están utilizando ecosistemas de datos para salvar
ecosistemas ambientales reales. En la Institución Scripps de Oceanografía, los
arrecifes de coral de todo el mundo son monitoreados digitalmente, para que puedan
ver cómo los organismos cambian con el tiempo, rastrear su crecimiento y medir
cualquier aumento o disminución en colonias individuales. Las posibilidades son
infinitas. Bien, ahora hablemos de algunos conceptos erróneos comunes con los que te
puedes encontrar. Primero está la diferencia entre los científicos de datos y los
analistas de datos. Es fácil confundirlos, pero lo que hacen en realidad es muy
diferente. La ciencia de datos se define como la creación de nuevas formas de
modelar y comprender lo desconocido mediante el uso de datos sin procesar. Aquí hay
una buena manera de pensar en ello. Los científicos de datos crean nuevas preguntas
utilizando datos, mientras que los analistas encuentran respuestas a las preguntas
existentes al crear conocimientos a partir de fuentes de datos. También hay muchas
palabras y frases que escuchará a lo largo de este curso, que son fáciles de confundir.
Por ejemplo, el análisis de datos y el análisis de datos suenan igual, pero en realidad
son cosas muy diferentes. Comencemos con el análisis. Ya aprendió que el análisis de
datos es la recopilación, transformación y organización de datos para sacar
conclusiones, hacer predicciones e impulsar la toma de decisiones informadas. El
análisis de datos en los términos más simples es la ciencia de los datos. Es un
concepto muy amplio que abarca todo, desde el trabajo de administrar y usar datos
hasta las herramientas y métodos que los trabajadores de datos usan todos los días.
Entonces, cuando piensa en datos, análisis de datos y el ecosistema de datos, es
importante comprender que todas estas cosas encajan bajo el paraguas del análisis de
datos. Muy bien, ahora que sabe un poco más sobre el ecosistema de datos y las
diferencias entre el análisis de datos y el análisis de datos, está listo para explorar
cómo se usan los datos para tomar decisiones efectivas. Podrá ver la toma de
decisiones basada en datos, en acción.

CUESTIONARIO

1.-En análisis de datos, ¿cuál es el término para los elementos que interactúan
entre sí para producir, administrar, almacenar, organizar, analizar y compartir
datos? (recordatorio: ¡asegúrese de desplazarse hacia abajo para ver todas las
opciones!)

Sistemas de almacenamiento de datos

Ecosistemas de datos
Composiciones de datos

Mapas de datos

VIDEO # 2

How data informs better decisions

So far, you've discovered that there are many different ways data can be used. In our
everyday lives, we use data when we wear a fitness tracker or read product reviews to
make a purchase decision. And in business, we use data to learn more about our
customers, improve processes, and help employees do their jobs more effectively. But
this is just the tip of the iceberg. One of the most powerful ways you can put data to
work is with data-driven decision-making. Data-driven decision-making is defined as
using facts to guide business strategy. Organizations in many different industries are
empowered to make better, data-driven decisions by data analysts all the time. The
first step in data-driven decision-making is figuring out the business need. Usually,
this is a problem that needs to be solved. For example, a problem could be a new
company needing to establish better brand recognition, so it can compete with bigger,
more well-known competitors. Or maybe an organization wants to improve a product
and needs to figure out how to source parts from a more sustainable or ethically
responsible supplier. Or, it could be a business trying to solve the problem of unhappy
employees, low levels of engagement, satisfaction and retention. Whatever the
problem is, once it's defined, a data analyst finds data, analyzes it and uses it to
uncover trends, patterns and relationships. Sometimes the data-driven strategy will
build on what's worked in the past. Other times, it can guide a business to branch out
in a whole new direction. Let's look at a real-world example. Think about a music or
movie streaming service. How do these companies know what people want to watch
or listen to, and how do they provide it? Well using data-driven decision-making, they
gather information about what their customers are currently listening to, analyze it,
then use the insights they've gained to make suggestions for things people will most
likely enjoy in the future. This keeps customers happy and coming back for more,
which in turn means more revenue for the company. Another example of data-driven
decision-making can be seen in the rise of e-commerce. It wasn't long ago that most
purchases were made in a physical store, but the data showed people's preferences
were changing. So a lot of companies created entirely new business models that
remove the physical store, and let people shop right from their computers or mobile
phones with products delivered right to their doorstep. In fact, data-driven decision-
making can be so powerful, it can make entire business methods obsolete. For
example, data helped companies completely move away from corded phones and
replace them with mobile phones. By ensuring that data is built into every business
strategy, data analysts play a critical role in their companies' success, but it's important
to note that no matter how valuable data-driven decision-making is, data alone will
never be as powerful as data combined with human experience, observation, and
sometimes even intuition. To get the most out of data-driven decision-making, it's
important to include insights from people who are familiar with the business problem.
These people are called subject matter experts, and they have the ability to look at the
results of data analysis and identify any inconsistencies, make sense of gray areas, and
eventually validate choices being made. Organizations that work this way put data at
the heart of every business strategy, but also benefit from the insights of their people.
It's a win-win. As a data analyst, you play a key role in empowering these
organizations to make data-driven decisions, which is why it's so important for you to
understand how data plays a part in the decision-making process.

VÍDEO # 2

Cómo los datos informan mejores decisiones

Hasta ahora, ha descubierto que hay muchas formas diferentes de utilizar los datos. En nuestra
vida cotidiana, usamos datos cuando usamos un rastreador de actividad física o leemos
reseñas de productos para tomar una decisión de compra. Y en los negocios, usamos los datos
para obtener más información sobre nuestros clientes, mejorar los procesos y ayudar a los
empleados a hacer su trabajo de manera más eficaz. Pero esto es solo la punta del iceberg.
Una de las formas más poderosas en que puede poner los datos a trabajar es con la toma de
decisiones basada en datos. La toma de decisiones basada en datos se define como el uso de
hechos para guiar la estrategia comercial. Las organizaciones en muchas industrias diferentes
están facultadas para tomar mejores decisiones basadas en datos por parte de analistas de
datos todo el tiempo. El primer paso en la toma de decisiones basada en datos es descubrir
la necesidad comercial. Por lo general, este es un problema que necesita ser resuelto. Por
ejemplo, un problema podría ser una nueva empresa que necesita establecer un mejor
reconocimiento de marca, para poder competir con competidores más grandes y conocidos. O
tal vez una organización quiere mejorar un producto y necesita descubrir cómo obtener piezas
de un proveedor más sostenible o éticamente responsable. O bien, podría ser una empresa que
intenta resolver el problema de los empleados insatisfechos, los bajos niveles de compromiso,
satisfacción y retención. Sea cual sea el problema, una vez definido, un analista de datos
encuentra datos, los analiza y los utiliza para descubrir tendencias, patrones y relaciones. A
veces, la estrategia basada en datos se basará en lo que funcionó en el pasado. Otras veces,
puede guiar a una empresa a diversificarse en una dirección completamente nueva. Veamos
un ejemplo del mundo real. Piense en un servicio de transmisión de música o películas.
¿Cómo saben estas empresas lo que la gente quiere ver o escuchar y cómo se lo proporcionan?
Bien, utilizando la toma de decisiones basada en datos, recopilan información sobre lo que sus
clientes están escuchando actualmente, lo analizan y luego usan los conocimientos que han
obtenido para hacer sugerencias sobre cosas que la gente probablemente disfrutará en el
futuro. Esto mantiene a los clientes contentos y regresando por más, lo que a su vez significa
más ingresos para la empresa. Otro ejemplo de toma de decisiones basada en datos se puede
ver en el auge del comercio electrónico. No hace mucho tiempo que la mayoría de las
compras se hacían en una tienda física, pero los datos mostraban que las preferencias de las

personas estaban cambiando. Por lo tanto, muchas empresas crearon modelos comerciales
completamente nuevos que eliminan la tienda física y permiten que las personas compren
directamente desde sus computadoras o teléfonos móviles con productos entregados
directamente en la puerta de su casa. De hecho, la toma de decisiones basada en datos puede
ser tan poderosa que puede hacer que los métodos comerciales completos queden obsoletos.
Por ejemplo, los datos ayudaron a las empresas a alejarse por completo de los teléfonos con
cable y reemplazarlos por teléfonos móviles. Al asegurarse de que los datos estén integrados
en cada estrategia comercial, los analistas de datos desempeñan un papel fundamental en el
éxito de sus empresas, pero es importante tener en cuenta que no importa cuán valiosa sea la
toma de decisiones basada en datos, los datos por sí solos nunca serán tan poderosos como los
datos. combinado con la experiencia humana, la observación y, a veces, incluso la intuición.
Para aprovechar al máximo la toma de decisiones basada en datos, es importante incluir
información de personas que estén familiarizadas con el problema comercial. Estas personas
se denominan expertos en la materia y tienen la capacidad de ver los resultados del
análisis de datos e identificar cualquier inconsistencia, dar sentido a las áreas grises y,
finalmente, validar las elecciones que se toman. Las organizaciones que trabajan de esta
manera colocan los datos en el centro de cada estrategia comercial, pero también se benefician
de los conocimientos de su gente. Es un ganar-ganar. Como analista de datos, usted juega un
papel clave en el empoderamiento de estas organizaciones para que tomen decisiones basadas
en datos, por lo que es tan importante que comprenda cómo los datos juegan un papel en el
proceso de toma de decisiones.

CUESTIONARIO

1.-Identifique los ejemplos del mundo real de cómo una empresa podría tomar
decisiones basadas en datos. Seleccione todas las que correspondan.

Programar un cierto número de empleados del restaurante para trabajar en función del número
promedio de asistentes al almuerzo por día X

Tomar decisiones de gastos basadas en el instinto visceral del contador de la empresa.

Sugerir nueva música a un cliente en función de su historial de escucha X

Elegir soluciones de comercio electrónico en función de las preferencias de compra del cliente
X

LECTURA # 1

Data and gut instinct

Detectives and data analysts have a lot in common. Both depend on facts and clues to make
decisions. Both collect and look at the evidence. Both talk to people who know part of the
story. And both might even follow some footprints to see where they lead. Whether you’re a
detective or a data analyst, your job is all about following steps to collect and understand
facts.

Analysts use data-driven decision-making and follow a step-by-step process. You have
learned that there are six steps to this process:

1. Ask questions and define the problem.


2. Prepare data by collecting and storing the information.
3. Process data by cleaning and checking the information.
4. Analyze data to find patterns, relationships, and trends.
5. Share data with your audience.
6. Act on the data and use the analysis results.

But there are other factors that influence the decision-making process. You may have read
mysteries where the detective used their gut instinct, and followed a hunch that helped them
solve the case. Gut instinct is an intuitive understanding of something with little or no
explanation. This isn’t always something conscious; we often pick up on signals without even
realizing. You just have a “feeling” it’s right.

Why gut instinct can be a problem


At the heart of data-driven decision making is data. Therefore, it's essential that data analysts
focus on the data to ensure they make informed decisions. If you ignore data by preferring to
make decisions based on your own experience, your decisions may be biased. But even worse,
decisions based on gut instinct without any data to back them up can cause mistakes.

Consider an example of a real estate developer bidding to redevelop a part of a city's central
district. They were well-known for preservation of historical buildings. Banking on their
reputation, the agency's planners followed gut instinct and included the preservation of several
buildings to gain support and win approval for the project. However, private donations fell
short and a partnership failed to materialize and save the day. The buildings eventually had to
be torn down after much delay and an expensive dispute with the city.

The more you understand the data related to a project, the easier it will be to figure out what is
required. These efforts will also help you identify errors and gaps in your data so you can
communicate your findings more effectively. Sometimes past experience helps you make a
connection that no one else would notice. For example, a detective might be able to crack
open a case because they remember an old case just like the one they’re solving today. It's not
just gut instinct.

Data + business knowledge = mystery solved

Blending data with business knowledge, plus maybe a touch of gut instinct, will be a common
part of your process as a junior data analyst. The key is figuring out the exact mix for each
particular project. A lot of times, it will depend on the goals of your analysis. That is why
analysts often ask, “How do I define success for this project?”

In addition, try asking yourself these questions about a project to help find the perfect balance:

 What kind of results are needed?


 Who will be informed?
 Am I answering the question being asked?
 How quickly does a decision need to be made?

For instance, if you are working on a rush project, you might need to rely on your own
knowledge and experience more than usual. There just isn’t enough time to thoroughly
analyze all of the available data. But if you get a project that involves plenty of time and
resources, then the best strategy is to be more data-driven. It’s up to you, the data analyst, to
make the best possible choice. You will probably blend data and knowledge a million
different ways over the course of your data analytics career. And the more you practice, the
better you will get at finding that perfect blend.

LECTURA # 1

Datos e instinto

Los detectives y los analistas de datos tienen mucho en común. Ambos dependen de
hechos y pistas para tomar decisiones. Ambos recogen y miran la evidencia. Ambos
hablan con personas que conocen parte de la historia. Y ambos podrían incluso seguir
algunas huellas para ver a dónde conducen. Ya sea que sea un detective o un analista
de datos, su trabajo se trata de seguir los pasos para recopilar y comprender los
hechos.
Los analistas utilizan la toma de decisiones basada en datos y siguen un proceso paso
a paso. Ha aprendido que hay seis pasos en este proceso:

1. Hacer preguntas y definir el problema.

2. Preparar datos recopilando y almacenando la información.

3. Procesar datos limpiando y revisando la información.

4. Analizar datos para encontrar patrones, relaciones y tendencias.

5. Comparte datos con tu audiencia.

6. Actuar sobre los datos y utilizar los resultados del análisis.

Pero hay otros factores que influyen en el proceso de toma de decisiones. Es posible
que haya leído misterios en los que el detective usó su instinto y siguió una
corazonada que los ayudó a resolver el caso. El instinto es una comprensión intuitiva
de algo con poca o ninguna explicación. Esto no siempre es algo consciente; a
menudo captamos señales sin siquiera darnos cuenta. Solo tienes la "sensación" de
que está bien.
Por qué el instinto puede ser un problema

En el corazón de la toma de decisiones basada en datos están los datos. Por lo tanto, es
esencial que los analistas de datos se concentren en los datos para asegurarse de tomar
decisiones informadas. Si ignora los datos y prefiere tomar decisiones basadas en su
propia experiencia, sus decisiones pueden estar sesgadas. Pero lo que es peor, las
decisiones basadas en el instinto sin ningún dato que las respalde pueden causar
errores.

Considere un ejemplo de un desarrollador de bienes raíces que presenta una oferta


para reconstruir una parte del distrito central de una ciudad. Eran bien conocidos por
la conservación de edificios históricos. Confiando en su reputación, los planificadores
de la agencia siguieron su instinto e incluyeron la conservación de varios edificios
para obtener apoyo y obtener la aprobación del proyecto. Sin embargo, las donaciones
privadas se quedaron cortas y una asociación no se materializó y salvó el día. Los
edificios finalmente tuvieron que ser demolidos después de mucho retraso y una
costosa disputa con la ciudad.
Cuanto más comprenda los datos relacionados con un proyecto, más fácil será
descubrir qué se requiere. Estos esfuerzos también lo ayudarán a identificar errores
y lagunas en sus datos para que pueda comunicar sus hallazgos de manera más
efectiva. A veces, la experiencia pasada te ayuda a establecer una conexión que nadie
más notaría. Por ejemplo, un detective podría abrir un caso porque recuerda un caso
antiguo como el que está resolviendo hoy. No es solo instinto visceral.

Datos + conocimiento empresarial = misterio resuelto

La combinación de datos con conocimiento empresarial, además de quizás un toque


de intuición, será una parte común de su proceso como analista de datos junior. La
clave es averiguar la mezcla exacta para cada proyecto en particular. Muchas veces,
dependerá de los objetivos de su análisis. Es por eso que los analistas a menudo
preguntan: "¿Cómo defino el éxito de este proyecto?"

Además, intente hacerse estas preguntas sobre un proyecto para ayudar a encontrar el
equilibrio perfecto:

• ¿Qué tipo de resultados se necesitan?

• ¿Quién será informado?

• ¿Estoy respondiendo a la pregunta que se me hace?

• ¿Con qué rapidez se debe tomar una decisión?

Por ejemplo, si está trabajando en un proyecto urgente, es posible que deba confiar en
su propio conocimiento y experiencia más de lo habitual. Simplemente no hay
suficiente tiempo para analizar a fondo todos los datos disponibles. Pero si obtiene un
proyecto que implica mucho tiempo y recursos, entonces la mejor estrategia es basarse
más en los datos. Depende de usted, el analista de datos, tomar la mejor decisión
posible. Probablemente combinará datos y conocimientos de un millón de maneras
diferentes a lo largo de su carrera de análisis de datos. Y cuanto más practiques, mejor
serás para encontrar la mezcla perfecta.
LECTURA # 2

Origins of the data analysis process

When you decided to join this program, you proved that you are a curious person. So
let’s tap into your curiosity and talk about the origins of data analysis. We don’t fully
know when or why the first person decided to record data about people and things.
But we do know it was useful because the idea is still around today!  
We also know that data analysis is rooted in statistics, which has a pretty long history itself.
Archaeologists mark the start of statistics in ancient Egypt with the building of the pyramids.
The ancient Egyptians were masters of organizing data. They documented their calculations
and theories on papyri (paper-like materials), which are now viewed as the earliest examples
of spreadsheets and checklists. Today’s data analysts owe a lot to those brilliant scribes, who
helped create a more technical and efficient process.

It is time to enter the data analysis life cycle—the process of going from data to decision.
Data goes through several phases as it gets created, consumed, tested, processed, and reused.
With a life cycle model, all key team members can drive success by planning work both up
front and at the end of the data analysis process. While the data analysis life cycle is well
known among experts, there isn't a single defined structure of those phases. There might not
be one single architecture that’s uniformly followed by every data analysis expert, but there
are some shared fundamentals in every data analysis process. This reading provides an
overview of several, starting with the process that forms the foundation of the Google Data
Analytics Certificate.

The process presented as part of the Google Data Analytics Certificate is one that will be
valuable to you as you keep moving forward in your career:
1. Ask: Business Challenge/Objective/Question
2. Prepare: Data generation, collection, storage, and data management
3. Process: Data cleaning/data integrity
4. Analyze: Data exploration, visualization, and analysis
5. Share: Communicating and interpreting results 
6. Act:  Putting your insights to work to solve the problem

Understanding this process—and all of the iterations that helped make it popular—will be a
big part of guiding your own analysis and your work in this program. Let’s go over a few
other variations of the data analysis life cycle.

EMC's data analysis life cycle

EMC Corporation's data analytics life cycle is cyclical with six steps:

1. Discovery
2. Pre-processing data
3. Model planning
4. Model building
5. Communicate results
6. Operationalize

EMC Corporation is now Dell EMC. This model, created by David Dietrich, reflects the
cyclical nature of real-world projects. The phases aren’t static milestones; each step connects
and leads to the next, and eventually repeats. Key questions help analysts test whether they
have accomplished enough to move forward and ensure that teams have spent enough time on
each of the phases and don’t start modeling before the data is ready. It is a little different from
the data analysis life cycle this program is based on, but it has some core ideas in common:
the first phase is interested in discovering and asking questions; data has to be prepared before
it can be analyzed and used; and then findings should be shared and acted on.

For more information, refer to this e-book, Data Science & Big Data Analytics.

SAS's iterative life cycle


An iterative life cycle was created by a company called SAS, a leading data analytics
solutions provider. It can be used to produce repeatable, reliable, and predictive results:

1. Ask
2. Prepare
3. Explore
4. Model
5. Implement
6. Act
7. Evaluate

The SAS model emphasizes the cyclical nature of their model by visualizing it as an infinity
symbol. Their life cycle has seven steps, many of which we have seen in the other models,
like Ask, Prepare, Model, and Act. But this life cycle is also a little different; it includes a step
after the act phase designed to help analysts evaluate their solutions and potentially return to
the ask phase again. 

For more information, refer to Managing the Analytics Life Cycle for Decisions at Scale.

Project-based data analytics life cycle

A project-based data analytics life cycle has five simple steps:

1. Identifying the problem


2. Designing data requirements
3. Pre-processing data
4. Performing data analysis
5. Visualizing data

This data analytics project life cycle was developed by Vignesh Prajapati. It doesn’t include
the sixth phase, or what we have been referring to as the Act phase. However, it still covers a
lot of the same steps as the life cycles we have already described. It begins with identifying
the problem, preparing and processing data before analysis, and ends with data visualization.

For more information, refer to Understanding the data analytics project life cycle.

Big data analytics life cycle


Authors Thomas Erl, Wajid Khattak, and Paul Buhler proposed a big data analytics life cycle
in their book, Big Data Fundamentals: Concepts, Drivers & Techniques. Their life cycle
suggests phases divided into nine steps:

1. Business case evaluation


2. Data identification
3. Data acquisition and filtering
4. Data extraction
5. Data validation and cleaning
6. Data aggregation and representation
7. Data analysis
8. Data visualization
9. Utilization of analysis results

This life cycle appears to have three or four more steps than the previous life cycle models.
But in reality, they have just broken down what we have been referring to as Prepare and
Process into smaller steps. It emphasizes the individual tasks required for gathering,
preparing, and cleaning data before the analysis phase.

For more information, refer to Big Data Adoption and Planning Considerations.

Key takeaway

From our journey to the pyramids and data in ancient Egypt to now, the way we analyze data
has evolved (and continues to do so). The data analysis process is like real life architecture,
there are different ways to do things but the same core ideas still appear in each model of the
process. Whether you use the structure of this Google Data Analytics Certificate or one of the
many other iterations you have learned about, we are here to help guide you as you continue
on your data journey.
LECTURA # 2

Orígenes del proceso de análisis de datos

Cuando decidiste unirte a este programa, demostraste que eres una persona curiosa.
Entonces, aprovechemos su curiosidad y hablemos sobre los orígenes del análisis de
datos. No sabemos completamente cuándo o por qué la primera persona decidió
registrar datos sobre personas y cosas. ¡Pero sabemos que fue útil porque la idea
todavía existe hoy!

También sabemos que el análisis de datos tiene sus raíces en las estadísticas, que
tienen una historia bastante larga. Los arqueólogos marcan el comienzo de las
estadísticas en el antiguo Egipto con la construcción de las pirámides. Los antiguos
egipcios eran maestros en la organización de datos. Documentaron sus cálculos y
teorías en papiros (materiales similares al papel), que ahora se consideran los primeros
ejemplos de hojas de cálculo y listas de verificación. Los analistas de datos de hoy en
día le deben mucho a esos escribas brillantes, que ayudaron a crear un proceso más
técnico y eficiente.
Es hora de entrar en el ciclo de vida del análisis de datos: el proceso de pasar de los
datos a la decisión. Los datos pasan por varias fases a medida que se crean,
consumen, prueban, procesan y reutilizan. Con un modelo de ciclo de vida, todos
los miembros clave del equipo pueden impulsar el éxito mediante la planificación del
trabajo tanto al principio como al final del proceso de análisis de datos. Si bien el ciclo
de vida del análisis de datos es bien conocido entre los expertos, no existe una única
estructura definida de esas fases. Puede que no haya una sola arquitectura que todos
los expertos en análisis de datos sigan uniformemente, pero hay algunos fundamentos
compartidos en cada proceso de análisis de datos. Esta lectura proporciona una
descripción general de varios, comenzando con el proceso que forma la base del
Certificado de análisis de datos de Google.

El proceso presentado como parte del Certificado de análisis de datos de Google será
valioso para usted a medida que avance en su carrera:

1. Pregunte: Desafío comercial/Objetivo/Pregunta

2. Preparar: generación, recopilación, almacenamiento y gestión de datos

3. Proceso: limpieza de datos/integridad de datos

4. Analizar: exploración, visualización y análisis de datos

5. Compartir: Comunicar e interpretar resultados

6. Actúe: Ponga sus ideas a trabajar para resolver el problema

Comprender este proceso, y todas las iteraciones que ayudaron a hacerlo popular, será
una gran parte de guiar su propio análisis y su trabajo en este programa. Repasemos
algunas otras variaciones del ciclo de vida del análisis de datos.
Ciclo de vida del análisis de datos de EMC

El ciclo de vida del análisis de datos de EMC Corporation es cíclico con seis pasos:

1. Descubrimiento

2. Preprocesamiento de datos

3. Modelo de planificación

4. Construcción de modelos

5. Comunicar resultados

6. Operacionalizar

EMC Corporation ahora es Dell EMC. Este modelo, creado por David Dietrich, refleja
la naturaleza cíclica de los proyectos del mundo real. Las fases no son hitos estáticos;
cada paso se conecta y conduce al siguiente, y eventualmente se repite. Las preguntas
clave ayudan a los analistas a probar si han logrado lo suficiente para avanzar y
garantizar que los equipos hayan dedicado suficiente tiempo a cada una de las fases y
no comiencen a modelar antes de que los datos estén listos. Es un poco diferente del
ciclo de vida del análisis de datos en el que se basa este programa, pero tiene algunas
ideas centrales en común: la primera fase está interesada en descubrir y hacer
preguntas; los datos deben estar preparados antes de que puedan ser analizados y
utilizados; y luego los hallazgos deben compartirse y actuar en consecuencia.

Para obtener más información, consulte este libro electrónico, Data Science & Big
Data Analytics.
Ciclo de vida iterativo de SAS

Una empresa llamada SAS, un proveedor líder de soluciones de análisis de datos, creó
un ciclo de vida iterativo. Se puede utilizar para producir resultados repetibles, fiables
y predictivos:

1. Pregunta

2. Prepárate

3. Explora

4. modelo

5. Implementar

6. Actuar

7. Evaluar

El modelo SAS enfatiza la naturaleza cíclica de su modelo al visualizarlo como un


símbolo de infinito. Su ciclo de vida tiene siete pasos, muchos de los cuales hemos
visto en los otros modelos, como Preguntar, Preparar, Modelar y Actuar. Pero este
ciclo de vida también es un poco diferente; incluye un paso después de la fase de
actuar diseñado para ayudar a los analistas a evaluar sus soluciones y potencialmente
volver a la fase de preguntar nuevamente.

Para obtener más información, consulte Gestión del ciclo de vida analítico para
decisiones a escala.
Ciclo de vida del análisis de datos basado en proyectos

Un ciclo de vida de análisis de datos basado en proyectos tiene cinco pasos simples:

1. Identificar el problema

2. Diseño de requisitos de datos

3. Preprocesamiento de datos

4. Realización de análisis de datos

5. Visualización de datos

Este ciclo de vida del proyecto de análisis de datos fue desarrollado por Vignesh
Prajapati. No incluye la sexta fase, o lo que nos hemos estado refiriendo como la fase
de Actuar. Sin embargo, todavía cubre muchos de los mismos pasos que los ciclos de
vida que ya hemos descrito. Comienza con la identificación del problema, la
preparación y el procesamiento de datos antes del análisis y finaliza con la
visualización de datos.

Para obtener más información, consulte Comprender el ciclo de vida del proyecto de
análisis de datos.

Ciclo de vida del análisis de big data

Los autores Thomas Erl, Wajid Khattak y Paul Buhler propusieron un ciclo de vida de
análisis de big data en su libro Big Data Fundamentals: Concepts, Drivers &
Techniques. Su ciclo de vida sugiere fases divididas en nueve pasos:

1. Evaluación del caso de negocio

2. Identificación de datos

3. Adquisición y filtrado de datos


4. Extracción de datos

5. Validación y limpieza de datos

6. Agregación y representación de datos

7. Análisis de datos

8. Visualización de datos

9. Utilización de los resultados del análisis

Este ciclo de vida parece tener tres o cuatro pasos más que los modelos de ciclo de
vida anteriores. Pero en realidad, simplemente han desglosado lo que nos hemos
estado refiriendo como Preparar y Procesar en pasos más pequeños. Enfatiza las tareas
individuales requeridas para recopilar, preparar y limpiar datos antes de la fase de
análisis.

Para obtener más información, consulte Consideraciones de adopción y planificación


de Big Data.

conclusión clave

Desde nuestro viaje a las pirámides y los datos en el antiguo Egipto hasta ahora, la
forma en que analizamos los datos ha evolucionado (y continúa haciéndolo). El
proceso de análisis de datos es como la arquitectura de la vida real, hay diferentes
formas de hacer las cosas, pero las mismas ideas centrales siguen apareciendo en cada
modelo del proceso. Ya sea que utilice la estructura de este Certificado de análisis de
datos de Google o una de las muchas otras iteraciones sobre las que ha aprendido,
estamos aquí para ayudarlo a guiarlo a medida que continúa en su viaje de datos.
CUESTIONARIO

Pon a prueba tus conocimientos sobre el ecosistema de datos

Pregunta 1

1.-¿Cuál de las siguientes afirmaciones define mejor los datos?

Los datos son un proceso de negocio.

Los datos son una variedad de preguntas.

Los datos son el uso de cálculos y estadísticas.

Los datos son una colección de hechos. X

2.-Complete el espacio en blanco: en el análisis de datos, el ecosistema de datos se


refiere a los diversos elementos que interactúan entre sí para producir,
administrar, almacenar, _____, analizar y compartir datos.

ingerir

unir

localizar

organizar X
3.-¿Cuál de los siguientes términos se refiere a la recopilación, transformación y
organización de datos para sacar conclusiones, hacer predicciones e impulsar la
toma de decisiones informada?

Análisis de los datos X

Elementos de datos

Información de datos

Ciclo de vida de los datos

4.-Una aerolínea recopila, observa y analiza los comportamientos en línea de sus


clientes. Luego, utiliza los conocimientos adquiridos para elegir qué nuevos
productos y servicios ofrecer. ¿Qué proceso de negocio describe esto?

Pensamiento analítico

Colaboración con las partes interesadas

Toma de decisiones basada en datos X

Medición del desempeño

1.-¿Cuál de las siguientes afirmaciones define mejor los datos?

Los datos son un proceso de negocio.

Los datos son el uso de cálculos y estadísticas.

Los datos son una variedad de preguntas.

Los datos son una colección de hechos. x


2.-Complete el espacio en blanco: en el análisis de datos, el ecosistema de datos se
refiere a los diversos elementos que interactúan entre sí para producir, administrar,
almacenar, _____, analizar y compartir datos.

unir

localizar

ingerir

organizar X

3.-¿Cuál de los siguientes términos se refiere a la recopilación, transformación y


organización de datos para sacar conclusiones, hacer predicciones e impulsar la
toma de decisiones informada?

Análisis de los datos X

Elementos de datos

Información de datos

Ciclo de vida de los datos

You might also like