Mapa PDF

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 11

Universidad Autnoma del Estado de Mxico

Centro Universitario UAEM Atlacomulco


Nombre: Mario flores Garca LIA I9

Big data
By Vangie Beal
Big data is a buzzword, or catch-phrase, used to describe a massive volume of both structured and
unstructured data that is so large that it's difficult to process using traditional database and
software techniques. In most enterprise scenarios the data is too big or it moves too fast or it
exceeds current processing capacity. Big data has the potential to help companies improve
operations and make faster, more intelligent decisions.
Is Big Data a Volume or a Technology?
While the term may seem to reference the volume of data, that isn't always the case. The term big
data, especially when used by vendors, may refer to the technology (which includes tools and
processes) that an organization requires to handle the large amounts of data and storage facilities.
The term big data is believed to have originated with Web search companies who needed to query
very large distributed aggregations of loosely-structured data.
An Example of Big Data
An example of big data might be petabytes (1,024 terabytes) or exabytes (1,024 petabytes) of data
consisting of billions to trillions of records of millions of peopleall from different sources (e.g.
Web, sales, customer contact center, social media, mobile data and so on). The data is typically
loosely structured data that is often incomplete and inaccessible.
Big Data and Types of Business Datasets
When dealing with larger datasets, organizations face difficulties in being able to create,
manipulate, and manage big data. Big data is particularly a problem in business analytics because
standard tools and procedures are not designed to search and analyze massive datasets.
As research from Webopedia parent company QuinStreet demonstrates, big data initiatives are
poised for explosive growth. QuinStreet surveyed 540 enterprise decision-makers involved in big
data and found the datasets of interest to many businesses today include traditional structured
databases of inventories, orders, and customer information, as well as unstructured data from the
Web, social networking sites, and intelligent devices.
This data, when captured, formatted, manipulated, stored, and analyzed can help a company to
gain useful insight to increase revenues, get or retain customers, and improve operations. Big data
may also be called enterprise big data.
Big data analytics

Universidad Autnoma del Estado de Mxico
Centro Universitario UAEM Atlacomulco
Nombre: Mario flores Garca LIA I9

Big data analytics refers to the process of collecting, organizing and analyzing large sets of data
("big data") to discover patterns and other useful information. Not only will big data analytics help
you to understand the information contained within the data, but it will also help identify the data
that is most important to the business and future business decisions. Big data analysts basically
want the knowledge that comes from analyzing the data.
The Benefits of Big Data Analytics
Enterprises are increasingly looking to find actionable insights into their data. Many big data
projects originate from the need to answer specific business questions. With the right big data
analytics platforms in place, an enterprise can boost sales, increase efficiency, and improve
operations, customer service and risk management.
Webopedia parent company, QuinStreet, surveyed 540 enterprise decision-makers involved in big
data purchases to learn which business areas companies plan to use Big Data analytics to improve
operations. About half of all respondents said they were applying big data analytics to improve
customer retention, help with product development and gain a competitive advantage.

For most organizations, big data analysis is a challenge. Consider the sheer volume of data and the
many different formats of the data (both structured and unstructured data) collected across the
entire organization and the many different ways different types of data can be combined,
contrasted and analyzed to find patterns and other useful information.
The first challenge is in breaking down data silos to access all data an organization stores in
different places and often in different systems. A second big data challenge is in creating platforms
that can pull in unstructured data as easily as structured data. This massive volume of data is
typically so large that it's difficult to process using traditional database and software methods.
Big Data Requires High-Performance Analytics
To analyze such a large volume of data, big data analytics is typically performed using specialized
software tools and applications for predictive analytics, data mining, text mining, forecasting and
data optimization. Collectively these processes are separate but highly integrated functions of
high-performance analytics. Using big data tools and software enables an organization to process
extremely large volumes of data that a business has collected to determine which data is relevant
and can be analyzed to drive better business decisions in the future.
Examples of How Big Data Analytics is Used Today
As technology to break down data silos and analyze data improves, business can be transformed in
all sorts of ways. According to Datamation, today's advances in analyzing Big Data allow

Universidad Autnoma del Estado de Mxico
Centro Universitario UAEM Atlacomulco
Nombre: Mario flores Garca LIA I9

researchers to decode human DNA in minutes, predict where terrorists plan to attack, determine
which gene is mostly likely to be responsible for certain diseases and, of course, which ads you are
most likely to respond to on Facebook. The business cases for leveraging Big Data are compelling.
For instance, Netflix mined its subscriber data to put the essential ingredients together for its
recent hit House of Cards, and subscriber data also prompted the company to bring Arrested
Development back from the dead.
Another example comes from one of the biggest mobile carriers in the world. France's Orange
launched its Data for Development project by releasing subscriber data for customers in the Ivory
Coast. The 2.5 billion records, which were made anonymous, included details on calls and text
messages exchanged between 5 million users. Researchers accessed the data and sent Orange
proposals for how the data could serve as the foundation for development projects to improve
public health and safety. Proposed projects included one that showed how to improve public
safety by tracking cell phone data to map where people went after emergencies; another showed
how to use cellular data for disease containment.

The pace of data creation will surely increase, especially as machine-to-machine communications
gets cheaper and more common. Think about how much data all of those sensor networks, burglar
alarms and vehicle telematics systems will create.
According to IBM, every single day we create 2.5 quintillion bytes of data. IBM argues that the
exponential growth of data means that 90 percent of the data that exists in the world today has
been created in the last two years. "This data comes from everywhere: sensors used to gather
climate information, posts to social media sites, digital pictures and videos, e-commerce
transaction records, and cell phone GPS coordinates, to name a few."
Of course, it's important to remember that in early human history, anything as ephemeral as a
tweet just would not have been recorded, so these comparisons can only be taken so far.
To put the data explosion in context, consider this. Every minute of every day we create
More than 204 million email messages
Over 2 million Google search queries
48 hours of new YouTube videos
684,000 bits of content shared on Facebook
More than 100,000 tweets

Universidad Autnoma del Estado de Mxico
Centro Universitario UAEM Atlacomulco
Nombre: Mario flores Garca LIA I9

$272,000 spent on e-commerce
3,600 new photos shared on Instagram
Nearly 350 new WordPress blog posts

Universidad Autnoma del Estado de Mxico
Centro Universitario UAEM Atlacomulco
Nombre: Mario flores Garca LIA I9



Universidad Autnoma del Estado de Mxico
Centro Universitario UAEM Atlacomulco
Nombre: Mario flores Garca LIA I9

TRADUCCIN
Big Data
Por Vangie Beal
Big data es una palabra de moda, o frase usada para describir un volumen
masivo de datos tanto estructurados como no estructurados es tan grande que es
difcil de procesar utilizando tcnicas de bases de datos y de software
tradicionales. En la mayora de los escenarios empresariales los datos son
demasiado grandes o se mueven demasiado rpido o se exceden de la
capacidad de procesamiento actual. Big Data (grandes datos) tiene el potencial
de ayudar a las empresas a mejorar sus operaciones y a tomar decisiones ms
rpidas e inteligentemente.
Big Data es un volumen o una tecnologa? Mientras que el trmino puede
parecer para hacer referencia al volumen de datos, que no siempre es el caso. El
trmino Big Data, especialmente cuando lo utilizan los proveedores, pueden
referirse a la tecnologa (que incluye herramientas y procesos) que una
organizacin necesita para manejar las grandes cantidades de datos e
instalaciones de almacenamiento. Se cree que el Big Data trmino que se
origin con las empresas de bsqueda Web que necesitaban consultar muy
grandes agregaciones distribuidas de datos estructurados dbilmente-. Un
ejemplo de Big Data.
Un ejemplo del Big Data podra ser petabytes (1024 terabytes) o hexabytes (1.024
petabytes) de datos que constan de miles de millones a miles de millones de
registros de millones de personas, todos de diferentes fuentes (por ejemplo, Web,
de ventas, centros de contacto de clientes, medios de comunicacin social,
datos mviles y as sucesivamente). Los datos son normalmente poco
estructurados de datos que a menudo es incompleta e inaccesible. Datos y tipos
de conjuntos de datos de negocios, cuando se ocupan grandes conjuntos de
datos, las organizaciones se enfrentan a dificultades en la capacidad de crear,
manipular y gestionar grandes volmenes de datos. Big Data es un problema
particularmente en anlisis de negocios porque las herramientas y procedimientos
estndar no estn diseados para buscar y analizar conjuntos de datos masivos.
Como la investigacin de la compaa matriz Webopedia QuinStreet demuestra,
iniciativas de grandes datos que estn preparados para un crecimiento explosivo.
QuinStreet encuest a 540 empresas que toman las decisiones involucradas en
grandes volmenes de datos y encontr a los conjuntos de datos de inters para
muchas empresas hoy en da incluyen las bases de datos tradicionales

Universidad Autnoma del Estado de Mxico
Centro Universitario UAEM Atlacomulco
Nombre: Mario flores Garca LIA I9

estructurados de inventarios, pedidos y la informacin del cliente, as como datos
no estructurados de la Web, los sitios de redes sociales y dispositivos inteligentes.
Estos datos, cuando son capturados, formateados, manipulados, almacenados y
analizados, pueden ayudar a una empresa para obtener informacin til para
aumentar los ingresos, obtener o retener a los clientes, y mejorar las operaciones.
Big Data tambin puede ser llamado por la empresa como datos grandes.
Anlisis de datos grandes, analtica de Big Data, se refiere al proceso de
recoleccin, organizacin y anlisis de grandes conjuntos de datos ("big data")
para descubrir patrones y otra informacin til. No slo habr anlisis de Big Data
que ayudar a entender la informacin contenida en los datos, sino que tambin
ayudar a identificar los datos que son ms importantes para el negocio y las
decisiones futuras del negocio. Los analistas de Big Data bsicamente quieren
que el conocimiento que proviene de analizar los datos.
Los beneficios del anlisis de Big Data
Las empresas estn cada vez ms buscando para encontrar informacin
procesable en sus datos. Muchos proyectos de Big Data se originan en la
necesidad de responder a las preguntas especficas del negocio. Con las grandes
plataformas de anlisis de los datos correctos en el lugar, una empresa puede
impulsar las ventas, aumentar la eficiencia, mejorar las operaciones, servir al
cliente y gestionar riesgos. Empresa matriz Webopedia, QuinStreet, encuest a
540 empresas que toman las decisiones que participan en las compras de Big
Data, para saber qu reas de negocio de las empresas planean utilizar el
anlisis de Big Data para mejorar las operaciones. Aproximadamente la mitad de
todos los encuestados dijeron que estaban aplicando el anlisis de Big Data
para mejorar la retencin de clientes, ayudar con el desarrollo de productos y
obtener una ventaja competitiva.
El primer desafo es romper los silos de datos para tener acceso a todos los datos
de un depsito de las organizaciones en diferentes lugares y, a menudo en
diferentes sistemas. Un segundo desafo de Big Data es en la creacin de
plataformas que pueden tratar los datos no estructurados con tanta facilidad
como los datos estructurados. Este volumen masivo de datos suele ser tan grande
que es difcil de procesar utilizando los mtodos de base de datos y de software
tradicionales. El anlisis de Big Data requiere de alto rendimiento para analizar un
gran volumen de datos como el anlisis de Big Data que se realiza normalmente
utilizando herramientas de software y aplicaciones especializadas para el anlisis
predictivo, minera de datos, minera de texto, la prediccin y la optimizacin de
datos. En conjunto, estos procesos son funciones separadas pero altamente

Universidad Autnoma del Estado de Mxico
Centro Universitario UAEM Atlacomulco
Nombre: Mario flores Garca LIA I9

integradas de anlisis de alto rendimiento. El uso de herramientas de Big Data y
software permite a una organizacin procesar extremadamente grandes
volmenes de datos que un negocio ha recogido para determinar qu datos son
relevantes y pueden ser analizados para tomar mejores decisiones de negocio en
el futuro. Ejemplos de cmo el anlisis de Big Data se utiliza hoy.
Como la tecnologa para romper los silos de datos y anlisis de datos, el negocio
puede transformarse en todo tipo de formas segn Datamation, los avances en el
anlisis de Big Data de hoy permiten a los investigadores descifrar el ADN humano
en cuestin de minutos, predicen que los terroristas planean atacar, determinan
qu gen es sobre todo probable que sea responsable de ciertas enfermedades y,
por supuesto, los anuncios que tienen ms probabilidades de responder en
Facebook. Los casos de negocio para aprovechar los Big Data son convincentes.
Por ejemplo, Netflix extrae sus datos de suscriptor para poner los ingredientes
esenciales juntos con su reciente xito Castillo de naipes, y los datos de abonado
tambin impulsaron a la empresa a llevar Arrested Development de entre los
muertos. Otro ejemplo proviene de una de las mayores compaas de telefona
mvil en el mundo, Orange de Francia puso en marcha su proyecto de datos
para el Desarrollo, para la liberacin de los datos de abonado de los clientes en
la Costa de Marfil. Los 2,5 mil millones de registros, que se hicieron en el
anonimato, incluidos detalles sobre las llamadas y mensajes de texto
intercambiados entre 5 millones de usuarios. Los investigadores pueden acceder a
los datos y enviar propuestas a Orange de cmo los datos pueden servir de base
para los proyectos de desarrollo para mejorar la salud y la seguridad pblica. Los
proyectos propuestos incluyen uno que mostraba la forma de mejorar la
seguridad pblica mediante el seguimiento de los datos del telfono celular para
mapear donde la gente iba tras una emergencia; otra mostr cmo usar los
datos celulares para la contencin de la enfermedad. El ritmo de creacin de
datos seguramente aumentar, sobre todo porque las comunicaciones de
mquina a mquina se volvern ms baratas y ms comunes. Piense en la
cantidad de datos de todas esas redes de sensores, alarmas antirrobo y los
sistemas telemticos vehculo crear.
De a cuerdo con IBM, cada da creamos 2,5 trillones de bytes de datos. IBM
sostiene que el crecimiento exponencial de los datos significa que el 90 por ciento
de los datos que existen en el mundo de hoy se ha creado en los ltimos dos
aos. "Estos datos vienen de todas partes: sensores utilizados para recopilar
informacin sobre el clima, los mensajes a sitios de medios sociales, fotos digitales
y videos, registros de transacciones de comercio electrnico, y las coordenadas
de GPS del telfono celular, por nombrar algunos." Por supuesto, es importante

Universidad Autnoma del Estado de Mxico
Centro Universitario UAEM Atlacomulco
Nombre: Mario flores Garca LIA I9

recordar que en la historia humana temprana, algo tan efmero como un Tweet,
simplemente no habra sido registrado, por lo que estas comparaciones slo
pueden ser tomadas hasta el momento. Para poner la explosin de datos en
contexto, considere esto. Cada minuto de cada da creamos ms de 204 millones
de mensajes de correo electrnico, ms de 2 millones de consultas Google de
bsqueda de 48 horas, los vdeos de YouTube 684.000 bits de contenido
compartido en Facebook, ms de 100.000 tweets de $ 272.000 gastados en el
comercio electrnico 3600 nuevas fotos compartidas en Instagram Casi 350
nuevas entradas del blog WordPress



















Universidad Autnoma del Estado de Mxico
Centro Universitario UAEM Atlacomulco
Nombre: Mario flores Garca LIA I9

























Big Data
Volumen datos
Toma de decisiones

Volumen
Tecnologa
Mejorar operaciones y
crecimiento de las empresas
Gran cantidad de datos
Tcnicas, herramientas y procesos
Origen
Empresas
de
bsqueda
de web
Necesidad
de hacer
grandes
consultas
Ejemplos Petabytes (1024
Terabytes), Hexabytes
(1024 petabytes) de datos

Beneficios
del anlisis
Gestin de datos
Mejorar
operaciones
Ventajas competitivas
Incrementar
productividad
Gestin de riesgos
Aumentar
eficiencia
Caractersticas

Universidad Autnoma del Estado de Mxico
Centro Universitario UAEM Atlacomulco
Nombre: Mario flores Garca LIA I9







Impulsar ventas
Incrementar
ingresos
Desafos Acceso a datos
en diversos
lugares
Gestin de
datos
estructurados
y no
estructurados

You might also like