Welcome to Scribd!

Inner Architecture of A Social Networking System: Petr Kunc, Jaroslav Škrabálek, Tomáš Pitner

Uploaded by

0% found this document useful (0 votes)

31 views21 pages

This document summarizes the key aspects of the social networking system Takeplace, which was built using Hadoop, HBase, and Memcached. It discusses the functional and technical requirements including high performance, scalability, and handling billions of rows. It provides an overview of the technologies used, including Hadoop for distributed processing, HBase for distributed storage, and Memcached for caching. It also includes diagrams of the system architecture showing how user data is stored across multiple tables in HBase and how the news feed is generated and cached in Memcached.

Original Description:

vfdvdfvgb

Original Title

Kunc

Copyright

Available Formats

PPSX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PPSX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as ppsx, pdf, or txt

0% found this document useful (0 votes)

31 views21 pages

Inner Architecture of A Social Networking System: Petr Kunc, Jaroslav Škrabálek, Tomáš Pitner

Uploaded by

Anca Ancaa

Copyright:

Available Formats

Download as PPSX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as ppsx, pdf, or txt

Jump to Page

You are on page 1of 21

Search inside document

Inner Architecture of a

Social Networking System

Petr Kunc, Jaroslav krablek,
Tom Pitner

Who am I?
Master student of FI MU
Member of LaSArIS
Webtops
Modern web applications
Cloud (and distributive) solutions

First time speaker at conference

Social network systems

Hundreds million users => advanced
software architecture and
technologies
High performance
Scalability
Billions of rows

Table of contents
What and why?
Takeplace
Which way?
Hadoop
HBase
Memcached
How?
Architecture and design
Was it worth it?
Testing

Takeplace

Takeplace and Social

Networking
Web-based service facilitating organization of
events based on meeting, sharing and
communication.
Emphasis on social and interpersonal interaction
Easy tool to comment conferences (feedback)
Professional user network: to create relations
among academic and professional world with
common interests
Analysis and statistics
To behave like Facebook with relations like
Twitter and to be used as LinkedIn.

Functional requirements
Entities can create asymmetric
relations
Posts
Walls and news feed
Comments and like

Technology requirements
Linux and Cloud
Data-oriented application
High throughput
Heavy loads
Concurrent requests

Caching tool

Relational databases
Fixed schema, ACID, indexes, joins
Problems
scaling up dataset size
Read/write concurrency

Typical use of MySQL: Production =>

Memcached (losing ACID) => Costly server
=> Denormalizing => materialize most
common queries => drop triggers, indexes
(compromises or expensive)

Hbase

Inspired by Google BigTable

Regions
4 dimensions
multidimensional sorted persistent
distributed key-value map
Keys & values = array of bytes
Row, CF, Columns & Version

Example
{
aa : {
cf : {
c1 : data
c2 : data
}
cf2 : {
anyByteArray : true
}
},
ab : { }
}

Hadoop
SW framework backbone of distributed
environment
MapReduce

HDFS

HBase

No real indexes
Automatic partitioning
Scale linearly and automatically
Parallel
Cheap
Not for everyone
Write once, read many
Built on top of Hadoop

Memcached
Distributed cache
Typical usage
public Data getData (String query) {
Data data = memcached.get(query);
if (data == null) {
data = database.get(query);
memcached.set(query, data);
}
return data;
}

Architecture

Architecture (2)

To be used in any system

Interface of services (REST, SOAP, )
User tables
Services: Follow, Wall, Like and
Discussion
Security

Architecture (3)

User ID
transformation

Data!
Three tables
Entities
Followers, Following, Blocked, Count,
News

Walls
Info, text, likes

Discussions (similar to Walls)

Storing data

Row IDs! Performance!

Lexically
Sequence scanner
UID (constant length)
yyyymmddhhmmssSSS
Inverted bytes -> newest to oldest

News feed
One by one (slow)

OR
Store news at each profile (great redundancy)

MEMCACHED!
Post put in DB => search followers =>
store minimized in Memcached => links to
news feed => 1 normal q & 1 batch q to
Memcached
TTL (LRU)

Conclusion
Pros
High volume data distribution
Scalability
High throughput
Heavy data load (write once, read many)

Cons
Losing relations, indexes, triggers,
Responsibility for consistent data
still not sure how it will behave when deployed on
production

ABC's of Relationship Selling: Charles M. Futrell
Document9 pages
ABC's of Relationship Selling: Charles M. Futrell
Ashtika Beharry
No ratings yet
Test Bank For Fundamentals of Mental Health Nursing 4th Edition, Linda
Document23 pages
Test Bank For Fundamentals of Mental Health Nursing 4th Edition, Linda
ILL101
100% (3)
Pertemuan 2
Document26 pages
Pertemuan 2
Arief Budiman
No ratings yet
Big Data 2021 - 6,7,8 Big Data Technologies
Document55 pages
Big Data 2021 - 6,7,8 Big Data Technologies
Putri Nur aini
No ratings yet
The Big Data Ecosystem at LinkedIn Presentation 1
Document33 pages
The Big Data Ecosystem at LinkedIn Presentation 1
Asep Sukmayadi Djaka
No ratings yet
Practical Issues in The Development of Secure Distributed Systems
Document31 pages
Practical Issues in The Development of Secure Distributed Systems
carabusu
No ratings yet
It System Architectures
Document39 pages
It System Architectures
Jona De castro
No ratings yet
Social Media IR
Document39 pages
Social Media IR
Flavio58IT
No ratings yet
Big Data and Hadoop
Document37 pages
Big Data and Hadoop
Sreenivasulu Gogula
No ratings yet
Hadoop Important Lecture
Document38 pages
Hadoop Important Lecture
affanabbasi015
No ratings yet
Bda - M1
Document64 pages
Bda - M1
Chandan A H
No ratings yet
Apache Cassandra
Document166 pages
Apache Cassandra
KoushikKc Chatterjee
100% (1)
Web2 0Apps-EuroSys2010Tutorial
Document114 pages
Web2 0Apps-EuroSys2010Tutorial
Alejandro Pinilla
No ratings yet
Class: CS 237 Distributed Systems Middleware Instructor: Nalini Venkatasubramanian
Document55 pages
Class: CS 237 Distributed Systems Middleware Instructor: Nalini Venkatasubramanian
Pratheesh Kumar
No ratings yet
Data-Intensive Computing
Document88 pages
Data-Intensive Computing
Amogh B S
No ratings yet
Cisco and Open Stack Presentation
Document17 pages
Cisco and Open Stack Presentation
Manoj Samtani
No ratings yet
Architecture Patterns of Analytics and Big Data
Document12 pages
Architecture Patterns of Analytics and Big Data
Sunny Singh
No ratings yet
4.1 Intro Nosql
Document43 pages
4.1 Intro Nosql
Tuan Anh
No ratings yet
01 Introduction
Document44 pages
01 Introduction
Suranga Sampath
No ratings yet
Data Mining With Hadoop and Hive Introduction To Architecture
Document39 pages
Data Mining With Hadoop and Hive Introduction To Architecture
Ashwin Ajmera
No ratings yet
Hadoop, A Distributed Framework For Big Data
Document55 pages
Hadoop, A Distributed Framework For Big Data
sonia choudhary
No ratings yet
Lecture 1
Document55 pages
Lecture 1
George Okemwa
No ratings yet
4.1 Intro Nosql
Document45 pages
4.1 Intro Nosql
antp9254
No ratings yet
Architectures For Distributed Systems
Document52 pages
Architectures For Distributed Systems
Supreet Singh
No ratings yet
Microservice Architecture
Document53 pages
Microservice Architecture
Vikas Sharma
100% (2)
Network Documentation and Netdot
Document37 pages
Network Documentation and Netdot
islam
No ratings yet
Airbnb
Document55 pages
Airbnb
Ashish Bindal
No ratings yet
No SQL
Document32 pages
No SQL
Shubham N/A
No ratings yet
Data Engineer-GC
Document7 pages
Data Engineer-GC
Mudassir Mirza
No ratings yet
Introduction: Hadoop's History and Advantages 2. Architecture in Detail 3. Hadoop in Industry
Document53 pages
Introduction: Hadoop's History and Advantages 2. Architecture in Detail 3. Hadoop in Industry
jainam dude
No ratings yet
Introduction To Big Data Analytics
Document33 pages
Introduction To Big Data Analytics
Trần Nguyên Thái Bảo
No ratings yet
An Introduction To Hadoop Presentation PDF
Document91 pages
An Introduction To Hadoop Presentation PDF
srinath_vj3326
100% (1)
Hadoop, A Distributed Framework For Big Data
Document55 pages
Hadoop, A Distributed Framework For Big Data
HARISH REDDY B
No ratings yet
Satyanarayana Gupta Kunda
Document9 pages
Satyanarayana Gupta Kunda
Vamsi Ramu
No ratings yet
Dice Resume CV Al Kazendar
Document8 pages
Dice Resume CV Al Kazendar
HARSHA
No ratings yet
Overview of Grid Technology: Tony Hey and Geoffrey Fox
Document28 pages
Overview of Grid Technology: Tony Hey and Geoffrey Fox
anon-742360
No ratings yet
Big Data
Document67 pages
Big Data
tamizhanps
No ratings yet
Introduction To Database Systems
Document24 pages
Introduction To Database Systems
Quran The Noble
No ratings yet
Big Data NoSLQ Kopyası
Document51 pages
Big Data NoSLQ Kopyası
sude uğur
No ratings yet
Cs 620 / Dasc 600 Introduction To Data Science & Analytics: Lecture 6-Nosql
Document31 pages
Cs 620 / Dasc 600 Introduction To Data Science & Analytics: Lecture 6-Nosql
DR. BODHI CHAKRABORTY
No ratings yet
Databricks, An Introduction: Chuck Connell, Insight Digital Innovation
Document36 pages
Databricks, An Introduction: Chuck Connell, Insight Digital Innovation
Saravanan1234567
No ratings yet
Chapter 3
Document85 pages
Chapter 3
Shivananda V Seeri
No ratings yet
Big Data Pipelines
Document22 pages
Big Data Pipelines
Geet Sharma
No ratings yet
04-2 Intro Nosql
Document43 pages
04-2 Intro Nosql
Dương Nguyễn
No ratings yet
NOSql
Document46 pages
NOSql
SAM7028
No ratings yet
WT 1
Document179 pages
WT 1
Prabin Silwal
No ratings yet
Welcome To The New Era of Cloud Computing: The Web Is Replacing The Desktop
Document36 pages
Welcome To The New Era of Cloud Computing: The Web Is Replacing The Desktop
freakedvicky
No ratings yet
System Design
Document19 pages
System Design
Phil Coulson
No ratings yet
Integration of Cloud Computing
Document55 pages
Integration of Cloud Computing
Michael Mcintosh
No ratings yet
Shyamsuder Rathi: 2707 Portland ST #104, Los Angeles, CA 90007 Email - Srathi@usc - Edu Objective
Document1 page
Shyamsuder Rathi: 2707 Portland ST #104, Los Angeles, CA 90007 Email - Srathi@usc - Edu Objective
kunalvjti
No ratings yet
Cs-344: Web Engineering: Dr. Qaiser Riaz
Document52 pages
Cs-344: Web Engineering: Dr. Qaiser Riaz
Hasan Ahmed
No ratings yet
Three-Tier Architecture: Manuel Corona David Nevarez
Document59 pages
Three-Tier Architecture: Manuel Corona David Nevarez
rakesh_cs_jsr
No ratings yet
2 Dist Arch (Week 2) Week 3 6
Document65 pages
2 Dist Arch (Week 2) Week 3 6
Muhammad Awais Shah
No ratings yet
DP-900 Cheatsheet
Document24 pages
DP-900 Cheatsheet
jyh83777
No ratings yet
Gis Foss: Alternatives To COTS Is It Time For A Change?
Document14 pages
Gis Foss: Alternatives To COTS Is It Time For A Change?
Blair L Adams
No ratings yet
Big Table
Document21 pages
Big Table
sharath_rakki
No ratings yet
Lecture 1
Document31 pages
Lecture 1
bilalmujahid500
No ratings yet
A Brief Introduction To C#: David Buksbaum
Document31 pages
A Brief Introduction To C#: David Buksbaum
tolekhinirao
No ratings yet
Merged Till Lec 17
Document309 pages
Merged Till Lec 17
FIZA SAIF
No ratings yet
PPT
Document17 pages
PPT
Dhruv Sharma
No ratings yet
Kafka Up and Running for Network DevOps: Set Your Network Data in Motion
From Everand
Kafka Up and Running for Network DevOps: Set Your Network Data in Motion
Eric Chou
No ratings yet
DBMS MASTER: Become Pro in Database Management System
From Everand
DBMS MASTER: Become Pro in Database Management System
Ummed Singh
No ratings yet
The Cultural Impact On International Assignments: Participation Fee
Document8 pages
The Cultural Impact On International Assignments: Participation Fee
Anca Ancaa
No ratings yet
SIB ExamenGrila 2016
Document4 pages
SIB ExamenGrila 2016
Anca Ancaa
No ratings yet
Briefing 2015 Presentation Gary Goodenough
Document31 pages
Briefing 2015 Presentation Gary Goodenough
Anca Ancaa
No ratings yet
Economic An 2
Document165 pages
Economic An 2
Anca Ancaa
No ratings yet
Carti Biblioteca Feaaj
Document1,385 pages
Carti Biblioteca Feaaj
Anca Ancaa
No ratings yet
10-12 Programare-B3 12-14 S.I.B-B3 8-10 Management B518 10-12 Econometrie B524 12-14 Engleza B602 14-16 Engleza B516
Document1 page
10-12 Programare-B3 12-14 S.I.B-B3 8-10 Management B518 10-12 Econometrie B524 12-14 Engleza B602 14-16 Engleza B516
Anca Ancaa
No ratings yet
Essential Vocabulary For The Final Test - 1
Document3 pages
Essential Vocabulary For The Final Test - 1
Anca Ancaa
No ratings yet
Big 5
Document16 pages
Big 5
Anubhav Pratap Singh
No ratings yet
DB2 UDB For OS390 and ZOS V7 Installation Guide
Document652 pages
DB2 UDB For OS390 and ZOS V7 Installation Guide
Vijay Chandar
No ratings yet
Types of Propaganda
Document13 pages
Types of Propaganda
Darren Nipotse
No ratings yet
Cadet Booklet PDF
Document6 pages
Cadet Booklet PDF
Vikas
100% (1)
Oce Remote Control
Document216 pages
Oce Remote Control
Loraine Lipalam Juanitas
100% (1)
Guide To Getting Closer
Document17 pages
Guide To Getting Closer
Shane
No ratings yet
A Study On The Organisational Behaviour of Aviation Industry
Document8 pages
A Study On The Organisational Behaviour of Aviation Industry
Roshan Bhosale
No ratings yet
Second Quarter Lesson 4
Document7 pages
Second Quarter Lesson 4
Jomarie Paule
No ratings yet
School Districts' Orig Petition
Document20 pages
School Districts' Orig Petition
CBS Austin Webteam
No ratings yet
Undergraduate Scholarships Application Form
Document3 pages
Undergraduate Scholarships Application Form
Abdul Rehman Shejwalkar
No ratings yet
Edinburgh Castle Power Point
Document12 pages
Edinburgh Castle Power Point
laurcahs
100% (3)
How 2 Drop Out and Other Essays by Ran Prieur
Document298 pages
How 2 Drop Out and Other Essays by Ran Prieur
Reddan Black
100% (1)
Research Paper Topics About Dogs
Document7 pages
Research Paper Topics About Dogs
cafjhhaj
100% (1)
The Legend of Daragang Magayon: by Merito B. Espinas
Document1 page
The Legend of Daragang Magayon: by Merito B. Espinas
Reu Amor Amorganda
No ratings yet
Business Plan Group 4
Document13 pages
Business Plan Group 4
Jennilyn Estillioso
No ratings yet
Md. Hafizur Rahman Arfin: Education Experience
Document1 page
Md. Hafizur Rahman Arfin: Education Experience
Mohidul Islam Heera
No ratings yet
Tang v. Ca
Document2 pages
Tang v. Ca
Dominique Pobe
100% (1)
MCQ ON - Chapter 1 - Artificial Intelligence (AI)
Document18 pages
MCQ ON - Chapter 1 - Artificial Intelligence (AI)
Adinath Baliram Shelke
No ratings yet
Symptomatology Close 1
Document41 pages
Symptomatology Close 1
Sk Saklin Mustak
No ratings yet
Mustafa Barakat CV 2 - 2020
Document6 pages
Mustafa Barakat CV 2 - 2020
Musa Bara
No ratings yet
Action Plan
Document2 pages
Action Plan
Maricel P Dulay
No ratings yet
Disney Research Paper
Document8 pages
Disney Research Paper
purfcgvnd
100% (1)
EOC - Business Law
Document5 pages
EOC - Business Law
Cha Eun Woo
No ratings yet
Task Week 11 - Working at A Shop
Document9 pages
Task Week 11 - Working at A Shop
Ramiro Ojeda
No ratings yet
Inpho GT Lom KM
Document11 pages
Inpho GT Lom KM
lash73752
No ratings yet
Cisco Quick Reference Guide - August - 2010
Document0 pages
Cisco Quick Reference Guide - August - 2010
sag005
No ratings yet
Syracuse Solitary Final Signed
Document42 pages
Syracuse Solitary Final Signed
PatLohmann
No ratings yet
Gene Expression in Prokaryotes.
Document23 pages
Gene Expression in Prokaryotes.
M.PRASAD NAIDU
100% (1)