Welcome to Scribd!

0% found this document useful (0 votes)

13 views

Large Scale Semantic Data Integration And: Analytics Through Cloud: A Case Study in Bioinformatics

Uploaded by

This document proposes a framework for large-scale semantic data integration and analytics of biological data through cloud computing. It presents a data infrastructure module using Hadoop for distributed storage and processing on Amazon EC2 and EC2. A data analytics module uses semantic technologies like Knowle for ontology population, querying and reasoning. It describes a case study integrating over 70,000 citations from PubMed and 14,000 proteins from UniProt about antiviral proteins.

Copyright:

Attribution Non-Commercial (BY-NC)

Available Formats

Download as PPT, PDF, TXT or read online from Scribd

Flag for inappropriate content

UNIT I - Introduction - DataScience - New
Document34 pages
UNIT I - Introduction - DataScience - New
Sid S
No ratings yet
Chapter 11 2 Applications and Trends in Data Mining
Document2 pages
Chapter 11 2 Applications and Trends in Data Mining
bharathimanian
No ratings yet
Assured Cloud Computing and Information Sharing
Document22 pages
Assured Cloud Computing and Information Sharing
arteepu4
No ratings yet
Big Data 2021 - 6,7,8 Big Data Technologies
Document55 pages
Big Data 2021 - 6,7,8 Big Data Technologies
Putri Nur aini
No ratings yet
Data Warehouse and Data Mining: Lecture Notes
Document69 pages
Data Warehouse and Data Mining: Lecture Notes
Henri IBOHN
No ratings yet
Chapter - 2: Data Science & Python
Document17 pages
Chapter - 2: Data Science & Python
Mubaraka Kundawala
No ratings yet
Unit 1f
Document50 pages
Unit 1f
Vasudevarao Peyyeti
No ratings yet
OgresABDS CloudDB Mar31 2014
Document64 pages
OgresABDS CloudDB Mar31 2014
John Berkmans
No ratings yet
Csit1232 (2021 - 07 - 30 08 - 37 - 35 UTC)
Document11 pages
Csit1232 (2021 - 07 - 30 08 - 37 - 35 UTC)
Anil Kumar
No ratings yet
Jeppiaar Institute of Technology: Department OF Computer Science and Engineering
Document24 pages
Jeppiaar Institute of Technology: Department OF Computer Science and Engineering
Project 21-22
No ratings yet
Data Science Using With Python
Document14 pages
Data Science Using With Python
suji myneedi
No ratings yet
The Scientific Data Management Center: Arie Shoshani (PI)
Document38 pages
The Scientific Data Management Center: Arie Shoshani (PI)
Anusha Ammu
No ratings yet
Topic Analysis Presentation
Document23 pages
Topic Analysis Presentation
Nader AlFakeeh
No ratings yet
IR UNIT I - Notes
Document23 pages
IR UNIT I - Notes
Angel
No ratings yet
Daniel G. Schwartz: Research Interests
Document22 pages
Daniel G. Schwartz: Research Interests
Samir Sabry
No ratings yet
Introduction To Big Data: Soorya Prasanna Ravichandran
Document33 pages
Introduction To Big Data: Soorya Prasanna Ravichandran
AbhishekChakladar
No ratings yet
Innovation 24 Finalppt
Document10 pages
Innovation 24 Finalppt
Appu
No ratings yet
Cloud-Based Assured Information Sharing and Identity Management
Document20 pages
Cloud-Based Assured Information Sharing and Identity Management
Sami Dick
No ratings yet
CHP 19
Document63 pages
CHP 19
mona yadv
No ratings yet
Big Data Unit 1 AKTU Notes
Document87 pages
Big Data Unit 1 AKTU Notes
abhijitraj229
No ratings yet
1stunit GN
Document36 pages
1stunit GN
manimekalai.k
No ratings yet
DM Unit-I
Document54 pages
DM Unit-I
manoj
No ratings yet
Cse 511
Document7 pages
Cse 511
Ioana
No ratings yet
Additional
Document1,008 pages
Additional
Kanishk Agrawal
No ratings yet
Ciencia Datos Corner
Document6 pages
Ciencia Datos Corner
Arias Saraeva
No ratings yet
Lec 1
Document48 pages
Lec 1
sayantikaroy217
No ratings yet
LLM For QnA Proposal
Document12 pages
LLM For QnA Proposal
Akhil Kumar
No ratings yet
Big Data Analysis Using Hadoop: A Survey: August 2015
Document6 pages
Big Data Analysis Using Hadoop: A Survey: August 2015
Dan
No ratings yet
Incremental Approach of Neural Network in Back Propagation Algorithms For Web Data Mining
Document5 pages
Incremental Approach of Neural Network in Back Propagation Algorithms For Web Data Mining
IAES IJAI
No ratings yet
Facebook Wall Data Using Graph API
Document55 pages
Facebook Wall Data Using Graph API
Cleilson Pereira
No ratings yet
Big Data Analytics Notess
Document69 pages
Big Data Analytics Notess
mydhili
No ratings yet
Python Data Analysis: Transforming Raw Data into Actionable Intelligence with Python's Data Analysis Capabilities
From Everand
Python Data Analysis: Transforming Raw Data into Actionable Intelligence with Python's Data Analysis Capabilities
Tom Lesley
No ratings yet
Bda Ese
Document66 pages
Bda Ese
jasbutani1234
No ratings yet
Defining IR - Information Retrieval Process
Document17 pages
Defining IR - Information Retrieval Process
abreham damtew
No ratings yet
Sem A Tic Microsoft
Document31 pages
Sem A Tic Microsoft
Abdul Khalique
No ratings yet
Sample Phase 1 Document
Document4 pages
Sample Phase 1 Document
Mohamed Ashic Ilaki A
No ratings yet
Hadoop
Document25 pages
Hadoop
RAJNISH KUMAR ROY
No ratings yet
Document Clustering: Alankrit Bhardwaj 18BIT0142 Priyanshu Gupta 18BIT0146 Aditya Raj 18BIT0412
Document33 pages
Document Clustering: Alankrit Bhardwaj 18BIT0142 Priyanshu Gupta 18BIT0146 Aditya Raj 18BIT0412
Aman Kushwaha
No ratings yet
Introduction To Big Data, Hadoop and Spark
Document40 pages
Introduction To Big Data, Hadoop and Spark
debmatra
No ratings yet
Unit 4
Document33 pages
Unit 4
Sahana Shetty
100% (1)
Unit I Introduction 1.1 What Motivated Data Mining? Why Is It Important?
Document18 pages
Unit I Introduction 1.1 What Motivated Data Mining? Why Is It Important?
ANITHA AMMU
No ratings yet
Big Data Analytics
Document79 pages
Big Data Analytics
sania2011
100% (2)
INSC Chapter Three
Document29 pages
INSC Chapter Three
Demelash Seifu
No ratings yet
Ecs765p W1
Document39 pages
Ecs765p W1
Yen-Kai Cheng
No ratings yet
Introduction To Information Retrieval
Document50 pages
Introduction To Information Retrieval
asma
No ratings yet
DMBI Presentations Unit-8
Document28 pages
DMBI Presentations Unit-8
Nayan Patel
No ratings yet
Lect7 IoT BigData1
Document28 pages
Lect7 IoT BigData1
Eng:Mostafa Morsy Mohamed
No ratings yet
Predictive Data Analytics With Python
Document97 pages
Predictive Data Analytics With Python
toon town
100% (1)
Hadoop
Document23 pages
Hadoop
sowjanya kandukuri
No ratings yet
Chapter 2-Data Science
Document23 pages
Chapter 2-Data Science
Wondimu Bantihun
No ratings yet
Advance Big Data Science Using Python-R-Hadoop-Spark (1/3) : Total Duration: 90 Hours + Practice
Document1 page
Advance Big Data Science Using Python-R-Hadoop-Spark (1/3) : Total Duration: 90 Hours + Practice
Siba Mohapatra
No ratings yet
Part A Aim: Prerequisite: Database Outcome: To Impart Knowledge of Data Warehouse and Data Mining Theory
Document4 pages
Part A Aim: Prerequisite: Database Outcome: To Impart Knowledge of Data Warehouse and Data Mining Theory
khushi
No ratings yet
Chapter 1 - Lecture 1
Document54 pages
Chapter 1 - Lecture 1
Aliyan Aman
No ratings yet
Data Science I: Charles C.N. Wang
Document68 pages
Data Science I: Charles C.N. Wang
sar
No ratings yet
Department of Mechatronics Engineering Machine Intelligence ME-555
Document8 pages
Department of Mechatronics Engineering Machine Intelligence ME-555
Kanwal Habib
No ratings yet
Bda - M1
Document64 pages
Bda - M1
Chandan A H
No ratings yet
Manj Data 1
Document30 pages
Manj Data 1
Aris Haryanto
No ratings yet
Updated Unit-2
Document55 pages
Updated Unit-2
sc
0% (1)
Gokaraju Rangaraju Institute of Engineering and Technology
Document49 pages
Gokaraju Rangaraju Institute of Engineering and Technology
Ramya Teja
No ratings yet
DWDMUNIT1A
Document93 pages
DWDMUNIT1A
Naveen Bhupathi
No ratings yet
SDL
Document2 pages
SDL
arteepu4
No ratings yet
Google Wallet Research Project: Evan T. Atherton, John Cheek, and Joseph Stern
Document53 pages
Google Wallet Research Project: Evan T. Atherton, John Cheek, and Joseph Stern
arteepu4
No ratings yet
p1194 Elmore
Document2 pages
p1194 Elmore
arteepu4
No ratings yet
Practical Tastypie: For The Modern Djangonaut
Document36 pages
Practical Tastypie: For The Modern Djangonaut
arteepu4
No ratings yet
TP
Document161 pages
TP
arteepu4
No ratings yet
Oscar
Document145 pages
Oscar
arteepu4
No ratings yet
Policy Te
Document1 page
Policy Te
arteepu4
No ratings yet
Relational Cloud: A Database-as-a-Service For The Cloud
Document6 pages
Relational Cloud: A Database-as-a-Service For The Cloud
arteepu4
No ratings yet
Oes Refarch Dbaas 508111
Document21 pages
Oes Refarch Dbaas 508111
arteepu4
No ratings yet
Delivering Database As A Service (Dbaas) Using Oracle Enterprise Manager 12C
Document21 pages
Delivering Database As A Service (Dbaas) Using Oracle Enterprise Manager 12C
arteepu4
No ratings yet
Relational Cloud: A Database-as-a-Service For The Cloud
Document7 pages
Relational Cloud: A Database-as-a-Service For The Cloud
arteepu4
No ratings yet
Providing Database As A Service
Document10 pages
Providing Database As A Service
arteepu4
No ratings yet
Building Database Applications in The Cloud
Document227 pages
Building Database Applications in The Cloud
arteepu4
No ratings yet
Mydbaas: A Framework For Database-As-A-Service Monitoring: (Araujodavid, Flavio, Jose - Macedo, Franzejr) @
Document6 pages
Mydbaas: A Framework For Database-As-A-Service Monitoring: (Araujodavid, Flavio, Jose - Macedo, Franzejr) @
arteepu4
No ratings yet
Two Can Keep A Secret: A Distributed Architecture For Secure Database Services
Document14 pages
Two Can Keep A Secret: A Distributed Architecture For Secure Database Services
arteepu4
No ratings yet
Author: Kalinga Villages in Muntinlupa, Paranaque, and Las Piñas. Her Background in Teaching Preschool and
Document23 pages
Author: Kalinga Villages in Muntinlupa, Paranaque, and Las Piñas. Her Background in Teaching Preschool and
arteepu4
No ratings yet
Achieving High Performance With Application Outsourcing
Document16 pages
Achieving High Performance With Application Outsourcing
arteepu4
No ratings yet
Olmisoft Company Profile
Document19 pages
Olmisoft Company Profile
arteepu4
No ratings yet
Checkers
Document2 pages
Checkers
arteepu4
No ratings yet
How To Help Your Child Enjoy and Succeed at Piano Lessons: by Joseph Hoffman, M.M
Document5 pages
How To Help Your Child Enjoy and Succeed at Piano Lessons: by Joseph Hoffman, M.M
arteepu4
No ratings yet
Jyothi Nandikonda Supervisor: Olav Tirkkonen
Document15 pages
Jyothi Nandikonda Supervisor: Olav Tirkkonen
arteepu4
No ratings yet
Chinese Checkers: Adapted For The Piecepack by Mark A. Biggar
Document3 pages
Chinese Checkers: Adapted For The Piecepack by Mark A. Biggar
arteepu4
No ratings yet
Giant Chinese Checkers
Document2 pages
Giant Chinese Checkers
arteepu4
No ratings yet
Chinese Checkers Rules: Equipment
Document1 page
Chinese Checkers Rules: Equipment
arteepu4
No ratings yet
Seminar Formatkhjj
Document24 pages
Seminar Formatkhjj
Prasad Chavan
No ratings yet
A Simple Python Web Crawler...
Document5 pages
A Simple Python Web Crawler...
tnasrevid
100% (1)
Big Data Solution For Tourism PDF
Document10 pages
Big Data Solution For Tourism PDF
prave19
No ratings yet
OBELICS An Open Web-Scale Filtered
Document51 pages
OBELICS An Open Web-Scale Filtered
Anthony J.
No ratings yet
Acunetix
Document13 pages
Acunetix
retcal
No ratings yet
SEO Report
Document97 pages
SEO Report
sivascute
77% (13)
Cs6007 - Information Retrieval: Objectives: The Student Should Be Made To
Document24 pages
Cs6007 - Information Retrieval: Objectives: The Student Should Be Made To
Pavithra pavi
No ratings yet
List of Search Engines and Online Data - 2019
Document104 pages
List of Search Engines and Online Data - 2019
Association of Internet Research Specialists
No ratings yet
SEO Notes by Suren-1
Document11 pages
SEO Notes by Suren-1
sriram prasad
No ratings yet
Gsa Datasheet
Document6 pages
Gsa Datasheet
snana23
No ratings yet
Scrapy Documentation
Document230 pages
Scrapy Documentation
Superquant
No ratings yet
Chrome Os
Document7 pages
Chrome Os
vaibhavmakkar54
No ratings yet
Search Engine
Document10 pages
Search Engine
Tejas Morajkar
No ratings yet
2 Chepter 2
Document40 pages
2 Chepter 2
pankajusb
No ratings yet
Fun With Google
Document52 pages
Fun With Google
api-3761151
No ratings yet
The Top Ten Largest Databases in The World
Document8 pages
The Top Ten Largest Databases in The World
lewis_keller
No ratings yet
Smriti Mishra
Document15 pages
Smriti Mishra
Docukits
No ratings yet
How Search Engines Work Mike Grehan
Document57 pages
How Search Engines Work Mike Grehan
jayashree99
No ratings yet
SEO Syllabus
Document3 pages
SEO Syllabus
leealarik
No ratings yet
CompletedUNIT 1 PPT 10.7.17
Document87 pages
CompletedUNIT 1 PPT 10.7.17
Dr.A.R.Kavitha
100% (6)
Web Scraping With Python
Document21 pages
Web Scraping With Python
Satyam Kumar
No ratings yet
Seo Course
Document427 pages
Seo Course
Marina Shilova
No ratings yet
Reconspider
Document9 pages
Reconspider
rushabhp17
No ratings yet
Cs572 HW Nutch
Document7 pages
Cs572 HW Nutch
Easo Thomas
No ratings yet
Google Distributed System
Document40 pages
Google Distributed System
sebghat aslamzai
No ratings yet
Data Structures Proposal
Document5 pages
Data Structures Proposal
vedant kohli
No ratings yet
Final Pass4Sure
Document125 pages
Final Pass4Sure
JueySlamat
No ratings yet
DMDW Mod4@AzDOCUMENTS - in
Document44 pages
DMDW Mod4@AzDOCUMENTS - in
Rakesh Jain
No ratings yet
Thesis
Document37 pages
Thesis
Apoorva Hegde
No ratings yet
Social Media Marketing 3rd Edition Tuten Test Bank
Document42 pages
Social Media Marketing 3rd Edition Tuten Test Bank
mudholetheat3lv
100% (29)

Large Scale Semantic Data Integration And: Analytics Through Cloud: A Case Study in Bioinformatics

Uploaded by

arteepu4

0% found this document useful (0 votes)

13 views25 pages

Original Description:

Thang

Original Title

Thang

Copyright

Available Formats

PPT, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Attribution Non-Commercial (BY-NC)

Available Formats

Download as PPT, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as ppt, pdf, or txt

0% found this document useful (0 votes)

13 views25 pages

Large Scale Semantic Data Integration And: Analytics Through Cloud: A Case Study in Bioinformatics

Uploaded by

arteepu4

Copyright:

Attribution Non-Commercial (BY-NC)

Available Formats

Download as PPT, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as ppt, pdf, or txt

Jump to Page

You are on page 1of 25

Search inside document

Large Scale Semantic Data Integration and Analytics through Cloud: A Case Study in Bioinformatics

Tat Thang Parallel and Distributed Computing Centre, School of Computer Engineering, NTU, Singapore

Michael Li Semantic Technology Group, Institute for Infocomm Research (I2R), A-Star, Singapore
11th Feb 2011

Overview
Motivation Problem Definition Objective Proposed Architecture A case study in Bio-informatics Demo Future works Summary

Motivation
Deluge of biological data Biomedical data is available on heterogeneous databases Data: structured and semi/un-structured formats Demand for fast, large-scale and cost-effective computing strategies

Problem Definition
Data
PubMed contains 20+ million abstracts UniProt contains 13.5+ million records

Case study on antiviral proteins

Over 70,000 citations in Pubmed Over 14,000 proteins in Uniprot

Integration and Analysis

Related Works
Using NLP to link documents to existing ontologies (e.g. GoPubMed, Textpresso)
No querying & reasoning Not scalable

RDF/OWL based integration tools (e.g. TopBraid Suite)

No NLP Not bio specific. Also not biologist friendly

Cloud-based bio data mining works (e.g. Kudtarkar P 2010)

Still in early stages Challenging to perform semantic integration on cloud

Objective
To provide a framework that enables Better data infrastructure
Scalability Management of heterogeneity Cost-effectiveness

Better data analytics

Integrative data mining Visual query interface

Our Approach
Proposed Framework

Data Infrastructure Module

Data Analytics Module

Our Approach
Data Infrastructure module Data Analytics module Query & Reasoner Web Crawler Parser Knowle Population Service

User Interface

Ontology

Biomedical sources

Cloud-based data store

Our Approach
Data Infrastructure Module
Cloud based: Amazon EC2, Hadoop, Microsoft Azure Parallel processing: MapReduce Distributed Storage: Big Table, HBase, HDFS

Data Analytics Module

Non-semantic: database driven Semantic: ontology driven (Knowle, Allegrograph, TopBraid)

Data Infrastructure Module (Hadoop)

Software framework for data-intensive and distributed applications Hadoop distributed file system provides a distributed, scalable, and portable file system that support for large data set Hadoop Map-reduce allows to program in parallel on large amount of data

Cloud Based Data Store Hadoop Distributed File System

Secondary Name node Name node

- Meta data (in memory) - Data nodes - Data blocks - Node attributes - Name of files - Mapping of block-node

Data node

- Stores file contents - File is chunked to block - each block is spread to data nodes

Data Analytics Module (Knowle)

Semantic Technology Toolkit Knowle services used in Data Analytics Module
Data/Text mining Ontology Population Ontology Query Visual Ontology Query

Developed in Institute for Infocomm Research, Singapore

Our Approach
Data Infrastructure module Data Analytics module Query & Reasoner Web Crawler Parser Knowle Population Service Ontology

User Interface

Biomedical data sources

Cloud-based data store

Web Crawler

UniProt

UniProt Crawler

Cloud-based data store

PubMed PubMed Crawler

Bio-medical data source

Parser

Crawled UniProt data

UniProt Parser Knowle Ontology Population Service

Crawled PubMed data

PubMed Parser

Cloud-based data store

Ontology
Protein + Literature Ontology Protein Ontology

Ontology Populator
Parsed Uniprot Data
Knowle Ontolgy Population Service
Populate concepts Assert Datatype Properties Assert Object Properties

Ontology Triplestore Protein + Literature ontology Knowle Text mining Service

Entity Detection Relation Extraction

Parsed Pubmed Data

Query & Reasoner

OWLIM Reasoner

SAIL

Ontology Triplestore

User Interface

Sesame

Knowle Query Service

User Interface
Knowle Population Service

Web Crawler

Parser

KnowleGator Ontology Visual Query

Visual Query Translator

Ontology Query & Reasoner

Ontology Triplestore

A case study in Bio-informatics

Integration, cross-querying from PubMed and UniProt Data
70,054 citations from Pubmed 14,527 proteins in Uniprot

Infrastructure (virtual computers)

4 data node ( RAM : 1Gb, CPU : Intel Xeon 2.4Ghz) 2 master node ( 1 name node,1 secondary name node) (RAM : 512 Mb, CPU : Intel Xeon 2.4Ghz) 1 virtual CPU = Intel Xeon 2.4 Ghz

Demo
Data
Uniprot : 853 antiviral protein entries Pubmed : 2000 citations

Demo Snapshot

Summary
We proposed a new framework
Data infrastructure module (cloud-based infrastructure ) Data analytics module(semantic technologies)

We tested on a prototype
Using our own infrastructure With integration, cross-querying from PubMed and UniProt

Future works
Integrated user interface Explore other cloud-based data store: HBase, BigTable Apply map-reduce concept on data analytics and crawling Integrate Knowle into cloud-based environment

Large Scale Semantic Data Integration and Analytics through Cloud: A Case Study in Bioinformatics
Tat Thang Parallel and Distributed Computing Centre, School of Computer Engineering, NTU, Singapore

Michael Li Semantic Technology Group, Institute for Infocomm Research (I2R), A-Star, Singapore
11th Feb 2011

UNIT I - Introduction - DataScience - New
Document34 pages
UNIT I - Introduction - DataScience - New
Sid S
No ratings yet
Chapter 11 2 Applications and Trends in Data Mining
Document2 pages
Chapter 11 2 Applications and Trends in Data Mining
bharathimanian
No ratings yet
Assured Cloud Computing and Information Sharing
Document22 pages
Assured Cloud Computing and Information Sharing
arteepu4
No ratings yet
Big Data 2021 - 6,7,8 Big Data Technologies
Document55 pages
Big Data 2021 - 6,7,8 Big Data Technologies
Putri Nur aini
No ratings yet
Data Warehouse and Data Mining: Lecture Notes
Document69 pages
Data Warehouse and Data Mining: Lecture Notes
Henri IBOHN
No ratings yet
Chapter - 2: Data Science & Python
Document17 pages
Chapter - 2: Data Science & Python
Mubaraka Kundawala
No ratings yet
Unit 1f
Document50 pages
Unit 1f
Vasudevarao Peyyeti
No ratings yet
OgresABDS CloudDB Mar31 2014
Document64 pages
OgresABDS CloudDB Mar31 2014
John Berkmans
No ratings yet
Csit1232 (2021 - 07 - 30 08 - 37 - 35 UTC)
Document11 pages
Csit1232 (2021 - 07 - 30 08 - 37 - 35 UTC)
Anil Kumar
No ratings yet
Jeppiaar Institute of Technology: Department OF Computer Science and Engineering
Document24 pages
Jeppiaar Institute of Technology: Department OF Computer Science and Engineering
Project 21-22
No ratings yet
Data Science Using With Python
Document14 pages
Data Science Using With Python
suji myneedi
No ratings yet
The Scientific Data Management Center: Arie Shoshani (PI)
Document38 pages
The Scientific Data Management Center: Arie Shoshani (PI)
Anusha Ammu
No ratings yet
Topic Analysis Presentation
Document23 pages
Topic Analysis Presentation
Nader AlFakeeh
No ratings yet
IR UNIT I - Notes
Document23 pages
IR UNIT I - Notes
Angel
No ratings yet
Daniel G. Schwartz: Research Interests
Document22 pages
Daniel G. Schwartz: Research Interests
Samir Sabry
No ratings yet
Introduction To Big Data: Soorya Prasanna Ravichandran
Document33 pages
Introduction To Big Data: Soorya Prasanna Ravichandran
AbhishekChakladar
No ratings yet
Innovation 24 Finalppt
Document10 pages
Innovation 24 Finalppt
Appu
No ratings yet
Cloud-Based Assured Information Sharing and Identity Management
Document20 pages
Cloud-Based Assured Information Sharing and Identity Management
Sami Dick
No ratings yet
CHP 19
Document63 pages
CHP 19
mona yadv
No ratings yet
Big Data Unit 1 AKTU Notes
Document87 pages
Big Data Unit 1 AKTU Notes
abhijitraj229
No ratings yet
1stunit GN
Document36 pages
1stunit GN
manimekalai.k
No ratings yet
DM Unit-I
Document54 pages
DM Unit-I
manoj
No ratings yet
Cse 511
Document7 pages
Cse 511
Ioana
No ratings yet
Additional
Document1,008 pages
Additional
Kanishk Agrawal
No ratings yet
Ciencia Datos Corner
Document6 pages
Ciencia Datos Corner
Arias Saraeva
No ratings yet
Lec 1
Document48 pages
Lec 1
sayantikaroy217
No ratings yet
LLM For QnA Proposal
Document12 pages
LLM For QnA Proposal
Akhil Kumar
No ratings yet
Big Data Analysis Using Hadoop: A Survey: August 2015
Document6 pages
Big Data Analysis Using Hadoop: A Survey: August 2015
Dan
No ratings yet
Incremental Approach of Neural Network in Back Propagation Algorithms For Web Data Mining
Document5 pages
Incremental Approach of Neural Network in Back Propagation Algorithms For Web Data Mining
IAES IJAI
No ratings yet
Facebook Wall Data Using Graph API
Document55 pages
Facebook Wall Data Using Graph API
Cleilson Pereira
No ratings yet
Big Data Analytics Notess
Document69 pages
Big Data Analytics Notess
mydhili
No ratings yet
Python Data Analysis: Transforming Raw Data into Actionable Intelligence with Python's Data Analysis Capabilities
From Everand
Python Data Analysis: Transforming Raw Data into Actionable Intelligence with Python's Data Analysis Capabilities
Tom Lesley
No ratings yet
Bda Ese
Document66 pages
Bda Ese
jasbutani1234
No ratings yet
Defining IR - Information Retrieval Process
Document17 pages
Defining IR - Information Retrieval Process
abreham damtew
No ratings yet
Sem A Tic Microsoft
Document31 pages
Sem A Tic Microsoft
Abdul Khalique
No ratings yet
Sample Phase 1 Document
Document4 pages
Sample Phase 1 Document
Mohamed Ashic Ilaki A
No ratings yet
Hadoop
Document25 pages
Hadoop
RAJNISH KUMAR ROY
No ratings yet
Document Clustering: Alankrit Bhardwaj 18BIT0142 Priyanshu Gupta 18BIT0146 Aditya Raj 18BIT0412
Document33 pages
Document Clustering: Alankrit Bhardwaj 18BIT0142 Priyanshu Gupta 18BIT0146 Aditya Raj 18BIT0412
Aman Kushwaha
No ratings yet
Introduction To Big Data, Hadoop and Spark
Document40 pages
Introduction To Big Data, Hadoop and Spark
debmatra
No ratings yet
Unit 4
Document33 pages
Unit 4
Sahana Shetty
100% (1)
Unit I Introduction 1.1 What Motivated Data Mining? Why Is It Important?
Document18 pages
Unit I Introduction 1.1 What Motivated Data Mining? Why Is It Important?
ANITHA AMMU
No ratings yet
Big Data Analytics
Document79 pages
Big Data Analytics
sania2011
100% (2)
INSC Chapter Three
Document29 pages
INSC Chapter Three
Demelash Seifu
No ratings yet
Ecs765p W1
Document39 pages
Ecs765p W1
Yen-Kai Cheng
No ratings yet
Introduction To Information Retrieval
Document50 pages
Introduction To Information Retrieval
asma
No ratings yet
DMBI Presentations Unit-8
Document28 pages
DMBI Presentations Unit-8
Nayan Patel
No ratings yet
Lect7 IoT BigData1
Document28 pages
Lect7 IoT BigData1
Eng:Mostafa Morsy Mohamed
No ratings yet
Predictive Data Analytics With Python
Document97 pages
Predictive Data Analytics With Python
toon town
100% (1)
Hadoop
Document23 pages
Hadoop
sowjanya kandukuri
No ratings yet
Chapter 2-Data Science
Document23 pages
Chapter 2-Data Science
Wondimu Bantihun
No ratings yet
Advance Big Data Science Using Python-R-Hadoop-Spark (1/3) : Total Duration: 90 Hours + Practice
Document1 page
Advance Big Data Science Using Python-R-Hadoop-Spark (1/3) : Total Duration: 90 Hours + Practice
Siba Mohapatra
No ratings yet
Part A Aim: Prerequisite: Database Outcome: To Impart Knowledge of Data Warehouse and Data Mining Theory
Document4 pages
Part A Aim: Prerequisite: Database Outcome: To Impart Knowledge of Data Warehouse and Data Mining Theory
khushi
No ratings yet
Chapter 1 - Lecture 1
Document54 pages
Chapter 1 - Lecture 1
Aliyan Aman
No ratings yet
Data Science I: Charles C.N. Wang
Document68 pages
Data Science I: Charles C.N. Wang
sar
No ratings yet
Department of Mechatronics Engineering Machine Intelligence ME-555
Document8 pages
Department of Mechatronics Engineering Machine Intelligence ME-555
Kanwal Habib
No ratings yet
Bda - M1
Document64 pages
Bda - M1
Chandan A H
No ratings yet
Manj Data 1
Document30 pages
Manj Data 1
Aris Haryanto
No ratings yet
Updated Unit-2
Document55 pages
Updated Unit-2
sc
0% (1)
Gokaraju Rangaraju Institute of Engineering and Technology
Document49 pages
Gokaraju Rangaraju Institute of Engineering and Technology
Ramya Teja
No ratings yet
DWDMUNIT1A
Document93 pages
DWDMUNIT1A
Naveen Bhupathi
No ratings yet
SDL
Document2 pages
SDL
arteepu4
No ratings yet
Google Wallet Research Project: Evan T. Atherton, John Cheek, and Joseph Stern
Document53 pages
Google Wallet Research Project: Evan T. Atherton, John Cheek, and Joseph Stern
arteepu4
No ratings yet
p1194 Elmore
Document2 pages
p1194 Elmore
arteepu4
No ratings yet
Practical Tastypie: For The Modern Djangonaut
Document36 pages
Practical Tastypie: For The Modern Djangonaut
arteepu4
No ratings yet
TP
Document161 pages
TP
arteepu4
No ratings yet
Oscar
Document145 pages
Oscar
arteepu4
No ratings yet
Policy Te
Document1 page
Policy Te
arteepu4
No ratings yet
Relational Cloud: A Database-as-a-Service For The Cloud
Document6 pages
Relational Cloud: A Database-as-a-Service For The Cloud
arteepu4
No ratings yet
Oes Refarch Dbaas 508111
Document21 pages
Oes Refarch Dbaas 508111
arteepu4
No ratings yet
Delivering Database As A Service (Dbaas) Using Oracle Enterprise Manager 12C
Document21 pages
Delivering Database As A Service (Dbaas) Using Oracle Enterprise Manager 12C
arteepu4
No ratings yet
Relational Cloud: A Database-as-a-Service For The Cloud
Document7 pages
Relational Cloud: A Database-as-a-Service For The Cloud
arteepu4
No ratings yet
Providing Database As A Service
Document10 pages
Providing Database As A Service
arteepu4
No ratings yet
Building Database Applications in The Cloud
Document227 pages
Building Database Applications in The Cloud
arteepu4
No ratings yet
Mydbaas: A Framework For Database-As-A-Service Monitoring: (Araujodavid, Flavio, Jose - Macedo, Franzejr) @
Document6 pages
Mydbaas: A Framework For Database-As-A-Service Monitoring: (Araujodavid, Flavio, Jose - Macedo, Franzejr) @
arteepu4
No ratings yet
Two Can Keep A Secret: A Distributed Architecture For Secure Database Services
Document14 pages
Two Can Keep A Secret: A Distributed Architecture For Secure Database Services
arteepu4
No ratings yet
Author: Kalinga Villages in Muntinlupa, Paranaque, and Las Piñas. Her Background in Teaching Preschool and
Document23 pages
Author: Kalinga Villages in Muntinlupa, Paranaque, and Las Piñas. Her Background in Teaching Preschool and
arteepu4
No ratings yet
Achieving High Performance With Application Outsourcing
Document16 pages
Achieving High Performance With Application Outsourcing
arteepu4
No ratings yet
Olmisoft Company Profile
Document19 pages
Olmisoft Company Profile
arteepu4
No ratings yet
Checkers
Document2 pages
Checkers
arteepu4
No ratings yet
How To Help Your Child Enjoy and Succeed at Piano Lessons: by Joseph Hoffman, M.M
Document5 pages
How To Help Your Child Enjoy and Succeed at Piano Lessons: by Joseph Hoffman, M.M
arteepu4
No ratings yet
Jyothi Nandikonda Supervisor: Olav Tirkkonen
Document15 pages
Jyothi Nandikonda Supervisor: Olav Tirkkonen
arteepu4
No ratings yet
Chinese Checkers: Adapted For The Piecepack by Mark A. Biggar
Document3 pages
Chinese Checkers: Adapted For The Piecepack by Mark A. Biggar
arteepu4
No ratings yet
Giant Chinese Checkers
Document2 pages
Giant Chinese Checkers
arteepu4
No ratings yet
Chinese Checkers Rules: Equipment
Document1 page
Chinese Checkers Rules: Equipment
arteepu4
No ratings yet
Seminar Formatkhjj
Document24 pages
Seminar Formatkhjj
Prasad Chavan
No ratings yet
A Simple Python Web Crawler...
Document5 pages
A Simple Python Web Crawler...
tnasrevid
100% (1)
Big Data Solution For Tourism PDF
Document10 pages
Big Data Solution For Tourism PDF
prave19
No ratings yet
OBELICS An Open Web-Scale Filtered
Document51 pages
OBELICS An Open Web-Scale Filtered
Anthony J.
No ratings yet
Acunetix
Document13 pages
Acunetix
retcal
No ratings yet
SEO Report
Document97 pages
SEO Report
sivascute
77% (13)
Cs6007 - Information Retrieval: Objectives: The Student Should Be Made To
Document24 pages
Cs6007 - Information Retrieval: Objectives: The Student Should Be Made To
Pavithra pavi
No ratings yet
List of Search Engines and Online Data - 2019
Document104 pages
List of Search Engines and Online Data - 2019
Association of Internet Research Specialists
No ratings yet
SEO Notes by Suren-1
Document11 pages
SEO Notes by Suren-1
sriram prasad
No ratings yet
Gsa Datasheet
Document6 pages
Gsa Datasheet
snana23
No ratings yet
Scrapy Documentation
Document230 pages
Scrapy Documentation
Superquant
No ratings yet
Chrome Os
Document7 pages
Chrome Os
vaibhavmakkar54
No ratings yet
Search Engine
Document10 pages
Search Engine
Tejas Morajkar
No ratings yet
2 Chepter 2
Document40 pages
2 Chepter 2
pankajusb
No ratings yet
Fun With Google
Document52 pages
Fun With Google
api-3761151
No ratings yet
The Top Ten Largest Databases in The World
Document8 pages
The Top Ten Largest Databases in The World
lewis_keller
No ratings yet
Smriti Mishra
Document15 pages
Smriti Mishra
Docukits
No ratings yet
How Search Engines Work Mike Grehan
Document57 pages
How Search Engines Work Mike Grehan
jayashree99
No ratings yet
SEO Syllabus
Document3 pages
SEO Syllabus
leealarik
No ratings yet
CompletedUNIT 1 PPT 10.7.17
Document87 pages
CompletedUNIT 1 PPT 10.7.17
Dr.A.R.Kavitha
100% (6)
Web Scraping With Python
Document21 pages
Web Scraping With Python
Satyam Kumar
No ratings yet
Seo Course
Document427 pages
Seo Course
Marina Shilova
No ratings yet
Reconspider
Document9 pages
Reconspider
rushabhp17
No ratings yet
Cs572 HW Nutch
Document7 pages
Cs572 HW Nutch
Easo Thomas
No ratings yet
Google Distributed System
Document40 pages
Google Distributed System
sebghat aslamzai
No ratings yet
Data Structures Proposal
Document5 pages
Data Structures Proposal
vedant kohli
No ratings yet
Final Pass4Sure
Document125 pages
Final Pass4Sure
JueySlamat
No ratings yet
DMDW Mod4@AzDOCUMENTS - in
Document44 pages
DMDW Mod4@AzDOCUMENTS - in
Rakesh Jain
No ratings yet
Thesis
Document37 pages
Thesis
Apoorva Hegde
No ratings yet
Social Media Marketing 3rd Edition Tuten Test Bank
Document42 pages
Social Media Marketing 3rd Edition Tuten Test Bank
mudholetheat3lv
100% (29)

Large Scale Semantic Data Integration And: Analytics Through Cloud: A Case Study in Bioinformatics

Uploaded by

Copyright:

Available Formats

You might also like

Large Scale Semantic Data Integration And: Analytics Through Cloud: A Case Study in Bioinformatics

Uploaded by

Document Information

Original Description:

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Large Scale Semantic Data Integration And: Analytics Through Cloud: A Case Study in Bioinformatics

Uploaded by

Copyright:

Available Formats

Large Scale Semantic Data Integration and Analytics through Cloud: A Case Study in Bioinformatics

Case study on antiviral proteins

Integration and Analysis

RDF/OWL based integration tools (e.g. TopBraid Suite)

Cloud-based bio data mining works (e.g. Kudtarkar P 2010)

Better data analytics

Data Infrastructure Module

Data Analytics Module

Cloud-based data store

Data Analytics Module

Data Infrastructure Module (Hadoop)

Cloud Based Data Store Hadoop Distributed File System

Data Analytics Module (Knowle)

Developed in Institute for Infocomm Research, Singapore

Biomedical data sources

Cloud-based data store

Cloud-based data store

Bio-medical data source

Crawled UniProt data

UniProt Parser Knowle Ontology Population Service

Crawled PubMed data

Cloud-based data store

Ontology Triplestore Protein + Literature ontology Knowle Text mining Service

Parsed Pubmed Data

Query & Reasoner

Knowle Query Service

KnowleGator Ontology Visual Query

Visual Query Translator

Ontology Query & Reasoner

A case study in Bio-informatics

Infrastructure (virtual computers)

You might also like