Welcome to Scribd!

Fault Avoidance and Tolerance Technique

Uploaded by

0% found this document useful (0 votes)

588 views15 pages

This document discusses fault tolerance techniques in computing systems. It defines different types of faults and explains how redundancy, such as triple modular redundancy, can be used to achieve fault tolerance. The goal of fault tolerant computing is to maintain system dependability, reliability, availability, and safety even in the presence of faults through approaches like information, time, and physical redundancy.

Original Description:

fault tolerance

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Attribution Non-Commercial (BY-NC)

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pptx, pdf, or txt

0% found this document useful (0 votes)

588 views15 pages

Fault Avoidance and Tolerance Technique

Uploaded by

tipo_de_incognito

Copyright:

Attribution Non-Commercial (BY-NC)

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pptx, pdf, or txt

Jump to Page

You are on page 1of 15

Search inside document

FAULT AVOIDANCE AND TOLERANCE TECHNIQUE

Nithiyanandham M. Pavithra R.

Fault-Intolerance and Fault-Tolerance

The fault intolerance (or fault-avoidance) approach improves system reliability by removing the source of failures (i.e., hardware and software faults) before normal operation begins

The approach of fault-tolerance expect faults to be present during system operation, but employs design techniques which insure the continued correct execution of the computing process

FAULTS

A DS should be fault-tolerant Should be able to continue functioning in the presence of faults

Fault tolerance is related to dependability Deviation from expected behavior Due to a variety of factors: Hardware failure Software bugs Operator errors Network errors/outages

Dependability
Dependability Includes Availability Reliability Safety Maintainability

Availability: A measurement of whether a system is ready to be used immediately. System is up and running at any given moment Reliability: A measurement of whether a system can run continuously without failure. System continues to function for a long period of time A system goes down 1ms/hr has an availability of more than 99.99%, but is unreliable A system that never crashes but is shut down for a week once every year is 100% reliable but only 98% available Safety: A measurement of how safe failures are System fails, nothing serious happens For instance, high degree of safety is required for systems controlling nuclear power plants Maintainability: A measurement of how easy it is to repair a system A highly maintainable system may also show a high degree of availability

A fault is the cause of the error An error is part of a system state that may lead to a failure A system fails when it cannot meet its promises (specifications) Faults can be three categories Transient (appear once and disappear) Intermittent (appear-disappear-reappear behavior) A loose contact on a connector intermittent fault Permanent (appear and persist until repaired)

FAULTS
Any fault may be fail-silent (fail-stop) Byzantine synchronous system vs. asynchronous system E.g., IP packet versus serial port transmission

ACHIEVING FAULT TOLERENCE

Redundancy information redundancy Hamming codes, parity memory ECC memory time redundancy Timeout & retransmit physical redundancy/replication TMR, RAID disks, backup servers Replication vs. redundancy: Replication: multiple identical units functioning concurrently
vote on outcome

REDUNDANCY
Redundancy is key technique for hiding failures When one unit is functioning others are available to fill in in case the unit ceases to work. Redundancy types: 1. Information: add extra (control) information Error-correction codes in messages 2. Time: perform an action persistently until it succeeds: Transactions 3. Physical: add extra components (S/W & H/W) Process replication, electronic circuits

ACTIVE REPLICATION Technique for fault tolerance through physical redundancy No redundancy:

Triple Modular Redundancy (TMR): Threefold component replication to detect and correct a single component failure

Availability: how much fault tolerance? 100 % fault-tolerance cannot be achieved. The closer we wish to get to 100%, the more expensive the system will be. Availability: % of time that the system is functioning five nines: system is up 99.999% of the time: 55.6 minutes downtime per year Three nines: system is up 99.9% of the time: 8.76 hours downtime per year Downtime includes all time when the system is unavailable.

GOAL OF FAULT TOLERANT COMPUTING

Dependability Reliability Availability Safety Security Performability Maintainability Testability Goal of tolerance

POINTS OF FAILURE Points of failure: A system is k-fault tolerant if it can withstand k faults. Need k+1 components with silent faults k can fail and one will still be working Need 2k+1 components with Byzantine faults k can generate false replies: k+1 will provide a majority vote

105 Universal Laws
Document17 pages
105 Universal Laws
tipo_de_incognito
50% (2)
Human Resource Management CB Gupta New Edition
Document2 pages
Human Resource Management CB Gupta New Edition
Girish Kumar
25% (12)
Advanced Process Control: Beyond Single Loop Control
From Everand
Advanced Process Control: Beyond Single Loop Control
Cecil L. Smith
No ratings yet
Discourses of Babuji Maharaj Vol-3
Document629 pages
Discourses of Babuji Maharaj Vol-3
tipo_de_incognito
No ratings yet
Discourses of Babuji Maharaj Vol-3
Document629 pages
Discourses of Babuji Maharaj Vol-3
tipo_de_incognito
No ratings yet
Discourses of Babuji Maharaj Vol-3
Document629 pages
Discourses of Babuji Maharaj Vol-3
tipo_de_incognito
No ratings yet
Logan CCTV Complete Manual
Document18 pages
Logan CCTV Complete Manual
Jofel Dulguime Suan
No ratings yet
Chapter 3
Document40 pages
Chapter 3
Amanuel Tefera
No ratings yet
Fault Tolerance Slides
Document18 pages
Fault Tolerance Slides
Amna Nadeem
No ratings yet
Fault Tolerance Slides
Document18 pages
Fault Tolerance Slides
Vaijayanthi
No ratings yet
Introduction To Fault Tolerance
Document20 pages
Introduction To Fault Tolerance
ankitbhattt
No ratings yet
Dependability of Railway Control & Communications Systems v3.1
Document28 pages
Dependability of Railway Control & Communications Systems v3.1
ditowijanarko
No ratings yet
Dependability of Railway Control & Communications Systems v2
Document28 pages
Dependability of Railway Control & Communications Systems v2
Shashi Bhusan Singh
100% (1)
Availability
Document30 pages
Availability
elaaf nawaz
No ratings yet
SDA Unit 1 - Chapter Availability
Document16 pages
SDA Unit 1 - Chapter Availability
ezhil
No ratings yet
SWE-600 SW Dependable System
Document48 pages
SWE-600 SW Dependable System
Mark Williams
No ratings yet
Design For Six Sigma - Contd..: Session13
Document43 pages
Design For Six Sigma - Contd..: Session13
kapilkg8
100% (1)
Reliability
Document58 pages
Reliability
rahulyadav5122000
No ratings yet
Lecture 7 - FAULT-TOLERANT COMPUTING
Document13 pages
Lecture 7 - FAULT-TOLERANT COMPUTING
Dj Mckenzie
No ratings yet
Dependable and Secure Computing Concepts
Document14 pages
Dependable and Secure Computing Concepts
Janaki Jan
No ratings yet
Intro To DS Chapter 6
Document51 pages
Intro To DS Chapter 6
Habib Muhammed
No ratings yet
Performance-Related Attributes: Presented By: Eddie Santillan
Document16 pages
Performance-Related Attributes: Presented By: Eddie Santillan
Ric Laurence Sayson
No ratings yet
Rts
Document44 pages
Rts
Moustapha Rachidi
No ratings yet
Software Reliability: by Allesh Panda Iiit BBSR
Document37 pages
Software Reliability: by Allesh Panda Iiit BBSR
Cieluu Panda
No ratings yet
Real-Time Systems: Frank Drews
Document30 pages
Real-Time Systems: Frank Drews
Shresth Kumar
No ratings yet
Fault Management
Document19 pages
Fault Management
Hamedullah
No ratings yet
Fault Dectection Max Hohenberger
Document27 pages
Fault Dectection Max Hohenberger
yassinebouazzi
No ratings yet
Lec 3
Document30 pages
Lec 3
salution technology
No ratings yet
Designing A Control System For High Availability
Document10 pages
Designing A Control System For High Availability
Zulkernain Omer Tariq
No ratings yet
Fault Tolerance: Click To Add Text Dealing Successfully With Partial System. Key Technique: Redundancy
Document48 pages
Fault Tolerance: Click To Add Text Dealing Successfully With Partial System. Key Technique: Redundancy
sengupta
No ratings yet
Modul 4. Availability Concepts
Document46 pages
Modul 4. Availability Concepts
kelvin
No ratings yet
PPT3-S3 - Availability
Document35 pages
PPT3-S3 - Availability
Dinne Ratj
No ratings yet
Session 12: Implementation and Maintenance Strategies
Document18 pages
Session 12: Implementation and Maintenance Strategies
toabhishekpal
No ratings yet
Module 1
Document20 pages
Module 1
pranav
No ratings yet
Unit 11 Dependability-and-Security
Document39 pages
Unit 11 Dependability-and-Security
Mysto Gan
No ratings yet
FALLSEM2021-22 ITA1004 TH VL2021220105942 Reference Material I 24-11-2021 Unit 6 Security and Dependability
Document99 pages
FALLSEM2021-22 ITA1004 TH VL2021220105942 Reference Material I 24-11-2021 Unit 6 Security and Dependability
Riyanshi Kedia 21BCA0022
No ratings yet
2.fall 23 Lecture2QualityMetrics
Document62 pages
2.fall 23 Lecture2QualityMetrics
saminayeem2
No ratings yet
Software Fault-Tolerance Fundamental Concepts: Ms. Arfaa Asaf
Document31 pages
Software Fault-Tolerance Fundamental Concepts: Ms. Arfaa Asaf
Shabab
No ratings yet
Technical Essentials of HP Servers, Rev. 11.41
Document72 pages
Technical Essentials of HP Servers, Rev. 11.41
Anonymous CZVjyUz
No ratings yet
Notes On Fault Tolerance
Document2 pages
Notes On Fault Tolerance
gauraharidas
No ratings yet
Software Reliability
Document25 pages
Software Reliability
sbr11
No ratings yet
Fault Tolerance in Distributed Systems
Document6 pages
Fault Tolerance in Distributed Systems
Heidar Usmael Jundi
No ratings yet
High Availaility
Document8 pages
High Availaility
hamid.shalbaf.tabar
No ratings yet
Reliability and Reusability
Document35 pages
Reliability and Reusability
Sneha Anantha
No ratings yet
Multiprocessing Schedulling
Document22 pages
Multiprocessing Schedulling
Oscar Loor
No ratings yet
RTOS New
Document83 pages
RTOS New
110059
No ratings yet
DC - Content
Document2 pages
DC - Content
Fatma Sakr
No ratings yet
Ascs 04 0213
Document5 pages
Ascs 04 0213
solma
No ratings yet
Lec 2
Document39 pages
Lec 2
Mushahid Hussain Nomee
No ratings yet
03 - Reliability Software
Document56 pages
03 - Reliability Software
Aparkenthon
No ratings yet
Reliability Engineering
Document44 pages
Reliability Engineering
Sarthak Raut
No ratings yet
01 en Principles of Distributed Systems
Document35 pages
01 en Principles of Distributed Systems
yagcifuad
No ratings yet
Network+ Guide To Networks 5 Edition: Ensuring Integrity and Availability
Document90 pages
Network+ Guide To Networks 5 Edition: Ensuring Integrity and Availability
Ryan Ortega
No ratings yet
13) A Distributed System: Feasibility
Document5 pages
13) A Distributed System: Feasibility
bahiru belina
No ratings yet
Reliable System Design: Hardware Design Checklist Testing Embedded Systems Critical Systems
Document28 pages
Reliable System Design: Hardware Design Checklist Testing Embedded Systems Critical Systems
Demke Adugna
No ratings yet
20-Distributed Architecture and Features-28!02!2024
Document24 pages
20-Distributed Architecture and Features-28!02!2024
cybersyndicatenft
No ratings yet
Module 3 Understanding Quality Attributes
Document41 pages
Module 3 Understanding Quality Attributes
Armando Gutierrez
No ratings yet
Glossary - 02 Reliability in Computer Systems
Document3 pages
Glossary - 02 Reliability in Computer Systems
victorwu.uk
No ratings yet
tmpAA19 TMP
Document10 pages
tmpAA19 TMP
Frontiers
No ratings yet
Software Reliability
Document16 pages
Software Reliability
Nida Khan
No ratings yet
Fault Tolerant Computing
Document4 pages
Fault Tolerant Computing
Mayowa Sunusi
No ratings yet
2 Fall22-Lecture2QualityMetrics
Document68 pages
2 Fall22-Lecture2QualityMetrics
Tarikul Islam
No ratings yet
4 Fault Tolerance Notes
Document9 pages
4 Fault Tolerance Notes
Yimnai C.Y
No ratings yet
Fault Tolerance
Document49 pages
Fault Tolerance
Maria Ngigi
No ratings yet
Semi-Markov Models: Control of Restorable Systems with Latent Failures
From Everand
Semi-Markov Models: Control of Restorable Systems with Latent Failures
Yuriy E Obzherin
No ratings yet
Feedback Control Theory
From Everand
Feedback Control Theory
Bruce Francis
Rating: 5 out of 5 stars
5/5 (1)
Light Body Study Sequence
Document0 pages
Light Body Study Sequence
tipo_de_incognito
No ratings yet
Confessions of A God Seeker
Document0 pages
Confessions of A God Seeker
tipo_de_incognito
100% (1)
Discourses of Babuji Maharaj Vol-1
Document547 pages
Discourses of Babuji Maharaj Vol-1
tipo_de_incognito
No ratings yet
Way of The Saints - Kirpal Singh
Document424 pages
Way of The Saints - Kirpal Singh
Fashji
100% (3)
Discourses of Babuji Maharaj Vol-2
Document583 pages
Discourses of Babuji Maharaj Vol-2
tipo_de_incognito
No ratings yet
Week One Ilab SCI 228
Document2 pages
Week One Ilab SCI 228
tipo_de_incognito
No ratings yet
BMWW
Document1 page
BMWW
tipo_de_incognito
No ratings yet
Ac Servo Motor Principal PDF
Document26 pages
Ac Servo Motor Principal PDF
Aman Deep
86% (7)
Gain Margin, Phase Margin, and Crossover Frequencies - MATLAB Margin
Document3 pages
Gain Margin, Phase Margin, and Crossover Frequencies - MATLAB Margin
tipo_de_incognito
No ratings yet
10.16 and 10.18
Document1 page
10.16 and 10.18
tipo_de_incognito
No ratings yet
Myanmar 10-03-10 Increased Burma Abuses-2
Document1 page
Myanmar 10-03-10 Increased Burma Abuses-2
tipo_de_incognito
No ratings yet
The One-Loop and Sommerfeld Electroweak Corrections To The Wino Dark Matter Annihilation
Document26 pages
The One-Loop and Sommerfeld Electroweak Corrections To The Wino Dark Matter Annihilation
tipo_de_incognito
No ratings yet
BB Ass 4
Document15 pages
BB Ass 4
aqsa maryam
No ratings yet
New
Document97 pages
New
Petsuca
No ratings yet
Data Communication: Lecturer: Fahim Shahzad
Document33 pages
Data Communication: Lecturer: Fahim Shahzad
kaif Bangash
No ratings yet
Linux
Document72 pages
Linux
Mishraa_ji
No ratings yet
Installation Utility
Document130 pages
Installation Utility
ShaileshDyade
No ratings yet
Denah TLP Dan Lan Lantai 2: SKALA 1: 200
Document6 pages
Denah TLP Dan Lan Lantai 2: SKALA 1: 200
Ega Ahmad
No ratings yet
VRP Deploy 2 2
Document307 pages
VRP Deploy 2 2
StaceyPayne-Izzo
No ratings yet
HANA Stonith Document
Document101 pages
HANA Stonith Document
Patha Vamshi
No ratings yet
TRIMBLE SCS 900 Manual EN
Document126 pages
TRIMBLE SCS 900 Manual EN
Cosmin Cautis
No ratings yet
SEMS: The SIP Express Media Server: Frafos GMBH
Document8 pages
SEMS: The SIP Express Media Server: Frafos GMBH
chingo9252
No ratings yet
2013 12 05 - Tcpflow and BE Update
Document70 pages
2013 12 05 - Tcpflow and BE Update
Agung Rachmat
No ratings yet
AWAD All PDF Lectures
Document569 pages
AWAD All PDF Lectures
Amar Riaz
No ratings yet
Mod 9 Introduction To CISCO IOS ICCNIOS003
Document66 pages
Mod 9 Introduction To CISCO IOS ICCNIOS003
Mao Bouricha
No ratings yet
ClickShare CX-50
Document4 pages
ClickShare CX-50
nury virguez
No ratings yet
DSM 3
Document58 pages
DSM 3
Oscar Javier Amezquita
No ratings yet
IWCS 2015 Balunless Measurement of Coupling Attenuation
Document10 pages
IWCS 2015 Balunless Measurement of Coupling Attenuation
Munkhbat Durvunchuluun
No ratings yet
SmartPTT Enterprise 9.0 Radioserver Configurator User Guide
Document171 pages
SmartPTT Enterprise 9.0 Radioserver Configurator User Guide
SmartPTT
No ratings yet
Msi 2012 - Q1 - PG - All
Document51 pages
Msi 2012 - Q1 - PG - All
zaskribdo
No ratings yet
Cisco WLC Controllers Summary 2015
Document7 pages
Cisco WLC Controllers Summary 2015
Owais AB
No ratings yet
AT Commands & Logging: Chin Gang Wu, Application Engineer 29 September, 2016 Rev. A Confidential
Document20 pages
AT Commands & Logging: Chin Gang Wu, Application Engineer 29 September, 2016 Rev. A Confidential
Chin GangWu
No ratings yet
Digital Transmission Through AWGN Channel
Document68 pages
Digital Transmission Through AWGN Channel
khadeja albayaty
No ratings yet
NX 5500 Data Sheet
Document2 pages
NX 5500 Data Sheet
ugur
No ratings yet
Headset Hookswitch Control For Cisco Unified Ip Phones.: Jabra Gn9350/Jabra Gn9350E
Document2 pages
Headset Hookswitch Control For Cisco Unified Ip Phones.: Jabra Gn9350/Jabra Gn9350E
Guillermo Erik Becerra
No ratings yet
Micom S1 Agile Micom S1 Agile
Document13 pages
Micom S1 Agile Micom S1 Agile
Trigras Bangun Perkasa
No ratings yet
CISA Certified Information Systems Auditor Module Study Guide
Document309 pages
CISA Certified Information Systems Auditor Module Study Guide
Shivang Kotecha
100% (3)
Release GXV35xx GXV36xx T1.0.1.91 0
Document13 pages
Release GXV35xx GXV36xx T1.0.1.91 0
Juliano Alves Fernandes
No ratings yet
2 Discovery 1 Lab Familiarization (Base Learning Lab)
Document13 pages
2 Discovery 1 Lab Familiarization (Base Learning Lab)
ADEM ASRES
No ratings yet
The Ultimate Experience With IPTV For Hotel and MDU
Document36 pages
The Ultimate Experience With IPTV For Hotel and MDU
apichan
No ratings yet