Google File System – Google's Success Secret Google File System - Googles suksess Secret
GFS ot Google File System is one the most innovative feature of Google which forms the backbone of all the searches and storage of Google Technology. GFS ot Google File System er en nyskapende funksjon i Google som danner ryggraden i alle søk og lagring av Google Technology. GFS is a scalable distributed file system which is based on Linux, built with the just one aim, to handle BIG files. GFS er en skalerbar distribuert filsystem som er basert på Linux, bygd med bare ett mål, å håndtere BIG filer. Scalable means “the ability of a product or network to accommodate growth” where as Distributed means ” Thing which can be spread around, here its aim is to decentralize to handle multiple request for data. Skalerbar betyr "evnen til et produkt eller et nettverk for å imøtekomme veksten" hvor som Distributed betyr Thing som kan spres rundt, her sitt mål er å decentralize å håndtere flere forespørsel om data.
What is GFS? Hva er GFS?
GFS as I described above is storage system which allows main functionality of storage, processing search and retrieval and in case of failure should be able to self correct it in order to retrieve huge amount of data which Google's paper say is in terms of Multi-GB. GFS som jeg har beskrevet ovenfor er lagringssystem som lar viktigste funksjonaliteten til lagring, bearbeiding søk og gjenfinning og i tilfelle av svikt bør kunne selv igjen for å hente enorme mengden data som Google's papir si i form av flere GB .
How GFS Work? Hvordan GFS arbeid?
According to Google Lab's Jeffery Dean, The idea behind GFS is to store data reliably even in the presence of unreliable machines. Ifølge Google Lab's Jeffery Dean, Ideen bak GFS er å lagre data pålitelig selv i nærvær av upålitelige maskiner. The GFS system works on master slave module. Den GFS systemet fungerer på master slave modulen. There is one machine which acts as server and several other which are slaves or node. Det er en maskin som fungerer som server og flere andre som slaver eller node.
The master is responsible to keep track of “which data is stored on which machine” , called as meta data ( data about data). Mestertjeneren er ansvarlig for å holde rede på hvilke data som er lagret på hvilken maskin ", heter som meta data (data om data). The GFS is said to maintain 3 copies of any data or file including executable. Den GFS sies å opprettholde 3 kopier av data eller filer inkludert kjørbare. The meta data resides on the main memory of Master , ie on ram, thus allowing faster access.GFS was designed to store huge amount of data, till current date, The meta data ligger på hovedsiden minne om Master, dvs. på ram, og dermed gir raskere access.GFS ble utviklet for å lagre store mengder data, til dagens dato,
The largest Google Cluster ( Cluster is group of computers together as network) stores hundreds of terrabytes of memory across thousands of disks. Den største Google Cluster (Cluster er gruppe datamaskiner sammen i nettverk) lagrer hundrevis av terrabytes minne tusenvis av disker.
How Data Failure and tolerance works in GFS ? Hvordan Data Failure og toleranse fungerer i GFS?
In GFS, The master server handles all the requests , which in turn transfer the request to exact location of data to one or more nodes or slaves. I GFS, The master server håndterer alle henvendelser som i sin tur overføre forespørselen til nøyaktig plassering av data til en eller flere noder eller slaver. In case the request takes more time than alloted the system switches to a backup-copy ( the reason of maintaining 3 copies!!). Ved forespørsel tar mer tid enn alloted systemet skifter til en backup-kopi (på grunn av vedlikehold 3 eksemplarer!).
In case of one of the slaves or nodes fail, its Master which is responsible to maintain the count of nodes either by reallocating ro some other machine or creating a duplicate copy. I tilfelle en av slaver eller noder mislykkes, dets Master som er ansvarlig for å opprettholde antall noder enten ved reallocating ro noen andre maskinen eller lage en kopi. Although there is only single master “active” at any given point, the state of master ( log of what the master has been doing) is present on other machines too. Selv om det bare er én master "aktiv" på et gitt punkt, staten master (logg over hva herren har gjort) er til stede på andre maskiner også.
Thus in case of failure of master , another machine which knows what the failed master was doing takes the position and keeps the work on move.This is an overview of how GFS works. Således i tilfelle feil på master, en annen maskin som vet hva den mislykkede master gjorde tar stilling og holder arbeidet med move.This er en oversikt over hvordan GFS fungerer. For more technical details look at For flere tekniske detaljer, se på GFS Papers GFS Papers Next post I will talk about Neste innlegg vil jeg snakke om MapReduce Tech used by Google MapReduce Tech brukes av Google which forms another heart of Google's success. som utgjør en annen hjertet av Googles suksess.

Posted on 14th April 2007 by Skrevet på 14 apr 2007 av Ashish Mohta Ashish Mohta , A tech blogger who writes about solving day to day problems of people who use computer. , A tech blogger som skriver om løse daglige problemer for personer som bruker datamaskinen. He also writes on How to use the applications like Office, PC tips, Online tools,Browsers and more. All posts by Han skriver om hvordan du bruker programmer som Office, PC tips Online verktøy, Nettlesere og mer. Alle innlegg av Ashish Mohta Ashish Mohta | Connect with me @ | Kontakt med meg @ Twitter Twitter | | Linkedin Linkedin | | Facebook Facebook | | Stumble Snuble | Need more help? | Trenger du mer hjelp? Ask your Questions at our Still dine spørsmål i vår Support Center Support Center




























Free Email Subscription
One Comment En kommentar » »
Leave your response! Forlat ditt svar!