Google i Googol

Radeći na problemu pronalaženja relevantnih informacija iz ogromne količine podataka, dva stenfordska poslediplomca, Sergej Brin i Lari Pejdž, razvila su 1996. godine originalan metod za analizu linkova na web stranicama. Umesto da relevantnost svake web stranice u odnosu na traženi pojam utvrđuju isključivo na osnovu sadržaja, Sergej i Lari su posebnu težinu dali linkovima. Ako imate link na stranici A koji vodi do stranice B, onda je to jedan glas stranice A za stranicu B. Što više glasova stranica prikupi, to je njena relevantnost veća a njen glas teži. Algoritam koji su razvili, poznat kao PageRank, vremenom je usavršavan tako da se danas relevantnost svake stranice određuje na osnovu 500 miliona različitih parametara. Njihova prva verzija internet pretraživača, BackRub, ocenjena je vrlo pohvalno od kolega sa univerziteta i pozitivne kritike počele su da cirkulišu internetom. S obzirom na to da su kuburili sa novcem, Lari je potreban hardver sklapao od jeftinih komponenti (prvi štampač imao je kućište od Lego kockica). S obzirom na sve veći broj web stranica koje su smeštali u svoju bazu podataka i sve širi krug korisnika, Sergej i Lari nikad nisu imali dovoljno računara i prateće opreme.

Prvi prodor napravili su 1998. godine kada su na kreditne kartice kupili oko hiljadu gigabajta računarske memorije po bagatelnim cenama i smestili sav hardver u Larijevu spavaću sobu. Sergejeva soba postala je njihova prva kancelarija. Neprekidno polirajući svoju tehnologiju, istovremeno su se bacili i na traženje sponozora, s obzirom na to da im je vrlo brzo postalo jasno da sami ne mogu da drže korak sa troškovima.

POČETAK U GARAŽI: Prvo su se obratili jednom od osnivača Jahua, Dejvidu Fajlou, bez naročitog uspeha. Međutim, Endi Behtolshajm, jedan od osnivača Sun Microsystemsa, glatko im je napisao ček na 100.000 dolara i naslovio ga na Google Inc. Firma pod ovim imenom nije postojala, tako da je ček u trenutku izdavanja bio nenaplativ. Pošto su od rođaka i prijatelja pribavili osnivački kapital od oko milion dolara, Gugl je zvanično krenuo sa radom 7. oktobra 1998. u jednoj garaži u Menlo Parku (Kalifornija). Krajem iste godine stiže im prvo veliko priznanje: "PC magazin" ih uvršćuje u listu 100 najboljih sajtova i mašina za pretraživanje.

U februaru 1999. Gugl se sa svojih desetak zaposlenih seli u u Palo Alto. Veb sajt www.google.com već beleži 500.000 korisničkih pretraga dnevno. Redhat, največi svetski distributer Linuxa postaje prva komercijalna mušterija, delimično zato što Gugl koristi isključivo Linux na svojim serverima. Veliki igrači im se pridružuju, velika imena dobijaju posao u Guglu a par giganata iz Silicijumske doline ulaže 25 miliona dolara za pravo glasa u upravnom odboru. Firma se seli u Mauntin Vju (Kalifornija), u svoje današnje prostorije, tzv. Googleplex. Nakon još dve značajne nagrade, Webby i People's Voice Award, Gugl u junu 2000. godine objavljuje da u svojoj bazi ima podatke za preko milijardu web stranica i tako postaje najveća mašina za pretraživanje interneta.

Sergej, današnji predsednik kopmanije, kaže da je Gugl uspeo zato što je od početka imao dobar koncept i orijentaciju. Pretraživanje web stranica je, po učestanosti, druga aktivnost na internetu, odmah iza razmene elektronske pošte. Za razliku od sličnih kompanija koje su nastale 1996. i 1997. godine sa idejom da postanu "Jahu umesto Jahua", Gugl je od početka smatrao da će, sa rastom interneta, efikasna mašina za pretraživanje sa relevantnim rezultatima postati korisnija od beskrajno razgranatih kataloga u Jahu stilu.

Gugl dnevno odgovori na preko 200 miliona upita, pri čemu tokom najvećeg opterećenja obradi nekoliko hiljada korisničkih zahteva u sekundi. Zahtev se tipično izvršava za oko 0,3 sekunde i podrazumeva pretragu baze podataka u kojoj se nalazi preko tri milijarde indeksiranih web stranica u najrazličitijim formatima, nešto manje od milijardu konferencijskih (Usenet) poruka i 250 miliona slika. Guglovi "robotići", "spajderi" ili "botovi", potpuno autonomni programi koji permanentno "špartaju" internetom, beležeći nove stranice i ažurirajući informacije o već postojećim, iznova "preriljaju" čitav internet za oko mesec dana. Četiri od pet internet pretraga obavlja se pomoću Gugla.

Zaposliti se u Guglu, tj. postati "gugler", teže je nego dobiti posao u Majkrosoftu. Dnevno u firmu stigne 1500 biografija, godišnje se primi oko 300 novajlija, a proces analize, intervjuisanja i finalnog ocenjivanja uzme oko deset radnih dana po svakom od njih. Da biste prošli makar eliminacije neophodno je da vaš rezime bude natprosečan, da imate mrvu genijalnosti u sebi i da iza sebe imate originalne reference iz oblasti koje su interesantne za Gugl. To je teorija. U praksi, neophodno je da budete "pametnjaković", ne samo po tatinom i maminom mišljenju, da imate doktorat nekog univerziteta mnogo jačeg od "narodnog", da ono što radite zasnivate na naučnim dostignućima i da ste potpuno posvećeni svojoj struci. Gugl svake godine pokupi 90 odsto najboljih doktora nauka iz oblasti pretraživanja informacija. Gugl danas ima oko 800 guglera koji veruju da je njihova jedina misija da kreiraju nešto što je najbolje na svetu. Iako im pare sigurno ne manjkaju (godišnji prihodi Gugla procenjuju se na oko 300 miliona dolara), gugleri i dalje veruju da je dobar kompjuter važniji od kuće na morskoj obali ili sportskog automobila. Gugl do sada nije osetio informatičku recesiju koja je tokom poslednje dve-tri godine razorila na hiljade dot-komova (firmi čija je jedina prava imovina – web sajt). Ljudi jednostavno vole Gugl.

OD ČEGA ŽIVE "GUGLERI": Interna organizacija kompanije je vrlo specifična. Umesto klasične piramide na čijem se vrhu nalazi neprikosnoveni gazda a na dnu armija anonimnih mrava udarnika, sa višeslojnim rukovodećim aparatom čija kompetentnost opada od podnožja ka vrhu, Gugl se vremenom opredelio za rad u malim timovima od po dva-tri ravnopravna člana eliminišući menadžerski sloj. Svaki tim ima skoro neograničenu slobodu da realizuje svoje ideje bez velikog uplitanja sa vrha i motivisan je da probleme rešava samostalno. Umesto jednog ili dva opsežna referata mesečno, mala ekipa menadžera na vrhu sada dobija oko 160 kratkih izveštaja. Zaposleni su stimulisani da eksperimentišu i da rezultate svojih istraživanja stavljaju na uvid korisnicima u relativno ranoj fazi: tipičan primer za ovo je Google News, novi servis koji nije proizvod strateških planova menadžmenta, već originalna ideja Krišne Barat, jednog od guglera. Ovakvih eksperimentalnih projekata ima još desetak, a da li će ijedan od njih izaći iz svoje beta-faze ili će propasti, zavisi samo od broja korisnika i njihovog konačnog suda. Neuspešan projekat sam po sebi ne donosi negativne poene onima koji su u njegovoj realizaciji učestvovali: loši rezultati biće konvertovani u pozitivno iskustvo za naredne projekte. Bitno je jedino da projekat osuđen na propast propadne što pre. Nijedan započeti projekat nema neposrednu komercijalnu osnovu: osnovna deviza Gugla još od privh dana osnivanja bila je – ako bude interesa, novac će doći sam po sebi (u prvih 18 meseci postojanja, Gugl nije zaradio ni cent). Dok traje razvoj, o novcu se ne razmišlja. Kada se okupi dovoljan broj korisnika, novac će već početi da kaplje.

Od čega, zapravo, žive gugleri? Osnovni izvor prihoda su oglasi koji se plasiraju na stranicama rezultata pretrage, isključivo u tekstualnom obliku (kako brzina učitavanja stranica ne bi trpela), i to na prilično "demokratski način". Ako, na primer, tražite informaciju o automobilima, Gugl će vam priložiti i par reklamnih linkova do sajtova velikih proizvođača. Kompanije koje su Guglu platile više, pojavljivaće se češće u oglasima, ali samo inicijalno. U kasnijem periodu, reklamni linkovi na koje klikne veći broj korisnika pojavljivaće se češće od onih na koje ne klikne niko. Štaviše, "mrtvi" linkovi bivaju brzo eleminisani iz oglasne ponude, bez obzira na uložena sredstva oglašivača. Gugl jednostavno neće da zatrpava svoje izuzetno lojalne korisnike sadržajem koji nikom ne treba, makar on bio i marektinškog karaktera.

Drugi važan izvor prihoda je prodaja Gugl tehnologije. Velike kompanije poput CNN-a ili IBM-a imaju ogromne web prezentacije, što za javnost (internet), što za potrebe svojih partnera i zaposlenih (intranet). Jedino Gugl ima tehnologiju pomoću koje se do relevantne informacije dolazi na najbrži mogući način. U pitanju je takozvani Google in a Box, žuto ofarbani server koji je sam sebi dovoljan i koji odmah po priključenju na kompanijsku mrežu počinje da traga za informacijama, vrši njihovu obradu, rangiranje i klasifikaciju. Kad god na nekom velikom kompanijskom sajtu uočite mali Gugl logo, znajte da kompanija plaća Guglu najmanje 25.000 dolara godišnje.

Za razliku od Jahua i mnogih drugih koji uz katalogizaciju i pretraživanje interneta nude e-mail, kupi–prodaj i druge servise obilato zatrpane reklamama, Gugl je i dalje ostao veran svojoj prvobitnoj orijentaciji. Naslovna stranica Gugla je i dalje spartanska, kao što je to bila i pre pet godina, bez reklama i suvišne grafike. Štaviše, veličina naslovne stranice Gugla limitirana je na par stotina bajtova i tačno 37 reči – kada imate milione korisnika, svaki dodatni bajt predstavlja rizik da pretraga postane sporija a internet link zagušeniji. Gugl i dalje ima samo jedan bazičan servis, pretraživanje interneta, i ne želi da na svoju naslovnu stranu dodaje sadržaje koji će sputavati korisnike sa skromnijim hardverom. I dok će novopečeni internet surfer imati problema da zaključi čemu sve današnji Jahu služi, za Gugl je i dalje očigledno da ima samo jednu osnovnu svrhu: da bude najbolja, najpametnija i najjača mašina za pretraživanje.

Vlasnici Gugla nemaju nameru da prodaju svoju kompaniju, iako bi im to danas donelo negde između jedne i tri milijarde dolara. I dalje su opsednuti starom idejom: napraviti mašinu koja će umeti da pronađe, obradi i klasifikuje i poslednji delić informacije. Oficijelno zaposleni gugleri nisu jedini koji rade na razvoju. Gugl je odnedavno omogućio programerima širom sveta da razvijaju sopstvene aplikacije na bazi Gugl tehnologije i sa njom rade šta god žele, računajući da će talas novih ideja doneti korist kompaniji na duge staze.

Lako je razumljivo zašto svaka kompanija koja drži do sebe nastoji da se njen web sajt visoko kotira na relevantnim Guglovim pretragama. Možda "Britanika" zna mnogo, ali ako nekog ni Guglom ne možete da nađete, taj definitivno ne postoji. Kreatori web sajtova koriste čitav niz recepata, malih i velikih trikova, preporuka, vradžbina i dovijanja ne bi li ih Gugl rangirao bolje od konkurencije, naročito kada su u pitanju jednostavne pretrage po opštepoznatim pojmovima. Još veća umetnost je biti prvi. Autor ovog teksta uspeo je da napravi web sajt koji je Gugl rangirao kao broj 1 kada je u pitanju jedan od ključnih pojmova našeg nacionalnog identiteta – čuvenih "deset s lukom". Kako je uspeo u tome? Prvo vam treba jedna beba, stara otprilike sedam meseci. Za ostatak pitajte Gugl.

O imenu

Google je dobio ime modifikovanjem reči googol koja u matematici označava jedinicu iza koje sledi stotinu nula. Ovaj matematički naziv je neformalan, verovatno zato što ga je skovao Milton Sirota, devetogodišnji nećak matematičara Edvarda Kasnera. Ovo je prilično veliki broj, i u kosmosu ne postoji ništa u googol primeraka. Čak i kad prebrojite sve zvezde na nebu, zrnca peska u Sahari i Dafinine štediše zajedno, opet ih je manje od jednog googola. Za one koji se spremaju za učešće u nekom kvizu, recimo da postoji i googolplex, broj koji ima jednu jedinicu i googol nula.

Google ispod haube

Svoj renome najbrže mašine za pretraživanje Gugl u velikoj meri duguje svojoj hardverskoj infrastrukturi. Gugleri su vrlo rano zaključili da ukoliko svoju računarsku mrežu budu zasnovali na skupim serverima najvećih svetskih proizvođača, postoji realna opasnost da bankrotiraju usled ogromnih troškova. Umesto toga, opredelili su se za kupovinu velikog broja jeftinih, identičnih servera, zasnovanih na Intel procesorima i pouzdanim tvrdim diskovima iz ekonomske klase. Na ovaj hardver dolazi operativni sistem Linux, Gugl softver koji povezuje servere u jednu inteligentnu celinu i gigabitni internet link. Gugl je razvio sopstveni sistem za balansiranje opterećenja mreže tako da se svaki novi zahtev za pretragu upućuje serveru čije je opterećenje najmanje. Sistem je visoko redundantan: ako otkaže jedan disk u serveru, njegovu ulogu transparentno će preuzeti drugi disk. Ako otkaže čitav server, njegovu ulogu preuzeće susedni server u istom klasteru (grupi). Gugl ima rešenje i za slučaj da otkaže čitav klaster, tako da je teško zamislitit situaciju u kojoj će vam sve njegovo blago odjednom postati nedostupno.

Guglova "farma" servera trenutno ima oko deset hiljada računara, a njihov broj se svakoga dana uveća za oko trideset. Svi serveri su identično konfigurisani tako da je servisiranje i proširenje mreže veoma pojednostavljeno. Ukupna količina arhiviranih informacija meri se terabajtima a glavna baza podataka raspodeljena je na nekih 10.000 diskova. Kada mreža raste tempom od 25 odsto mesečno, fizički smeštaj uređaja počinje da predstavlja problem: Gugl od svojih dobavljača hardvera insistira na kompaktnom dizajnu jer po kompanijskim standardima u prostor veličine jednog kubnog metra mora da stane bar 80 servera.

Svi traže Šakiru

Gugl na kraju svake godine objavljuje svoj Zeitgeist, ili "Duh vremena" – vrlo detaljan pregled onoga što korisnici Gugla najčešće traže. Završni izveštaj za 2002. godinu napravljen je na osnovu statističke obrade 55 milijardi korisničkih zahteva. Evo nekoliko najinteresantnijih rezultata:

Najveći porast interesovanja

1. Spajdermen 2. Šakira 3. Zimska olimpijada 4. Svetski kup u fudbalu 5. Avril Lavinj

Najveći pad interesovanja

1. Nostradamus 2. Napster 3. Svetski trgovački centar 4. Antraks 5. Osama bin Laden

Najtraženije žene

1. Dženifer Lopez 2. Britni Spirs 3. Šakira 4. Hale Beri 5. Dženifer Lav Hjuit

Najtraženiji muškarci

1. Eminem 2. Bred Pit 3. Neli 4. 2pac 5. Vin Dizel

Najtraženije robne marke

1. Ferari 2. Soni 3. Nokija 4. Dizni 5. Ikea

Najtraženiji sportisti

1. Dejvid Bekam 2. Ana Kurnjikova 3. Ronaldo 4. Kobi Brajant 5. Zidan

Najtraženiji muzičari

1. Eminem 2. Šakira 3. Madona 4. Neli 5. 2pac

Najtraženije destinacije

1. Pariz 2. Kanada 3. Njujork 4. Indija 5. Las Vegas

Najtraženije slike žena

1. Britni Spirs 2. Pamela Anderson 3. Dženifer Lopez 4. Šakira 5. Ana Kurnjikova

Najtraženije slike muškaraca

1. Eminem 2. Bred Pit 3. Neli 4. 2pac 5. Vin Dizel

(Vreme #642)