|
Największa, najszybsza, najdokładniejsza - takie określenia padają często, kiedy mowa jest o Google. Trudno się z nimi nie zgodzić, obecnie jest to zdecydowanie najlepsza wyszukiwarka i chyba jeden z niewielu serwisów, o którym przyszłe pokolenia będą się uczyć na lekcjach historii Internetu. Nazwa Google to zabawa angielskim słowem „googol", które jest określeniem na liczbę 10 do potęgi 10 (1 i 10 zer). Taka nazwa wyszukiwarki ma nawiązywać do jej przeogromnego indeksu stron. Każdego dnia do wyszukiwarki trafia ok. 150 milionów zapytań. Zdecydowana większość z nich jest obsługiwana w czasie < 0,5 sekundy. W indeksie Google znajduje się ponad 2 miliardy stron - jeśli by je wydrukować i ułożyć kartka na kartce, to taki stos miałby wysokość prawie 200 kilometrów! Archiwa Google Groups obejmują ponad 700 milionów wiadomości o łącznej objętości ponad terabajta. Szukasz czegoś? Wchodzisz na Google (http://google.com), zadajesz pytanie i od razu otrzymujesz odpowiedź. Dla wielu młodszych stażem internautów taki stan rzeczy jest całkiem normalny, jednak jeszcze kilka lat temu cyfrowi surferzy mogli tylko marzyć o czymś takim. Entuzjaści sieci zmuszeni do korzystania z mało obszernych katalogów i bardzo zawodnych wyszukiwarek szybko tracili zapał do serfowania, a w założeniu wygodne przeglądanie światowych zasobów stawało się drogą przez mękę, bo znalezienie czegokolwiek było po prostu bardzo trudne. Mimo kiepskiej skuteczności ośrodki wyszukiwawcze, takie jak AltaYista (http://altavista.com) czy Infoseek (http://infoseek.com), obecnie połączony z Go.com, cieszyły się i o dziwo wciąż cieszą dużą popularnością. Tak duże zainteresowanie wyszukiwarkami motywowało wielu wybitnych specjalistów, jak i dopiero początkujących entuzjastów sieci do podejmowania prób tworzenia coraz to lepszych wyszukiwarek i katalogów. Jeden z największych polskich portali, Wirtualna Polska, też początkowo był tylko katalogiem stron WWW stworzonym przez grupę entuzjastów. Jak się to wszystko zaczęło? Historia najlepszej wyszukiwarki nie jest wcale inna. Google to dzieło dwóch młodych ludzi, którzy niemal przez przypadek poznali się na Uniwersytecie Stanford w USA. W roku 1996 Larry Page i Sergey Brin rozpoczęli prace nad wyszukiwarką BackRub, która od innych systemów tego typu różniła się tym, iż dogłębnie analizowała odnośniki prowadzące do danej strony umieszczone w innych dokumentach. Równocześnie Lary starał się stworzyć system, który mógłby obsłużyć miliony dokumentów oraz zapytań i działałby w sieci zbudowanej z tanich pecetów. Niewątpliwe to mu się udało i dziś Google działa w oparciu o takie właśnie relatywnie niedrogie serwery. BackRub rósł w siłę i zdobywał coraz większą popularność. Problemem stały się pieniądze, a właściwie ich brak - dwaj entuzjaści sieci mieli olbrzymie trudności ze zdobywaniem środków na zakup nowych komputerów do ich wewnętrznej sieci, które najczęściej po prostu pożyczali. Rozpoczęli więc pewne działania marketingowe (otwarcie biura), które miały pomóc w znalezieniu firmy zainteresowanej wykorzystaniem na własnych stronach ich wyszukiwarki. Niestety, rozmowy z przedstawicielami będących na fali portali (dotcomy miały wtedy swój złoty okres) nie przyniosły żadnych konkretnych efektów. Największy z wielkich, czyli Yahoo, wykazał nawet pewne zainteresowanie, jednak poważne rozmowy miały odbyć się dopiero wtedy, gdy Google (tak już wtedy nazywała się wyszukiwarką) będzie w pełni gotowa. Wobec takiego obrotu sprawy Larry i Sergey napisali biznesplan i ruszyli na poszukiwanie inwestora. Zaczęli od powiązanego z ich uniwersytetem Andyego Bechtolsheima, współzałożyciela Sun Microsystems. Spotkanie z szefem Suną miało miejsce wczesnym rankiem i trwało krótko, bowiem Bechtolsheim spieszył się na ważne zebranie. Po obejrzeniu przygotowanej przez Larryego i Sergeya prezentacji Bechtolsheim, będący pod presją czasu, bez zbędnych dyskusji wyjął czek i wypisał go na 100 tys. USD dla „Google Inc.". Dzięki tym pieniądzom Larry i Sergey mogliby oddać długi i przenieść serwerownię w lepsze miejsce (dotąd mieściła się na uczelni), jednak pojawił się mały problem - otóż z punktu widzenia prawa nie istniało coś takiego jak Google Inc., podjęcie pieniędzy było więc niemożliwe. Czek musiał poczekać, aż firma zostanie oficjalnie zarejestrowana. Tak też się stało, a w tym czasie fundusze urosły do okrągłego miliona dolarów. 7 września 1998 r. marzenie się ziściło - firma Google Inc. Zaczęła działać w swojej własnej siedzibie (na razie niezbyt okazałej), a jej założyciele zatrudnili pierwszego pracownika. Google rosło w siłę i dziennie obsługiwało ok. 10 tysięcy zapytań, choć była to wciąż wersja alpha. W grudniu tego samego roku PC Magazine umieścił Google na liście stu najlepszych stron w kategorii „wyszukiwarki". Rok 1999 to dwie kolejne przeprowadzki, a także pozyskanie 25 milionów USD od firm typu venture capital, których przedstawiciele zasiedli na dyrektorskich stołkach firmy. Ten rok to także wdrożenie Google do dużych portali (w tej chwili z jej mechanizmu korzysta m.in. Yahoo, Wirtualna Polska), następne wyróżnienia, a także wyjście ze stadium beta, co miało miejsce 21 września. Dalszą historię wszyscy już znamy... kolejne udoskonalenia, kolejne nagrody (m.in. trzykrotnie Webby Avard). To wszystko złożyło się na to, że dziś Google jest bez wątpienia największą najlepsza wyszukiwarką. Jak działa Google? Siła Google tkwi we wspomnianej już technologii analizującej stronę pod kątem prowadzących do niej odnośników umieszczonych innych stronach. Brzmi zawile? Oto przykład: strona xyz.com to popularna witryna sportowa, do której jej miłośnicy często odwołują się na swoich prywatnych stronach (np. umieszczając odnośniki do relacji z imrezz sportowych). Konkurencyjna strona z.com pod względem treści nie jest wiele gorsza, ale ponieważ działa krótko, nie doczekała się jeszcze wiernych fanów, którzy na swoich stronach umieszczaliby do niej nośniki. W wynikach wyszukiwania Goole, gdy treść obu witryn będzie w mniej więcej takim samym stopniu odpowiadała zapytaniu, pierwsza strona w 9 na 10 przypadków pojawiać się będzie przed tą o adresie zyz.com. Podobnie wyszukiwarką będzie bardziej promować newsa umieszczonego na łamach znanego portalu, niż na prywatnej stronie Jasia Kowalskiego, który go po prostu na nią przekopiował. Taka analiza stron praktyce sprawdza się doskonale – Google na samej górze umieszcza odnośniki najbardziej wiarygodne, zaś te mniej pewne umieszcza niżej, na dalszych stronach. Oczywiście PageRank, bo tak nazywa się owa opatentowana technika, to tylko rozszerzenie głównego algorytmu oceny dokumentów, który przy wyszukiwaniu bierze pod uwagę przede wszystkim prawdziwą zawartość strony, analizując nie tylko „gęstość" występowania słów kluczowych, ale też ich położenie na stronie, wielkość czcionek itp. Oprócz dokumentów HTML Google przeszukuje także pliki w 12 innych formatach m.in. PDF, DOC, PostScript czy RTF. W praktyce Google śmiało można określić mianem portalu, bowiem jest to autentyczna „brama do Internetu". Podstawowe serwisy wchodzące w skład oferty Google to: wyszukiwarka stron WWW, wyszukiwarką grafiki, wyszukiwarka, archiwum i bramka WWW - Usenet, katalog stron WWW oparty na DMOZ (http://dmoz.org) i innowacyjna wyszukiwarka w WAP. Strony Google skonstruowane są tak, że przejście z jednego działu do drugiego odbywa się płynnie - po skończeniu przeszukiwania stron WWW wystarczy kliknąć odnośnik prowadzący do serwisu grup dyskusyjnych, a zostaną one automatycznie przeszukane pod kątem frazy, którą wcześniej podaliśmy. Wygląd wszystkich stron w domenie google.com jest prosty, przejrzysty i w minimalnym tylko stopniu wykorzystuje grafikę - wszystko to sprawia, że poruszanie się po stronach Google jest łatwe i szybkie. Strony WWW/Katalog http://www.google.pl http://www.google.com Najczęściej wykorzystywanym działem Google jest wyszukiwarką stron WWW, która zajmuje eksponowane miejsce na stronie głównej. Formularz wyszukiwania w swej podstawowej formie wygląda raczej skromnie, wyróżnia się tylko dodatkowym, obok standardowego Szukaj, przyciskiem o nazwie Szczęśliwy Traf (jego oryginalna nazwa to I'm Feeling Lucky). Ten dodatkowy przycisk to mała ekstrawagancja twórców Google i ukłon w stronę niepoprawnych optymistów - po wpisaniu poszukiwanej frazy i wciśnięciu właśnie jego, a nie standardowego Szukaj zostaniemy od razu, z pominięciem wyświetlania wyników, przeniesieni na pierwszą stronę odpowiadającą kryteriom wyszukiwania. To nie jedyna innowacja, jaką wprowadziło Google. Kolejną jest to, że wyszukiwarką domyślnie przeszuka strony pod kątem występowania na nich wszystkich podanych przez nas słów kluczowych. Nie ma, więc potrzeby poprzedzania ich operatorami logicznymi typu AND czy +. Wpisując ford taunus otrzymamy dokładnie te same wyniki, na jakie w innych wyszukiwarkach moglibyśmy liczyć po wpisaniu +ford +taunus. Istotna jest kolejność, w jakiej wprowadzamy poszczególne słowa kluczowe, gdy wpiszemy: taunus ford, liczba znalezionych stron nie ulegnie zmianie, jednak będą one posortowane inaczej - słowa kluczowe podawajmy więc w takiej kolejności, w jakiej chcielibyśmy znaleźć je na stronie lub hierarchizujmy je pod wzglądem ważności, na początku umieszczając te najbardziej istotne. Innym sposobem na znalezienie czegoś w otchłaniach sieci jest „nakarmienie" wyszukiwarki frazą, czyli dwoma lub więcej logicznie połączonymi słowami objętymi w cudzysłów. Przykład: „Tanita Tikaram". Po wpisaniu takiej frazy ukażą się adresy stron opisujących życie i działalność artystyczną piosenkarki. Na pierwszym miejscu Google umieszcza www.tanitatikaram.com – jej oficjalne strony WWW. Ujęte w cudzysłów frazy można stosować wraz ze słowami kluczowymi: „Tanita Tikaram" Warszawa. Takie zapytanie spowoduje, że Google wyświetli odnośniki do stron, na których oprócz nazwiska piosenkarki pojawia się słowo Warszawa (na pierwszym miejscu polska strona fanów piosenkarki. Niepoprawne jest jednak wpisywanie słów kluczowych w obrębie cudzysłowu. Fraza „Tanita Tikaram Warszawa" nie przyniesie żadnych rezultatów, bowiem dokumentów, w których wszystkie te trzy słowa stoją obok siebie po prostu nie ma. We frazach można używać specjalnego symbolu - gwiazdki (*), która zastępuje dowolne słowo. Fraza: „tanie * samochody" spowoduje, że zostaną wyświetlone m.in. strony ze zwrotem tanie używane samochody. Gdy wśród słów kluczowych znajdzie się tzw. wyraz popularny, to zostanie on pominięty podczas wyszukiwania. Oto przykład: I like you. I cóż się dzieje? Pojawia się komunikat, że wyraz „I" jest często spotykany i został pominięty podczas poszukiwania, co zabezpiecza przed otrzymaniem milionów niekoniecznie interesujących nas trafień. Na początku akapitu wspomniałem, że w Google operator logiczny AND, czyli + stracił rację bytu i nie jest wykorzystywany. Nie jest to jednak do końca prawdą, otóż plusem należy poprzedzić wszystkie te słowa, które koniecznie muszą się znaleźć na stronach wynikowych. Jeśli więc naprawdę chcemy dołączyć to popularne słówko do warunków szukania, wystarczy postawić przed nim plus: +I like you. Oczywiście, aby uzyskać najlepsze wyniki, powinniśmy pierwotne wyrażenie ująć w cudzysłów - powyższa zabawa z plusem została przedstawiona tylko w celach dydaktycznych.
Ogólne porady dotyczące wyszukiwania Rozpoczynaj od bardzo szczegółowych i restrykcyjnych słów kluczowych i dopiero w razie niepowodzenia staraj się je uogólnić. Przy dobieraniu słów kluczowych postaw się w sytuacji autora szukanej strony i pomyśl, jakie słowa/wyrażenia mógł on na niej umieścić. Używaj polskich liter, tak jak to czyni zdecydowana większość webmasterów. Zanim rozpoczniesz korzystanie z wyszukiwarki, zajrzyj do katalogu - tam powinny znajdować się odnośniki do najlepszych stron z danego tematu. Korzystaj z wielu wyszukiwarek (zaczynaj od Google) - każda ma trochę inny indeks stron, więc istnieje szansa, że w jednym z nich znajdzie się i poszukiwana strona. Grafika http://images.google.com Podobnie jak przy stronach WWW, także jeśli chodzi o wyszukiwarkę grafiki Google nie ma sobie równych. Jest to obecnie najobszerniejsza baza informacji o tego typu plikach. Przed skorzystaniem z wyszukiwarki obrazków trzeba uzmysłowić sobie jedną rzecz, otóż obrazki, które pokażą się w wynikach wyszukiwania, mogą być i w większości przypadków będą objęte prawami autorskimi, tak, że ich dalsze wykorzystywanie w celach innych niż prywatne będzie wyraźnym złamaniem prawa. Wyszukiwanie obrazów nie jest bezpośrednie, tj. wyszukiwarka nie analizuje samego pliku graficznego, a jedynie tekst go otaczający, nazwę pliku itp. - nie jest to, więc mechanizm idealny, ale w praktyce sprawdza się całkiem nieźle. Od strony użytkownika proces wyszukiwania wygląda podobnie do tego w wyszukiwarce WWW - działają te same operatory logiczne i niektóre ze specjalnych przełączników, np. site:. Dodatkowym operatorem jest filetype:, który pozwala znaleźć obrazki o podanym rozszerzeniu, np. filetype:jpg car Opcję tę oferuje także formularz zaawansowanego szukania. Ponadto korzystając z rozbudowanego formularza możemy określić przybliżony rozmiar obrazka, który chcemy znaleźć, a także ustalić, czy ma być on kolorowy, czarno-biały czy może w odcieniach szarości. Wynikiem wyszukiwania jest strona zapełniona miniaturkami (thumbs) plików graficznych. Kliknięcie jakiejś miniaturki otworzy stronę podzieloną na dwie ramki. W górnej ramce ujrzymy nieco większą wersję obrazka (jego kliknięcie otworzy wersję pełnowymiarową), zaś w tej na dole umieszczona będzie strona, z której pochodzi dana grafika. Grupy dyskusyjne http://groups.google.com Grupy dyskusyjne to chyba największa po WWW składnica informacji w Internecie, szkoda, więc że duża część internautów jakby ich nie zauważa. Google oprócz wyszukiwarki newsów, jak popularnie określa się Usenet, udostępnia prawie kompletne ich archiwum i w pełni funkcjonalną bramkę news-WWW (aby móc wysyłać posty, trzeba się zarejestrować). Nas jednak najbardziej interesuje wyszukiwanie. Wyszukiwarka akceptuje tę samą składnię, co główny szperacz i dodatkowo oferuje kilka operatorów pozwalających wykorzystać charakterystyczne cechy Usenetu: -group: - zawęża wyszukiwanie do konkretnej grupy/grup, np. group:pl.* (jak widać, możliwe jest wykorzystanie gwiazdki - *, która zastępuje dowolny ciąg znaków), dodatkowo możemy podać też słowa kluczowe, np. group:pl.* pies. - insubject: - szuka określonego wyrażenia w tematach wiadomości, np. insub-ject:serwer, można też dodać standardowe słowa kluczowe, np. insubject:ser-wer php, - author: - szuka wiadomości nadanych przez konkretną osobę, np. autor:jasio lub author:abuse@tpnet.pl - wg adresu e-mail albo jego części - author: @wp.pl, jw. można łączyć to ze słowami kluczowymi, np. author:@onet.pl Onet. Wiele dodatkowych możliwości daje zaawansowany formularz wyszukiwania w grupach dyskusyjnych. Za jego pomocą możemy wyświetlić post o konkretnym Message-ID, czyli unikalnym identyfikatorze wiadomości, ograniczyć wyszukiwanie do wiadomości napisanych w jednym z kilku języków czy też wysłanych w konkretnym przedziale czasowym. Strona wynikowa do złudzenia przypomina tę z wyszukiwarki WWW, lecz co raczej jasna, nieco różni się od niej funkcjonalnością. Kliknięcie w temat znalezionej wiadomości przeniesie nas do tego konkretnego postu, aby zaś wyświetlić cały wątek, należy skorzystać z odnośnika Rozwiń wątek. Strona z wynikami na samej górze prezentuje grupy dyskusyjne odpowiadające naszemu zapytaniu, zaś każdy „trafiony" post zaopatrzony jest w odnośnik prowadzący do grupy, w której został opublikowany. Wyszukiwarka WAP http://www.google.com (z urządzeń WAP) WAP-owska wersja Google to chyba jeden z najlepszych serwisów dla użytkowników urządzeń obsługujących ten protokół. WAP Google przeszukuje nie tylko strony w formacie WML, ale także normalne dokumenty HTML. Co więcej, standardowe strony WWW są w locie konwertowane do WML-a, dzięki czemu użytkownicy tak popularnych u nas telefonów komórkowych z WAP-em mogą serfować po „normalnym" Internecie. Oczywiście przekonwertowane na WML strony niezbyt okazale prezentują się na malutkich wyświetlaczach komórek, ale w większości przypadków można z nich w miarę bezproblemowo korzystać. Składnia zapytań jest taka sama jak w normalnej wyszukiwarce stron WWW, od której miniaturowa jej wersja odróżnia się głownie tym, że w opcjach można ograniczyć poszukiwania do tylko stron WML. Google.maps & satellite - Olecko Google.maps & satellite - New York Najpopularniejsze słowa wpisywane do wyszukiwarki. Więcej tego typu statystyk można znaleźć pod adresem: http://www.google.com/intl/pl/press/zeitgeist.html Dodaj do Google Aby dodać swoją stronę do zasobów Google, nie trzeba robić nic - przynajmniej tak twierdza autorzy wyszukiwarki. Proces ten można spróbować przyspieszyć podając URL swojej strony w formularzu na http://www.google.com/addurl.html. Nie radzę jednak oczekiwać jakichś rewelacyjnych wyników, na dodanie do Google trzeba zazwyczaj czekać kilka miesięcy. Znalezienie się w zasobach to jedno, ważna jest też wysoka pozycja w wynikach wyszukiwania - większość internautów poprzestaje na odwiedzeniu witryn wylistowanych na pierwszej stronie z wynikami. Co zrobić, aby nasza strona uplasowała się wysoko? Najważniejsze są odnośniki - im więcej odnośników prowadzi do naszej strony, tym wyższy jej PageRank i pozycja w wynikach. Dobrym pomysłem jest zastosowanie nieco już zapomnianej formy promocji, a mianowicie wymienianie się odnośnikami ze stronami o podobnej tematyce. Sprawa numer dwa to odpowiednia konstrukcja strony. Najważniejsze terminy, czyli potencjalne słowa kluczowe, powinny być jakoś wyróżnione, np. przez pogrubienie czy zwiększenie fontu. Dodaj Google Google oferuje webmasterom możliwość wzbogacenia strony o wyszukiwarkę, która może przeszukiwać równie dobrze cały Internet, jak i tylko konkretny serwis. Podstawowa, darmowa wersja umożliwia całkiem niezłe dostosowanie stron z wynikami do wyglądu naszej witryny - możemy zmienić kolory wszystkich podstawowych elementów, a także wykorzystać własne logo. Google oferuje także płatne rozwiązania tego typu, przeznaczone zarówno dla mniejszych witryn, jak i portali, a także Google Search Appliance, czyli unikalne połączenie platformy sprzętowej (w gustownej żółtej obudowie) z „silnikiem" Google, przeznaczone dla dużych intranetów. Info - http://www.google.com/services/ Google Toolbar. Znudzony ciągłym wklepywaniem www.google.com? Stworzony przez Google pasek narzędziowy dla Internet Explorera to obowiązkowa pozycja dla każdego, kto szuka często i intensywnie. Po zainstalowaniu pod paskiem adresowym IE pojawi się nowy toolbar, którego najważniejszym elementem jest pole wyszukiwania - wystarczy wpisać tam poszukiwaną frazę i wcisnąć Enter, a po chwili załaduje się Google z rezultatami wyszukiwania. Oprócz prostego wyszukiwania na stronach WWW możemy przeszukać Usenet, katalog DMOZ, a także poszukać w Internecie plików graficznych. Pasek narzędziowy pozwala szybko przeszukać witrynę, którą aktualnie przeglądamy, jednak nie należy za bardzo polegać na wynikach takiego wyszukiwania - indeks Google odświeżany jest, co miesiąc, więc wyszukiwarka, wielu treści może po prostu nie odnaleźć. Inne funkcje paska to m.in. przycisk umożliwiający przejście do strony głównej danego serwisu, tłumacz stron (tylko na angielski), wskaźnik PageRank, a także przyciski głosowania, które umożliwiają wyrażenie swojej opinii o danej stronie (na dzień dzisiejszy wyniki głosowania nie są w żaden sposób wykorzystywane przez Google). Przydatną opcją jest możliwość znalezienia oraz podświetlenia na stronie frazy aktualnie wpisanej w pole wyszukiwania, a także podgląd kopii strony zapisanej na serwerze Google. Google Toolbar pozwala też na odnalezienie podobnych stron, witryn odnoszących się do strony aktualnie przeglądanej oraz przejście na powiązaną ze stroną kategorią tematyczną katalogu. http:/toolbar. google.com FAST znaczy dużo FAST (http://www.fastsearch.com), operator wyszukiwarki AIITheWeb (http://alltheweb.com) poinformował, że indeks stron, który przeszukuje ten mechanizm jest obecnie największy w Internecie i obejmuje 2 095 568 809 stron (stan na dzień 27 czerwca 2002 r.). Dotychczasowy lider, Google, ma w swoim indeksie 2 073 418 204 dokumentów. Na koniec. Mam nadzieję, że ten dość obszerny artykuł pomoże w lepszym wykorzystaniu tak wspaniałego narzędzia, jakim jest Google, a tym internautom, którzy jeszcze nie znają najlepszej wyszukiwarki, dostarczy argumentów do jej wypróbowania. Miłego googlowania! Opracowano na podstawie artykułu Andrzej Węcławskiego INTERNET 8/2002
|
|
Internet LO Olecko Ostatnia zmiana: J.Kunicki