Wszystko o robotach wyszukiwarek
  Strona glówna O serwisie Kontakt Mapa Szukaj w serwisie 
    Menu
       Wprowadzenie
       Plik robots.txt
       Meta Tag 'ROBOTS'
       Baza robotów
       Analiza logów
       FAQ
  • O robotach WWW
  • Roboty indeksujące
  • Dla administratorów
  • Exclusion standard
  • Dostepnośa
  •        Forum
           Linki
      Nasze serwisy
           SearchEngines.pl
           Katalog Dobrych Stron
           Forum P2P
           Pozycjonowanie
           Domy studenckie
           Hostele w Europie
      Polecamy
           DirectTraffic.pl


    :: Strona Glówna --> FAQ --> O robotach WWW

    O robotach WWW


    Czym jest robot WWW?

    Robot to program, który automatycznie bada strukturę hipertekstu, pobierając dokument oraz (rekursywnie) wszystkie inne połączone z nim linkami.

    Normalne przeglądarki WWW nie są robotami, ponieważ kieruje nimi człowiek, i nie ściągają one polinkowanych stron automatycznie.

    Roboty czasem nazywamy Pełzaczami czy Pająkami. Te nazwy są trochę nietrafne, ponieważ dają wrażenie, że program porusza się między stronami jak wirus. Roboty nie działają w ten sposób. One po prostu odwiedzają strony i pobierają dokumenty...


    Czym jest 'agent'?

    Słowo "agent" ma wiele znaczeń w informatyce. Najczęściej jednak:
    Autonomiczni agenci
    to programy, które podróżują między stronami WWW. Decydują one same o sobie. Podróżują między specjalnymi serwerami, i nie są jeszcze rozpowszechnione w internecie.

    Intelligentni agenci

    to programy, które pomagają użytkownikowi np. w wybraniu odpowiedniego produktu, w wypełnieniu formularza. Programy te mają niewiele wspólnego z siecią.
    User-agent
    to techniczna nazwa dla programów, które wykonują zadania sieciowe dla użytkowników. tj. tak jak Netscape Navigator, Microsoft Internet Explorer, i Emailowe (User-agent) jak Qualcomm Eudora.

    Czym jest wyszukiwarka?

    Wyszukiwarka to program, który wyszukują dane. W kontekscie internetu, słowo 'wyszukiwarka' jest często używane dla formularza, który przeszukuje bazy danych (tworzone przez roboty indeksujące) zawierające dokumenty HTML, obrazy itp.


    Jakie są jeszcze typy robotów?

    Roboty mogą być używane w wielu celach:
    • Indeksowania
    • Sprawdzania poprawności HTML
    • Sprawdzania linków
    • Monitorowania "co nowego"
    • Mirroringu
    Przejrzyj listę aktywnych robotów aby zobaczyć czym roboty zajmują się w praktyce.

    Czy roboty mogą zaszkodzić Sieci?

    Jest kilka powodów dla, których ludzie myślą, że roboty mogą być złe dla sieci:
    • Duża część implementowanych robotów może (i robiła to w przeszłości) przeciążać sieci i serwery. Dzieje się tak zazwyczaj, gdy robota pisze osoba, która nie ma wystarczającej do tego wiedzy.
    • Roboty są pisane przez ludzi, którzy mylą się w konfiguracji, nie przewidując działania robota. Ludzi piszący roboty powinni być ostrożni i przewidujący...
    • Ogólnoświatowe roboty indeksujące budują centralną bazę dokumentów, która nie radzi sobie z milionami dokumentów na milionach serwerach.

    Z drugiej strony większość robotów jest jednak dobrze zaprojektowana i profesjonalnie skonfigurowana. Nie sprawia zatem problemów i dostarcza wielu cennych wiadomości.

    Nie, roboty nie są złe, ale potrzebują wiele wiedzy i uwagi przy tworzeniu i konfiguracji...


    Gdzie dowiem się więcej o robotach?

    Zamieszczam link do oficjalnej strony robotów indeksujących - http://www.robotstxt.org/wc/robots.html

    Poszukaj dodatkowych informacji na naszym forum.

    Dalej - roboty indeksujące

      Reklama
     
    Start | Najlepsze internetowe infografiki => www.infografika.co | Cezzy.pl -> Blog SEO o Google, SEO, Centrum Webmastera, nowych i ciekawych zjawiskach w Internecie | Polecamy komputery, laptopy, akcesoria komputerowe w katalogu komputerowym pcshop.com.pl | Najlepsze katalogi stron WWW - ranking top 50 | Reklama | O serwisie | Mapa serwisu | Kontakt
    Copyright 2005-2011© SearchEngines.pl