zde máte další povídání z odkazu :
http://the.cz/clanky/index.php?kat=6&co=1Tvorba dotazů pro vyhledávací služby:
Vyhledává se podle tzv. klíčových slov. Při jejich vkládání do vyhledavače je nutné si dávat pozor na několik věcí:
- rozlišování velkých a malých písmen. Některé servery velikost rozlišují jiné ne (case senzitive)
- diakritika může být také problém. Existuje několik druhů kódování češtiny (Latin 2,1250, Mac , ...). Vyhledavače pak většinou z textu diakritiku odstraní (např: znaky ě,é nahradí za e, to samé provedou se všemi ostatními znaky). Takhle se ošetří i prohledávaná data v databázi a pak se slova porovnávají.
Mnoho uživatelů vyhledává dost neefektivně, při vyhledávání informací zadávají jen jedno klíčové slovo. Vyhledavač pak vrací odkazy na tisíce stránek s daným slovem (např. při zadání slova sex na
www.altavista.com mi bylo vráceno 15 584 335 odkazů). Uživatel pak neprochází všechny vrácené stranky, ale max. pár desítek. A protože stránek denně přibývá, stává se vyhledávání s jedním klíčovým slovem stále méně účinné. Př. Na dotaz dvou slov (sex a foto) už altavista našla "jen" 81 540 stránek.
Prohledavače se stále zdokonalují (např. možnost vyhledat podobné odkazy, filtrování výsledku vyhledání podle kategorie do které spadá klíčové slovo a pod.), ale chyba není na straně vyhledavače, ale u uživatele. Není praktické zadávat jen jedno klíčové slovo. Pro efektivní vyhledávání je nutno používat složitějších dotazů s více klíčovými slovy a operátory.
Operátory:
Pomocí operátorů se vytvářejí dotazy pro vyhledávání. Dalším pomocníkem při vyhledávání jsou i zástupné znaky (tzv. wildcards)
""
- vyhledávají se stránky obsahující frázi uvedenou v uvozovkách
- u některých serverů je možné uvozovky nahradit závorkami () nebo []
Př. na dotaz "zlatý řez" se hledají pouze dokumenty, kde se vyskytuje tato fráze ( a ne jen slova zlatý a řez)
AND (a)
- spojuje slova v dotazu
- dá se většinou nahradit znakem '+' nebo '&', na českých serverech i písmenkem 'a' (ne na všech)
Př. na dotaz Neruda & dilo se hledají dokumenty, kde se vyskytují obě slova tj. mělo by najít stránky dílech Jana Nerudy
OR (nebo)
- vyhledává dokumenty ve kterých je obsaženo alespoň jedno ze zadaných slov
- dá se nahradit znakem '|'
Př. na dotaz Cesko OR Slovensko se hledají dokumenty obsahující oba dva termíny nebo jen jeden z nich
NOT (ne)
- při hledání vyloučí dokumenty, v nichž je obsaženo dané slovo
- dá se nahradit znakem '-' nebo '!'
Př. na dotaz televize NOT Nova se hledají všechny televize kromě Novy.
NEAR
- hledá slova která jsou poblíž sebe
Příklad: slovo1 NEAR slovo2 vyhledá dokumenty, kde se vyskytuje slovo1 a do určitého počtu slov od něho se vyskytuje i slovo2 Počet slov mezi hledanými slovy je možné upravit pomocí znaku "/" a čísla (slovo1 near/10 slovo2)
FAR
- opak NEAR, hledá slova která jsou od sebe vzdálená Vzdálenost mezi slovy je možné opět upravit pomocí "/"
Zástupné znaky (wildcards)
Většina vyhledávacích služeb podporuje tzv. zástupné znaky (wildcards). Ty se používají i například při práci se soubory a při vyhledávání obecně. Jedná se o znaky, které zastupují jeden nebo více znaků v hledaném slově.
Standartně se používá :
* (hvězdička) jako zástupný znak pro více znaků
? (otazník) jako zástupný znak pro jeden znak
Přiklady :
sou?ek - může najít např. výrazy souček, soudek, ...
Mar* - může najít nepřberné množství slov, začínajících na Mar (Mars, Martin, Martina,...)
Je možné použít i oba zástupné znaky v jednom slově nebo i vícekrát v jednom slově.
Vyhledavače
České Cizí
www.seznam.czObrovský katalog + fulltext. Vyhledávání lidí a emailů. Další služby (SMS brána, email, zpravodajství, ...)
www.google.comŽádné doplňkové služby - jen fulltext. vyhledávání. Ale za to skvělé vyhledávání
www.atlas.czKatalog i fulltext + spousta dalších služeb
www.altavista.comPodporuje složité vyhledávací příkazy, bohužel databáze je aktualizována pomalu
www.centrum.czJeden z nejoblíbenějších vyhledavačů, má katalog i fulltext
www.yahoo.comKatalog i fulltext
Další vyhledávače
www.redbox.czwww.najdi.towww.quick.cz www.aol.comwww.goto.comwww.lycos.com Ano