Premessa

Sygol funziona più o meno come tutti gli altri motori di ricerca: si inserisce la frase da cercare, si clicca su Cerca e si aspettano i risultati.

Da notare che la ricerca è effettuata in 'OR', cioè saranno visualizzate tutte le pagine che contengono almeno uno dei termini ricercati.

Da notare inoltre che non esistono parole o caratteri speciali per cui + # & OR AND . (punto) , (virgola), ecc. sono trattati come parte delle parole da ricercare. In altre parole, ad esempio, +italia +bella non ricerca siti che contengono entrambe le parole ma siti che contengono '+italia' o '+bella'. Allo stesso modo le virgolette non sono usate per cercare frasi esatte e verranno scartate nella ricerca.

Si possono ricercare anche stringhe UNICODE (es. giapponese o koreano).

 

La ricerca

Le ricerche possono essere filtrate usando le seguenti opzioni:

Dominio Trova solo pagine web provenienti dal dominio specificato.
Internet Include nei risultati le pagine Web i cui link non provengono da feed XML (vedi sotto) ma da normali pagine trovate dallo spider su Internet.
Annunci Include nei risultati gli annunci e i siti inseriti nella directory di Sygol dagli utenti. Infatti, la directory di Sygol viene spiderata periodicamente come un qualunque sito.
Files Include i files nei risultati, cioè quelle pagine web che finiscono con estensioni di tipo GIF, JPG, MPEG, PDF, ecc. In altre parole, include tutte quelle entità web che non si traducono in un file di solo testo come potrebbe essere una pagina HTML.
Synd Include nei risultati le pagine Web i cui link sono stati trovati in un feed XML, cioè le pagine "Syndicated". Qui si possono trovare Blog, News, Annunci e tutto ciò che di solito viene messo nei vari feed RSS, Atom, ecc.

Precisione Dal Alta a Bassa:
  1. Cerca solo le parole esatte inserite.
  2. Cerca anche tutte le coppie di parole inserite separate da spazio: ad es. se inserite a b c, oltre alle parole del punto 1, saranno cercati anche a b e b c.
  3. Cerca anche la concatenazione di tutte le parole inserite: ad es. se inserite a b c, saranno cercati a, b, c, a b, b c, abc, a-b-c e a_b_c
  4. Cerca anche la concatenazione di tutte le parole inserite a coppie da sinistra a destra: ad es. se inserite a b c, oltre alle parole dei punti 1, 2 e 3, saranno cercati anche ab, bc, a-b, b-c, a_b e b_c

N.B. Le precisioni 1, 2 e 3 e 4 danno sempre gli stessi risultati quando si inserisce una parola sola. Le precisioni 3 e 4 danno sempre gli stessi risultati quando si inseriscono solo due parole.

Lingua Cerca solo pagine scritte nella lingua selezionata.

N.B. Versione Alfa 1.0--

 

I risultati

Prima parte

I risultati della ricerca presentano prima di tutto la lista delle parole che effettivamente sono state prese in considerazione nella ricerca stessa. Queste parole sono colorate dall'azzurro molto chiaro al blu scuro. Più la parola è chiara, più il suo indice non è aggiornato. Più è scura, più il suo indice è aggiornato. Una parola rossa indica che essa sarà aggiornata a breve.

Cliccando su una di queste parole si esegue una ricerca immediata della parola stessa.

E' possibile forzare un aggiornamento quasi immediato delle parole mostrate cliccando su Forza aggiornamento parole. Ripetendo poi la ricerca più volte vedremo che le parole passeranno dal rosso (aggiornamento imminente) al blu scuro (aggiornamento effettuato). Il tempo richiesto per l'aggiornamento dipende da vari fattori che vanno da quante richieste di aggiornamento ci sono in coda alla frequenza della parola in Internet. Ad esempio, le parole 'www' o 'http' richiederanno molto più tempo di parole come 'zuzzurellone' o 'cimino'. 

N.B. Ogni parola può essere aggiornata forzatamente al massimo ogni 7 giorni.

Per capire questi concetti dobbiamo vedere brevemente come funzionano gli spider. Gli spider scaricano le pagine web da internet. Ogni parola nuova trovata viene messa nel database delle parole, mentre tutte le parole trovate nelle pagine vengono messe in un secondo database (chiamiamolo database delle pagine). Un programma apposito prende poi la parola meno aggiornata dal database delle parole ed estrae dal database delle pagine tutto ciò che serve a ritrovare rapidamente le pagine che contengono quella parola quando un utente effettua una ricerca. Questo programma ripete il ciclo all'infinito e, siccome il database delle parole contiene milioni di record, questo ciclo può richiedere molti mesi per essere completato. In altri termini, una parola che viene indicizzata oggi, verrà rivisitata tra un anno o forse più. E' dunque molto probabile che, nel mentre, lo spider abbia trovato altre pagine che contengono quella parola ma, per molto tempo, cercando la parola in questione, queste pagine non vengano presentate nei risultati della ricerca. Forzando l'aggiornamento dell'indice, vedremo subito cosa c'è di nuovo per una o più parole. 

Seconda parte

Nella seconda parte dei risultati vediamo 3 colonne:

  1. Il tipo di risultato, che può essere:
    • html se si tratta di una pagina web,
    • Synd se è una pagina trovata in un feed,
    • Zip, Exe, Pdf, Jpg, Mpeg, ecc. se si tratta di un file non risultante in testo HTML,
    • Sito WEB, Vendo, Affitto, ecc. se il risultato viene dalla directory degli annunci e dei siti.

    Appena sotto troviamo il numero delle parole (in rosso) trovate nella pagina, tra quelle inserite dall'utente o derivate dalle varie concatenazioni.

  2. Un thumbshot della pagina (cortesia di Thumbshots.de).

  3. La descrizione del risultato, il cui formato varia a seconda del tipo del risultato stesso.