Premessa
Sygol funziona più o meno come tutti gli altri motori di ricerca: si inserisce la frase da cercare, si clicca su Cerca e si aspettano i risultati.
Da notare che la ricerca è effettuata in 'OR', cioè saranno visualizzate tutte le pagine che contengono almeno uno dei termini ricercati.
Da notare inoltre che non esistono parole o caratteri speciali per cui + # & OR AND . (punto) , (virgola), ecc. sono trattati come parte delle parole da ricercare. In altre parole, ad esempio, +italia +bella non ricerca siti che contengono entrambe le parole ma siti che contengono '+italia' o '+bella'. Allo stesso modo le virgolette non sono usate per cercare frasi esatte e verranno scartate nella ricerca.
Si possono ricercare anche stringhe UNICODE (es. giapponese o koreano).
La ricerca
Le ricerche possono essere filtrate usando le seguenti opzioni:
| Dominio | Trova solo pagine web provenienti dal dominio specificato. |
| Internet | Include nei risultati le pagine Web i cui link non provengono da feed XML (vedi sotto) ma da normali pagine trovate dallo spider su Internet. |
| Annunci | Include nei risultati gli annunci e i siti inseriti nella directory di Sygol dagli utenti. Infatti, la directory di Sygol viene spiderata periodicamente come un qualunque sito. |
| Files | Include i files nei risultati, cioè quelle pagine web che finiscono con estensioni di tipo GIF, JPG, MPEG, PDF, ecc. In altre parole, include tutte quelle entità web che non si traducono in un file di solo testo come potrebbe essere una pagina HTML. |
| Synd | Include nei risultati le pagine Web i cui link sono stati trovati in un feed XML, cioè le pagine "Syndicated". Qui si possono trovare Blog, News, Annunci e tutto ciò che di solito viene messo nei vari feed RSS, Atom, ecc. |
|
|
|
| Precisione | Dal Alta a Bassa:
N.B. Le precisioni 1, 2 e 3 e 4 danno sempre gli stessi risultati quando si inserisce una parola sola. Le precisioni 3 e 4 danno sempre gli stessi risultati quando si inseriscono solo due parole. |
| Lingua | Cerca solo pagine scritte nella lingua
selezionata.
N.B. Versione Alfa 1.0-- |
I risultati
Prima parte
I risultati della ricerca presentano prima di tutto la lista delle parole che effettivamente sono state prese in considerazione nella ricerca stessa. Queste parole sono colorate dall'azzurro molto chiaro al blu scuro. Più la parola è chiara, più il suo indice non è aggiornato. Più è scura, più il suo indice è aggiornato. Una parola rossa indica che essa sarà aggiornata a breve.
Cliccando su una di queste parole si esegue una ricerca immediata della parola stessa.
E' possibile forzare un aggiornamento quasi immediato delle parole mostrate cliccando su Forza aggiornamento parole. Ripetendo poi la ricerca più volte vedremo che le parole passeranno dal rosso (aggiornamento imminente) al blu scuro (aggiornamento effettuato). Il tempo richiesto per l'aggiornamento dipende da vari fattori che vanno da quante richieste di aggiornamento ci sono in coda alla frequenza della parola in Internet. Ad esempio, le parole 'www' o 'http' richiederanno molto più tempo di parole come 'zuzzurellone' o 'cimino'.
N.B. Ogni parola può essere aggiornata forzatamente al massimo ogni 7 giorni.
Per capire questi concetti dobbiamo vedere brevemente come funzionano gli spider. Gli spider scaricano le pagine web da internet. Ogni parola nuova trovata viene messa nel database delle parole, mentre tutte le parole trovate nelle pagine vengono messe in un secondo database (chiamiamolo database delle pagine). Un programma apposito prende poi la parola meno aggiornata dal database delle parole ed estrae dal database delle pagine tutto ciò che serve a ritrovare rapidamente le pagine che contengono quella parola quando un utente effettua una ricerca. Questo programma ripete il ciclo all'infinito e, siccome il database delle parole contiene milioni di record, questo ciclo può richiedere molti mesi per essere completato. In altri termini, una parola che viene indicizzata oggi, verrà rivisitata tra un anno o forse più. E' dunque molto probabile che, nel mentre, lo spider abbia trovato altre pagine che contengono quella parola ma, per molto tempo, cercando la parola in questione, queste pagine non vengano presentate nei risultati della ricerca. Forzando l'aggiornamento dell'indice, vedremo subito cosa c'è di nuovo per una o più parole.
Seconda parte
Nella seconda parte dei risultati vediamo 3 colonne:
Appena sotto troviamo il numero delle parole (in rosso) trovate nella pagina, tra quelle inserite dall'utente o derivate dalle varie concatenazioni.
Un thumbshot della pagina (cortesia di Thumbshots.de).