Indirizzi di pagina (URL) ideali per utenti e motori

La pagina di questo articolo ha come indirizzo (Url): www.nonsoloseo.com/2009/06/indirizzi-url-ideali-per-utenti-e-motori/ . Questo è l’indirizzo che comparirà nei risultati di ricerca sui motori (ammesso che questo articolo si posizioni per qualche ricerca) e farà già capire all’utente il contenuto della pagina, attirando i click di chi è interessato a questo argomento. Per dare alle pagine di questo blog delle Url come questa è stato necessario qualche intervento, infatti di default WordPress appena installato avrebbe dato a questo articolo una Url così: http://www.nonsoloseo.com/?p=148.

Si tratta di una pagina dinamica, come tutte quelle in cui compare il “?”.  La pagina non esiste cioè come documento html sul server, ma viene creata “al volo”  in seguito ad un query. Vengono passati al CMS dei parametri che identificano quella pagina (in questo caso la pagina corrispondente a “p=148”) ed eventuali altri parametri necessari alla sua visualizzazione (ad esempio in che lingua si intende leggere la pagina). In questo caso, con WordPress, la url è semplice e corta, ma in siti più complessi possiamo avere un numero maggiore di parametri, divisi da “&”.  Possono poi essere presenti anche altri caratteri, ad esempio che identificano la sessione di navigazione.

Url statiche “parlanti”

Una Url dinamica come  www.example.com/index.php?user=148&lang=ita&product=346&option=red&… non è molto leggibile e memorizzabile per l’utente, non gli suggerisce niente riguardo al contenuto della pagina web e non da alcuna informazione neanche ai motori di ricerca.  Invece gli indirizzi delle pagine statiche (cioè che esistono fisicamente sul server come documenti html) invece sono del tipo www.example.com/aggeggio-rosso-per-fare-la-pizza.html e sono senz’altro più comprensibili ed attraenti sia per l’utente che per il motore di ricerca, che trova delle keyword significative già nell’indirizzo della pagina. Le Url statiche non hanno il “?” ed i parametri, e se sono costruite con cura dicono qualcosa del contenuto della pagina e della sua relazione con le altre pagine del sito. Sono perciò Url “parlanti” perchè ci danno tutte queste informazioni.

Fino a non molto tempo fa i motori di ricerca avevano problemi ad indicizzare le pagine dinamiche, sopratutto se questa presentavano indirizzi complessi, con molti parametri. Fino a non molto tempo fa si consigliava di limitare a 2 il numero di parametri nelle Url, per evitare problemi di indicizzazione. Con il tempo i motori sono diventati progressivamente più efficienti nella indicizzazione delle pagine dinamiche ed ormai indicizzano anche pagine con Url complesse o caratteri particolari. Possono però sempre sorgere problemi di indicizzazione dovuti a Url troppo complesse e la migliore struttura – anche per favorire l’indicizzazione – rimane quella da Url di “pagina statica”: senza punto interrogativo o altri caratteri particolari.

Esistono dei metodi per ottenere anche per siti dinamici delle Url parlanti con una struttura da sito in html statico. Uno di questi è di attivare dei sistemi di riscrittura delle Url.  Su server Apache, ad esempio, si sfrutta il modulo  mod-rewrite attivabile da htaccess. In pratica si utilizzano dei filtri che interpretano la Url “parlante” e richiamano poi la pagina dinamica giusta con tutti i suoi parametri. Quindi l’utente ed il motore di ricerca vedono la Url statica e ricca di keyword ma al CMS giungono tutti i parametri necessari per visualizzare la pagina giusta.

Permalinks di WordPress: le Url amiche dei motori

Fortunatamente oggi i CMS più diffusi danno la possibilità, senza troppo sforzo, di ottenere delle Url “Search Engine Friendly”. WordPress non è da meno e d’altra parte questo era un requisito fondamentale senza il quale non lo avrei scelto come piattaforma per pubblicare il blog.

Nelle impostazioni di WordPress, una volta intallato, troviamo la voce “Permalink”. Da qui è possibile scegliere la struttura delle Url che avranno le nostre pagine. La scelta della struttura delle Url da fare preferibilmente all’inizio, prima di pubblicare articoli. Questo perchè i motori di ricerca indicizzeranno i nostri articoli con la Url che gli daremo, e cambiarla in un momento successivo ci creerebbe dei problemi di indicizzazione.

Di default, come dicevo, le Url sono quelle “brutte”: http://www.nonsoloseo.com/?p=idarticolo.

Attivando i Permalink possiamo scegliere una serie di Url “carine” ed amichevoli per motori ed utenti, che riportino nell’indirizzo di pagina la data di pubblicazione ed il nome dell’articolo (personalizzabile poi per ogni articolo). WordPress fornisce già alcune opzioni predefinite di possibili strutture di Url, e la possibilità di impostare una struttura personalizzata. Il consiglio che gli sviluppatori di WordPress danno è di mantenere nella Url di pagina dei caratteri numerici (l’id dell’articolo o la data). Io ho scelto una struttura personalizzata del tipo “/%year%/%monthnum%/%postname%/”, cioè le Url dei post saranno del tipo http://www.nonsoloseo.com/anno/mese/nome-del-post/ . Questo per quanto riguarda i post, che sono legati da una data e quindi ha senso che tale data sia presente nella Url. Le pagine, invece, che dovrebbero avere un contenuto meno dipendente dalla data di pubblicazione avranno una Url semplice del tipo http://www.nonsoloseo.com/pagina-madre/pagina/.

Vi sono poi Tag e Categorie. Riguardo a queste ultime, sono un buon modo per classificare i post per argomento, di default hanno una Url del tipo http://www.nonsoloseo.com/category/nome-categoria/. A mio parere questo è un annidamento inutile, non ho bisogno della cartella /category/ che non dice niente al mio utente e fa sembrare più periferica, e quindi meno importante nell’albero del sito, quella pagina. Ho installato perciò il plug-in di WordPress “top level categories” per eliminare la radice “category” da tutte le Url di pagine-categoria.

WordPress stesso poi modifica l’htaccess (se quest’ultimo è scrivibile) per impostare le regole di riscrittura necessarie ad attivare questa struttura di Url: In alternativa posso modificare manualmente l’htaccess seguendo le istruzioni dal pannello di WordPress. Una spiegazione dettagliata dei Permlinks, le Url Parlanti di WordPress, si trova qui: http://codex.wordpress.org/Using_Permalinks (in inglese).

La struttura delle Url di un sito è una parte importante  (e spesso trascurata) della ottimizzazione per i motori di ricerca, e conto di tornare sull’argomento in maniera più completa!