Opendata e turismo, dataset delle strutture ricettive

Panoramica sulla disponibilità degli opendata turistici delle strutture ricettive regione per regione

L'Italia è ricchisima di risorse turistiche di tutti i tipi: culturali, storiche e naturali. Siamo baciati da un meteo spettacolare, abbiamo un'enogastronomia che tutto il mondo ci invidia. Tutto il Belpaese è pervaso e "invaso" di bellezza. Tuttavia è parere diffuso che il settore turistico potrebbe contribuire molto più concretamente all'economia italiana. Riusciamo a sfruttare in modo ottimale le attrazioni più famose al punto di dover trovare un modo per ridurre il flusso turistico (vedi Venezia o i sentieri delle Cinque Terre) ma abbiamo una miriade di "perle", degli autentici tesori inesplorati il cui potenziale risulta ancora oggi insespresso.

Il turista "fa muovere l'economia" in molti modi: con il trasporto (aereo, treno, taxi, bicicletta, etc), con le consumazioni ai ristoranti e bar, con l'acquisto di souvenir, con lo sfruttamento di servizi ma generalmente la quota di spesa maggiore ricade nel settore della ricettività (alloggio e vitto). Come trova e sceglie un alloggio un turista o un professionista che necessita di un alloggio? Come decide a quale albergo, bed&breakfast, appartamento, ostello della gioventù, residence, foresteria, villaggio turistico, rifugio alpino, marina-resort, affittacamere o campeggio rivolgersi?

Ci sono aziende importanti e molto strutturate che facilitano l'incontro della domanda di chi cerca un alloggio con l'offerta di chi lo offre, pensiamo ai vari booking.com, expedia, hotel.com, venere e aggregatori quali trivago, momondo e chissà quante altre aziende simili esistono. Questi "facilitatori" hanno con i gestori delle strutture ricettive un rapporto di amore-odio: da una parte portano clienti e aiutano in modo sostanziale le strutture ricettive ad avere un numero maggiore di camere occupate ma, per il loro lavoro di intermediazione chiedono delle commissioni a volte molto pesanti. Il risultato è che l'albergatore italiano (o il gestore di una qualsiasi struttura ricettiva) si vede erodere parte del profitto che va in mano di aziende raramente italiane.

Possiamo facilitare l'incontro della domanda di alloggio con l'offerta ricettiva in altro modo, magari sistemico, magari italiano al 100%? Si potrebbe citare l'esempio di italia.it ma meglio, molto meglio passare oltre... Ci vengono in aiuto gli opendata!

Mettere a disposizione di tutti gli elenchi degli hotel presenti in una Regione è un ottimo modo per stimolare aziende/sviluppatori o semplici cittadini a creare strumenti (siti web, applicazioni, brochure, etc.) tali da facilitare l'incontro delal domanda di posti letto con l'offerta territoriale.

Mettere online i dataset delle strutture ricettive di una Regione non garantisce un incremento turistico immediato, servono gli sviluppatori e le aziende che grazie a tali dati creano portali turistici e applicazioni. E' una condizione non sufficiente ma è pur vero che non mettere online gli opendata delle strutture turistiche è garanzia che nessun attore (azienda, sviluppatore o singolo cittadino) mai proverà a creare qualcosa a favore del turismo regionale.

Gli enti turistici comunali, provinciali, regionali e finanche nazionali hanno e possggono i dati riguardanti le strutture turistiche. Quanti mettono online questi dati a disposizione di tutti (aziende, cittadini o semplici smanettoni) e in che formato (facilmente "maneggiabile" o chiuso o magari non "machine readable")?

Queste sono le domande che mi hanno guidato durante la realizzazione di open-dormire. Si tratta di una web-application che sfrutta gli open-data per offrire agli utenti una panoramica semplice, ma immediata sulla posizione e sulle altre caratteristiche delle varie strutture ricettive di una Regione. Qui open-dormire homepage potete vedere lo strumento open-dormire in azione (se qualcuno volesse approfondire lo sviluppo si faccia avanti) mentre di seguito condivido con voi alcune osservazioni nate durante lo sviluppo. Immaginate che open-dormire potrebbe essere il primo, primissimo passo per creare un ipotetico portale nazionale in cui un turista (o professionista) può navigare per trovare un alloggio.

Premetto che il livello di "sviluppo" dello strumento è molto diverso da regione a regione: per alcune regioni si possono fare ricerche per comune, per tipologia, per categoria, mentre per altre solo per provincia. Quello che mi piacerebbe fornire è una panoramica del mio personale punto di vista (di sviluppatore in erba) su come gli opendata attualmente potrebbero essere utilizzati per supportare il turismo. Ci sono moltissimi opendata inerenti al turismo che non ho ancora analizzato. Durante la ricerca dei dati sulle strutture ricettive ho incontrato dati riguardanti una moltitudine di argomenti, per esempio i beni culturali, la lista delle attrattività turistiche di una provincia/regione, la lista dei musei e così via.

A che punto siamo in Italia?

Nella tabella seguente potete vedere cosa ho trovato nei dataset sulle strutture ricettive per le 19 regioni italiane più le province autonome del Trentino e dell'Alto Adige.

  1. Il primo passo è stato individuare il portale opendata regionale (ricerca sui motori di ricerca),
  2. poi all'interno del portale opendata digitando "turismo" o "strutture" sono andato alla ricerca dei dataset con l'anagrafica delle srutture turistiche.
  3. Individuato il/i dataset (non presente per tutti i portali) la prima domanda che mi sono posto è stata "esistono i dati in formato csv?" (visto che il formato csv è il più diffuso mi sono focalizzato sull'utilizzo di questo formato). Alcuni portali mettevano a disposizione gli shapefile, altri un excel, in certi casi ho trovato solo gli XML. Sono passato ad analizzare quali sono le informazioni presenti nei dataset.
  4. In tutti i casi ho trovato le informazioni essenziali ovvero la denominazione della struttura e la loro tipologia.Nella colonna "posiz." indico i dataset in cui ho visto le informazioni latitudine e longitudine geografica.
  5. La colonna "info posti letto" indica quali dataset hanno le informazioni riguardanti il numero di camere, di posti letto e di bagni.
  6. In "info servizi" ho segnalato i dataset aventi delle informazioni riguardanti i servizi offerti e le attrezzature mentre
  7. nella colonna "foto" mostra quali sono le regioni che offrono dataset contenenti foto di strutture.

Regione e portale opendata

dataset strutt.

csv

posiz.

info posti letto

info servizi

foto

Piemonte

no

no

no

Valle d'Aosta

no

-

-

-

-

-

Lombardia

no

Trentino

no

-

-

no

Alto Adige

no

-

-

-

-

-

Veneto

no

no

no

Friuli Venezia Giulia

no

varie

no

Liguria

no

no

no

Emilia Romagna

no

no

no

Toscana

no

no

no

Umbria

no

no

no

Marche

no

no

no

no

Lazio

no

no

-

-

-

-

Abruzzo

no

-

-

-

-

-

Molise

-

-

-

-

-

-

Campania

no

-

-

-

-

-

Puglia

si

Basilicata

no

-

-

-

-

-

Campania

-

-

-

-

-

-

Sicilia

-

-

-

-

-

-

Sardegna

no

no

no

 

open-dormire delle Regioni italiane

Mentre ho realizzato le varie parti regionali di open-dormire mi sono segnato queste considerazioni.

Veneto

Sono partito dalla mia regione. Il csv si trova facilmente sia via google che tramite il portale degli opendata o il portale turistico. E' ben strutturato, contiene un campo specifico per ognuno dei servizi offerti dalla struttura (per esempio piscina sì/no), per le lingue parlate (ad esempio tedesco sì/no) e per la vicinanza con i punti di interesse (per esempio: vicino autostrada sì/no). Purtroppo non ci sono i campi che individuano con precisione la posizione geografica della struttura, i classici latitudine e longitudine (preferibilmente con sistema di riferimento WGS84 così che si possono stampare su una mappa senza conversione).

Gli opendata turistici possono portare ad interessanti realizzazioni. Proprio per la Regione Veneto ho voluto "approfondire" l'esperimento di open-dormire e realizzare un "motore di ricerca" molto più evoluto di quello che si trova in questo sito. In questa pagina "cerca un alloggio in Veneto di venetocio.com" si vede concretamente come possono essere utilizzate le tante informazioni disponibili. Il modulo di ricerca permette di ottenere una lista di alloggi scegliendone la provincia, la zona turistica, il comune, la tipologia (albergo, appartamento, etc.) e dove possibile le stelle. La ricerca si può affinare chiedendo alla pagina di restituire solo i risultati che soddisfano alcuni parametri che possono essere "di vicinanza", riguardanti "i servizi" e le "lingue parlate". Ad esempio se volessi trovare gli alberghi di Padova, zona Terme-Euganee, con piscina, sauna, vicino al centro storico che parlino anche la lingua tedescam inserisco questi dati nel modulo ed esso ci restituisce questa lista di strutture.

Esempio motore di ricerca per alloggi realizzato grazie agli opendata

Associando al motore di ricerca alloggi dei contenuti redazionali riguardanti le attrazioni turistiche della Regione, chiunque anche il cittadino, può realizzare un portale turistico che potenzialmente può incrementare il flusso turistico. Venetocio.com ne è un esempio. "Migliori" sono gli opendata, più informazioni contengono, più facili da maneggiare sono e maggiore sarà l'interesse di aziende e sviluppatori a riutilizzarli.

In Venetocio attualmente vi è anche un esempio di riutilizzo dei dataset riguardanti i beni culturali delle province venete (esempio per i beni-culturali di Vicenza).

Il dataset della Regione Veneto l'ho trovato davvero ben strutturato, la divisione dei servizi, vicinanze e lingue in campi si è rivelata molto comoda. Peccato per l'assenza dei classici campi latitudine e longitudine. Mancano anche le classiche informazioni del numero camere, posti letto e bagni. Altro spunto per migliorare è mettere delle foto come ha fatto la Regione Puglia (unica a suggerire delle foto).

Per navigare tra i dati delle strutture turistiche della Regione Veneto: open-dormire Veneto.

Lombardia

Dataset con molte informazioni e ben strutturato. Il portale opendata mi è sembrato molto ricco e ben fatto. Anche questo dataset contiene le informazioni sulle "vicinanze" ognuna con un campo dedicato mentre le informazioni sui servizi/attrezzature a differenza del dataset della regione Veneto sono contenute in un unico campo (separate da un limitatore costituito da una virgola). La quantità di informazione tra i due modi di proporre i dati è la medesima ma lo sviluppatore deve fare qualche funzione aggiuntiva per maneggiare i dati che sono forniti mediante stringhe con separatore. Molto interessante il campo "prima colazione" e quello dedicato ai pagamenti con carta di credito. Un errore sul campo "web" in cui l'informazione sul sito internet viene fornita in linguaggio html errato (esempio: <p><a target="_blank"> www.nomestruttura.it </a></p>).

Sono presenti le informazioni sulla posizione e questo ha permesso di generare delle comode mappe interattive. Ci sono dataset diversi per differenti strutture ricettive (per esempio gli ostelli della gioventù, rifugi alpini, etc.sono su dataset diversi) per lo sviluppatore sarebbe comodo poter avere un unico dataset con le strutture divise per tipologia. Per esplorare i dati delle strutture turistiche della Regione Lombardia: open-dormire Lombardia.

Toscana

Dataset e portale opendata molto buoni. Sono presenti i dati sulla posizione geografica ma qualche volta sono errati o poco corretti. Non sono presenti informazioni sul numero di posti letto disponibili, bagni e camere. Non ci sono informazioni sui servizi offerti o sulla vicinanza della struttura a particolari zone (centro storico, stazione ferroviaria, etc.).

Per navigare tra i dati delle strutture turistiche della Regione Toscana: open-dormire Toscana.

Puglia

Personalmente lo reputo uno dei migliori dataset incontrati! Sono presenti anche delle informazioni relative alle foto della strutture! Vi sono i campi per la posizione geografica ma il dato non è presente per tutte le strutture. Altra "chicca" del dataset pugliese è la presenza dei campi inerenti al prezzo, aspetto molto interessante. Il portale inoltre fornisce la spiegazione di come i file csv sono organizzati. E' presente anche il campo per le informazioni sul periodo di apertura. Le informazioni sui servizi (generali e in camera) ci sono ma vengono forniti con 2 campi distinti, i vari servizi sono separati da un carattere di separazione.

Per navigare tra i dati delle strutture turistiche della Regione Puglia: open-dormire Puglia.

Emilia Romagna

L'elenco delle strutture viene fornito scaricando uno zip con i dati suddivisi per provinciaM sarebbe comodo avere tutte le strutture in un unico file avente un campo identificativo "provincia" (esistente già nei diversi file provinciali); le informazioni sulla posizione ci sono ma i dati di qualche struttura sono errati. Per navigare tra i dati delle strutture turistiche della Regione Emilia Romagna: open-dormire Emilia Romagna.

Sardegna

I dati che si scaricano dal portale opendata Sardegna non sono molto aggiornati; se si confrontano i dati presenti nel portale turistico della Regione Sardegna si nota che quest'ultimo ha dati molto più aggiornati e dettagliati rispetto a quelli forniti con i dataset opendata. Presenti le informazioni sulla posizione delle strutture e questo ha permesso di creare comode mappe interattive. Permettono di segnalare sul loro sito le applicazioni che riutilizzano gli opendata Sardegna.

Per navigare tra i dati delle strutture turistiche della Regione Sardegna: open-dormire Sardegna.

Piemonte

Portale molto ben fatto e dataset ben strutturato. Qualche problema con i numeri di telefono e di fax: molte volte sono "scomparsi" gli zero che segnano il classico inizio dei numeri di telefono, fax, etc. (questo comportamento è tipico dei file che hanno subito un "passaggio" attraverso i fogli di calcolo elttronici come per esempio excel o calc o con software di elaborazione dati che eliminano in automatico gli zero iniziali).

Per navigare tra i dati delle strutture turistiche della Regione Piemonte: open-dormire Piemonte.

Friuli Venezia Giulia

Il portale è molto comoda da usare. Il dataset delle delle strutture ricettive non è unico ma si compone di svariati dataset (io ne ho considerati 8) i quali hanno i primi 20 campi uguali. I campi successivi differiscono poichè danno informazioni specifiche per il tipo di struttura a cui si rivolgono (nel caso di strutture alberghiere elencano i servizi, nel caso dei rifugi descrivono le caratteristiche del rifugio alpino, etc.). Le informazioni riguardanti la posizione geografica vengono fornite solo per qualche tipologia.

Per navigare tra i dati delle strutture turistiche della Regione Friuli Venezia Giulia: open-dormire FVG.

Liguria

Il portale opendata fornisce sia i dataset csv che uno shapefile che fornisce la posizione delle strutture, quest'ultimo file tuttavia non è completo e non è "collegato" con i csv delle strutture turistiche. Per esplorare i dati delle strutture turistiche della Regione Liguria: open-dormire Liguria.

Marche

Il dataset è composto da un file excel (formato proprietario, magari per qualche persona più comodo del csv) e non è dispobile il csv. Curioso come non ci sia l'informazione della provincia. Ci sono le informazioni per la posizione ma non per tutte le strutture. Per esplorare i dati delle strutture turistiche della Regione Marche: open-dormire Marche.

Umbria

Portale opendadata ben fatto. Il dataset che si scarica contiene le informazioni di posizione che però sono registrate in un sistema di riferimento poco diffuso, solitamente viene usato il WGS84. La generazione di mappe interattive è più complessa poichè è necessario convertire le coordinate. Per esplorare i dati delle strutture turistiche della Regione Umbria: open-dormire Umbria.

Trentino

I dati esistono ma viene proposto solamente in formato xml che rappresenta uno dei formati più adatti alla condivisione delle informazioni, "migliore" anche del csv. Non ho realizzato un "open-dormire Trentino" perchè avrei dovuto programmare da zero alcune funzioni.

Altre regioni

Per alcune regioni non sono riuscito a trovare il portale opendata oppure, come nel caso della Regione Valle d'Aosta non ho trovato il dataset con l'anagrafica delle strutture ricettive.

home page del portale opendata della regione valle d'aosta

Curiosità

I vari open-dormire regionali sono realizzati con delle tecniche che facilitano la loro indicizzazione nei motori di ricerca. Alcune piccole strutture a gestione "famigliare" sono state registrate nei motori di ricerca web probabilmente per la prima volta. Non sono stati rari i casi in cui i proprietari degli alloggi si sono rivolti a me, a volte anche scortesemente, adducendo che la loro privacy era stata violata, volendo sapere chi mi avesse dato il permesso di pubblicare i loro dati e chiedendomi di rimuovere subito la loro struttura da open-dormire. La "cultura degli opendata" non si è completamente "radicata" nella popolazione :-)

Il dataset ideale

Dal mio punto di vista (volevo usare la parola "raccomandazioni" ma mi sembra troppo "impegnativa") il dataset ideale dovrebbe essere fornito a livello "nazionale" o per lo meno regionale. Dovrebbe essere individuabile dal portale regionale opendata cercando con le parole-chiave turismo, alberghi o strutture e contenere al minimo questi campi: un id univoco per ogni struttura, i servizi elencati ognuno con un proprio campo (come per il dataset Veneto), il campo prima colazione, un campo o più di uno con i link delle foto (come per il dataset Puglia), un campo con i prezzi indicativi (come per il dataset Puglia), un campo con i periodi di apertura, campi sulle lingue, metodi pagamento, posti letto, bagno, camere. La struttura del dataset non dovrebbe mai essere modificata in modo che gli sviluppatori una volta realizzato il codice che elabora gli opendata hanno semplificati i lavori di aggiornamento dei dati (nel caso degli xml se si usano gli xml remoti il problema dell'aggioramento dati "scompare").

Poichè ho trovato molto intuitive e comode le mappe con i segnalini delle strutture, dovrebbero essere presenti le informazioni sulla posizione geografica con sistema di riferimento WGS84. La dimensione amministrativa dovrebbe contenere sia la provincia che il comune di appartenenza. Per le informazioni di contatto sarebbe comodo avere tutti i campi più comuni ovvero: telefono fisso, telefono cellulare del gestore, fax, email e sito internet.