Set di dati pubblici BigQuery

Un set di dati pubblico è qualsiasi set di dati archiviato in BigQuery e disponibile per il pubblico in genere tramite il programma per i set di dati pubblici di Google Cloud. I set di dati pubblici sono quelli ospitati da BigQuery per l'accesso e l'integrazione nelle applicazioni. Google paga lo spazio di archiviazione di questi set di dati e fornisce l'accesso pubblico ai dati tramite progetto. Paghi solo per le query eseguite sui dati. Il primo TB al mese è gratuito, in base ai dettagli dei prezzi delle query.

I set di dati pubblici sono disponibili per l'analisi le SQL precedente GoogleSQL query. Utilizza un nome di tabella completo quando esegui query su set di dati pubblici, per esempio bigquery-public-data.bbc_news.fulltext. Se la tua organizzazione limita l'accesso ai dati, ad esempio con perimetri di sicurezza, potresti dover contattare l'amministratore per ottenere l'autorizzazione ad accedere ai set di dati pubblici.

Puoi accedere ai set di dati pubblici di BigQuery utilizzando la console Google Cloud, lo strumento a riga di comando bq o effettuando chiamate all'API REST BigQuery tramite varie librerie client, come Java, .NET o Python. Puoi anche visualizzare ed eseguire query sui set di dati pubblici tramite Analytics Hub, una piattaforma di scambio dati che ti aiuta a scoprire e accedere alle raccolte di dati.

I set di dati pubblici non sono accessibili per impostazione predefinita dall'interno di un Perimetro Controlli di servizio VPC. Là non è un accordo sul livello del servizio (SLA) per il programma per i set di dati pubblici.

Vai ad Analytics Hub

Puoi trovare ulteriori dettagli su ogni singolo set di dati facendo clic sul nome del set di dati nella sezione Set di dati di Cloud Marketplace.

Vai a Dataset in Cloud Marketplace

Prima di iniziare

Per iniziare a utilizzare un set di dati pubblico BigQuery, devi creare o selezionare un progetto. Il primo terabyte di dati elaborati al mese è gratuito, quindi puoi iniziare a eseguire query sui set di dati pubblici senza attivare la fatturazione. Se intendi superare il livello gratuito, devi anche attivare la fatturazione.

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Make sure that billing is enabled for your Google Cloud project.

  6. BigQuery viene attivato automaticamente nei nuovi progetti. Per attivare BigQuery in un progetto preesistente,

    Enable the BigQuery API.

    Enable the API

Località set di dati pubblici

Ogni set di dati pubblico viene archiviato in una posizione specifica, ad esempio US o EU. Al momento, le tabelle di esempio BigQuery sono archiviate nella località multiregione US. Quando esegui una query su una tabella di esempio, specifica il flag --location=US sulla riga di comando, scegli US come posizione di elaborazione nella console Google Cloud o specifica la proprietà location nella sezione jobReference della risorsa job quando utilizzi l'API. Poiché le tabelle di esempio sono archiviate negli Stati Uniti, non puoi scrivi risultati di query di tabella di esempio in una tabella in un'altra regione e non potrai unire tabelle di esempio a tabelle di un'altra regione.

Accedi a set di dati pubblici nella console Google Cloud

Puoi accedere ai set di dati pubblici in Console Google Cloud con i seguenti metodi:

Per scoprire quando è stato effettuato l'ultimo aggiornamento di una tabella di dati, vai alla sezione Dettagli della tabella come descritto in Ottenere informazioni sulle tabelle e visualizza il campo Ultima modifica. Per ulteriori informazioni su come selezionare e rimuovere i progetti, consulta Lavorare con i progetti.

Altri set di dati pubblici

Esistono molti altri set di dati pubblici su cui puoi eseguire query, alcuni dei quali sono ospitati anche da Google, ma molti altri da terze parti. Altro i set di dati includono:

Condividere un set di dati con il pubblico

Puoi condividere qualsiasi set di dati con il pubblico modificando il campo per consentire l'accesso da parte di "Tutti gli utenti autenticati". Per maggiori informazioni informazioni sull'impostazione dei controlli di accesso al set di dati, consulta Controllo dell'accesso ai set di dati.

Quando condividi un set di dati con il pubblico:

  • I costi di archiviazione sono addebitati dall'account di fatturazione associato al progetto che contiene il set di dati condiviso pubblicamente.
  • I costi delle query sono addebitati dall'account di fatturazione associato al progetto in cui vengono eseguiti i job di query.

Per ulteriori informazioni, vedi Panoramica dei prezzi di BigQuery.

Tabelle di esempio

Oltre ai set di dati pubblici, BigQuery fornisce un numero limitato di tabelle di esempio su cui puoi eseguire query. Queste tabelle sono contenute bigquery-public-data:samples set di dati.

I requisiti per eseguire query sulle tabelle BigQuery di esempio sono secondo i requisiti per l'esecuzione di query sui set di dati pubblici.

Il set di dati bigquery-public-data:samples include le seguenti tabelle:

Nome Descrizione
gsod Contiene le informazioni meteo raccolte dal NOAA, come la quantità di precipitazioni e la velocità del vento dalla fine del 1929 all'inizio del 2010.
github_nested Contiene una cronologia di azioni come richieste di pull e commenti sui repository GitHub con uno schema nidificato. Creato a settembre 2012.
github_timeline Contiene una cronologia di azioni come richieste di pull e commenti sui repository GitHub con uno schema semplice. Creato a maggio 2012.
natality Descrive tutte le nascite registrate negli Stati Uniti nei 50 stati, nel Distretto di Columbia e nella città di New York dal 1969 al 2008.
shakespeare Contiene un indice di parole delle opere di Shakespeare, che indica il numero di volte in cui ogni parola compare in ciascun corpus.
trigrams Contiene trigrammi in lingua inglese tratti da un campione di opere pubblicate tra il 1520 e il 2008.
wikipedia Contiene la cronologia completa delle revisioni di tutti gli articoli di Wikipedia fino ad aprile 2010.

Contattaci

Per eventuali domande sul programma dei set di dati pubblici di BigQuery, contattaci all'indirizzo [email protected].

Passaggi successivi

Scopri come eseguire query su una tabella in un set di dati pubblico nella guida rapida all'utilizzo della console Google Cloud.