10 Fenomenale bronnen voor open gegevens

10 Fenomenale bronnen voor open gegevens - dummies

Open data is onderdeel van een grotere trend naar een minder beperkend, meer open begrip van het idee van intellectueel eigendom, een trend die het afgelopen decennium enorm populair is geworden. Open data zijn gegevens die openbaar beschikbaar zijn gemaakt en mogen worden gebruikt, hergebruikt, gebouwd en gedeeld met anderen. Open data maakt deel uit van de open beweging.

Naast open gegevens omvat deze toepasselijke naam open verkeer ook open-source software, open hardware, open-inhoud creatief werk, open toegang tot wetenschappelijke tijdschriften en open wetenschap - allemaal toegewijd aan het idee dat inhoud (inclusief onbewerkte gegevens van experimenten) moet vrij worden gedeeld.

Het onderscheidende kenmerk van open licenties is dat ze copyleft hebben in plaats van copyright. Met copyleft, is de enige beperking dat de bron van het werk moet worden geïdentificeerd, soms met het voorbehoud dat afgeleide werken niet auteursrechtelijk beschermd kunnen worden met een beperktere licentie dan het origineel. Als de tweede voorwaarde van kracht is, wordt het succesvol verkopen van het werk zelf moeilijk, hoewel mensen vaak tal van andere indirecte, creatieve manieren van commercialisering vinden.

Houd er rekening mee dat werk dat als open is gemarkeerd, mogelijk niet voldoet aan de geaccepteerde definitie. U bent verantwoordelijk om de licentierechten en beperkingen van de open gegevens die u gebruikt te controleren.

Mensen verwarren open -licenties vaak met Creative Commons-licenties. Creative Commons is een non-profitorganisatie die zich bezighoudt met het stimuleren en verspreiden van creatieve werken door een wettelijk kader aan te bieden waardoor gebruiksmachtigingen kunnen worden verleend en verkregen, zodat deelnemende partijen veilig zijn voor juridische risico's bij het bouwen op en gebruik van werk en kennis dat openlijk is gedeeld. Sommige Creative Commons-licenties zijn open en sommige verbieden expliciet afgeleide werken en / of commercialisatie.

Als onderdeel van recentere open-overheidinitiatieven begonnen regeringen over de hele wereld open overheidsgegevens vrij te geven. Overheden verstrekken deze gegevens over het algemeen zodat deze kunnen worden gebruikt door vrijwillige analisten en civic hackers - programmeurs die samenwerken om open-sourceoplossingen te bouwen die open data gebruiken om sociale problemen op te lossen - in een poging om de samenleving ten goede te komen groot. In 2013 ondertekenden de G8-landen (Frankrijk, de Verenigde Staten, het Verenigd Koninkrijk, Rusland, Duitsland, Japan, Italië en Canada) een charter waarin ze zich engageerden om gegevens te openen, waarbij ze prioriteit gaven aan nationale statistieken, verkiezingsresultaten, overheidsbegrotingen, en nationale kaarten.

De open overheid stimuleert transparantie en verantwoording door de overheid, voedt een goed geïnformeerd electoraat en moedigt publieke betrokkenheid aan. Om het in computertermen te formuleren, faciliteert open overheid een lees / schrijfrelatie tussen een overheid en haar burgers.

Door gegevens graven. gov

De gegevens. Het gov-programma is gestart door de Obama-administratie om open toegang te bieden tot niet-geclassificeerde gegevens van de Amerikaanse overheid. Gegevens. Gov-gegevens worden geproduceerd door alle afdelingen in de uitvoerende macht - het Witte Huis en alle afdelingen op kabinetsniveau - evenals datasets van andere overheidsniveaus. Halverwege 2014 kon je zoeken naar meer dan 100.000 datasets met behulp van de gegevens. gov zoeken. De website is een ongeëvenaarde bron als u op zoek bent naar door de Amerikaanse overheid verkregen gegevens over de volgende indicatoren:

  • Economisch
  • Milieu
  • STEM-industrie
  • Kwaliteit van leven
  • Wettelijk

Uitchecken Canada Open Data

Als u de website Canada Open Data bekijkt, is de sterke toewijding van de natie aan gegevens overweldigend evident. Op de website van Canada Open Data vindt u meer dan 200.000 datasets. Onder de 25 meest populaire aanbiedingen op de Canada Open Data-site zijn datasets die de volgende indicatoren omvatten:

  • Milieu
  • Burgerschap
  • Kwaliteit van leven

Gegevens duiken. gov. uk

Het Verenigd Koninkrijk is laat begonnen in de open overheidsbeweging. Gegevens. gov. UK is in 2010 gestart en medio 2014 waren er nog slechts zo'n 20.000 datasets beschikbaar. Zoals gegevens. gov, data. gov. uk wordt ook ondersteund door de CKAN-gegevenscatalogus.

Hoewel gegevens. gov. uk speelt nog steeds een inhaalbeweging, het heeft een indrukwekkende verzameling Ordnance Survey-kaarten oud genoeg - 50 jaar of meer - om geen copyright te hebben. Als u op zoek bent naar wereldberoemde, gratis te gebruiken enquêtekaarten, gegevens. gov. uk is een ongelooflijke plaats om te verkennen. Voorbij zijn sterrenkaarten, data. gov. Verenigd Koninkrijk is een nuttige bron voor gegevens over de volgende indicatoren:

  • Milieu (meest bekendste thema van het Verenigd Koninkrijk)
  • Overheidsuitgaven
  • Societal
  • Gezondheid
  • Onderwijs
  • en economisch

US Census Bureau-gegevens uitchecken

De US Census wordt om de tien jaar gehouden en sinds 2010 zijn de gegevens vrij beschikbaar. Statistieken zijn beschikbaar tot het niveau van het censusblok - dat gemiddeld per 30-koppige tellingen is geaggregeerd. De demografische gegevens die worden verstrekt door het US Census Bureau kunnen zeer nuttig zijn als u marketing- of advertentieonderzoek doet en uw doelgroep moet targeten volgens de volgende classificaties:

  • Leeftijd
  • Gemiddeld jaarinkomen
  • Huishoudmaat < Geslacht of ras
  • Scholingsniveau
  • Weten NASA-gegevens

Sinds haar oprichting in 1958 heeft NASA alle niet-geclassificeerde projectgegevens openbaar gemaakt. Het is al zo lang in het open-data-spel dat NASA heel veel data heeft! NASA-gegevensreeksen zijn nog sneller gegroeid dankzij recente verbeteringen in satelliet- en communicatietechnologie. In feite genereert NASA nu 4 terabytes aan nieuwe aardwetenschappelijke gegevens per dag - dat is gelijk aan meer dan een miljoen MP3-bestanden.Veel van de NASA-projecten hebben gegevens verzameld in het petabyte-bereik.

Het open gegevensportaal van NASA wordt data genoemd. Deze portal is een bron van allerlei prachtige gegevens, waaronder gegevens over

Astronomie en ruimte (natuurlijk!)

  • Klimaat
  • Biowetenschappen
  • Geologie
  • Engineering
  • Wrangling World Bank Data

De Wereldbank is een internationale financiële instelling die wordt gerund door de Verenigde Naties. Het verstrekt leningen aan ontwikkelingslanden om te betalen voor kapitaalinvesteringen die (naar men hoopt) tot armoedebestrijding en een overschot zullen leiden, zodat de ontvangende landen de geleende bedragen in de loop van de tijd kunnen terugbetalen. Omdat functionarissen van de Wereldbank goed geïnformeerde beslissingen moeten nemen over welke landen eerder geneigd zijn hun leningen terug te betalen, hebben ze enorme hoeveelheden gegevens verzameld over lidstaten. Ze hebben deze gegevens beschikbaar gemaakt voor het publiek op de Open Data-pagina van de Wereldbank.

Als u op zoek bent naar gegevens om uw argument te onderbouwen in een echt interessant stuk gegevensjournalistiek dat wordt ondersteund door wereldwijde statistieken, zou de Wereldbank uw go-to-source moeten zijn. Ongeacht de reikwijdte van uw project, als u gegevens nodig hebt over wat er gebeurt in ontwikkelingslanden, is de Wereldbank de plek om naartoe te gaan. U kunt de website gebruiken om volledige datasets te downloaden of eenvoudig de datavisualisaties online bekijken. U kunt ook de Open Data API van de Wereldbank gebruiken om toegang te krijgen tot wat u nodig hebt.

World Bank Open Data levert gegevens over de volgende indicatoren (en nog veel, veel meer):

Landbouw en plattelandsontwikkeling

  • Economie en groei
  • Milieu
  • Wetenschap en technologie
  • Financiële sector < Armoede-inkomen
  • Gegevens van de Wereldbank bevat ook
  • microdata

- steekproefenquêtes van huishoudens en bedrijven in ontwikkelingslanden. U kunt microdata gebruiken om variaties in uw datasets te verkennen. Knoema-gegevens leren kennen Knoema (spreek uit als "nee-mah") beweert de grootste bewaarplaats te zijn van openbare gegevens op internet. Het Knoema-platform biedt met zijn meer dan 500 miljoen <1099> tijdreeks

- 150 miljoen verzamelingen gegevens over attribuutwaarden mettertijd een verbluffende 500 + -database, met andere woorden. Knoema omvat, maar is niet beperkt tot, al deze gegevensbronnen:

Overheidsgegevens van industrielanden Nationale openbare gegevens van ontwikkelingslanden Verenigde Naties

  • Internationale organisatiegegevens
  • Bedrijfsgegevens van wereldwijde bedrijven
  • Knoema is een uitstekende hulpbron als u op zoek bent naar internationale gegevens over landbouw, misdaadstatistieken, demografie, economie, onderwijs, energie, milieu, voedselzekerheid, buitenlandse handel, gezondheid, landgebruik, nationale defensie, armoede, onderzoek en ontwikkeling, telecommunicatie, toerisme, transport of water.
  • Knoema is niet alleen een ongelooflijke gegevensbron, maar ook een veelzijdig opgavenplatform. U kunt het Knoema-platform gebruiken om dashboards te maken die automatisch al uw favoriete datasets volgen. U kunt de tools voor gegevensvisualisatie van het platform gebruiken om uw gegevens snel en eenvoudig in een tabel- of kaartindeling te bekijken.U kunt de Knoema-gegevensatlas gebruiken om naar categorieën en / of geografische regio's te gaan en snel toegang te krijgen tot de specifieke datasets die u nodig hebt. Als individu kunt u uw eigen gegevens uploaden en Knoema gebruiken als een gratis hostingdienst. Bovendien biedt Knoema zelfs de Knoema-markt - een plek waar u kunt gaan om te worden betaald, alleen omdat u deel uitmaakt van datagedreven projecten.
  • Hoewel veel van de gegevens van Knoema vrij algemeen zijn, kunt u nog steeds enkele verrassend specifieke gegevens vinden. Als u het moeilijk vindt om gegevens over een specifiek onderwerp te vinden, heeft u misschien geluk om het op het Knoema-platform te vinden. De afbeelding illustreert hoe specifiek Knoema-gegevens kunnen zijn.

De index van insectenregisters in Knoema's zoekopdracht.

In de rij staan ​​met Quandl-gegevens

Quandl is een in Toronto gebaseerde website die als doel heeft een zoekmachine voor numerieke gegevens te zijn. In tegenstelling tot de meeste zoekmachines wordt de database echter niet automatisch gegenereerd door spiders die het web crawlen. Het richt zich eerder op gekoppelde gegevens die zijn bijgewerkt via

crowdsourcing

- handmatig bijgewerkt via menselijke curatoren, met andere woorden.

Omdat de meeste financiële gegevens in numeriek formaat zijn, is Quandl een uitstekende tool om up-to-date te blijven over de nieuwste zakelijke informatica. Zoals je ziet, levert een zoekopdracht naar Apple meer dan 4, 700 datasets uit 11 verschillende bronnen met tijdreeksen op het dagelijkse, wekelijkse, maandelijkse, driemaandelijkse of jaarlijkse niveau. Veel van deze resultaten houden verband met de landbouwgegevens van de Verenigde Naties. Als u op zoek bent naar gegevens op Apple Computers, kunt u de reikwijdte van uw zoekopdracht beperken door de zoekterm

Apple te vervangen door de afkorting van het bedrijf, AAPL . De index van Apple-records in Quandl-zoekopdracht. De Quandl-database bevat koppelingen naar meer dan 10 miljoen gegevensreeksen (hoewel deze een genereuze metriek gebruikt om te verklaren wat de ene gegevensset van de andere onderscheidt). Quandl linkt naar 2. 1 miljoen VN-datasets en vele andere bronnen, waaronder datasets in het Open Financial Data Project, de centrale banken, vastgoedorganisaties en bekende denktanks. Exversion Data verkennen

gemodelleerd naar GitHub - het door de cloud gehoste platform waarover programmeurs gezamenlijk code kunnen delen en herzien - Exversion streeft naar dezelfde samenwerkingsfunctionaliteit rond gegevens die GitHub rondom code biedt. Het Exversion-platform biedt versiebeheerfunctionaliteit en hostingservices waaraan u uw gegevens kunt uploaden en delen. Om te illustreren hoe Exversion werkt, stel je een platform voor waarmee je eerst

fork

(of een kopie van) een dataset kunt maken en vervolgens de gewenste wijzigingen kunt aanbrengen. Exversion zou er zijn om bij te houden wat er is veranderd van de originele set en elke verandering die je erin aanbrengt. Met Exversion kunnen gebruikers ook datasets beoordelen, beoordelen en becommentariëren.

Datasets die op het Exversion-platform worden gehost, worden geleverd door een gebruiker of gemaakt door een spider die open gegevens crawlt en indexeert zodat deze doorzoekbaar is vanuit een enkele API (Application Programming Interface).Net als GitHub, met een gratis gebruikersaccount, zijn alle gegevens die u uploadt naar Exversion openbaar. Als u bereid bent te betalen voor een account, kunt u uw eigen privégegevensopslagplaatsen maken. Ook krijgt u met het betaalde account de mogelijkheid om uw gegevens te delen met geselecteerde gebruikers voor samenwerkingsprojecten. OpenStreetMap in kaart brengen Ruimtelijke gegevens OpenStreetMap (OSM) is een open, crowd-sourced alternatief voor commerciële kaartproducten zoals Google Maps en ESRI ArcGIS Online. In OSM maken, uploaden of digitaliseren gebruikers geografische gegevens in de centrale repository.

Het OSM-platform is vrij robuust. Overheden en particuliere bedrijven zijn begonnen met het bijdragen aan en trekken aan de gedeelde datasets. Zelfs bedrijven zo groot als Apple vertrouwen op OSM-gegevens. OSM heeft nu meer dan 1 miljoen geregistreerde gebruikers. Om te illustreren hoe een persoon gegevens in OSM kan creëren, stel je voor dat iemand de GPS-systemen op haar mobiele telefoon koppelt aan de OSM-applicatie. Vanwege deze autorisatie kan OSM automatisch de routes van wegen traceren terwijl de persoon reist. Later kan deze persoon (of een andere OSM-gebruiker) het online platform van OSM bezoeken om de routes te verifiëren en te labelen.

De gegevens in OSM worden niet opgeslagen als kaarten, maar als geometrische en tekstrepresentaties - punten, lijnen, veelhoeken en kaartannotatie - zodat alle gegevens van OSM snel van de website kunnen worden gedownload en eenvoudig kunnen worden samengevoegd tot een cartografische weergave via een desktop-applicatie.