10 Gratis bronnen voor gegevenswetenschap

10 Gratis bronnen voor gegevenswetenschap - dummies

Een uitstekend ding over gegevenswetenschap is dat u niet veel geld hoeft uit te geven aan softwaretoepassingen en brongegevens om hiervan te profiteren. U kunt eenvoudig beginnen met uw eigen gegevens en beginnen met het gebruik van open source-applicaties of programmeertalen om waardevolle inzichten te verkrijgen.

Zelfs contextuele gegevens kunnen gratis worden verzameld uit open gegevensbronnen. Het is waarschijnlijk dat u betere, exactere resultaten krijgt (met minder moeite) als u geld heeft om te besteden aan dure tools en exact getargete gegevensbronnen, maar dit is absoluut geen absolute vereiste.

Veel van de hier gepresenteerde middelen zijn beschikbaar als onderdeel van de bijdrage van de donerende organisatie aan de open beweging - een beweging die pleit voor de vrije uitwisseling van intellectuele eigendom op het gebied van kunst, onderwijs, software, data en technologie, onder anderen. Drie belangrijke componenten van de open beweging zijn open data, open source en open kennis.

Open data -initiatieven zijn gebaseerd op het uitgangspunt dat gegevens vrijelijk moeten worden openbaar gemaakt en open voor gebruik door het grote publiek voor gebruik, hergebruik en herpublicatie. Open data kan worden uitgegeven onder een open licentievoorwaarde, maar het is over het algemeen vrij van auteursrechten en patentbeperkingen.

De open source softwarebeweging begon eind jaren '70 en is gebaseerd op het uitgangspunt dat softwaregebruikers vrijelijk software kunnen delen. De open source-beweging pleit er ook voor dat ontwikkelaars het recht zouden moeten hebben om afgeleide open-source of eigen werken te bouwen.

Tot slot heeft de open kennis beweging zich gepositioneerd bovenop andere open bewegingen en zet het idee uiteen dat kennis in alle vormen vrij en open voor het grote publiek beschikbaar moet worden gemaakt. De open kennisbeweging bepleit ook dat mensen de vrijheid moeten hebben om die kennis te gebruiken, opnieuw te gebruiken, te delen en opnieuw te publiceren.

Open data openen via Open Knowledge

De grootste voorstander van de open kennisbeweging is de non-profit organisatie Open Knowledge. Deze organisatie definieert open kennis als de nuttige, zinvolle en waardevolle inzichten die zijn afgeleid van open gegevensbronnen. De Open Knowledge-website is een geweldige bron voor ontmoeting en samenwerking met open data- en data science-enthousiastelingen.

Vind gratis gegevens bij Open Data van de Wereldbank

Wereldbank Open Data is een ongelooflijk krachtige bron van gegevens en demografische gegevens over ontwikkelingslanden. Onderwerpen zijn onder meer gezondheid, infrastructuur, armoede, handel, stedelijke ontwikkeling, landbouw en plattelandsontwikkeling, en het milieu.Gegevens over de indicatoren van de Wereldbank worden ook openbaar gemaakt. Dat zijn een geweldige basis om een ​​vergelijkende analyse tussen ontwikkelingslanden te maken.

Brongevrije ruimtelijke gegevens van OpenStreetMap

OpenStreetMap (OSM) is een uitstekende bron van gratis, open geografische gegevens die u kunt gebruiken voor het analyseren van gegevens in geografische informatiesystemen (GIS) of voor het ontwikkelen van locatiebewuste webtoepassingen. Op de OSM Export-pagina kunt u de gehele (enorme) database met OSM-ruimtelijke gegevens downloaden. (Om gegevensuittreksels te downloaden van alleen de continenten, landen en steden die u wilt, moet u de Geofabrik-downloadoptie gebruiken; u kunt ook de Metro Extracts-functie van OSM gebruiken om grootstedelijke gegevens te downloaden in de grootste steden ter wereld.)

Gratis verzamelen overheidsgegevens van Data. gov

Data. gov is een geweldige bron als u op zoek bent naar gratis gegevens over bedrijven, milieu, volksgezondheid en onderzoek en ontwikkeling (R & D) in de VS. Gegevens. gov is geweldig omdat het, naast standaard tabellenreeksen, ook ruimtelijke gegevensbronnen biedt die u kunt downloaden en gebruiken voor analyse in GIS.

Berekenen met talen die voortkomen uit de open source-beweging

Gegevenswetenschapsvriendelijke programmeertalen, zoals R en Python, zijn open source en gratis te gebruiken voor analyse of applicatie-ontwikkeling. Beide talen zijn ideaal voor data-analyse en visualisatie. R heeft het voordeel dat het meer geavanceerde statistische en datavisualisatiemogelijkheden biedt, terwijl het voordeel van Python is dat het veel gemakkelijker te leren is dan R.

Gegevens gratis analyseren met de applicatie Data Applied

Als u niet wilt gebruik code om aangepaste routines voor uw analyse te schrijven, dan kunt u ervoor kiezen om in plaats daarvan een gratis webapplicatie te gebruiken. Data Applied biedt robuuste functionaliteit voor het maken van draaitabellen, boomkaarten en voorspellende voorspellingen. Het heeft ook functies die u kunt gebruiken voor correlatie, uitbijter en associatieanalyse.

Kaarten maken met Geocommons

Geocommons is een gratis webgebaseerde kaarttoepassing. Het meest opvallende kenmerk is de integratie van gerelateerde diagrammen en de functionaliteit van Google Earth. Met Geocommons kunt u gegevens uploaden en uw ID's automatisch geocoderen. U hebt de keuze om gegevens te visualiseren met behulp van chloropleth (waarvoor u een aantal geautomatiseerde of handmatige kleurschema's kunt bedenken) of om gegevens te visualiseren met behulp van bubbels en markeringen (zoals vlaggen en druppeltjes die gegevens overbrengen op grootte of kleur).

Met geocommons kunt u ook een eenvoudig lijndiagram, staafdiagram, kolomdiagram of spreidingsplot invoegen (meestal niet iets wat u gemakkelijk op een kaart kunt doen) om de relatie tussen twee kwantitatieve variabelen weer te geven. Ten slotte integreert Geocommons markerings- of categoriale gebiedvisualisaties met Google Earth, zodat u uw ruimtelijke gegevens kunt bekijken op een bolvormige, roteerbare, zoombare afbeelding van de planeet. (Merk op dat, om deze functie te gebruiken, u de invoegtoepassing van Google Earth moet installeren.)

Kaarten maken met Datawrapper

Datawrapper is een gratis, opensource-hulpmiddel dat u kunt gebruiken om eenvoudige visualisaties te maken .Het heeft twee functies die u nergens anders vindt: een verkiezingsdiagram met donutgegevens dat lijkt op de lay-out van verschillende huizen van het parlement of congressen, en een eenvoudige markeerfunctionaliteit die u kunt gebruiken om de belangrijkste betekenis van een datavisualisatie te benadrukken door slechts één gegevenspunt in een grafiek te markeren . Datawrapper biedt de volgende keuzes in grafisch type gegevens: kolomdiagrammen, cirkeldiagrammen, ringdiagrammen, verkiezingsdiagrammen, kaarten en staafdiagrammen.

Maak leuke interactieve infographics met Infoactive. co

Infoactive. co is een goedkope, webgebaseerde datavisualisatie ontwerpapplicatie. Het biedt een aantrekkelijke sjabloon die de nadruk legt op de minimalistische 'flat-design'-tekst en visualisaties die tegenwoordig de rage zijn. De toepassing heeft mogelijkheden om mouse-over-gebeurtenissen, gegevensfiltering en zelfs gegevensverbindingen toe te voegen aan live-updates, online bronnen zoals Google Spreadsheets.

Uw Infoactive verbinden. co-infographic naar gegevens die zijn opgeslagen in een Google-spreadsheet, kunnen dynamische resultaten opleveren. Telkens wanneer de spreadsheet wordt bijgewerkt, wordt de Infoactive-visualisatie tegelijkertijd bijgewerkt.

Infoactive. co biedt veel keuzes in het grafisch type van gegevens - inclusief kolomdiagrammen, cirkeldiagrammen, ringdiagrammen, percentagepictogrammen, lijndiagrammen, vlakdiagrammen, kaarten en staafdiagrammen. Ook, net als een klein beetje over Infoactive. co - de startup werd geboren als een resultaat van een succesvolle Kickstarter-campagne! ! Dat laat alleen maar zien dat je nooit echt kunt voorspellen waar het succes vandaan komt.

Diagram met ChartBuilder

ChartBuilder is verbazingwekkend omdat het nog eenvoudiger is om diagrammen in de ChartBuilder-toepassing te maken dan in Microsoft Excel. Bovendien kunnen ChartBuilder-diagrammen aantrekkelijker en professioneler zijn dan die in de standaard Excel-toepassing. U kunt ChartBuilder gratis gebruiken om lijndiagrammen, kolomdiagrammen, staafdiagrammen en spreidingsdiagrammen te maken.

Bovendien kunt u met de toepassing eenvoudige kopieer- en plakbewerkingen uitvoeren om uw gegevens te importeren en vervolgens binnen enkele seconden bruikbare resultaten te genereren. Hoewel de site geen mogelijkheden voor gegevensopslag biedt, kunnen uw visualisaties met één klik worden gedownload, als bitmapafbeeldingen of SVG-vectorafbeeldingen.