10 Tips over werken met pakketten in R

10 Tips over werken met pakketten in R-dummies

Een van de zeer aantrekkelijke kenmerken van R is dat het een grote verzameling van -pakketten (verzamelingen van functies in een goed gedefinieerde indeling) bevat . Om het meeste uit R te halen, moet u weten waar u extra pakketten kunt vinden, hoe u ze kunt downloaden en installeren en hoe u ze kunt gebruiken.

Naderen over de hoeken en gaten van CRAN

Het Comprehensive R Archive Network (CRAN) is een netwerk van webservers overal ter wereld waar u de R-broncode, R-handleidingen en -documentatie en bijgedragen pakketten kunt vinden.

CRAN is geen enkele website; het is een verzameling webservers, elk met een identieke kopie van alle informatie op CRAN. Dus elke webserver wordt een mirror genoemd. Het idee is dat u de spiegel kiest die zich het dichtst bij uw locatie bevindt, waardoor internationaal of langeafstands internetverkeer wordt beperkt. Je vindt hier een lijst met CRAN-mirrors.

Ongeacht welke R-interface u gebruikt, u kunt uw favoriete CRAN-mirror (en andere instellingen) permanent opslaan in een speciaal bestand met de naam. RProfile, in de basismap van de gebruiker of in de R-opstartmap. Als u bijvoorbeeld de Imperial College, de UK-mirror, wilt instellen als uw standaard CRAN-mirror, neemt u deze regel op in uw. RProfile:

 opties ("repos" = c (CRAN = " // cran. Ma. Imperial. Ac. Uk /")) 

interessante pakketten zoeken

aan het begin van 2015 waren er meer dan 6.000 pakketten op CRAN. Dat betekent dat het moeilijk lijkt om een ​​pakket te vinden voor je taak.

Gelukkig hebben een handvol vrijwillige experts een aantal van de meest gebruikte pakketten gerangschikt in samengestelde lijsten. Deze lijsten worden CRAN-taakweergaven genoemd. Je kunt taakoverzichten vinden voor empirische financiering, statistische genetica, machine learning, statistisch leren en vele andere fascinerende onderwerpen.

Elk pakket heeft zijn eigen webpagina op CRAN. Op de webpagina van een pakket vindt u een samenvatting, informatie over de gebruikte pakketten, een link naar de pakketwebsite (als een dergelijke site bestaat) en andere nuttige informatie.

Pakketten installeren

Gebruik de installatie om een ​​pakket te installeren. pakketten () functie. Deze eenvoudige opdracht downloadt het pakket vanuit een opgegeven repository (standaard CRAN) en installeert het op uw computer: >> installeren. packages ("fortunes")

 Merk op dat het argument om te installeren. packages () is een tekenreeks. Met andere woorden, onthoud de citaten rond de naam van het pakket! 

In RGui, maar ook in RStudio, vindt u een menuopdracht om hetzelfde te doen:

Kies in RGui Pakketten → Pakket (ken) installeren.

  • Kies in RStudio Tool → Pakketten installeren ...

  • Pakketten laden

Om een ​​pakket te laden, gebruikt u de functie library () of require (). Deze functies zijn identiek in hun effecten, maar ze verschillen in de retourwaarde:

library ()

  • : Geeft onzichtbaar een lijst met pakketten die zijn bijgevoegd, of stopt met een foutmelding als het pakket niet is ingeschakeld jouw machine. require ()

  • : Retourneert WAAR als het pakket succesvol is gekoppeld en ONWAAR als dit niet is gelukt.

    De R documentatie suggereert dat library () de geprefereerde manier is om packages in scripts te laden, terwijl require () de voorkeur heeft binnen functies en packages.

Dus na het installeren van de pakket fortuinen laad je het zo: >> bibliotheek ("fortunes")

Merk op dat je de naam van het pakket niet hoeft te citeren in het argument van library () , maar het is een goede gewoonte om altijd de naam van het pakket te vermelden.

 

Hoewel het mogelijk is om een ​​pakket binnen een R-sessie te ontladen met behulp van de functie detach (), is het in de praktijk meestal veel eenvoudiger om uw R-sessie gewoon opnieuw te starten.

De handleiding van het pakket en vignet lezen

De handleiding van het pakket bevat een verzameling van alle functies en andere documentatie van het pakket. U kunt de handleiding op twee manieren openen. De eerste manier is om het help-argument te gebruiken voor de functie library ():

>> bibliotheek (help = "fortunes")

De tweede manier is om de handleiding op de pakketwebsite te vinden. Als u uw browservenster naar de CRAN-pagina voor het fortuinen-pakket richt, ziet u onderaan in de pagina een link naar de handleiding.

Welke methode u ook kiest, het resultaat is een PDF-document met de handleiding van het pakket.
 Sommige pakketauteurs schrijven ook een of meer 

vignetten,

documenten die illustreren hoe het pakket te gebruiken. Een vignet toont meestal enkele voorbeelden van hoe de functies te gebruiken en hoe te beginnen. Het belangrijkste is dat een vignet illustreert hoe het pakket te gebruiken met R-code en uitvoer, net als dit boek.

Om het vignet voor het fortunes-pakket te lezen, probeert u het volgende: >> vignette ("fortunes") Pakketten bijwerken Gebruik update om ervoor te zorgen dat u over de nieuwste versie van een pakket beschikt. packages (): >> update. packages ()

Deze functie maakt verbinding met CRAN (standaard) en controleert of er updates zijn voor alle pakketten die u op uw machine hebt geïnstalleerd. Als dit het geval is, wordt u gevraagd of u elk pakket wilt bijwerken en vervolgens downloadt u de code en installeert u de nieuwe versie.

 Als u update toevoegt. packages (ask = FALSE), R updatet alle verouderde pakketten in de huidige bibliotheeklocatie, zonder erom te vragen. Ook kun je het melden aan update. packages () om naar een andere repository dan CRAN te kijken door het repos-argument te wijzigen. Als het argument repos verwijst naar een bestand op uw computer (of netwerk), installeert R het pakket uit dit bestand. 

Zowel RGui als RStudio hebben menu-opties waarmee u de pakketten kunt bijwerken:

Kies in RGui Pakketten → Pakket (en) bijwerken.

 Kies in RStudio Tools → Controleren op pakketupdates ... 

Beide toepassingen stellen u in staat om grafisch pakketten te selecteren die u wilt bijwerken.

Doorgaan met R-Forge

Hoewel het niet overal waar is, hebben pakketten op CRAN de neiging om een ​​bepaald minimum aan volwassenheid te hebben.

  • Dus, waar leven pakketten die zich in de ontwikkelingscyclus bevinden? Heel vaak wonen ze in R-Forge. R-Forge biedt ontwikkelaars een platform om hun R-pakketten te ontwikkelen en te testen. R-Forge biedt bijvoorbeeld

Een build- en controlesysteem op Windows- en Linux-besturingssystemen (Mac OSX wordt niet ondersteund)

Versiebeheer

Bug-rapportsystemen

Backup en beheer

Installeren een project van R-Forge, je gebruikt ook de installatie. packages () functie, maar je moet het repos-argument specificeren. Bijvoorbeeld om de ontwikkelversie van de pakketgegevens te installeren. tabel, probeer het volgende:
  • >> installeren. packages ("data. table", repos = " // R-Forge. R-project. org")

  • Hoewel R-Forge geen specifiek build- en controlesysteem voor Mac OSX heeft, kunnen Mac-gebruikers installeer en gebruik pakketten van R-Forge door het bronpakket te installeren. U vindt meer informatie in de FAQ voor Mac.

  • Pakketten ophalen van github

  • In de afgelopen jaren zijn veel ontwikkelaars begonnen om github te gebruiken als een code-ontwikkelingssite. Hoewel github geen enkele van de R-specifieke functies van CRAN of R-Forge biedt, is code soms gemakkelijker te delen door github te gebruiken. Dus je kunt af en toe instructies krijgen om een ​​pakket rechtstreeks vanuit github te installeren.

Op de besturingssystemen Linux en Mac OSX is het installeren van pakketten vanuit github relatief eenvoudig. In Windows moet u echter ook eerst RTools installeren (een set compilers en andere hulpmiddelen om pakketten van de bron te maken). Om RTools op een Windows-computer te installeren, volgt u zorgvuldig de instructies.
 Installatie uitvoeren vanuit BioConductor 

BioConductor is een opslagplaats voor R-pakketten en -software, een verzameling tools die is gespecialiseerd in analyse van genomische en gerelateerde gegevens.

BioConductor heeft eigen regels voor ontwikkelaars. Als u bijvoorbeeld een pakket van BioConductor wilt installeren, moet u een script van de server: >> bron (" // bioconductor .org / biocLite. R")

vervolgens de biocLite () gebruiken functie om pakketten van BioConductor te installeren. Als u geen argument opgeeft, installeert u gewoon de benodigde basispakketten van het BioConductor-project.

BioConductor maakt uitgebreid gebruik van objectgericht programmeren met S4-klassen.

De R-handleiding lezen

De handleiding "R Installatie en beheer" is een uitgebreide handleiding voor de installatie en het beheer van R. Hoofdstuk 6 van deze handleiding bevat alle informatie die u nodig hebt over het werken met pakketten.