R bij KI
R is een open-source "environment for statistical computing". R wordt actief
ondersteund door de R foundation, en alle informatie over R is te vinden
op: http://www.r-project.org/. Om
het leven iets makkelijker te maken, staan hieronder ook een aantal tips en
truuks, en een aantal min of meer KI-specifieke opmerkingen.
Deze pagina zal ik met onregelmatige intervallen updaten.
HvR.
- 060330: Kort stukje over ESS toegevoegd.
- 041209: Beschrijving R installeren uitgebreid.
- 041208: Added link to US 2004 election script
- 040831: Eerste versie
R op Linux machines
In principe is R op alle KI Linux machines geinstalleerd. Gewoon R intypen
op de prompt zou wonderen moeten doen.
R Environment
De meest prettige omgeving om R in te gebruiken (dit is natuurlijk geheel
objectief :-)) is Emacs. Installeer hiervoor ESS. Download ESS
from http://ess.r-project.org/ into
the directory ~/Emacs . Unzip the downloaded file. Open ~/.emacs in Emacs,
and add the following lines:
(load "~/Emacs/ess-5.2.12/lisp/ess-site")
(transient-mark-mode t)
Now files will be color coded (given that they end in .r) and
you can start a R session by typing:
ESC x R [enter]
Now you can easily copy lines of R code from a source code file to R by typing
Ctrl-C Ctrl-R, and whole functions by Ctlr-C Ctlr-F.
Zelf installeren
Voor Mac en Windows
Download the R executable van de R website: CRAN -> select a mirror ->
select
operating
system.
(Directe link voor Windows
95+ en voor Mac OS X
10.1.2+.) Installeren en starten zou redelijk
voorzich moeten spreken.
De Mac versie is zowel als GUI als als command line versie te gebruiken. De
R versie die bij Fink zit biedt eigenlijk
niets extras.
Voor Linux
Vrijwel alle distributies hebben R in het standaard pakket zitten. Anders
kan je op de R website links vinden naar repositories waar direct
downloadable packages staan (in elk geval in rpm en deb formaat).
Beginnen
Nog een keer als waarschuwing: al het begin is moeilijk, en het begin met R
is dat zeker! Gelukkig zijn er een aantal online (gratis) manuals en
getting started guides:
- An Introduction to
R, een manual geschreven door de makers van R zelf. Goed, maar soms
wat te weing gericht op dingen voor elkaar krijgen.
- simpleR
is een onofficiele, maar betere introductie tekst door John Verzani.
- Using R, een tekst van John Maindonald - ook
onofficieel en beter dan de officiele tekst. Deze text heeft ook
voorbeelden van opstarten en runnen onder windows (niet dat dat nou zo
specifiek moeilijk is...)
Voor meer inhoudelijke informatie, zie:
Vragen?
Je hebt natuurlijk goed gekeken of de vraag niet in "An Introduction to R"
wordt besproken, toch? (En, zoeken in PDF files zou geen probleem moeten
zijn...)
Aangezien het echt niet in An Introduction to R voorkomt, bekijk je
natuurlijk als eerste de F.A.Q.. De
vragen die hier beantwoord staan, zijn waarschijnlijk niet echt van het type
dat waar je in het begin mee zal zitten. Zie voor meer praktische zaken: Rtips (wat eerst
statsRus heette). Op deze pagina staan veel howto's.
Een andere mogelijk is om in Google op: "helpterm site:r-project.org" te
zoeken. Op de R-Project pagina's worden alle mailinglists opgeslagen die
een vrijwel onuitputtelijke bron van informatie zijn. (Al kunnen de "seniors"
op deze lijst nogal bot zijn naar mensen die vragen stellen die in de
documentatie te vinden zijn.) (Zie ook http://www.stat.ucl.ac.be/ISdidactique/Rhelp/,
een pagina met een goede documentatie-search-engine.)
Een van de vragen die veel wordt gesteld is hoe data in R in te lezen. Deze
vraag werd zo vaak gesteld dat er een aparte manual voor is geschreven: R Data
Import/Export, met als gevolg dat niemand deze informatie meer
kan vinden. :-)
Toevoegen van packages
Als je op Linux werkt, kan je zelf geen packages toevoegen. Gebruik dan
onderstaande instructies:
Since you cannot add packages to the system wide installation, you'll have
to add them locally. First, create a directory to store the to-be-added
packages in, for example: mkdir ~/Library/R and then create a file
called .Renviron in your home directory and make sure it contains the
following line: R_LIBS="$HOME/Library/R". This is probably the best
way to specify a directory where R should load its libraries from, but
doesn't always work (haven't figured out yet why). In those situations,
adding a line like .libPaths("/Users/rijn/Library/R") to
.Rprofile does the job as well. (Disadvantage: --no-init skips
loading .Rprofile, if I recall correctly.)
Start R, and enter the following command on the prompt:
install.packages("packagename",lib="~/Library/R") where packagename
should be replaced with the name of the package you wish to install,
e.g., "gregmisc".
After that, entering library() on the R prompt should show your
newly installed package, which can then be loaded
using library(packagename).
Voorbeelden en Packages
US 2004
Voor de lol een plaatje geprobeerd na te maken dat in een flash gebaseerd
artikel in de New York Times gebruikt werd. In die illustratie kon je ook
inzoomen. Dat nog maar niet ingebouwd. :-) Zie ./US2004
voor de sources en een voorbeeld.
Hedderik's homepage