R ni nini?

R ni nini?

R ni lugha ya kikompyuta na mazingira yaliyo tengenezwa mahsusi kwa ajili ya kazi za kitakwimu (statistical computing) na picha maelezo (visualization). Mfumo huu ulihasisiwa na Ross Ihaka na Robert Gentleman  katika Chuo Kikuu cha Auckland, New Zealand na kwasasa hivi unaendelezwa na R Development Core Team. Mfumo wa R Ulitokana na lugha ya kikompyuta iliyoitwa S iliyovumbuliwa katika maabara za BELL miaka ya 80 washiriki wakiwa Rick Becker, John Chambers na Allan Wilks. Mfumo huu unafuata mfumo wa leseni ya “GNU General Public License” toleo la 2 na kuendelea kama zinavyochapishwa na Free Software Foundation hivyo basi kuufanya upatikane bure na hauna vikwazo vyovyote katika matumizi yake, yaani una uhuru wa kuutumia au kuusambaza kadri unavyotaka bila kukiuka kanuni zozote za leseni za matumizi.

Kujua zaidi kuhusu R tafadhali tembelea tovuti ya mradi husika kwa bofya hapa.

Kwanini utumie R?

Kuna aina nyingi ya mifumo ya kompyuta ya uchambuzi wa data (data analysis) kama vile SAS, Stata, SPSS  n.k. tembelea en.wikipedia.org (Comparison of statistical packages) kuona aina tofauti ya mifumo hii na uchambuzi wake kwa vigezo tofauti. Pia waweza kuona namna gani mifumo hii inapendwa kwa vigezo tofauti tofauti kwa kusoma r4stats.com (The Popularity of Data Analysis Software). Uwiano wa matumizi ya mifumo ya uchambuzi wa data unaoendeshwa na kdnuggets.com unaonyesha pia R inavyopendwa na sehemu kubwa ya wachambuzi (Languages for analytics / data mining / data science) . Baada ya kupitia mapitio mbalimbali yanayohusu mifumo ya uchambuzi wa data kama haujapata jibu kwanini unitumie R nitaorodhesha sababu kama ifuatavyo:

  • R inapatikana bure, kama wewe ni mwanafunzi au mwalimu sababu hii itakufanya uone R ni chaguo la kwanza,
  • R ni moja ya mifumo inayoongoza kwa kuwa na uwezo mkubwa wa uchambuzi na picha maelezo ya data unaosimamiwa na timu ya kimataifa inayohusisha watafiti, watakwimu na wanasayansi wa kompyuta wanaofanya kazi katika taasisi za kitaaluma (vyuo vikuu) na sehemu zingine za kazi duniani,
  • Mbinu mpya za kufanya uchambuzi wa takwimu (new statistical methods) huwahi kuingizwa katika R kuliko mifumo mingine ya uchambuzi wa data.

Courtney Brown anaweza kukushawishi zaidi kwanini utumie R

Vikwazo vya Kutumia R

  • Kujifunza R ni kugumu kwa kiasi flani kwa watu waliozoea mifumo mingine ya uchambuzi wa data,
  • Sehemu kubwa ya matumizi ya R ni kutumia amri (commands) na sio kubofya kwa kutumia puku,
  • Kuna njia zaidi ya moja kufanya kitu kile kile, hivyo huwa changamoto kwa watu wanaojifunza.

Mambo ya Kuzingatia Wakati Unajifunza Mifumo ya Kikompyuta ya Uchambuzi wa Data za Kitakwimu

Mifumo ya kikompyuta ya uchambuzi wa data za kitakwimu ni nyezo za kukurahisishia kazi ya uchambuzi wa data ili kupata taarifa na maarifa yalibebwa na data husika. Ili uweze kutumia mifumo hii vizuri unahitaji uelewa mzuri wa takwimu (good background in statistics) na ujue namna ya kuchagua mbinu sahihi ya kufanya uchambuzi wa kitakwimu (the right statistical method) kwa tatizo husika. Pia mhusika anatakiwa kutambua mahitaji (requirements)  au dhana (assumptions) ambazo mbinu husika ya uchambuzi wa kitakwimu imesimamia ili uchambuzi ulete maana sahihi.

Wakati unajifunza R ukiwa na lengo la kuwa mchambuzi wa takwimu au ukitarajia kufanya uchambuzi wa takwimu basi uzingatie nukuu ifuatayo kutoka kwa Agresti na Finlay:

“….The easy access to statistical methods using software has dangers as well as benefits. It is simple to apply inappropriate methods. A computer performs the analysis requested weather or not the assumptions required for its proper use are satisfied.
      Incorrect analyses result when researchers take insufficient time to understand the statistical method, the assumptions for its use, or appropriateness for the specific problem. It is vital to understand the method before using it. Just knowing how to use statistical software does not guarantee a proper analysis. You’ll need a good background in statistics to understand which method to select, which options to choose in that method, and howto make valid conclusions from the output.” — From Page 6 of Statistical Methods for the Social Sciences (4th Edition)

Kwa sababu R ni lugha ya kikompyuta maalamu kwa kazi za kitakwimu (Statistics Domain Specific Language) basi unashauriwa wakati ukiwa unajifunza R au mfumo mwingine wowote wa uchambuzi wa takwimu ni vizuri pia sambamba ukawa unajifunza takwimu ili uweze kuelewa vizuri matumizi ya mfumo na maana halisi ya uchambuzi husika. Kuna shahidi nyingi za msisitizo huu lakini baadhi ni mfano Leek na Peng:

“Better education is a start. Just as anyone who does DNA sequencing or remote-sensing has to be trained to use a machine, so too anyone who analyses data must be trained in  the relevant software and concepts.”

Pia bwana John D. Cook anasisitiza umuhimu wa kujifunza takwimu pamoja na R kwenye video ifuatayo ya “The R Language The Good The Bad And The Ugly”, sio lazima uangalie yote kwa mantiki ya hapa unaweza angalia dakika 10 za mwanzo.

Hitimisho

Baada ya kujifunza R na ukiwa hauna msingi mzuri wa takwimu na unataka kufanya uchambuzi wa takwimu basi ni vizuri kutafauta ushauri kutoka kwa watakwimu (statisticians) wakati wa matayarisho ya ya “study” yako ili wakupe msaada husika na kukushauri na namna ya kukusanya data na mbinu utakayotumia kufanya uchambuzi wako. Cha msingi cha kuzingatia ni kuchagua mtakwimu ambaye ana uelewa na mambo unayofanyia utafiti na sio ili mradi ni mtakwimu au alisoma takwimu tuu basi. Sitakuwa na msisitizo zaidi katika hili ila naomba uchambue nukuu ifuatayo kutoka kwa mmoja wa wakongwe wa mambo ya takwimu, Fisher:

“To consult the statistician after an experiment is finished is often merely to ask him to conduct a post mortem examination. He can perhaps say what the experiment died of. “—  Kama alivyonukuliwa na  BrainyQuotes.

Pia wakati unajifunza R naomba uwe unatafakari unachokifanya, yaani ujitahidi kujenga nadharia (theory) kabla ya kufanya majaribio ili matokeo utakayo yapata kwenye R yawe yenye maana zaidi. Nukuu ifuatayo inasisitiza suala hili:

“He who loves practice without theory is like the sailor who boards ship without a rudder and compass and never knows where he may be cast.” — Leonardo da Vinci, 1452-1519 Kama alivyonukuliwa na  John Fox

Hivyo basi wakati unajifunza R zingatia maneno ya wakongwe ili uweze kuwa mchambuzi mzuri wa data na kuchangia maendeleo yako binafsi, jamii inayokuzunguka, shirika au kampuni yako, Tanzania na Dunia kwa ujumla.

Karibu kwenye Ulimwengu wa R na takwimu kwa ujumla!

——————————————————————————————————————————————————–

Marejeo

————————————————————————————————————————————————–

Kwasababu nitakuwa natumia muda wangu wa ziada kufanya hii kazi, uharaka wa vitu vipya unaweza usiwe wa kuridhisha lakini nitajitahidi kwa kadri ninavyoweza kuwatia moyo watumiaji wapya wa R.

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s