Fujitsu-Siemens
 
M A G A Z I N
 
SOFTWARE 
  Igor Borojević

SPSS – statistika za svakoga

Pošto smo u dosadašnjim brojevima često govorili o softverskom paketu SPSS-u, odlučili smo da u ovom broju više pažnje posvetimo predstavljanju samog paketa i na taj način široj čitalačkoj publici dočaramo bar deo mogućnosti već pomenutog softvera.
SPSS je statistički softverski paket u kome su implementirane gotove sve konvencionalne statističke metode. Iako je verzija 11.0 već neko vreme u upotrebi mi ćemo ovde predstaviti verziju 10.0, a pri tome važno je znati, da kada je u pitanju ovaj softverski paket, sama verzija ne predstavlja neku preterano važnu karakteristiku, s obzirom na to da svaka verzija ovog softvera predstavlja dovoljno moćan alat, koji sam po sebi zaslužuje pažnju.
Ukoliko spadate u onu grupu ljudi koja u školi nije baš volela statistiku i verovatnoću, a i sam autor ovog teksta spada u tu grupu, nemojte ovde stati sa čitanjem ovog članka. Naime SPSS paket ne podseća mnogo na ono što smo iz ovih predmeta učili u školi, jer umesto dokazivanja raznih teorema i drugih matematičkih formalizacija, ovaj paket omogućava realizaciju konkretnih analiza i na taj način donošenje pravih zaključaka, koji imaju svoju upotrebnu vrednost. Drugim rečima, u školi smo učili kako da izračunamo verovatnoću da nam satelit padne na glavu ili ako u jenoj kutiji ima 3 plave, 4 crvene i 8 zelenih kuglica, pa onda izvadimo 3 kuglice, pa onda vratimo 1 kuglicu, pa onda … za razliku od svega toga SPSS će nam omogućiti da se uhvtimo u koštac sa stvarnim podacima iz realnog okruženja i uz pomoć statističke analize dođemo do konkretnih zaključaka u vezi sa konkretnim pitanjima : Zašto ljudi ne kupuju moj proizvod? Šta birači očekuju od svog političkog lidera u predstojećem periodu? Koja vrsta medija ima najveći uticaj na formiranje javnog mnjenja? Itd,itd…
Osnovna prednost ovog softverskog paketa jeste način na koji je osmišljena realizacija same statističke analize. Bez obzira na to o kojoj se vrsti analize radi, do konačnih rezultata se uvek dolazi kroz četiri jednostavna koraka:


Rad sa podacima


Pošto je osnovna namena ovog softverskog paketa da se bavi analizom velikog broja raznovrsnih podataka, nimalo ne čudi činjenica da su projektanti iz SPSS-a, posebnu pažnju poklonili upravo različitim načinima unosa podataka. Starovanjem programa dobija se Data Editor i mogućnost da : otvorite predhodno sačuvanu datoteku sa podacima, učitate neku radnu tabelu kao što je Excel, učitate podatke iz dBASE ili podatke iz tekstualne datoteke, ili da jednostavno direktno unosite podatke za analizu u Data Editor.

Data Editor predstavlja osnovno radno okruženje za rad sa podacima. Svaka kolona u ovoj tabeli prestavlja određenu varijablu koja se analizira, a svaka vrsta predstavlja konkretan primerak odnosno entitet. U ovom radnom okruženju pored Data View možete izabrati i Variable View koji će vam dati sledeći prikaz:


Kao i su svakom drugom programskom jeziku, što SPSS u suštini i jeste, na početku rada, potrebno je definisati promenljive, tip podatka, veličinu polja, odrediti kojoj mernoj skali pripada definisana promenljiva… a za sve ove radnje SPSS je predvideo upravo Variable View u okviru Data Editora.
Pored ovoga SPSS 10.0 korisniku nudi mogućnost da u okviru glavnog menija izabere podmenije Data ili Transform, u kojima se nalaze različite opcije za obradu podataka. Pomenućemo samo neke, najčeće korišćene, kao što su sortiranja entiteta, insertovanje novog entiteta, pronalaženje kokretnog entiteta i dr. Posebno je interesantna opcija Compute, koja se nalazi u okviru podmenija Transform. Naime ovom opciojm ne samo da možete da izvršite bilo koju matematičku operaciju nad izabranom varijablom, već možete da generišete različite statističke raspodele verovatnoća kao što su Normalna, Puasonova, Hi Kvadrat i mnoge druge raspodele.


Pokretanje analize


Kada su podaci konačno uneti u Data Editor, ostaje samo još da se izabere i pokrene željena statistička analiza. U okviru glavnog menija nalazi se podmeni Analyze, koji nudi toliki broj različitih statističkih analiza, da bi i samo njihovo nabrajanje prevazišlo obim ovog kratkog prikaza. S toga ćemo navesti samo one metode koje se najčešće koriste u praksi : različite metode deskriptivne statistike u okviru koje se nalazi i Crosstabs analiza, zatim različiti testovi vezani za matematička očekivanja kao što su T-test i Anova, Regresiona anliza, različite metode grupisanja, razni neparametarski testovi i još mnogo, mnogo toga. Pokretanjem željene analize dobija se sledeći Dialog Box:


Naravno svaka izabrana analiza daće drugačiji Dialog Box, ali je osnovna ideja uvek ista, iz izvornog spiska varijabli sa leve strane izaberite varijable nad kojima želite da izvršite analizu, a zatim izaberete opcije koje vam se nude na konkretnom Dialog Boxu. Pritskom na neko ponuđeno dugme ( u ovom slučaju Statistics, Plots i Options ), otvara se novi prozor, sa novim opcijama. Ukoliko ne znate šta predstavljaju pojedine opcije, desnim klikom miša na konkretnu opciju dobija se pop-up prozor sa kratkim objašnjenjm šta predstavlja predmetna opcija. Naprimer ukoliko na posmatranom Dialog Boxu pritisnete Statistics, a zatim kliknete desnim tastermo tastera na opciju M-estimators, dobićete sledeće objašnjenje:

I na kraju kada budete sigurni da ste izabrali prave varijable i naravno odgovarajuće opcije statističke analize, ostaje vam samo još da kliknete na dugme OK, i sačekate da se na ekranu pojave rezultati analize.


Tumačenje izlaznih rezultata


Za prikaz izlaznih rezultata SPSS koristi jedan poseban Output window, koji u opštem slučaju izgleda ovako:

Na levoj strani ovog prozora nalazi se panel koji sadrži pregled osnovnih stavki izlaznih rezultata. Ovaj panel omogućava jednostavnu navigaciju kroz izlazne rezultate, što predstavlja značajno olakšanje naročito kada su u pitanju kompleksne analize koje sadrže veliki broj izlaznih tabela, grfikona i drugih rezultata.
Na desnoj strani nalazi se panel koji sadrži konačne rezultate statističke analize. Ti rezultati mogu biti prikazani u obliku tabele, grafika ili običnog texta. Za korisnika koji poseduje osnovna znanja iz statistike, tumačenje izlaznih rezultata ne bi trebalo da predstavlja poseban problem. Za sve ostale korisnike SPSS nudi sledeću mogućnost. Dva puta kliknite na tabelu na kojoj se nalazi termin koji želite da vam bude objašnjen. Zatim kliknite desnim tasterom miša na taj termin, naprimer neka kolona u tabeli, i iz pop-up menija izaberite »What is this?«. Na ovaj način u novom pop-up prozoru dobićete preciznu definiciju i kratko objašnjenje nepoznatog pojma.


Rad sa grafikom


Iako se, po skromnom mišljenju autora ovog teksta, osnovna snaga SPSS-a ogleda prvenstveno u njegovoj mogućnosti da izvršava razne statističke testove i druge statističke analize, ovaj softverski paket nudi i različite mogućnosti korišćenja grafičkih prikaza. Dovoljno je da iz glavnog menija izaberete podmeni Graphs i dobićete čitavu gomilu različitih mogućnosti grafičkih prikaza. Osnovni rad sa raznim pitama, barovima, linijama, histogramima… ne razlikuje se mnogo od uobičajnih procedura za rad sa grafičkim prikazima, koji su široj publici poznatim iz Microsoft Office paketa. Tako, na primer, ukoliko izaberemo opciju Histogram dobićemo sledeći prikaz:


Dovoljno je da iz izvorne liste izaberemo varijablu koju želimo da prikažemo grafički, preko opcije Titles… postavimo nazive koordinatnih osa, eventualno uključimo opciju Display normal curve, koja će nam omogućiti da vizuelno ocenimo koliko posmatrana varijabla odstupa od Normalne raspodele i na kraju kliknemo dugme OK, i dobićemo izlazne rezultate:


Dalji rad sa dobijenim grafikom SPSS 10.0 omogućava preko posebnog Chart Editora u kome možete menjati boje, položaj, veličinu… vašeg grafika. Chart Editor se dobija tako što dvaput kliknete tastermo miša na grafikon koji želite da menjate.
I to nije sve…
Pored svega ovoga SPSS nudi još čitav niz različitih opcija i posebnih alata koji služe za prilagođavanje SPSS-a, automatizaciju rada, zatim Statistics coach koji će vam olakšati pronalaženje metode koja vam je potrebna za analizu, interaktivni graf, Syntax editor u kojem možete pisati kod i još mnogo, mnogo toga…
I na kraju možemo reći da osnovni razlog zbog kojeg SPSS i slični softveri, nisu posebno popularni u našoj sredini, verovatno leži u pogrešnom uverenju da je statistika nešto što naučiš u školi, za ocenu, a posle ti u životu to znanje nikad više ne zatreba. Upravo iz želje da se suprotstavimo ovom pogubno lošem shvatanju, pokušali smo da bar u kratkim crtama predstavimo osnovne mogućnosti ovog softvera.
Naravno, da biste shvatili zašto osnovni paket SPSS u Sjedinjenim Američkim Državama košta otprilike 40.000 $ i zašto su ljudi koji znaju da koriste ovaj softver tako dobro plaćeni, potrebno je da mnogo bolje upoznate sam softver i njegove mogućnosti. Pored tek nekoliko Fakulteta Beogradskog Univerziteta (posebno treba istaći napore ljudi sa FON-a i Psihologije), znanja vezana za korišćenje SPSS-a, možete dobiti i na kursu koji organizuje Škola računara OMEGA. Detaljnije informacije o kursu možete pronaći na oficijalnom sajtu škole, a mi ćemo i u narednim brojevima magazina nastojati da vas detaljno informišemo o mogućnostima softvera.

 

VRH STRANE

(c) 2003 OMEGA - sva prava zadržana