Ordinatsioonimeetodid
Ordineerimine ehk korrastamine toimub läbi tunnuste rühmitamise. Põhimõte on ühendada omavahel rohkem seotud (näiteks korrelatsiooni või sarnasuse kaudu) tunnused nn peakomponentideks, mis on lineaarsed kombinatsioonid algsetest tunnustest ja mis kirjeldaksid võimalikult palju algete (paljude) tunnuste hajuvusest, olles ise omavahel võimalikult sõltumatud. Tavaliselt illustreeritakse ja hinnatakse kahte esimest peakomponenti - mida rohkem need andmeid esindavad, seda mõttekam ordinatsioonimeetodi kasutamine on. Antud õpiobjekti raames tutvustan põgusalt kahte meetodit.
Esimene neist on kanooniline korrespondentsanalüüs (Canonical Correlation Analysis (CCA või CA, kasutatakse mõlemat akronüümi ), mis on parameetriline meetod. Kovariatsioonimaatriksi alusel leitakse omavektorid ja omaväärtused. Omaväärtuste kirjeldusvõime näitab, kui palju üks või teine peakomponent (või ka kõik koos) kirjeldab algsest tunnuste hajuvusest. Arvutused eeldavad algandmete mitmemõõtmelist normaaljaotust. Soovitav on tunnused enne analüüsi algust üle vaadata (testida) ja vajadusel teisendada. Minu kogemuse põhjal kasutatakse siiski bioloogide poolt kõiki mitmemõõtmelise analüüsimeetodeid üpris vabalt, ilma rangelt normaaljaotuse nõuet täitmata. Ettevaatlik peab olema järelduste ja üldistuste tegemisel - kui põhieesmärk on andmete kirjeldamine, siis on peakomponendid usaldusväärsed küll.
NÄIDE
Esimene neist on kanooniline korrespondentsanalüüs (Canonical Correlation Analysis (CCA või CA, kasutatakse mõlemat akronüümi ), mis on parameetriline meetod. Kovariatsioonimaatriksi alusel leitakse omavektorid ja omaväärtused. Omaväärtuste kirjeldusvõime näitab, kui palju üks või teine peakomponent (või ka kõik koos) kirjeldab algsest tunnuste hajuvusest. Arvutused eeldavad algandmete mitmemõõtmelist normaaljaotust. Soovitav on tunnused enne analüüsi algust üle vaadata (testida) ja vajadusel teisendada. Minu kogemuse põhjal kasutatakse siiski bioloogide poolt kõiki mitmemõõtmelise analüüsimeetodeid üpris vabalt, ilma rangelt normaaljaotuse nõuet täitmata. Ettevaatlik peab olema järelduste ja üldistuste tegemisel - kui põhieesmärk on andmete kirjeldamine, siis on peakomponendid usaldusväärsed küll.
NÄIDE