Indikaatorliigid
Indikaatorliikideks nimetan selliseid liike, mis on iseloomulikud just mingile konkreetsele ajale või kohale. Kas siis leidumise-mitteleidumise või arvukuse-katvuse jne poolest. Allpool toodud meetodite korral tähendab indikaatoriliigiks olemine seda, et liik esineb kindlas grupis (klastris) võrreldes teiste gruppidega oluliselt rohkem või vähem (näiteks kusagil on palju, aga teistes peaaegu üldse mitte, ehk siis liik on iseloomulik kindlale grupile).
Analüüsime, kas meie zooplanktoni liikide andmestiku alusel saab tuvastada ühe või teise järveosa indikaatorliigid ( kui järveosad liikide poolest ei erine, siis ei ole ka võimalik indikaatorliiki leida). Tutvustan kahte R funktsiooni, mõlemad eeldavad eraldi paketi sisselugemist.
Mõlema funktsiooni korral arvutatakse, kasutades permutatsioonide meetodit, välja p-väärtused, mis näitavad meie tõenäosust eksida väites, et antud valimi põhjal konkreetne liik on iseloomulik just antud järveosale.
Andmeteks zoopl_aug.csv
andmed<-read.csv("zoopl_aug.csv", header=T, sep=",", dec=".")
andmed[is.na(andmed)] <- 0
zoo<-andmed[,-c(1,2)]
Analüüsime, kas meie zooplanktoni liikide andmestiku alusel saab tuvastada ühe või teise järveosa indikaatorliigid ( kui järveosad liikide poolest ei erine, siis ei ole ka võimalik indikaatorliiki leida). Tutvustan kahte R funktsiooni, mõlemad eeldavad eraldi paketi sisselugemist.
Mõlema funktsiooni korral arvutatakse, kasutades permutatsioonide meetodit, välja p-väärtused, mis näitavad meie tõenäosust eksida väites, et antud valimi põhjal konkreetne liik on iseloomulik just antud järveosale.
Andmeteks zoopl_aug.csv
andmed<-read.csv("zoopl_aug.csv", header=T, sep=",", dec=".")
andmed[is.na(andmed)] <- 0
zoo<-andmed[,-c(1,2)]
1.
library(labdsv) mod <- indval(zoo, andmed$osa) summary(mod) Lõpptulemuse väljatrükk: cluster indicator_value probability L11 2 0.7721 0.001 L8 2 0.6667 0.001 L6 2 0.5134 0.001 L12 2 0.3806 0.007 L2 2 0.3333 0.005 L21 3 0.3824 0.020 L22 3 0.3767 0.014 L30 3 0.3653 0.017 L20 3 0.3054 0.040 Sum of probabilities = 6.842 Sum of Indicator Values = 7.5 Sum of Significant Indicator Values = 4.1 Number of Significant Indicators = 9 Significant Indicator Distribution (sagedustabel) 2 3 5 4 Järveosa tähistus on cluster |
2.
library(indicspecies) #see sobib, kui mõõtmiste arvud gruppides ei ole võrdsed multig=multipatt(zoo, func = "IndVal.g",nperm=999, duleg=T,cluster=andmed$osa) summary(multig) Lõpptulemuse väljatrükk: Multilevel pattern analysis Association function: IndVal.g Significance level (alpha): 0.05 Minimum statistic value (minstat): 0 Total number of species: 29 Selected number of species: 9 Number of species associated to 1 group: 9 Group 2 #sps. 5 stat p.value L11 0.879 0.001 *** L8 0.816 0.001 *** L6 0.717 0.003 ** L12 0.617 0.012 * L2 0.577 0.003 ** Group 3 #sps. 4 stat p.value L21 0.618 0.037 * L22 0.614 0.012 * L30 0.604 0.019 * L20 0.553 0.045 * --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Järveosa tähistus on group |
Tulemused on identsed, järveosade indikaatorliigid on mõlema funktsiooniga leides samad, väikesed erinevused on teststatistikute ja p-väärtuste numbrites. Lõppjäreldused sellest ei muutu - 2. järveosa indikaatorliigid on Liigid 2 , 6, 8,11 ja 12, 3. järveosa omad liigid 20, 21, 22 ja 30. Ülejäänud järveosad ei erine teistest oluliselt.
Kes tunneb huvi, siis arvutusvalemid, kuidas täpselt üks või teine indeksi väärtus arvutatakse, on kättesaadavad Internetis, otsingusõnadeks R paketi või funktsiooni nimi (näiteks Google's "R indval")
Kes tunneb huvi, siis arvutusvalemid, kuidas täpselt üks või teine indeksi väärtus arvutatakse, on kättesaadavad Internetis, otsingusõnadeks R paketi või funktsiooni nimi (näiteks Google's "R indval")