Type: | Package |
Language: | pt-BR |
Title: | Analise multivariada (brazilian portuguese) |
Version: | 2.2.7 |
Date: | 2025-04-19 |
Imports: | graphics, grDevices, MASS, stats |
Description: | Analise multivariada, tendo funcoes que executam analise de correspondencia simples (CA) e multipla (MCA), analise de componentes principais (PCA), analise de correlacao canonica (CCA), analise fatorial (FA), escalonamento multidimensional (MDS), analise discriminante linear (LDA) e quadratica (QDA), analise de cluster hierarquico e nao hierarquico, regressao linear simples e multipla, analise de multiplos fatores (MFA) para dados quantitativos, qualitativos, de frequencia (MFACT) e dados mistos, biplot, scatter plot, projection pursuit (PP), grant tour e outras funcoes uteis para a analise multivariada. |
License: | GPL-3 |
Encoding: | UTF-8 |
LazyData: | true |
NeedsCompilation: | yes |
Author: | Paulo Cesar Ossani
|
Maintainer: | Paulo Cesar Ossani <ossanipc@hotmail.com> |
Repository: | CRAN |
Packaged: | 2025-04-18 18:29:35 UTC; Ossan |
Date/Publication: | 2025-04-18 18:40:04 UTC |
Analise multivariada (brazilian portuguese).
Description
Analise multivariada, tendo funcoes que executam analise de correspondencia simples (CA) e multipla (MCA), analise de componentes principais (PCA), analise de correlacao canonica (CCA), analise fatorial (FA), escalonamento multidimensional (MDS), analise discriminante linear (LDA) e quadratica (QDA), analise de cluster hierarquico e nao hierarquico, regressao linear simples e multipla, analise de multiplos fatores (MFA) para dados quantitativos, qualitativos, de frequencia (MFACT) e dados mistos, biplot, scatter plot, projection pursuit (PP), grant tour e outras funcoes uteis para a analise multivariada.
Details
Package: | MVar.pt |
Type: | Package |
Version: | 2.2.7 |
Date: | 2025-04-19 |
License: | GPL(>=2) |
LazyLoad: | yes |
Author(s)
Paulo Cesar Ossani e Marcelo Angelo Cirillo.
Maintainer: Paulo Cesar Ossani <ossanipc@hotmail.com>
References
Abdessemed, L.; Escofier, B.; Analyse factorielle multiple de tableaux de frequencies: comparaison avec l'analyse canonique des correspondences. Journal de la Societe de Statistique de Paris, Paris, v. 137, n. 2, p. 3-18, 1996.
Abdi, H. Singular Value Decomposition (SVD) and Generalized Singular Value Decomposition (GSVD). In: SALKIND, N. J. (Ed.). Encyclopedia of measurement and statistics. Thousand Oaks: Sage, 2007. p. 907-912.
Abdi, H.; Valentin, D. Multiple factor analysis (MFA). In: SALKIND, N. J. (Ed.). Encyclopedia of measurement and statistics. Thousand Oaks: Sage, 2007. p. 657-663.
Abdi, H.; Williams, L. Principal component analysis. WIREs Computational Statatistics, New York, v. 2, n. 4, p. 433-459, July/Aug. 2010.
Abdi, H.; Williams, L.; Valentin, D. Multiple factor analysis: principal component analysis for multitable and multiblock data sets. WIREs Computational Statatistics, New York, v. 5, n. 2, p. 149-179, Feb. 2013.
Asimov, D. The Grand Tour: A Tool for Viewing Multidimensional Data. SIAM Journal of Scientific and Statistical Computing, 6(1), 128-143, 1985.
Asimov, D.; Buja, A. The grand tour via geodesic interpolation of 2-frames. in Visual Data Exploration and Analysis. Symposium on Electronic Imaging Science and Technology, IS&T/SPIE. 1994.
Becue-Bertaut, M.; Pages, J. A principal axes method for comparing contingency tables: MFACT. Computational Statistics & Data Analysis, New York, v. 45, n. 3, p. 481-503, Feb. 2004
Becue-Bertaut, M.; Pages, J. Multiple factor analysis and clustering of a mixture of quantitative, categorical and frequency data. Computational Statistics & Data Analysis, New York, v. 52, n. 6, p. 3255-3268, Feb. 2008.
Benzecri, J. Analyse de l'inertie intraclasse par l'analyse d'un tableau de contingence: intra-classinertia analysis through the analysis of a contingency table. Les Cahiers de l'Analyse des Donnees, Paris, v. 8, n. 3, p. 351-358, 1983.
Buja, A.; Asimov, D. Grand tour methods: An outline. Computer Science and Statistics, 17:63-67. 1986.
Buja, A.; Cook, D.; Asimov, D.; Hurley, C. Computational Methods for High-Dimensional Rotations in Data Visualization, in C. R. Rao, E. J. Wegman & J. L. Solka, eds, "Handbook of Statistics: Data Mining and Visualization", Elsevier/North Holland, http://www.elsevier.com, pp. 391-413. 2005.
Charnet, R., at al. Analise de modelos de regressao lienar, 2a ed. Campinas: Editora da Unicamp, 2008. 357 p.
Cook, D.; Lee, E. K.; Buja, A.; WickmamM, H. Grand tours, projection pursuit guided tours and manual controls. In Chen, Chunhouh, Hardle, Wolfgang, Unwin, e Antony (Eds.), Handbook of Data Visualization, Springer Handbooks of Computational Statistics, chapter III.2, p. 295-314. Springer, 2008.
Cook, D.; Buja, A.; Cabrera, J. Projection pursuit indexes based on orthonormal function expansions. Journal of Computational and Graphical Statistics, 2(3):225-250, 1993.
Cook, D.; Buja, A.; Cabrera, J.; Hurley, C. Grand tour and projection pursuit, Journal of Computational and Graphical Statistics, 4(3), 155-172, 1995.
Cook, D.; Swayne, D. F. Interactive and Dynamic Graphics for Data Analysis: With R and GGobi. Springer. 2007.
Escofier, B. Analyse factorielle en reference a un modele: application a l'analyse d'un tableau d'echanges. Revue de Statistique Appliquee, Paris, v. 32, n. 4, p. 25-36, 1984.
Escofier, B.; Drouet, D. Analyse des differences entre plusieurs tableaux de frequence. Les Cahiers de l'Analyse des Donnees, Paris, v. 8, n. 4, p. 491-499, 1983.
Escofier, B.; Pages, J. Analyse factorielles simples et multiples. Paris: Dunod, 1990. 267 p.
Escofier, B.; Pages, J. Analyses factorielles simples et multiples: objectifs, methodes et interpretation. 4th ed. Paris: Dunod, 2008. 318 p.
Escofier, B.; Pages, J. Comparaison de groupes de variables definies sur le meme ensemble d'individus: un exemple d'applications. Le Chesnay: Institut National de Recherche en Informatique et en Automatique, 1982. 121 p.
Escofier, B.; Pages, J. Multiple factor analysis (AFUMULT package). Computational Statistics & Data Analysis, New York, v. 18, n. 1, p. 121-140, Aug. 1994
Espezua, S.; Villanueva, E.; Maciel, C. D.; Carvalho, A. A projection pursuit framework for supervised dimension reduction of high dimensional small sample datasets. Neurocomputing, 149, 767-776, 2015.
Ferreira, D. F. Estatistica multivariada. 2. ed. rev. e ampl. Lavras: UFLA, 2011. 675 p.
Friedman, J. H., Tukey, J. W. A projection pursuit algorithm for exploratory data analysis. IEEE Transaction on Computers, 23(9):881-890, 1974.
Greenacre, M.; Blasius, J. Multiple correspondence analysis and related methods. New York: Taylor and Francis, 2006. 607 p.
Hastie, T.; Buja, A.; Tibshirani, R. Penalized discriminant analysis. The Annals of Statistics. 23(1), 73-102 . 1995.
Hotelling, H. Analysis of a complex of statistical variables into principal components. Journal of Educational Psychology, Arlington, v. 24, p. 417-441, Sept. 1933.
Huber, P. J. Projection pursuit. Annals of Statistics, 13(2):435-475, 1985.
Hurley, C.; Buja, A. Analyzing high-dimensional data with motion graphics, SIAM Journal of Scientific and Statistical Computing, 11 (6), 1193-1211. 1990.
Johnson, R. A.; Wichern, D. W. Applied multivariate statistical analysis. 6th ed. New Jersey: Prentice Hall, 2007. 794 p.
Jones, M. C.; Sibson, R. What is projection pursuit, (with discussion), Journal of the Royal Statistical Society, Series A 150, 1-36, 1987.
Lee, E.; Cook, D.; Klinke, S.; Lumley, T. Projection pursuit for exploratory supervised classification. Journal of Computational and Graphical Statistics, 14(4):831-846, 2005.
Lee, E. K., Cook, D. A projection pursuit index for large p small n data. Statistics and Computing, 20(3):381-392, 2010.
Martinez, W. L.; Martinez, A. R. Computational Statistics Handbook with MATLAB, 2th. ed. New York: Chapman & Hall/CRC, 2007. 794 p.
Martinez, W. L.; Martinez, A. R.; Solka, J. Exploratory Data Analysis with MATLAB, 2th. ed. New York: Chapman & Hall/CRC, 2010. 499 p.
Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.
Ossani, P. C.; Cirillo, M. A.; Borem, F. M.; Ribeiro, D. E.; Cortez, R. M. Quality of specialty coffees: a sensory evaluation by consumers using the MFACT technique. Revista Ciencia Agronomica (UFC. Online), v. 48, p. 92-100, 2017.
Ossani, P. C. Qualidade de cafes especiais e nao especiais por meio da analise de multiplos fatores para tabelas de contingencias. 2015. 107 p. Dissertacao (Mestrado em Estatistica e Experimentacao Agropecuaria) - Universidade Federal de Lavras, Lavras, 2015.
Pages, J. Analyse factorielle multiple appliquee aux variables qualitatives et aux donnees mixtes. Revue de Statistique Appliquee, Paris, v. 50, n. 4, p. 5-37, 2002.
Pages, J. Multiple factor analysis: main features and application to sensory data. Revista Colombiana de Estadistica, Bogota, v. 27, n. 1, p. 1-26, 2004.
Pena, D.; Prieto, F. Cluster identification using projections. Journal of the American Statistical Association, 96(456):1433-1445, 2001.
Posse, C. Projection pursuit exploratory data analysis, Computational Statistics and Data Analysis, 29:669-687, 1995a.
Posse, C. Tools for two-dimensional exploratory projection pursuit, Journal of Computational and Graphical Statistics, 4:83-100, 1995b
Rencher, A.C.; Methods of Multivariate Analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
Young, F. W.; Rheingans P. Visualizing structure in high-dimensional multivariate data, IBM Journal of Research and Development, 35:97-107, 1991.
Young, F. W.; Faldowski R. A.; McFarlane M. M. Multivariate statistical visualization, in Handbook of Statistics, Vol 9, C. R. Rao (ed.), The Netherlands: Elsevier Science Publishers, 959-998, 1993.
Grafico Biplot.
Description
Realiza o grafico Biplot.
Usage
Biplot(data, alpha = 0.5, title = NA, xlabel = NA, ylabel = NA,
size = 1.1, grid = TRUE, color = TRUE, var = TRUE,
obs = TRUE, linlab = NA, class = NA, classcolor = NA,
posleg = 2, boxleg = TRUE, axes = TRUE, savptc = FALSE,
width = 3236, height = 2000, res = 300)
Arguments
data |
Dados para plotagem. |
alpha |
Representatividade dos individuos (alpha), representatividade das variaveis (1 - alpha). Sendo 0.5 o default. |
title |
Titulo para o grafico, se nao for definido assume texto padrao. |
xlabel |
Nomeia o eixo X, se nao for definido assume texto padrao. |
ylabel |
Nomeia o eixo Y, se nao for definido assume texto padrao. |
size |
Tamanho dos pontos no grafico. |
grid |
Coloca grade nos graficos (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
var |
Acrescenta as projecoes das variaveis ao grafico (default = TRUE). |
obs |
Acrescenta as observacoes ao grafico (default = TRUE). |
linlab |
Vetor com os rotulos para as observacoes. |
class |
Vetor com os nomes das classes dos dados. |
classcolor |
Vetor com as cores das classes. |
posleg |
0 sem legenda, |
boxleg |
Coloca moldura na legenda (default = TRUE). |
axes |
Plota os eixos X e Y (default = TRUE). |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
Value
Biplot |
Grafico Biplot. |
Md |
Matriz autovalores. |
Mu |
Matriz U (autovetores). |
Mv |
Matriz V (autovetores). |
coorI |
Coordenadas dos individuos. |
coorV |
Coordenadas das variaveis. |
pvar |
Proporcao dos componentes principais. |
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
References
Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
Examples
data(iris) # conjunto de dados
data <- iris[,1:4]
Biplot(data)
cls <- iris[,5]
res <- Biplot(data, alpha = 0.6, title = "Biplot dos Dados\n valorizando os individuos",
class = cls, classcolor = c("goldenrod3","gray56","red"),
posleg = 2, boxleg = FALSE, axes = TRUE, savptc = FALSE,
width = 3236, height = 2000, res = 300)
print(res$pvar)
res <- Biplot(data, alpha = 0.4, title = "Grafico valorizando as variaveis",
xlabel = "", ylabel = "", color = FALSE, obs = FALSE,
savptc = FALSE, width = 3236, height = 2000, res = 300)
print(res$pvar)
Analise de correspondencia (CA).
Description
Realiza analise de correspondencia simples (CA) e multipla (MCA) em um conjunto de dados.
Usage
CA(data, typdata = "f", typmatrix = "I")
Arguments
data |
Dados a serem analisados (tabela de contingencia). |
typdata |
"f" para dados de frequencia (default), |
typmatrix |
Matriz usada para calculos quando typdata = "c". |
Value
depdata |
Verifica se as linhas e colunas sao dependentes, ou independentes pelo teste Qui-quadrado, a nivel 5% de significancia. |
typdata |
Tipo de dados: "F" frequencia ou "C" qualitativo. |
numcood |
Numero de coordenadas principais. |
mtxP |
Matriz da frequencia relativa. |
vtrR |
Vetor com as somas das linhas. |
vtrC |
Vetor com as somas das colunas. |
mtxPR |
Matriz com perfil das linhas. |
mtxPC |
Matriz com perfil das colunas. |
mtxZ |
Matriz Z. |
mtxU |
Matriz com os autovetores U. |
mtxV |
Matriz com os autovetores V. |
mtxL |
Matriz com os autovalores. |
mtxX |
Matriz com as coordenadas principais das linhas. |
mtxY |
Matriz com as coordenadas principais das colunas. |
mtxAutvlr |
Matriz das inercias (variancias), com as proporcoes e proporcoes acumuladas. |
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
References
Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.
Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
See Also
Examples
data(DataFreq) # conjunto de dados de frequencia
data <- DataFreq[,2:ncol(DataFreq)]
rownames(data) <- as.character(t(DataFreq[1:nrow(DataFreq),1]))
res <- CA(data = data, "f") # realiza CA
print("Existe dependencia entre as linhas e as colunas?"); res$depdata
print("Numero de coordenadas principais:"); res$numcood
print("Coordenadas principais das Linhas:"); round(res$mtxX,2)
print("Coordenadas principais das Colunas:"); round(res$mtxY,2)
print("Inercias das componentes principais:"); round(res$mtxAutvlr,2)
Analise de correlacao canonica (CCA).
Description
Realiza analise de correlacao canonica (CCA) em um conjunto de dados.
Usage
CCA(X = NULL, Y = NULL, type = 1, test = "Bartlett", sign = 0.05)
Arguments
X |
Primeiro grupo de variaveis de um conjunto de dados. |
Y |
Segundo grupo de variaveis de um conjunto de dados. |
type |
1 para analise utilizando a matriz de covariancia (default), |
test |
teste de significancia da relacao entre o grupo X e Y: |
sign |
Grau de significancia do teste (default 5%). |
Value
Cxx |
Matriz de Covariancia ou Correlacao Cxx. |
Cyy |
Matriz de Covariancia ou Correlacao Cyy. |
Cxy |
Matriz de Covariancia ou Correlacao Cxy. |
Cyx |
Matriz de Covariancia ou Correlacao Cyx. |
var.UV |
Matriz com autovalores (variancias) dos pares cononicos U e V. |
corr.UV |
Matriz de Correlacao dos pares cononicos U e V. |
coef.X |
Matriz dos Coeficientes canonicos do grupo X. |
coef.Y |
Matriz dos Coeficientes canonicos do grupo Y. |
corr.X |
Matriz das Correlacoes entre as variaveis canonicas e as variaveis originais do grupo X. |
corr.Y |
Matriz das Correlacoes entre as variaveis canonicas e as variaveis originais do grupo Y. |
score.X |
Matriz com os scores do grupo X. |
score.Y |
Matriz com os scores do grupo Y. |
sigtest |
Retorna o teste de significancia da relacao entre o grupo X e Y: "Bartlett" (default) ou "Rao". |
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
References
Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.
Ferreira, D. F. Estatistica Multivariada. 2a ed. revisada e ampliada. Lavras: Editora UFLA, 2011. 676 p.
Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
Lattin, J.; Carrol, J. D.; Green, P. E. Analise de dados multivariados. 1th. ed. Sao Paulo: Cengage Learning, 2011. 455 p.
See Also
Examples
data(DataMix) # conjunto de dados
data <- DataMix[,2:ncol(DataMix)]
rownames(data) <- DataMix[,1]
X <- data[,1:2]
Y <- data[,5:6]
res <- CCA(X, Y, type = 2, test = "Bartlett", sign = 0.05)
print("Matriz com autovalores (variancias) dos pares cononicos U e V:");
round(res$var.UV,3)
print("Matriz de correlacao dos pares cononicos U e V:"); round(res$corr.UV,3)
print("Matriz dos coeficientes canonicos do grupo X:"); round(res$coef.X,3)
print("Matriz dos coeficientes canonicos do grupo Y:"); round(res$coef.Y,3)
print("Matriz das correlacoes entre as variaveis canonicas
e as variaveis originais do grupo X:"); round(res$corr.X,3)
print("Matriz das correlacoes entre as variaveis canonicas
e as variaveis originais do grupo Y:"); round(res$corr.Y,3)
print("Matriz com os scores do grupo X:"); round(res$score.X,3)
print("Matriz com os scores do grupo Y:"); round(res$score.Y,3)
print("teste de significancia dos pares canonicos:"); res$sigtest
analysis de cluster.
Description
Realiza analysis de cluster hierarquico e nao hierarquico em um conjunto de dados.
Usage
Cluster(data, titles = NA, hierarquic = TRUE, analysis = "Obs",
cor.abs = FALSE, normalize = FALSE, distance = "euclidean",
method = "complete", horizontal = FALSE, num.groups = 0,
lambda = 2, savptc = FALSE, width = 3236, height = 2000,
res = 300, casc = TRUE)
Arguments
data |
Dados a serem analizados. |
titles |
Titulos para os graficos, se nao for definido assume texto padrao. |
hierarquic |
Agrupamentos hierarquicos (default = TRUE), para agrupamentos nao hierarquicos (method K-Means), somente para caso 'analysis' = "Obs". |
analysis |
"Obs" para analises nas observacoes (default), "Var" para analises nas variaveis. |
cor.abs |
Matriz de correlacao absoluta caso 'analysis' = "Var" (default = FALSE). |
normalize |
Normaliza os dados somente para caso 'analysis' = "Obs" (default = FALSE). |
distance |
Metrica das distancias caso agrupamentos hierarquicos: "euclidean" (default), "maximum", "manhattan", "canberra", "binary" ou "minkowski". Caso analysis = "Var" a metrica sera a matriz de correlacao, conforme cor.abs. |
method |
Metodo para analises caso agrupamentos hierarquicos: "complete" (default), "ward.D", "ward.D2", "single", "average", "mcquitty", "median" ou "centroid". |
horizontal |
Dendrograma na horizontal (default = FALSE). |
num.groups |
Numero de grupos a formar. |
lambda |
Valor usado na distancia de minkowski. |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
casc |
Efeito cascata na apresentacao dos graficos (default = TRUE). |
Value
Varios graficos.
tab.res |
Tabela com as similaridades e distancias dos grupos formados. |
groups |
Dados originais com os grupos formados. |
res.groups |
Resultados dos grupos formados. |
R.sqt |
Resultado do R quadrado. |
sum.sqt |
Soma do quadrado total. |
mtx.dist |
Matriz das distancias. |
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
References
Mingoti, S. A. Analysis de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.
Ferreira, D. F. Estatistica Multivariada. 2a ed. revisada e ampliada. Lavras: Editora UFLA, 2011. 676 p.
Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
Examples
data(DataQuan) # conjunto de dados quantitativos
data <- DataQuan[,2:8]
rownames(data) <- DataQuan[1:nrow(DataQuan),1]
res <- Cluster(data, titles = NA, hierarquic = TRUE, analysis = "Obs",
cor.abs = FALSE, normalize = FALSE, distance = "euclidean",
method = "ward.D", horizontal = FALSE, num.groups = 2,
savptc = FALSE, width = 3236, height = 2000, res = 300,
casc = FALSE)
print("R quadrado:"); res$R.sqt
# print("Soma do quadrado total:"); res$sum.sqt
print("Grupos formados:"); res$groups
# print("Tabela com as similaridades e distancias:"); res$tab.res
# print("Tabela com os resultados dos grupos:"); res$res.groups
# print("Matriz de distancias:"); res$mtx.dist
write.table(file=file.path(tempdir(),"SimilarityTable.csv"), res$tab.res, sep=";",
dec=",",row.names = FALSE)
write.table(file=file.path(tempdir(),"GroupData.csv"), res$groups, sep=";",
dec=",",row.names = TRUE)
write.table(file=file.path(tempdir(),"GroupResults.csv"), res$res.groups, sep=";",
dec=",",row.names = TRUE)
Coeficiente de variacao dos dados.
Description
Encontra o coeficiente de variacao dos dados, global ou por coluna.
Usage
CoefVar(data, type = 1)
Arguments
data |
Dados a serem analisados. |
type |
1 Coeficiente de variacao global (default), |
Value
Coeficiente de variacao, global ou por coluna.
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
References
Ferreira, D. F. Estatistica Basica. 2 ed. rev. Lavras: UFLA, 2009. 664 p.
Examples
data(DataQuan) # conjunto de dados
data <- DataQuan[,2:8]
res <- CoefVar(data = data, type = 1) # coeficiente de variacao global
round(res,2)
res <- CoefVar(data = data, type = 2) # coeficiente de variacao por coluna
round(res,2)
Analise discriminante linear (LDA) e quadratica (QDA).
Description
Realiza analise discriminante linear e quadratica.
Usage
DA(data, class = NA, type = "lda", validation = "learning",
method = "moment", prior = NA, testing = NA)
Arguments
data |
Dados a serem a classificados. |
class |
Vetor com os nomes das classes dos dados. |
type |
"lda": analise discriminante linear (default), ou |
validation |
Tipo de validacao: |
method |
Metodo de classificacao: |
prior |
Probabilidades de ocorrencia das classes. Se nao especificado, tomara as proporcoes das classes. Se especificado, as probabilidades devem seguir a ordem dos niveis dos fatores. |
testing |
Vetor com os indices que serao utilizados em data como teste. Para validation = "learning", tem-se testing = NA. |
Value
confusion |
Tabela de confusao. |
error.rate |
Proporcao global de erro. |
prior |
Probabilidade das classes. |
type |
Tipo de analise discriminante. |
validation |
Tipo de validacao. |
num.class |
Numero de classes. |
class.names |
Nomes das classes |
method |
Metodo de classificacao. |
num.correct |
Numero de observacoes corretas. |
results |
Matriz com resultados comparativos das classificacoes. |
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
References
Ferreira, D. F. Estatistica Multivariada. 2a ed. revisada e ampliada. Lavras: Editora UFLA, 2011. 676 p.
Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.
Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
Ripley, B. D. Pattern Recognition and Neural Networks. Cambridge University Press, 1996.
Venabless, W. N.; Ripley, B. D. Modern Applied Statistics with S. Fourth edition. Springer, 2002.
Examples
data(iris) # conjunto de dados
data = iris[,1:4] # dados a serem classificados
class = iris[,5] # classe dos dados
prior = c(1,1,1)/3 # probabilidade a priori das classes
res <- DA(data, class, type = "lda", validation = "learning",
method = "mle", prior = prior, testing = NA)
print("Tabela de confusao:"); res$confusion
print("Proporcao global de acerto:"); 1 - res$error.rate
print("Probabilidade das classes:"); res$prior
print("Metodo de classificacao:"); res$method
print("Tipo analise discriminante:"); res$type
print("Nomes das classes:"); res$class.names
print("Numero de classes:"); res$num.class
print("Tipo de validacao:"); res$validation
print("Numero de observacoes corretas:"); res$num.correct
print("Matriz com os resultados da classificacao:"); res$results
### validacao cruzada ###
amostra = sample(2, nrow(data), replace = TRUE, prob = c(0.7,0.3))
datatrain = data[amostra == 1,] # dados para treino
datatest = data[amostra == 2,] # dados para teste
dim(datatrain) # dimensao dados treino
dim(datatest) # dimensao dados teste
testing = as.integer(rownames(datatest)) # indice dos dados teste
res <- DA(data, class, type = "qda", validation = "testing",
method = "moment", prior = NA, testing = testing)
print("Tabela de confusao:"); res$confusion
print("Proporcao global de acerto:"); 1 - res$error.rate
print("Numero de observacoes corretas:"); res$num.correct
print("Matriz com os resultados da classificacao:"); res$results
Conjunto de dados de frequencia.
Description
Conjunto simulado de dados com a frequencia semanal do numero de chicaras de cafes consumidas semanalmente em algumas capitais mundiais.
Usage
data(DataFreq)
Format
Conjunto de dados com 6 linhas e 9 colunas. Sendo 6 observacoes descritas por 9 variaveis: Grupo por sexo e idade, Sao Paulo - Cafe Bourbon, Londres - Cafe Bourbon, Atenas - Cafe Bourbon, Londres - Cafe Acaia, Atenas - Cafe Acaia, Sao Paulo - Cafe Catuai, Londres - Cafe Catuai, Atenas - Cafe Catuai.
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
Examples
data(DataFreq)
DataFreq
Conjunto de dados mistos.
Description
Conjunto simulado de dados mistos, sobre consumo de cafes.
Usage
data(DataMix)
Format
Conjunto de dados com 10 linhas e 7 colunas. Sendo 10 observacoes descritas por 7 variaveis: Cooperativas/Degustadores, Medias das notas dadas aos cafes analisados, Anos de trabalho como degustador, Degustador com formacao tecnica, Degustador com dedicacao exclusiva, Frequencia media dos cafes classificados como especiais, Frequencia media dos cafes classificados como comercias.
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
Examples
data(DataMix)
DataMix
Conjunto de dados qualitativos.
Description
Conjunto simulado de dados qualitativos, sobre consumo de cafes.
Usage
data(DataQuali)
Format
Conjunto simulado de dados com 12 linhas e 6 colunas. Sendo 12 observacoes descritas por 6 variaveis: Sexo, Idade, Fumante, Estado Civil, Esportista, Estuda.
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
Examples
data(DataQuali)
DataQuali
Conjunto de dados quantitativos.
Description
Conjunto simulado de dados quantitativos, sobre notas dadas a algumas caracteristas sensoriais dos cafes.
Usage
data(DataQuan)
Format
Conjunto de dados com 6 linhas e 11 colunas. Sendo 6 observacoes descritas por 11 variaveis: Cafes, Achocolatado, Acaramelado, Maduro, Doce, Delicado, Amendoado, Acaramelado, Achocolatado, Picante, Acaramelado.
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
Examples
data(DataQuan)
DataQuan
Conjunto de dados de frequencia.
Description
Conjunto de dados categorizados por cafes, sobre habilidades sensoriais no consumo de cafes especiais.
Usage
data(Data_Cafes)
Format
Conjunto de dados de uma pesquisa feita com o proposito de avaliar a concordancia entre as respostas de diferentes grupos de consumidores com diferentes habilidades sensoriais. O experimento relaciona a analise sensorial de cafes especiais definidos por (A) Bourbon Amarelo, cultivado a altitudes maiores do que 1200 m.; (D) idem a (A) diferenciando apenas no preparo das amostras; (B) Acaia cultivados a altitude menores do que 1.100m; (C) idem ao (B) porem diferenciando o preparo das amostras. Aqui os dados estao categorizados por cafes. O exemplo dado demonstra os resultados encontrados em OSSANI et al. (2017).
References
Ossani, P. C.; Cirillo, M. A.; Borem, F. M.; Ribeiro, D. E.; Cortez, R. M. Quality of specialty coffees: a sensory evaluation by consumers using the MFACT technique. Revista Ciencia Agronomica (UFC. Online), v. 48, p. 92-100, 2017.
Ossani, P. C. Qualidade de cafes especiais e nao especiais por meio da analise de multiplos fatores para tabelas de contingencias. 2015. 107 p. Dissertacao (Mestrado em Estatistica e Experimentacao Agropecuaria) - Universidade Federal de Lavras, Lavras, 2015.
Examples
data(Data_Cafes) # conjunto de dados categorizados
data <- Data_Cafes[,2:ncol(Data_Cafes)]
rownames(data) <- as.character(t(Data_Cafes[1:nrow(Data_Cafes),1]))
group.names = c("Cafe A", "Cafe B", "Cafe C", "Cafe D")
mf <- MFA(data, c(16,16,16,16), c(rep("f",4)), group.names)
print("Variancias dos Componentes Principais:"); round(mf$mtxA,2)
print("Matriz das Inercias Parciais/Escores das Variaveis:"); round(mf$mtxEV,2)
tit <- c("Scree-plot","Individuos", "Individuos/Tipos Cafes", "Inercias Grupos")
Plot.MFA(mf, titles = tit, xlabel = NA, ylabel = NA,
posleg = 2, boxleg = FALSE, color = TRUE,
namarr = FALSE, linlab = NA, casc = FALSE) # Imprime varios graficos da tela
Conjunto de dados de frequencia.
Description
Conjunto de dados categorizados por individuos, sobre habilidades sensoriais no consumo de cafes especiais.
Usage
data(Data_Individuos)
Format
Conjunto de dados de uma pesquisa feita com o proposito de avaliar a concordancia entre as respostas de diferentes grupos de consumidores com diferentes habilidades sensoriais. O experimento relaciona a analise sensorial de cafes especiais definidos por (A) Bourbon Amarelo, cultivado a altitudes maiores do que 1200 m.; (D) idem a (A) diferenciando apenas no preparo das amostras; (B) Acaia cultivados a altitude menores do que 1.100m; (C) idem ao (B) porem diferenciando o preparo das amostras. Aqui os dados estao categorizados por individuos. O exemplo dado demonstra os resultados encontrados em OSSANI et al. (2017).
References
Ossani, P. C.; Cirillo, M. A.; Borem, F. M.; Ribeiro, D. E.; Cortez, R. M. Quality of specialty coffees: a sensory evaluation by consumers using the MFACT technique. Revista Ciencia Agronomica (UFC. Online), v. 48, p. 92-100, 2017.
Ossani, P. C. Qualidade de cafes especiais e nao especiais por meio da analise de multiplos fatores para tabelas de contingencias. 2015. 107 p. Dissertacao (Mestrado em Estatistica e Experimentacao Agropecuaria) - Universidade Federal de Lavras, Lavras, 2015.
Examples
data(Data_Individuos) # conjundo de dados categorizados
data <- Data_Individuos[,2:ncol(Data_Individuos)]
rownames(data) <- as.character(t(Data_Individuos[1:nrow(Data_Individuos),1]))
group.names = c("Grupo 1", "Grupo 2", "Grupo 3", "Grupo 4")
mf <- MFA(data, c(16,16,16,16), c(rep("f",4)), group.names) # analise dos dados
print("Variancias dos Componentes Principais:"); round(mf$mtxA,2)
print("Matriz das Inercias Parciais/Escores das Variaveis:"); round(mf$mtxEV,2)
tit <- c("Scree-plot","Individuos", "Individuos/Grupos Individuos", "Inercias Grupos")
Plot.MFA(mf, titles = tit, xlabel = NA, ylabel = NA,
posleg = 2, boxleg = FALSE, color = TRUE,
namarr = FALSE, linlab = NA, casc = FALSE) # Imprime varios graficos da tela
Analise fatorial (FA).
Description
Realiza analise fatorial (FA) em um conjunto de dados.
Usage
FA(data, method = "PC", type = 2, nfactor = 1, rotation = "None",
scoresobs = "Bartlett", converg = 1e-5, iteracao = 1000,
testfit = TRUE)
Arguments
data |
Dados a serem analisados. |
method |
Metodo de analise: |
type |
1 para analise utilizando a matriz de covariancia, |
rotation |
Tipo de rotacao: "None" (default), "Varimax" e "Promax". |
nfactor |
Numero de fatores (default = 1). |
scoresobs |
Tipo de scores para as observacoes: "Bartlett" (default) ou "Regression". |
converg |
Valor limite para convergencia para soma do quadrado dos residuos para metodo de Maxima Verossimilhanca (default = 1e-5). |
iteracao |
Numero maximo de iteracoes para metodo de Maxima Verossimilhanca (default = 1000). |
testfit |
Testa o ajuste do modelo para o metodo de Maxima Verossimilhanca (default = TRUE). |
Value
mtxMC |
Matriz de Correlacao/Covariancia. |
mtxAutvlr |
Matriz de autovalores. |
mtxAutvec |
Matriz de autovetores. |
mtxvar |
Matriz de variancias e proporcoes. |
mtxcarga |
Matriz de cargas fatoriais. |
mtxvaresp |
Matriz das variancias especificas. |
mtxcomuna |
Matriz das comunalidades. |
mtxresidue |
Matriz dos residuos. |
vlrsqrs |
Valor limite superior para a soma dos quadrados dos residuos. |
vlrsqr |
Soma dos quadrados dos residuos. |
mtxresult |
Matriz com todos os resultados associados. |
mtxscores |
Matriz com os escores das observacoes. |
coefscores |
Matriz com os escores dos coeficientes dos fatores. |
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
References
Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.
Kaiser, H. F.The varimax criterion for analytic rotation in factor analysis. Psychometrika 23, 187-200, 1958.
Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
Ferreira, D. F. Estatistica Multivariada. 2a ed. revisada e ampliada. Lavras: Editora UFLA, 2011. 676 p.
See Also
Examples
data(DataQuan) # conjunto de dados
data <- DataQuan[,2:ncol(DataQuan)]
rownames(data) <- DataQuan[,1]
res <- FA(data = data, method = "PC", type = 2, nfactor = 3, rotation = "None",
scoresobs = "Bartlett", converg = 1e-5, iteracao = 1000,
testfit = TRUE)
print("Matriz com todos os resultados associados:"); round(res$mtxresult,3)
print("Soma dos Quadrados dos Residuos:"); round(res$vlrsqr,3)
print("Matriz das Cargas Fatoriais:"); round(res$mtxcarga,3)
print("Matriz com os escores das observacoes:"); round(res$mtxscores,3)
print("Matriz com os escores dos coeficientes dos fatores:"); round(res$coefscores,3)
Decomposicao de valor singular generalizada (GSVD).
Description
Dada a matriz A
de ordem nxm
, a decomposicao de valor singular generalizada (GSVD), envolve a utilizacao de dois conjuntos de matrizes quadradas positivas de ordem nxn
e mxm
, respectivamente. Estas duas matrizes expressam restricoes impostas, respectivamente, nas linhas e colunas de A
.
Usage
GSVD(data, plin = NULL, pcol = NULL)
Arguments
data |
Matriz usada para a decomposicao. |
plin |
Peso para as linhas. |
pcol |
Peso para as colunas. |
Details
Se nao for utilizado plin ou pcol, sera calculada como a decomposicao em valor singular usual.
Value
d |
Autovalores, isto e, vector linha com os valores singulares da decomposicao. |
u |
Autovetores referentes as linhas. |
v |
Autovetores referentes as colunas. |
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
References
Abdi, H. Singular Value Decomposition (SVD) and Generalized Singular Value Decomposition (GSVD). In: SALKIND, N. J. (Ed.). Encyclopedia of measurement and statistics. Thousand Oaks: Sage, 2007. p. 907-912.
Examples
data <- matrix(c(1,2,3,4,5,6,7,8,9,10,11,12), nrow = 4, ncol = 3)
svd(data) # decomposicao de valor singular usual
GSVD(data) # GSVD com os mesmos resultados anteriores
# GSVD com pesos para linhas e colunas
GSVD(data, plin = c(0.1,0.5,2,1.5), pcol = c(1.3,2,0.8))
Tecnica de animacao Grand Tour.
Description
Realiza a exploracao dos dados atraves da tecnica de animacao Grand Tour.
Usage
GrandTour(data, method = "Interpolation", title = NA, xlabel = NA,
ylabel = NA, size = 1.1, grid = TRUE, color = TRUE, linlab = NA,
class = NA, classcolor = NA, posleg = 2, boxleg = TRUE,
axesvar = TRUE, axes = TRUE, numrot = 200, choicerot = NA,
savptc = FALSE, width = 3236, height = 2000, res = 300)
Arguments
data |
Conjunto de dados numericos. |
method |
Metodo usado para as rotacoes: |
title |
Titulo para os graficos, se nao for definido assume texto padrao. |
xlabel |
Nomeia o eixo X, se nao for definido assume texto padrao. |
ylabel |
Nomeia o eixo Y, se nao for definido assume texto padrao. |
size |
Tamanho dos pontos no grafico. |
grid |
Coloca grade nos graficos (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
linlab |
Vetor com os rotulos para as observacoes. |
class |
Vetor com os nomes das classes dos dados. |
classcolor |
Vetor com as cores das classes. |
posleg |
0 sem legenda, |
boxleg |
Coloca moldura na legenda (default = TRUE). |
axesvar |
Coloca eixos de rotacao das variaveis (default = TRUE). |
axes |
Plota os eixos X e Y (default = TRUE). |
numrot |
Numero de rotacoes (default = 200). Se method = "Interpolation", numrot representara o angulo de rotacao. |
choicerot |
Escolhe rotacao especifica e apresenta na tela, ou salva a imagem se savptc = TRUE. |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
Value
Graficos com as rotacoes.
proj.data |
Dados projetados. |
vector.opt |
Vetor projecao. |
method |
Metodo usado no Grand Tour. |
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
References
Asimov, D. The Grand Tour: A Tool for Viewing Multidimensional data. SIAM Journal of Scientific and Statistical Computing, 6(1), 128-143, 1985.
Asimov, D.; Buja, A. The grand tour via geodesic interpolation of 2-frames. in Visual data Exploration and Analysis. Symposium on Electronic Imaging Science and Technology, IS&T/SPIE. 1994.
Buja, A.; Asimov, D. Grand tour methods: An outline. Computer Science and Statistics, 17:63-67. 1986.
Buja, A.; Cook, D.; Asimov, D.; Hurley, C. Computational methods for High-Dimensional Rotations in data Visualization, in C. R. Rao, E. J. Wegman & J. L. Solka, eds, "Handbook of Statistics: data Mining and Visualization", Elsevier/North Holland, http://www.elsevier.com, pp. 391-413. 2005.
Hurley, C.; Buja, A. Analyzing high-dimensional data with motion graphics, SIAM Journal of Scientific and Statistical Computing, 11 (6), 1193-1211. 1990.
Martinez, W. L.; Martinez, A. R.; Solka, J.; Exploratory data Analysis with MATLAB, 2th. ed. New York: Chapman & Hall/CRC, 2010. 499 p.
Young, F. W.; Rheingans P. Visualizing structure in high-dimensional multivariate data, IBM Journal of Research and Development, 35:97-107, 1991.
Young, F. W.; Faldowski R. A.; McFarlane M. M. Multivariate statistical visualization, in Handbook of Statistics, Vol 9, C. R. Rao (ed.), The Netherlands: Elsevier Science Publishers, 959-998, 1993.
Examples
data(iris) # conjunto de dados
res <- GrandTour(iris[,1:4], method = "Torus", title = NA, xlabel = NA, ylabel = NA,
color = TRUE, linlab = NA, class = NA, posleg = 2, boxleg = TRUE,
axesvar = TRUE, axes = FALSE, numrot = 10, choicerot = NA,
savptc = FALSE, width = 3236, height = 2000, res = 300)
print("Dados projetados:"); res$proj.data
print("Vetores de projecao:"); res$vector.opt
print("Metodo da projecao Grand Tour:"); res$method
res <- GrandTour(iris[,1:4], method = "Interpolation", title = NA, xlabel = NA, ylabel = NA,
color = TRUE, linlab = NA, posleg = 2, boxleg = FALSE, axesvar = FALSE,
axes = FALSE, numrot = 10, choicerot = NA, class = iris[,5],
classcolor = c("goldenrod3","gray53","red"), savptc = FALSE,
width = 3236, height = 2000, res = 300)
print("Dados projetados:"); res$proj.data
print("Vetores de projecao:"); res$vector.opt
print("Metodo da projecao Grand Tour:"); res$method
Matriz indicadora.
Description
Na matriz indicadora os elementos estao dispostos na forma de variaveis dummy, em outras palavras, 1 para uma categoria escolhida como variavel resposta e 0 para as outras categorias de uma mesma variavel.
Usage
IM(data, names = TRUE)
Arguments
data |
Dados categoricos. |
names |
Inclui os nomes das variaveis nos niveis da Matriz Indicadora (default = TRUE). |
Value
mtxIndc |
Retorna dados convertidos em matriz indicadora. |
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
References
Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
Examples
data <- matrix(c("S","S","N","N",1,2,3,4,"N","S","T","N"), nrow = 4, ncol = 3)
IM(data, names = FALSE)
data(DataQuali) # conjunto de dados qualitativos
IM(DataQuali, names = TRUE)
Funcao para melhor posicao dos rotulos nos graficos.
Description
Funcao para melhor posicao dos rotulos nos graficos.
Usage
LocLab(x, y = NULL, labels = seq(along = x), cex = 1,
method = c("SANN", "GA"), allowSmallOverlap = FALSE,
trace = FALSE, shadotext = FALSE,
doPlot = TRUE, ...)
Arguments
x |
Coordenada x |
y |
Coordenada y |
labels |
Os rotulos |
cex |
cex |
method |
Nao usado |
allowSmallOverlap |
Booleana |
trace |
Booleana |
shadotext |
Booleana |
doPlot |
Booleana |
... |
Outros argumentos passados para ou a partir de outros metodos |
Value
Veja o texto da funcao.
Escalonamento multidimensional (MDS).
Description
Realiza o escalonamento multidimensional (MDS) em um conjunto de dados.
Usage
MDS(data, distance = "euclidean", title = NA, xlabel = NA,
ylabel = NA, posleg = 2, boxleg = TRUE, axes = TRUE,
size = 1.1, grid = TRUE, color = TRUE, linlab = NA,
class = NA, classcolor = NA, savptc = FALSE, width = 3236,
height = 2000, res = 300)
Arguments
data |
Dados a serem analizados. |
distance |
Metrica das distancias: "euclidean" (default), "maximum", "manhattan", "canberra", "binary" ou "minkowski". |
title |
Titulo do grafico, se nao for definido assume texto padrao. |
xlabel |
Nomeia o eixo X, se nao for definido assume texto padrao. |
ylabel |
Nomeia o eixo Y, se nao for definido assume texto padrao. |
posleg |
0 sem legenda, |
boxleg |
Coloca moldura na legenda (default = TRUE). |
axes |
Coloca eixos nos graficos (default = TRUE). |
size |
Tamanho dos pontos no grafico . |
grid |
Coloca grade nos graficos (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
linlab |
Vetor com os rotulos para as observacoes. |
class |
Vetor com os nomes das classes dos dados. |
classcolor |
Vetor com as cores das classes. |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
Value
Grafico de escalonamento multidimensional.
mtxD |
Matriz das distancias. |
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
References
Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.
Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
Examples
data(iris) # conjunto de dados
data <- iris[,1:4]
cls <- iris[,5] # classe dos dados
md <- MDS(data = data, distance = "euclidean", title = NA, xlabel = NA,
ylabel = NA, posleg = 2, boxleg = TRUE, axes = TRUE, color = TRUE,
linlab = NA, class = cls, classcolor = c("goldenrod3","gray53","red"),
savptc = FALSE, width = 3236, height = 2000, res = 300)
print("Matriz das distancias:"); md$mtxD
Analise de multiplos fatores (MFA).
Description
Realiza analise de multiplos fatores (MFA) em grupos de variaveis. Os grupos de variaveis podem ser dados quantitativos, qualitativos, de frequencia (MFACT), ou dados mistos.
Usage
MFA(data, groups, typegroups = rep("n", length(groups)), namegroups = NULL)
Arguments
data |
Dados a serem analisados. |
groups |
Numero de colunas para cada grupo em ordem seguindo a ordem dos dados em 'data'. |
typegroups |
Tipo de grupo: |
namegroups |
Nomes para cada grupo. |
Value
vtrG |
Vetor com os tamanhos de cada grupo. |
vtrNG |
Vetor com os nomes de cada grupo. |
vtrplin |
Vetor com os valores usados para balancear as linhas da matriz Z. |
vtrpcol |
Vetor com os valores usados para balancear as colunas da matriz Z. |
mtxZ |
Matriz concatenada e balanceada. |
mtxA |
Matriz de autovalores (variancias) com as proporcoes e proporcoes acumuladas. |
mtxU |
Matriz U da decomposicao singular da matriz Z. |
mtxV |
Matriz V da decomposicao singular da matriz Z. |
mtxF |
Matriz global dos escores dos fatores onde as linhas sao as observacoes e as colunas os componentes. |
mtxEFG |
Matriz dos escores dos fatores por grupo. |
mtxCCP |
Matriz de correlacao dos componentes principais com as variaveis originais. |
mtxEV |
Matriz das inercias parciais/escores das variaveis. |
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
References
Abdessemed, L.; Escofier, B. Analyse factorielle multiple de tableaux de frequencies: comparaison avec l'analyse canonique des correspondences. Journal de la Societe de Statistique de Paris, Paris, v. 137, n. 2, p. 3-18, 1996..
Abdi, H. Singular Value Decomposition (SVD) and Generalized Singular Value Decomposition (GSVD). In: SALKIND, N. J. (Ed.). Encyclopedia of measurement and statistics. Thousand Oaks: Sage, 2007. p. 907-912.
Abdi, H.; Valentin, D. Multiple factor analysis (MFA). In: SALKIND, N. J. (Ed.). Encyclopedia of measurement and statistics. Thousand Oaks: Sage, 2007. p. 657-663.
Abdi, H.; Williams, L. Principal component analysis. WIREs Computational Statatistics, New York, v. 2, n. 4, p. 433-459, July/Aug. 2010.
Abdi, H.; Williams, L.; Valentin, D. Multiple factor analysis: principal component analysis for multitable and multiblock data sets. WIREs Computational Statatistics, New York, v. 5, n. 2, p. 149-179, Feb. 2013.
Becue-Bertaut, M.; Pages, J. A principal axes method for comparing contingency tables: MFACT. Computational Statistics & data Analysis, New York, v. 45, n. 3, p. 481-503, Feb. 2004
Becue-Bertaut, M.; Pages, J. Multiple factor analysis and clustering of a mixture of quantitative, categorical and frequency data. Computational Statistics & data Analysis, New York, v. 52, n. 6, p. 3255-3268, Feb. 2008.
Bezecri, J. Analyse de l'inertie intraclasse par l'analyse d'un tableau de contingence: intra-classinertia analysis through the analysis of a contingency table. Les Cahiers de l'Analyse des Donnees, Paris, v. 8, n. 3, p. 351-358, 1983.
Escofier, B. Analyse factorielle en reference a un modele: application a l'analyse d'un tableau d'echanges. Revue de Statistique Appliquee, Paris, v. 32, n. 4, p. 25-36, 1984.
Escofier, B.; Drouet, D. Analyse des differences entre plusieurs tableaux de frequence. Les Cahiers de l'Analyse des Donnees, Paris, v. 8, n. 4, p. 491-499, 1983.
Escofier, B.; Pages, J. Analyse factorielles simples et multiples. Paris: Dunod, 1990. 267 p.
Escofier, B.; Pages, J. Analyses factorielles simples et multiples: objectifs, methodes et interpretation. 4th ed. Paris: Dunod, 2008. 318 p.
Escofier, B.; Pages, J. Comparaison de groupes de variables definies sur le meme ensemble d'individus: un exemple d'applications. Le Chesnay: Institut National de Recherche en Informatique et en Automatique, 1982. 121 p.
Escofier, B.; Pages, J. Multiple factor analysis (AFUMULT package). Computational Statistics & data Analysis, New York, v. 18, n. 1, p. 121-140, Aug. 1994
Greenacre, M.; Blasius, J. Multiple correspondence analysis and related methods. New York: Taylor and Francis, 2006. 607 p.
Ossani, P. C.; Cirillo, M. A.; Borem, F. M.; Ribeiro, D. E.; Cortez, R. M. Quality of specialty coffees: a sensory evaluation by consumers using the MFACT technique. Revista Ciencia Agronomica (UFC. Online), v. 48, p. 92-100, 2017.
Pages, J. Analyse factorielle multiple appliquee aux variables qualitatives et aux donnees mixtes. Revue de Statistique Appliquee, Paris, v. 50, n. 4, p. 5-37, 2002.
Pages, J.. Multiple factor analysis: main features and application to sensory data. Revista Colombiana de Estadistica, Bogota, v. 27, n. 1, p. 1-26, 2004.
See Also
Examples
data(DataMix) # conjunto de dados mistos
data <- DataMix[,2:ncol(DataMix)]
rownames(data) <- DataMix[1:nrow(DataMix),1]
group.names = c("Notas Cafes/Trabalho", "Formacao/Dedicacao", "Cafes")
mf <- MFA(data = data, c(2,2,2), typegroups = c("n","c","f"), group.names) # realiza MFA
print("Variancias dos Componentes Principais:"); round(mf$mtxA,2)
print("Matriz das Inercias Parciais/Escores das Variaveis:"); round(mf$mtxEV,2)
Normaliza os dados.
Description
Funcao que normaliza os dados globalmente, ou por coluna.
Usage
NormData(data, type = 1)
Arguments
data |
Dados a serem normalizados. |
type |
1 normaliza global (default), |
Value
dataNorm |
Dados normalizados. |
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
Examples
data(DataQuan) # conjunto de dados quantitativos
data <- DataQuan[,2:8]
res <- NormData(data, type = 1) # normaliza os dados globalmente
res # dados normalizados globalmente
sd(res) # desvio padrao global
mean(res) # media global
res <- NormData(data, type = 2) # normaliza os dados por coluna
res # dados normalizados por coluna
apply(res, 2, sd) # desvio padrao por coluna
colMeans(res) # medias das colunas
Teste de normalidade dos dados.
Description
Verificar a normalidade dos dados, baseado no teste de coeficiente de assimetria.
Usage
NormTest(data, sign = 0.05)
Arguments
data |
Dados a serem analisados. |
sign |
Grau de significancia do teste (default 5%). |
Value
statistic |
Valor Chi-quadrado observado, ou seja, a estatistica do teste. |
chisquare |
Valor Chi-quadrado calculado. |
gl |
Grau de liberdade. |
p.value |
Valor p. |
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
References
Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.
Rencher, A. C. Methods of Multivariate Analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
Ferreira, D. F. Estatistica Multivariada. 2a ed. revisada e ampliada. Lavras: Editora UFLA, 2011. 676 p.
Examples
data <- cbind(rnorm(100,2,3), rnorm(100,1,2))
NormTest(data)
plot(density(data))
data <- cbind(rexp(200,3), rexp(200,3))
NormTest(data, sign = 0.01)
plot(density(data))
Analise de componentes principais (PCA).
Description
Realiza analise de componentes principais (PCA) em um conjunto de dados.
Usage
PCA(data, type = 1)
Arguments
data |
Dados a serem analizados. |
type |
1 para analise utilizando a matriz de covariancia (default), |
Value
mtxC |
Matriz de covariancia ou de correlacao conforme "type". |
mtxAutvlr |
Matriz de autovalores (variancias) com as proporcoes e proporcoes acumuladas. |
mtxAutvec |
Matriz de autovetores - componentes principais. |
mtxVCP |
Matriz da covariancia dos componentes principais com as variaveis originais. |
mtxCCP |
Matriz da correlacao dos componentes principais com as variaveis originais. |
mtxscores |
Matriz com os escores dos componentes principais. |
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
References
Hotelling, H. Analysis of a complex of statistical variables into principal components. Journal of Educational Psychology, Arlington, v. 24, p. 417-441, Sept. 1933.
Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.
Ferreira, D. F. Estatistica Multivariada. 2a ed. revisada e ampliada. Lavras: Editora UFLA, 2011. 676 p.
Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.. 708 p.
See Also
Examples
data(DataQuan) # conjunto de dados quantitativos
data <- DataQuan[,2:8]
rownames(data) <- DataQuan[1:nrow(DataQuan),1]
pc <- PCA(data = data, 2) # executa o PCA
print("Matriz de Covariancia/Correlacao:"); round(pc$mtxC,2)
print("Componentes Principais:"); round(pc$mtxAutvec,2)
print("Variancias dos Componentes Principais:"); round(pc$mtxAutvlr,2)
print("Covariancia dos Componentes Principais:"); round(pc$mtxVCP,2)
print("Correlacao dos Componentes Principais:"); round(pc$mtxCCP,2)
print("Escores dos Componentes Principais:"); round(pc$mtxscores,2)
Funcao para encontrar os indices da projection pursuit (PP).
Description
Funcao usada para encontrar os indices da projection pursuit (PP).
Usage
PP_Index(data, class = NA, vector.proj = NA,
findex = "HOLES", dimproj = 2, weight = TRUE,
lambda = 0.1, r = 1, ck = NA)
Arguments
data |
Conjunto de dados numericos sem a informacao das classes. |
class |
Vetor com os nomes das classes dos dados. |
vector.proj |
Vetor projecao. |
findex |
Funcao indice de projecao a ser usada: |
dimproj |
Dimensao da projecao dos dados (default = 2). |
weight |
Usado nos indice LDA, PDA e Lr, para ponderar os calculos pelo numero de elementos em cada classe (default = TRUE). |
lambda |
Usado no indice PDA (default = 0.1). |
r |
Usado no indice Lr (default = 1). |
ck |
Uso interno da funcao indice CHI. |
Value
num.class |
Numero de classes. |
class.names |
Nomes das classes. |
findex |
Funcao indice de projecao usada. |
vector.proj |
Vetores de projecao encontrados. |
index |
Indice de projecao encontrado no processo. |
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
References
Ossani, P. C.; Figueira, M. R.; Cirillo, M. A. Proposition of a new index for projection pursuit in the multiple factor analysis. Computational and Mathematical Methods, v. 1, p. 1-18, 2020.
Cook, D.; Buja, A.; Cabrera, J. Projection pursuit indexes based on orthonormal function expansions. Journal of Computational and Graphical Statistics, 2(3):225-250, 1993.
Cook, D.; Buja, A.; Cabrera, J.; Hurley, C. Grand tour and projection pursuit, Journal of Computational and Graphical Statistics, 4(3), 155-172, 1995.
Cook, D.; Swayne, D. F. Interactive and Dynamic Graphics for data Analysis: With R and GGobi. Springer. 2007.
Espezua, S.; Villanueva, E.; Maciel, C. D.; Carvalho, A. A projection pursuit framework for supervised dimension reduction of high dimensional small sample datasets. Neurocomputing, 149, 767-776, 2015.
Friedman, J. H., Tukey, J. W. A projection pursuit algorithm for exploratory data analysis. IEEE Transaction on Computers, 23(9):881-890, 1974.
Hastie, T., Buja, A., Tibshirani, R. Penalized discriminant analysis. The Annals of Statistics. 23(1), 73-102 . 1995.
Huber, P. J. Projection pursuit. Annals of Statistics, 13(2):435-475, 1985.
Jones, M. C.; Sibson, R. What is projection pursuit, (with discussion), Journal of the Royal Statistical Society, Series A 150, 1-36, 1987.
Lee, E. K.; Cook, D. A projection pursuit index for large p small n data. Statistics and Computing, 20(3):381-392, 2010.
Lee, E.; Cook, D.; Klinke, S.; Lumley, T. Projection pursuit for exploratory supervised classification. Journal of Computational and Graphical Statistics, 14(4):831-846, 2005.
Martinez, W. L., Martinez, A. R.; Computational Statistics Handbook with MATLAB, 2th. ed. New York: Chapman & Hall/CRC, 2007. 794 p.
Martinez, W. L.; Martinez, A. R.; Solka, J. Exploratory data Analysis with MATLAB, 2th. ed. New York: Chapman & Hall/CRC, 2010. 499 p.
Pena, D.; Prieto, F. Cluster identification using projections. Journal of the American Statistical Association, 96(456):1433-1445, 2001.
Posse, C. Projection pursuit exploratory data analysis, Computational Statistics and data Analysis, 29:669-687, 1995a.
Posse, C. Tools for two-dimensional exploratory projection pursuit, Journal of Computational and Graphical Statistics, 4:83-100, 1995b.
See Also
PP_Optimizer
and Plot.PP
Examples
data(iris) # conjunto de dados
data <- iris[,1:4]
# Exemplo 1 - Sem as classes nos dados
ind <- PP_Index(data = data, class = NA, vector.proj = NA,
findex = "moment", dimproj = 2, weight = TRUE,
lambda = 0.1, r = 1)
print("Numero de classes:"); ind$num.class
print("Nomes das classes:"); ind$class.names
print("Funcao indice de projecao:"); ind$findex
print("Vetores de projecao:"); ind$vector.proj
print("Indice de projecao:"); ind$index
# Exemplo 2 - Com as classes nos dados
class <- iris[,5] # classe dos dados
findex <- "pda" # funcao indice
sphere <- TRUE # Dados esfericos
res <- PP_Optimizer(data = data, class = class, findex = findex,
optmethod = "SA", dimproj = 2, sphere = sphere,
weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9,
eps = 1e-3, maxiter = 1000, half = 30)
# Comparando o resultado obtido
if (match(toupper(findex),c("LDA", "PDA", "LR"), nomatch = 0) > 0) {
if (sphere) {
data <- apply(predict(prcomp(data)), 2, scale) # dados esfericos
}
} else data <- as.matrix(res$proj.data[,1:Dim])
ind <- PP_Index(data = data, class = class, vector.proj = res$vector.opt,
findex = findex, dimproj = 2, weight = TRUE, lambda = 0.1,
r = 1)
print("Numero de classes:"); ind$num.class
print("Nomes das classes:"); ind$class.names
print("Funcao indice de projecao:"); ind$findex
print("Vetores de projecao:"); ind$vector.proj
print("Indice de projecao:"); ind$index
print("Indice de projecao otimizado:"); res$index[length(res$index)]
Funcao de otimizacao dos indices da projection pursuit (busca de projecao).
Description
Funcao de otimizacao dos indices da projection pursuit (busca de projecao).
Usage
PP_Optimizer(data, class = NA, findex = "HOLES",
dimproj = 2, sphere = TRUE, optmethod = "GTSA",
weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9,
eps = 1e-3, maxiter = 3000, half = 30)
Arguments
data |
Conjunto de dados numericos sem a informacao das classes. |
class |
Vetor com os nomes das classes dos dados. |
findex |
Funcao indice de projecao a ser usada: |
dimproj |
Dimensao para a projecao dos dados (default = 2). |
sphere |
Dados esfericos (default = TRUE). |
optmethod |
Metodo de otimizacao GTSA - Grand Tour Simulated Annealing ou SA - Simulated Annealing (default = "GTSA"). |
weight |
Usado nos indice LDA, PDA e Lr, para ponderar os calculos pelo numero de elementos em cada classe (default = TRUE). |
lambda |
Usado no indice PDA (default = 0.1). |
r |
Usado no indice Lr (default = 1). |
cooling |
Taxa de arrefecimento (default = 0.9). |
eps |
Precisao de aproximacao para cooling (default = 1e-3). |
maxiter |
Numero maximo de iteracoes do algoritmo (default = 3000). |
half |
Numero de etapas sem incrementar o indice, para em seguida diminuir o valor do cooling (default = 30). |
Value
num.class |
Numero de classes. |
class.names |
Nomes das classes. |
proj.data |
Dados projetados. |
vector.opt |
Vetores de projecao encontrados. |
index |
Vetor com os indices de projecao encontrados no processo, convergindo para o maximo, ou o minimo. |
findex |
Funcao indice de projecao usada. |
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
References
Cook, D.; Lee, E. K.; Buja, A.; Wickmam, H. Grand tours, projection pursuit guided tours and manual controls. In Chen, Chunhouh, Hardle, Wolfgang, Unwin, e Antony (Eds.), Handbook of data Visualization, Springer Handbooks of Computational Statistics, chapter III.2, p. 295-314. Springer, 2008.
Lee, E.; Cook, D.; Klinke, S.; Lumley, T. Projection pursuit for exploratory supervised classification. Journal of Computational and Graphical Statistics, 14(4):831-846, 2005.
See Also
Examples
data(iris) # conjunto de dados
# Exemplo 1 - Sem as classes nos dados
data <- iris[,1:4]
class <- NA # classe dos dados
findex <- "kurtosismax" # funcao indice
dim <- 1 # dimensao da projecao dos dados
sphere <- TRUE # Dados esfericos
res <- PP_Optimizer(data = data, class = class, findex = findex,
optmethod = "GTSA", dimproj = dim, sphere = sphere,
weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9,
eps = 1e-3, maxiter = 1000, half = 30)
print("Numero de classes:"); res$num.class
print("Nomes das classes:"); res$class.names
print("Funcao indice de projecao:"); res$findex
print("Dados projetados:"); res$proj.data
print("Vetores de projecao:"); res$vector.opt
print("Indices de projecao:"); res$index
# Exemplo 2 - Com as classes nos dados
class <- iris[,5] # classe dos dados
res <- PP_Optimizer(data = data, class = class, findex = findex,
optmethod = "GTSA", dimproj = dim, sphere = sphere,
weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9,
eps = 1e-3, maxiter = 1000, half = 30)
print("Numero de classes:"); res$num.class
print("Nomes das classes:"); res$class.names
print("Funcao indice de projecao:"); res$findex
print("Dados projetados:"); res$proj.data
print("Vetores de projecao:"); res$vector.opt
print("Indices de projecao:"); res$index
Graficos da analise de correspondencia (CA) simples e multipla.
Description
Graficos da analise de correspondencia (CA) simples e multipla.
Usage
Plot.CA(CA, titles = NA, xlabel = NA, ylabel = NA, size = 1.1,
grid = TRUE, color = TRUE, linlab = NA, axes = TRUE,
savptc = FALSE, width = 3236, height = 2000, res = 300,
casc = TRUE)
Arguments
CA |
Dados da funcao CA. |
titles |
Titulos para os graficos, se nao for definido assume texto padrao. |
xlabel |
Nomeia o eixo X, se nao for definido assume texto padrao. |
ylabel |
Nomeia o eixo Y, se nao for definido assume texto padrao. |
size |
Tamanho dos pontos no grafico. |
grid |
Coloca grade nos graficos (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
linlab |
Vetor com os rotulos para as observacoes. |
axes |
Plota os eixos X e Y (default = TRUE). |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucaoo nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
casc |
Efeito cascata na apresentacao dos graficos (default = TRUE). |
Value
Retorna varios graficos.
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
See Also
Examples
data(DataFreq) # conjunto de dados de frequencia
data <- DataFreq[,2:ncol(DataFreq)]
rownames(data) <- DataFreq[1:nrow(DataFreq),1]
res <- CA(data, "f") # realiza CA
tit <- c("Scree-plot","Observacoes", "Variaveis", "Observacoes/Variaveis")
Plot.CA(res, titles = tit, xlabel = NA, ylabel = NA, axes = TRUE,
color = TRUE, linlab = rownames(data), savptc = FALSE,
width = 3236, height = 2000, res = 300, casc = FALSE)
data(DataQuali) # conjunto de dados qualitativos
data <- DataQuali[,2:ncol(DataQuali)]
res <- CA(data, "c", "b") # realiza CA
tit <- c("","","Grafico das Variaveis")
Plot.CA(res, titles = tit, xlabel = NA, ylabel = NA,
color = TRUE, linlab = NA, savptc = FALSE,
width = 3236, height = 2000, res = 300,
axes = TRUE, casc = FALSE)
Graficos da analise de correlacao canonica (CCA).
Description
Graficos da analise de correlacao canonica (CCA).
Usage
Plot.CCA(CCA, titles = NA, xlabel = NA, ylabel = NA, size = 1.1,
grid = TRUE, color = TRUE, axes = TRUE, savptc = FALSE,
width = 3236, height = 2000, res = 300, casc = TRUE)
Arguments
CCA |
Dados da funcao CCA. |
titles |
Titulos para os graficos, se nao for definido assume texto padrao. |
xlabel |
Nomeia o eixo X, se nao for definido assume texto padrao. |
ylabel |
Nomeia o eixo Y, se nao for definido assume texto padrao. |
size |
Tamanho dos pontos no grafico. |
grid |
Coloca grade nos graficos (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
axes |
Plota os eixos X e Y (default = TRUE). |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
casc |
Efeito cascata na apresentacao dos graficos (default = TRUE). |
Value
Retorna varios graficos.
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
See Also
Examples
data(DataMix) # conjunto de dados
data <- DataMix[,2:ncol(DataMix)]
rownames(data) <- DataMix[,1]
X <- data[,1:2]
Y <- data[,5:6]
res <- CCA(X, Y, type = 2, test = "Bartlett", sign = 0.05) # Analise de correlacao canonica
tit <- c("Scree-plot","Correlacoes","Scores do grupo X","Scores do grupo Y")
Plot.CCA(res, titles = tit, xlabel = NA, ylabel = NA,
color = TRUE, savptc = FALSE, width = 3236,
height = 2000, res = 300, axes = TRUE,
casc = FALSE)
Grafico das correlacoes entre as variaveis.
Description
Realiza as correlacoes entre as variaveis de uma base de dados e apresenta em forma de grafico.
Usage
Plot.Cor(data, title = NA, grid = TRUE, leg = TRUE, boxleg = FALSE,
text = FALSE, arrow = TRUE, color = TRUE, namesvar = NA,
savptc = FALSE, width = 3236, height = 2000, res = 300)
Arguments
data |
Conjunto de dados numericos. |
title |
Titulo para o grafico, se nao for definido assume texto padrao. |
grid |
Coloca grade no grafico (default = TRUE). |
leg |
Coloca a legenda no grafico (default = TRUE) |
boxleg |
Coloca moldura na legenda (default = FALSE). |
text |
Coloca os valores das correlacoes nos circulos (default = FALSE). |
arrow |
Setas das correlacoes positivas (para cima) e negativas (para baixo) (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
namesvar |
Vetor com os nomes das variaveis, se omitido assume os nomes em 'data'. |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
Value
Grafico com as correlacoes entre as variaveis em 'data'
Author(s)
Paulo Cesar Ossani
Examples
data(iris) # conjunto de dados
Plot.Cor(data = iris[,1:4], title = NA, grid = TRUE, leg = TRUE, boxleg = FALSE,
text = FALSE, arrow = TRUE, color = TRUE, namesvar = NA, savptc = FALSE,
width = 3236, height = 2000, res = 300)
Plot.Cor(data = iris[,1:4], title = NA, grid = TRUE, leg = TRUE, boxleg = FALSE,
text = TRUE, arrow = TRUE, color = TRUE, namesvar = c("A1","B2","C3","D4"),
savptc = FALSE, width = 3236, height = 2000, res = 300)
Graficos da analise fatorial (FA).
Description
Graficos da analise fatorial (FA).
Usage
Plot.FA(FA, titles = NA, xlabel = NA, ylabel = NA, size = 1.1,
grid = TRUE, color = TRUE, linlab = NA, axes = TRUE, class = NA,
classcolor = NA, posleg = 2, boxleg = TRUE, savptc = FALSE,
width = 3236, height = 2000, res = 300, casc = TRUE)
Arguments
FA |
Dados da funcao FA. |
titles |
Titulos para os graficos, se nao for definido assume texto padrao. |
xlabel |
Nomeia o eixo X, se nao for definido assume texto padrao. |
ylabel |
Nomeia o eixo Y, se nao for definido assume texto padrao. |
size |
Tamanho dos pontos no grafico. |
grid |
Coloca grade nos graficos (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
linlab |
Vetor com os rotulos para as observacoes. |
axes |
Plota os eixos X e Y (default = TRUE). |
class |
Vetor com os nomes das classes dos dados. |
classcolor |
Vetor com as cores das classes. |
posleg |
0 sem legenda, |
boxleg |
Coloca moldura na legenda (default = TRUE). |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
casc |
Efeito cascata na apresentacao dos graficos (default = TRUE). |
Value
Retorna varios graficos.
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
See Also
Examples
data(iris) # conjunto de dados
data <- iris[,1:4]
cls <- iris[,5] # classe dos dados
res <- FA(data, method = "PC", type = 2, nfactor = 3)
tit <- c("Scree-plot","Scores das observacoes","Cargas Fatoriais","Biplot")
cls <- as.character(iris[,5])
Plot.FA(FA = res, titles = tit, xlabel = NA, ylabel = NA,
color = TRUE, linlab = NA, savptc = FALSE, size = 1.1,
posleg = 1, boxleg = FALSE, class = cls, axes = TRUE,
classcolor = c("blue3","red","goldenrod3"),
width = 3236, height = 2000, res = 300, casc = FALSE)
Graficos da analise de multiplos fatores (MFA).
Description
Graficos da analise de multiplos fatores (MFA).
Usage
Plot.MFA(MFA, titles = NA, xlabel = NA, ylabel = NA,
posleg = 2, boxleg = TRUE, size = 1.1, grid = TRUE,
color = TRUE, groupscolor = NA, namarr = FALSE,
linlab = NA, savptc = FALSE, width = 3236,
height = 2000, res = 300, casc = TRUE)
Arguments
MFA |
Dados da funcao MFA. |
titles |
Titulos para os graficos, se nao for definido assume texto padrao. |
xlabel |
Nomeia o eixo X, se nao for definido assume texto padrao. |
ylabel |
Nomeia o eixo Y, se nao for definido assume texto padrao. |
posleg |
1 para legenda no canto superior esquerdo, |
boxleg |
Coloca moldura na legenda (default = TRUE). |
size |
Tamanho dos pontos no grafico. |
grid |
Coloca grade nos graficos (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
groupscolor |
Vetor com as cores dos grupos. |
namarr |
Coloca nomes nos pontos na nuvem ao redor do centroide no grafico correspondente a analise global dos individuos e variaveis (default = FALSE). |
linlab |
Vetor com os rotulos para as observacoes, se nao for definido assume texto padrao. |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
casc |
Efeito cascata na apresentacao dos graficos (default = TRUE). |
Value
Retorna varios graficos.
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
See Also
Examples
data(DataMix) # conjunto de dados mistos
data <- DataMix[,2:ncol(DataMix)]
rownames(data) <- DataMix[1:nrow(DataMix),1]
group.names = c("Notas Cafes/Trabalho", "Formacao/Dedicacao", "Cafes")
mf <- MFA(data, c(2,2,2), typegroups = c("n","c","f"), group.names) # realiza MFA
tit <- c("Scree-plot","Observacoes","Observacoes/Variaveis",
"Circulo de Correlacoes","Inercias dos Grupos Variaveis")
Plot.MFA(MFA = mf, titles = tit, xlabel = NA, ylabel = NA,
posleg = 2, boxleg = FALSE, color = TRUE,
groupscolor = c("blue3","red","goldenrod3"),
namarr = FALSE, linlab = NA, savptc = FALSE,
width = 3236, height = 2000, res = 300,
casc = FALSE) # Plota varios graficos da tela
Plot.MFA(MFA = mf, titles = tit, xlabel = NA, ylabel = NA,
posleg = 2, boxleg = FALSE, color = TRUE,
namarr = FALSE, linlab = rep("A?",10),
savptc = FALSE, width = 3236, height = 2000,
res = 300, casc = FALSE) # Plota varios graficos da tela
Graficos da analise de componentes principais (PCA).
Description
Graficos da analise de componentes principais (PCA).
Usage
Plot.PCA(PC, titles = NA, xlabel = NA, ylabel = NA, size = 1.1,
grid = TRUE, color = TRUE, linlab = NA, axes = TRUE, class = NA,
classcolor = NA, posleg = 2, boxleg = TRUE, savptc = FALSE,
width = 3236, height = 2000, res = 300, casc = TRUE)
Arguments
PC |
Dados da funcao PCA. |
titles |
Titulos para os graficos, se nao for definido assume texto padrao. |
xlabel |
Nomeia o eixo X, se nao for definido assume texto padrao. |
ylabel |
Nomeia o eixo Y, se nao for definido assume texto padrao. |
size |
Tamanho dos pontos no grafico. |
grid |
Coloca grade nos graficos (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
linlab |
Vetor com os rotulos para as observacoes. |
axes |
Plota os eixos X e Y (default = TRUE). |
class |
Vetor com os nomes das classes dos dados. |
classcolor |
Vetor com as cores das classes. |
posleg |
0 sem legenda, |
boxleg |
Coloca moldura na legenda (default = TRUE). |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
casc |
Efeito cascata na apresentacao dos graficos (default = TRUE). |
Value
Retorna varios graficos.
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
See Also
Examples
data(iris) # conjunto de dados
data <- iris[,1:4]
cls <- iris[,5] # classe dos dados
pc <- PCA(data, 2) # executa o PCA
tit <- c("Scree-plot","Grafico das Observacoes","Circulo de Correlacoes")
cls <- as.character(iris[,5])
Plot.PCA(PC = pc, titles = tit, xlabel = NA, ylabel = NA,
color = TRUE, linlab = NA, savptc = FALSE, size = 1.1,
posleg = 2, boxleg = FALSE, class = cls, axes = TRUE,
classcolor = c("blue3","red","goldenrod3"),
width = 3236, height = 2000, res = 300, casc = FALSE)
Graficos da projection pursuit (PP).
Description
Graficos da projection pursuit (PP).
Usage
Plot.PP(PP, titles = NA, xlabel = NA, ylabel = NA, posleg = 2, boxleg = TRUE,
size = 1.1, grid = TRUE, color = TRUE, classcolor = NA, linlab = NA,
axesvar = TRUE, axes = TRUE, savptc = FALSE, width = 3236, height = 2000,
res = 300, casc = TRUE)
Arguments
PP |
Dados da funcao PP_Optimizer. |
titles |
Titulos para os graficos, se nao for definido assume texto padrao. |
xlabel |
Nomeia o eixo X, se nao for definido assume texto padrao. |
ylabel |
Nomeia o eixo Y, se nao for definido assume texto padrao. |
posleg |
0 sem legenda, |
boxleg |
Coloca moldura na legenda (default = TRUE). |
size |
Tamanho dos pontos no grafico. |
grid |
Coloca grade nos graficos (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
classcolor |
Vetor com as cores das classes. |
linlab |
Vetor com os rotulos para as observacoes. |
axesvar |
Coloca eixos de rotacao das variaveis, somente quando dimproj > 1 (default = TRUE). |
axes |
Plota os eixos X e Y (default = TRUE). |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
casc |
Efeito cascata na apresentacao dos graficos (default = TRUE). |
Value
Grafico da evolucao dos indices, e graficos cujos dados foram reduzidos em duas dimensoes.
Author(s)
Paulo Cesar Ossani
Marcelo Angelo Cirillo
See Also
PP_Optimizer
and PP_Index
Examples
data(iris) # conjunto de dados
# Exemplo 1 - Sem as classes nos dados
data <- iris[,1:4]
findex <- "kurtosismax" # funcao indice
dim <- 1 # dimensao da projecao dos dados
sphere <- TRUE # dados esfericos
res <- PP_Optimizer(data = data, class = NA, findex = findex,
optmethod = "GTSA", dimproj = dim, sphere = sphere,
weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9,
eps = 1e-3, maxiter = 500, half = 30)
Plot.PP(res, titles = NA, posleg = 1, boxleg = FALSE, color = TRUE,
linlab = NA, axesvar = TRUE, axes = TRUE, savptc = FALSE,
width = 3236, height = 2000, res = 300, casc = FALSE)
# Exemplo 2 - Com as classes nos dados
class <- iris[,5] # classe dos dados
res <- PP_Optimizer(data = data, class = class, findex = findex,
optmethod = "GTSA", dimproj = dim, sphere = sphere,
weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9,
eps = 1e-3, maxiter = 500, half = 30)
tit <- c(NA,"Exemplo de grafico") # titulos para os graficos
Plot.PP(res, titles = tit, posleg = 1, boxleg = FALSE, color = TRUE,
classcolor = c("blue3","red","goldenrod3"), linlab = NA,
axesvar = TRUE, axes = TRUE, savptc = FALSE, width = 3236,
height = 2000, res = 300, casc = FALSE)
# Exemplo 3 - Sem as classes nos dados, mas informando
# as classes na funcao plot
res <- PP_Optimizer(data = data, class = NA, findex = "Moment",
optmethod = "GTSA", dimproj = 2, sphere = sphere,
weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9,
eps = 1e-3, maxiter = 500, half = 30)
lin <- c(rep("a",50),rep("b",50),rep("c",50)) # classe dos dados
Plot.PP(res, titles = NA, posleg = 1, boxleg = FALSE, color = TRUE,
linlab = lin, axesvar = TRUE, axes = TRUE, savptc = FALSE,
width = 3236, height = 2000, res = 300, casc = FALSE)
# Exemplo 4 - Com as classes nos dados, mas nao informada na funcao plot
class <- iris[,5] # classe dos dados
dim <- 2 # dimensao da projecao dos dados
findex <- "lda" # funcao indice
res <- PP_Optimizer(data = data, class = class, findex = findex,
optmethod = "GTSA", dimproj = dim, sphere = sphere,
weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9,
eps = 1e-3, maxiter = 500, half = 30)
tit <- c("",NA) # titulos para os graficos
Plot.PP(res, titles = tit, posleg = 1, boxleg = FALSE, color = TRUE,
linlab = NA, axesvar = TRUE, axes = TRUE, savptc = FALSE,
width = 3236, height = 2000, res = 300, casc = FALSE)
Graficos dos resultados da regressao linear.
Description
Graficos dos resultados da regressao linear.
Usage
Plot.Regr(Reg, typegraf = "Scatterplot", title = NA, xlabel = NA,
ylabel = NA, namevary = NA, namevarx = NA, size = 1.1,
grid = TRUE, color = TRUE, intconf = TRUE, intprev = TRUE,
savptc = FALSE, width = 3236, height = 2000, res = 300,
casc = TRUE)
Arguments
Reg |
Dados da funcao de regressao. |
typegraf |
Tipo de grafico: |
title |
Titulos para os graficos, se nao for definido assume texto padrao. |
xlabel |
Nomeia o eixo X, se nao for definido assume texto padrao. |
ylabel |
Nomeia o eixo Y, se nao for definido assume texto padrao. |
namevary |
Nome da variavel Y, se nao for definido assume texto padrao. |
namevarx |
Nome da variavel X, ou variaveis X, se nao for definido assume texto padrao. |
size |
Tamanho dos pontos no grafico. |
grid |
Coloca grade nos graficos (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
intconf |
Caso typegraf = "Regression". Graficos com intervalo de confianca (default = TRUE). |
intprev |
Caso typegraf = "Regression". Graficos com intervalo de previsao (default = TRUE) |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
casc |
Efeito cascata na apresentacao dos graficos (default = TRUE). |
Value
Retorna varios graficos.
Author(s)
Paulo Cesar Ossani
See Also
Examples
data(DataMix)
Y <- DataMix[,2]
X <- DataMix[,7]
name.y <- "Media das notas"
name.x <- "Cafes comerciais"
res <- Regr(Y, X, namevarx = name.x ,intercept = TRUE, sigf = 0.05)
tit <- c("Scatterplot")
Plot.Regr(res, typegraf = "Scatterplot", title = tit,
namevary = name.y, namevarx = name.x, color = TRUE,
savptc = FALSE, width = 3236, height = 2000, res = 300)
tit <- c("Grafico de Dispersao com a \n reta ajustada")
Plot.Regr(res, typegraf = "Regression", title = tit,
xlabel = name.x, ylabel = name.y, color = TRUE,
intconf = TRUE, intprev = TRUE, savptc = FALSE,
width = 3236, height = 2000, res = 300)
dev.new() # necessario para nao sobrepor os graficos seguintes ao grafico anterior
par(mfrow = c(2,2))
Plot.Regr(res, typegraf = "QQPlot", casc = FALSE)
Plot.Regr(res, typegraf = "Histogram", casc = FALSE)
Plot.Regr(res, typegraf = "Fits", casc = FALSE)
Plot.Regr(res, typegraf = "Order", casc = FALSE)
Regressao linear.
Description
Realiza a regressao linear em um conjunto de dados.
Usage
Regr(Y, X, namevarx = NA, intercept = TRUE, sigf = 0.05)
Arguments
Y |
Variaveis respotas. |
X |
Variaveis regressoras. |
namevarx |
Nome da variavel, ou variaveis X, se nao for definido assume texto padrao. |
intercept |
Considerar o intercepto na regressao (default = TRUE). |
sigf |
Nivel de significancia dos testes dos residuos (default = 5%). |
Value
Betas |
Coeficientes da regressao. |
CovBetas |
Matriz de covariancias dos coeficientes da regressao. |
ICc |
Intervalo de confianca dos coeficientes da regressao. |
hip.test |
Teste de hipoteses dos coeficientes da regressao. |
ANOVA |
Analise de variancia da regressao. |
R |
Coeficiente de determinacao. |
Rc |
Coeficiente de determinacao corrigido. |
Ra |
Coeficiente de determinacao ajustado. |
QME |
Variancia dos residuos. |
ICQME |
Intervalo de confianca da variancia dos residuos. |
prev |
Previsao do ajuste da regressao. |
IPp |
Intervalo das previsoes. |
ICp |
Intervalo de confianca das previsoes. |
error |
Residuos do ajuste da regressao. |
error.test |
Retorna a 5% de significancia o teste de independencia, de normalidade e de homogeneidade da variancia dos residuos. |
Author(s)
Paulo Cesar Ossani
References
Charnet, R.; at al.. Analise de modelos de regressao lienar, 2a ed. Campinas: Editora da Unicamp, 2008. 357 p.
Rencher, A. C.; Schaalje, G. B. Linear models in statisctic. 2th. ed. New Jersey: John & Sons, 2008. 672 p.
Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
See Also
Examples
data(DataMix)
Y <- DataMix[,2]
X <- DataMix[,6:7]
name.x <- c("Cafes Expeciais","Cafes Comerciais")
res <- Regr(Y, X, namevarx = name.x , intercept = TRUE, sigf = 0.05)
print("Coeficientes da Regressao:"); round(res$Betas,4)
print("Analise de Variancia:"); res$ANOVA
print("Teste de Hipoteses dos Coeficientes da Regressao:"); round(res$hip.test,4)
print("Coeficiente de Determinacao:"); round(res$R,4)
print("Coeficiente de Determinacao Corrigido:"); round(res$Rc,4)
print("Coeficiente de Determinacao Ajustado:"); round(res$Ra,4)
print("Testes dos Residuos:"); res$error.test
Grafico de dispersao.
Description
Realiza o grafico de dispersao.
Usage
Scatter(data, ellipse = TRUE, ellipse.level = 0.95, rectangle = FALSE,
title = NA, xlabel = NA, ylabel = NA, posleg = 2, boxleg = TRUE,
axes = TRUE, size = 1.1, grid = TRUE, color = TRUE, linlab = NA,
class = NA, classcolor = NA, savptc = FALSE, width = 3236,
height = 2000, res = 300)
Arguments
data |
Dados com as coordenadas x e y. |
ellipse |
Coloca uma elipse envolta das classes (default = TRUE). |
ellipse.level |
Nivel de significancia da elipse (defaul = 0.95). |
rectangle |
Coloca retangulo para diferenciar as classes (default = FALSE). |
title |
Titulo para os graficos, se nao for definido assume texto padrao. |
xlabel |
Nomeia o eixo X, se nao for definido assume texto padrao. |
ylabel |
Nomeia o eixo Y, se nao for definido assume texto padrao. |
posleg |
0 sem legenda, |
boxleg |
Coloca moldura na legenda (default = TRUE). |
axes |
Plota os eixos X e Y (default = TRUE). |
size |
Tamanho dos pontos no grafico. |
grid |
Coloca grade nos graficos (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
linlab |
Vetor com os rotulos para as observacoes. |
class |
Vetor com os nomes das classes dos dados. |
classcolor |
Vetor com as cores das classes. |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
Value
Grafico de dispersao.
Author(s)
Paulo Cesar Ossani
References
Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
Anton, H.; Rorres, C. Elementary linear algebra: applications version. 10th ed. New Jersey: John Wiley & Sons, 2010. 768 p.
Examples
data(iris) # conjunto de dados
data <- iris[,3:4]
cls <- iris[,5] # classe dos dados
Scatter(data, ellipse = TRUE, ellipse.level = 0.95, rectangle = FALSE,
title = NA, xlabel = NA, ylabel = NA, posleg = 1, boxleg = FALSE,
axes = FALSE, size = 1.1, grid = TRUE, color = TRUE, linlab = NA,
class = cls, classcolor = c("goldenrod3","blue","red"),
savptc = FALSE, width = 3236, height = 2000, res = 300)
Scatter(data, ellipse = FALSE, ellipse.level = 0.95, rectangle = TRUE,
title = NA, xlabel = NA, ylabel = NA, posleg = 1, boxleg = TRUE,
axes = FALSE, size = 1.1, grid = TRUE, color = TRUE, linlab = NA,
class = cls, classcolor = c("goldenrod3","blue","red"),
savptc = FALSE, width = 3236, height = 2000, res = 300)