Download as pdf or txt
Download as pdf or txt
You are on page 1of 20

 

 
 
 
GenoCline v1.3 
 
May, 2020 
 
 
 
Jose A. Peña, Miguel A. Alfonso‐Sánchez, Luis Gómez‐Pérez 
Dpto. Genética, Antropología Física y Fisiología Animal 
Facultad de Ciencia y Tecnología 
Universidad del País Vasco (UPV/EHU) 
Aptdo. 644, 48080 Bilbao 
SPAIN 
E‐mail:  genoclinesoftware@gmail.com 
http://www.didac.ehu.es/genocline 
http://genocline.sourceforge.net 
 
 
 
Table of contents 
 
Features ............................................................................................................................... 3 
Download ............................................................................................................................ 3 
Requirements ...................................................................................................................... 3 
Menu options ...................................................................................................................... 4 
  Frequencies ............................................................................................................... 4 
    Data input ....................................................................................................... 4 
  Read a xls file .................................................................................................. 5 
  Genetic clines ‐ linear ..................................................................................... 6 
  Genetic cline for an allele ‐ linear ................................................................... 7 
  Genetic clines – angular transformation ........................................................ 7 
  Genetic cline for an allele ‐ angular transformation ...................................... 8 
  Genetic clines ‐ sigmoid .................................................................................. 8 
  Genetic cline for an allele ‐ sigmoid ............................................................... 8 
  GW data .................................................................................................................... 9 
  Read Eigensoft files ......................................................................................... 9 
  Read Eigenvectors and Coordinates ............................................................... 9 
  Genetic clines ‐ linear ..................................................................................... 9 
  Genetic cline for an eigenvector ‐ linear ........................................................ 9 
  Genetic clines – angular transformation ...................................................... 10 
  Genetic cline for an eigenvector ‐ angular transformation .......................... 10 
  Genetic clines ‐ sigmoid ................................................................................ 10 
  Genetic cline for an eigenvector ‐ sigmoid ................................................... 10 
  GeoGraphics ............................................................................................................ 11 
  Spatial autocorrelation ................................................................................. 11 
  Isolation by distance ..................................................................................... 12 
  Isolation by distance ‐ kinship ...................................................................... 13 
  Isolation by distance ‐ Fst ............................................................................. 14 
  Isolation by distance – Fst log transformation ............................................. 14 
  Heterozygosity in a cline ............................................................................... 15 
  Centroid method .......................................................................................... 16 
  Distances ................................................................................................................. 17 
  MDS ‐ Reynolds Fst ....................................................................................... 17 
  Sammon’s projection .................................................................................... 18 
  Geographical ................................................................................................. 18 
  Fst ................................................................................................................. 18 
  Export to Arlequin / Phylip / Past / Poptree ........................................................... 18 
  Output ..................................................................................................................... 19 
    Save results ................................................................................................... 19 
Graphical representation of results .................................................................................. 19 
Errors ................................................................................................................................. 19 
Bibliography ...................................................................................................................... 20 
 
 
 
 
 
 

GenoCline v. 1.3 User Manual 2


 
 
 
 
GenoCline v1.3 user manual 
 
 
GenoCline is a free Java software for genetic cline analysis. 
 
This software has been developed at the University of the Basque Country, Department of 
Genetics, Physical Anthropology and Animal Physiology by Jose A. Peña, Miguel A. Alfonso‐
Sánchez and Luis Gómez‐Pérez. 
 
 
Features 
 
Identification  of  clines  from  allele  frequency  or  genome‐wide  databases.  Angular 
transformation. Sigmoidal curve fitting. 
Parameterization of a cline: orientation, Pearson’s product‐moment correlation coefficient, 
linear and sigmoid regressions, and coefficient of determination. Graphical representation of 
the cline. Confidence limits. 
Spatial autocorrelation. Moran's index. 
Isolation by distance. Exponential regression. Correlation Fst/Distance. 
Centroid method. 
Cline's expected vs. predicted heterozygosity. 
MDS. Sammon projection. 
Geographical distances. Fst distances. 
Export data to Arlequin, Phylip, Past and Poptree. 
User‐friendly input data. 
 
 
Download 
 
The current version is v1.3. 
Available at  
http://genocline.sourceforge.net 
and  
http://www.didac.ehu.es/genocline 
 
 
Requirements 
 
The  normal  running  of  this  program  does  not  depend  on  a  specific  operating  system  or 
platform, but merely requires a runtime environment of Java 1.8 or higher to be installed on 
your system. 
 

GenoCline v. 1.3 User Manual 3


Menu options 
 
Frequencies 
 
Bearing  in  mind  that  the  main  purpose  of  GenoCline  is  to  identify  potential  genetic  clines, 
geographic and genetic data are required to implement its execution.  
The  program  can  analyze  allelic  frequencies  or  individual  genotypes.  This  first  section 
addresses the procedure when working with allele frequency data. 
 
Data input 
 
The data file should be a spreadsheet with Excel Binary File Format (.xls). A xlsx format is not 
supported.  
The data are distributed on two spreadsheets (Figs. 1 and 2). 
 
Sheet 1 
 
Cell A1: Number of populations 
Cell B1: Number of loci 
Cell A2: Number of allele frequencies at locus 1 
Cell B2: Number of allele frequencies at locus 2 
Cell C2: Number of allele frequencies at locus 3 
... 
Cell B3: Label of population 1 
Cell C3: Label of population 2 
Cell D3: Label of population 3 
... 
Cell A4: Label of allele 1 
Cell A5: Label of allele 2 
Cell A6: Label of allele 3 
... 
Cells B4, C4, D4, etc: Allele frequencies 
Cells B5, C5, D5, etc: Allele frequencies  
... 
 

 
 
Fig. 1. Example of the arrangement of Sheet 1. 

GenoCline v. 1.3 User Manual 4


Sheet 2 
 
Cell A1: Number of populations (as in Sheet 1) 
Cells A2, B2, C2, etc.: Labels of the populations (as in the Sheet 1) 
Cells A3, B3, C3, etc.: Latitude (degrees) 
Cells A4, B4, C4, etc.: Latitude (minutes) 
Cells A5, B5, C5, etc.: Latitude North (1) or South (‐1) 
Cells A6, B6, C6, etc.: Longitude (degrees) 
Cells A7, B7, C7, etc.: Longitude (minutes) 
Cells A8, B8, C8, etc.: Longitude East (1) or West (‐1) 
 

 
 
Fig. 2. Example of the arrangement of Sheet 2. 
 
Read a xls file 
 
The Read a xls file option allows for the selection of the xls file containing the raw data. Once 
the data have been read, the program creates a Results folder. This folder will be labeled using 
the date and hour when the database was eventually opened (yyyymmddhhmmss). At the 
same time, two windows appear on the screen to check if all the information is accurate: one 
window with the allele frequency data and another with the geographical coordinates (Fig. 3). 
If an error is detected, it should be corrected in the xls file.   
 
 

 
 
Fig. 3. Screenshot after Read data option. 

GenoCline v. 1.3 User Manual 5


Genetic clines – linear 
 
The GenoCline software makes a virtual coordinate axis to rotate in consecutive iterations of 
one  degree  each  until  completing  360  degrees.  After  every  iteration,  the  position  of  all 
populations is projected on this "new" axis. Then the program computes the Pearson product‐
moment correlation coefficient (r) between the allele frequencies and the coordinates of the 
populations  concerning  the  virtual  axis.  A  statistically  significant  correlation  coefficient 
(p<0.05) between both variables will be indicative of a spatially structured distribution of the 
allele frequencies, that is, of an allele frequency cline. It is not uncommon to find statistically 
significant  associations  for  several  consecutive  degrees  of  rotation.  In  such  a  case,  the 
program will select the orientation providing the highest value for the r coefficient. 
Once  obtained  the  gene  frequency  gradients,  the  option  Genetic  clines  enables  the 
program  to  group  them  in  10‐degrees  intervals  (10‐degrees  circumference  arcs)  and  then 
generates a radar chart (also called spider chart) to represent the absolute frequency of clines 
per interval (Fig. 4). The resulting graph is sent to the Results folder and saved as Clines.eps. 
Statistical data associated with the genetic clines such as correlation coefficient (r), degrees of 
freedom (df), significance level (p‐value), as well as the cline's orientation angle are saved in 
the file Results.xls. 
 
 

 
 
Fig. 4. Absolute frequency of detected genetic clines, grouped in 10‐degrees circumference arcs 
 
 
 
 

GenoCline v. 1.3 User Manual 6


 
 
Genetic cline for an allele – linear 
 
The GenoCline software provides additional tools for a more thorough analysis of each genetic 
cline.  To  that  end,  the  program  displays  in  a  window  all  those  alleles  featuring  spatially 
patterned frequency distributions (significant r coefficient). Once you have selected a given 
gradient, GenoCline generates a two‐dimensional plot with the regression line and their 95% 
confidence limits. In this graph, the x‐axis represents the coordinates relative to the virtual 
(rotating) axis and the y‐axis the corresponding allele frequencies. With this option Genocline 
also renders: i) orientation of the genetic cline, ii) parameters defining the regression line, iii) 
coefficient of determination (r2), and (iv) Pearson's r correlation coefficient with its statistical 
significance (Fig. 5). 
An example of the analysis of genetic clines with variable orientation can be found in 
Gómez‐Pérez et al. (2011b). 
Figures illustrating the genetic clines identified will be saved in the "Results" folder as 
Cline*.eps. 
 
 

 
 
Fig. 5. Regression line with 95% confidence limits (dotted lines), coefficient of determination (r2), Pearson’s r 
correlation coefficient with statistical significance level and orientation of an allele frequency cline obtained with 
the GenoCline software. Data from Moreira et al (2015) 
 
 
Genetic clines – angular transformation  
 
The same as the previous option, the program computes the Pearson's r correlation coefficient 
between the frequency of each allele and the populations' coordinates regarding an axis that 
rotates 360 degrees in consecutive iterations of one degree each.  
In this option, singularity lies in the possibility of carrying out the angular transformation arcsin
√p  (where  p  is  the  allele  frequency)  to  separate  the  variance  of  the  estimate  from  the 

GenoCline v. 1.3 User Manual 7


estimate  itself  (Hartl  and  Clark,  1997).  The  figure  depicting  the  distribution  of  the  genetic 
clines'  orientation  is  saved  in  the  Results  folder  as  Clinesat.eps.  Parameters  characterizing 
each allele frequency gradient (angle, r, df, and p‐value) are saved in the file Results.xls. 
 
 
Genetic cline for an allele – angular transformation 
 
As  we  have  explained  above,  GenoCline  displays  in  a  window  all  alleles  featuring  spatially 
patterned frequency distributions. Once selected a specific gradient, GenoCline creates a two‐
dimensional plot with the regression line along with 95% confidence limits. In this graph, the 
x‐axis represents the coordinates relative to the virtual (rotating) axis, but in this case, the y‐
axis  represents  the  corresponding  angular  transformation  arcsin√p  (where  p  is  the  allele 
frequency).  Here,  Genocline  renders  the  same  parameters  as  in  the  previous  case:  i) 
orientation of the genetic cline, ii) parameters defining the regression line, iii) coefficient of 
determination (r2), and (iv) Pearson's r correlation coefficient with its statistical significance.  
Figures illustrating the genetic clines detected will be saved in the "Results" folder as 
Clineat*.eps. 
 
 
Genetic clines – sigmoid 
 
Since, particularly in hybrid areas, the spatial distribution of allele frequencies is usually best 
explained through a sigmoid function (Barton & Gale, 1993; Fitzpatrick, 2013), it could be often 
more  appropriate  to  perform  the  cline  analysis  according  to  this  model.  In  this  case,  the 
criterion for the selection of clines is the probability of F ratio rather than Pearson's correlation 
coefficient. 
The resulting graph is sent to the Results folder and saved as Clinessig.eps. Statistical 
data associated with the genetic clines such as ordinate scaling factor, slope, midpoint of the 
threshold, sum of residual squares, the statistical significance of the F ratio (P‐value), as well 
as the cline's orientation angle are saved in the file Results.xls. 
 
Genetic cline for an allele – sigmoid 
 
Similar to what we have seen in previous options, the program displays in a window those 
alleles  showing  spatially  patterned  frequency  distributions  (significant  P‐value  for  F  ratio). 
Once you have chosen a specific gradient, GenoCline generates a two‐dimensional plot with 
the sigmoid regression curve. In this graph, the x‐axis represents the coordinates relative to 
the virtual (rotating) axis and the y‐axis the corresponding allele frequencies. Likewise, the 
program also renders: i) orientation of the genetic cline, ii) parameters defining the regression 
curve, iii) slope, midpoint of the threshold, the sum of residual squares, and (iv) F ratio P.  
Figures illustrating the genetic clines detected will be saved in the "Results" folder as 
Cline*.eps. 
 
 
 
 

GenoCline v. 1.3 User Manual 8


GW data 
 
Read Eigensoft files 
 
Genome‐wide data can be imported in Eigensoft format. First the ind file will be read and then 
the geno file. 
In this case, the program will extract the main trends of variation of the individual genomes in 
the form of eigenvectors, by means of a mutidimensional scaling analysis.  
GenoCline  generates  a  spreadsheet  with  the  values  of  the  eigenvectors,  which  is  called 
MDSIbsCoords.xls and saved in the folder Eigenvectors. In this spreadsheet the geographical 
coordinates will be added. 
 
 
Read Eigensoft and Coordinates 
 
By  choosing  this  option,  the  program  will  read  the  file  with  the  eigenvectors  and  the 
geographical coordinates from the Eigenvectors folder. 
Once the data have been read, the program generates a folder for the results. This folder 
will be labelled using date and hour when the database was opened (yyyymmddhhmmss). At 
the same time, two windows appear on the screen to verify that all the information is correct: 
one window with the allele frequency data and another with the geographical coordinates. If 
any error is detected, it must be corrected on the MDSIbsCoords.xls file.  
 
 
Genetic clines – linear 
 
Once  obtained  the  eigenvectors'  gradients,  the  option  Genetic  clines  enables  the  program 
clustering them in 10‐degrees intervals (10‐degrees circumference arcs) and then generates a 
radar chart (also called spider chart) to represent the absolute frequency of clines per interval. 
The  resulting  graph  is  sent  to  the  Results  folder  and  saved  as  Clines.eps.  Statistical  data 
associated with the genetic clines such as correlation coefficient (r), degrees of freedom (df), 
significance  level  (p‐value),  as  well  as  the  cline's  orientation  angle  will  be  saved  in  the  file 
Results.xls. 
 
Genetic cline for an eigenvector – linear 
 
The GenoCline software allows for a thorough analysis of each genetic cline. To that end, the 
program  displays  in  a  window  all  those  alleles  showing  spatially  patterned  frequency 
distributions (statistically significant r coefficient). Once selected a given gradient, GenoCline 
generates a two‐dimensional plot with the regression line along with 95% confidence limits. 
In  the  graph,  the  x‐axis  represents  the  coordinates  relative  to  the  virtual  (rotating)  axis, 
whereas the y‐axis represents the corresponding eigenvector values. By choosing this option, 
Genocline  also  provides:  i)  orientation  of  the  genetic  cline,  ii)  parameters  defining  the 
regression line, iii) coefficient of determination (r2), and (iv) Pearson's r correlation coefficient 
with its statistical significance. 

GenoCline v. 1.3 User Manual 9


Figures illustrating the genetic clines detected will be saved in the "Results" folder as 
Cline*.eps. 
 
 
Genetic clines – angular transformation  
 
This option gives the possibility of carrying out the angular transformation arcsin√p (where 
p is the eigenvector value), to separate the variance of the estimate from the estimate itself 
(Hartl and Clark, 1997). The figure illustrating the distribution of the genetic clines' orientation 
is saved in the Results folder as Clinesat.eps. Parameters characterizing each allele frequency 
gradient (angle, r, df, and p‐value) will be saved in the file Results.xls. 
 
 
Genetic cline for an eigenvector – angular transformation 
 
The program displays in a window all eigenvectors featuring spatially patterned distributions 
(significant  r  coefficient).  Once  selected  a  given  gradient,  GenoCline  generates  a  two‐
dimensional plot with the regression line along with 95% confidence limits. In such a graph, 
the x‐axis represents the coordinates relative to the virtual (rotating) axis, and the y‐axis the 
corresponding  angular  transformation  arcsin√p  (where  p  is  the  eigenvector  value).  This 
option also renders: i) orientation of the genetic cline, ii) parameters defining the regression 
line, iii) coefficient of determination (r2), and (iv) Pearson's r correlation coefficient with its 
statistical significance.  
Figures illustrating the genetic clines detected will be saved in the "Results" folder as 
Clineat*.eps. 
 
 
Genetic clines – sigmoid 
 
GenoCline can perform a cline analysis from eigenvectors according to the sigmoid function 
model. In this case, the criterion for the selection of clines is the  probability of the F ratio 
rather than the Pearson correlation coefficient. 
The resulting graph is sent to the Results folder and saved as Clinessig.eps. Statistical 
parameters associated with the genetic clines such as ordinate scaling factor, slope, midpoint 
of the threshold, sum of residual squares, statistical significance of F ratio (P‐value), as well as 
the cline's orientation angle are saved in the file Results.xls. 
 
Genetic cline for an eigenvector – sigmoid 
 
As  in  the  other  cases,  the  program  shows  in  a  window  all  eigenvectors  featuring  spatially 
patterned  distributions  (significant  F  ratio  P).  Once  selected  a  specific  gradient,  GenoCline 
generates a two‐dimensional plot with the sigmoidal regression curve. In this graph, the x‐axis 
represents  the  coordinates  relative  to  the  virtual  (rotating)  axis,  and  the  y‐axis  the 
corresponding eigenvector values. This option also renders: i) orientation of the genetic cline, 

GenoCline v. 1.3 User Manual 10


ii) parameters defining the regression curve, iii) slope, the midpoint of the threshold, the sum 
of residual squares, and (iv) statistical significance of the F ratio (P‐value).  
Figures illustrating the genetic clines identified will be saved in the "Results" folder as 
Cline*.eps. 
 
 
GeoGraphics  
 
Spatial autocorrelation 
 
Spatial  autocorrelation  may  be  roughly  described  as  the  property  of  random  variables  of 
featuring  values,  at  pairs  of  locations  a  certain  distance  apart,  that  will  be  more  (positive 
autocorrelation)  or  less  similar  (negative  autocorrelation)  than  expected  for  randomly 
associated pairs of observations. It poses a problem for statistical testing since autocorrelated 
data  violate  the  assumption  of  independence  of  most  standard  statistical  procedures 
(Legendre,  1993).  For  this  reason,  some  specialists  have  devised  specific  methods  to  test 
whether  the  observed  value  of  a  variable  at  one  locality  is  significantly  dependent  on  the 
values of this variable at neighboring localities (Sokal & Oden, 1978). 
Among the several indexes implemented to estimate the spatial autocorrelation level, 
Moran's I (Moran, 1950) has been widely used among the biologists. Moran’s index is defined 
by the equation: 
 

 
 
where, 
xi, xj are the frequencies of the allele x for the populations i and j, respectively, 
 is the mean frequency, 
wij is the spatial weight between populations i and j, and 
d is the distance. 
  
Moran's  index  values  can  be  represented  against  the  geographic  distance  in  a  graph 
known  as  autocorrelogram.  According  to  the  "isolation‐by‐distance"  model,  it  should  be 
expected  a  decreasing  trend  of  the  Moran's  index  as  geographic  distance  increases.  With 
GenoCline  we  can  also  obtain  the  statistical  significance  of  the  autocorrelation  values. 
Logically,  the  statistical  robustness  of  the  autocorrelogram  is  greater  when  most  of  the 
Moran's index values are statistically significant. 
Based  on  the  geographic  coordinates  of  the  populations,  this  program  calculates  the 
distances  between  all  population  pairs  and  distributes  them  among  seven  (7)  distance 
categories or classes. Subsequently, GenoCline performs spatial autocorrelation analysis and 
calculates the Moran's index for each distance class. Variations in the Moran's index owing to 
the  distance  among  populations  are  shown,  along  with  the  corresponding  95%  confidence 
limits (Fig. 6). The resulting image is saved as Autocorrelation.eps. 

GenoCline v. 1.3 User Manual 11


 
Fig. 6. Autocorrelogram. Represented are Moran’s index values for each distance class along with the statistical 
significance and the total number of cases included in each class. 
 
 
Isolation by distance 
 
The "isolation‐by‐distance" model developed by Malécot (1973) assumes that genetic kinship 
depends on the geographic distance, as mirrored in the mathematical function of the mean 
kinship coefficient ∅ , 
 
 
 
where d is the distance,  
a is a measure of local kinship, b specifies the rate of exponential decline of ∅ and, 
∅ is  calculated  between  all  pairs  of  populations,  according  to  the  formulae 
(Harpending and Jenkins, 1973): 
 

 
 
where rij refers to conditional kinship,  
pik represents the frequency of the allele k in the population i and,  
 is the mean allele frequency of allele k. 
 
Another method to examine the isolation by distance is based on the analysis of the 
relationship between the quotient 
 
 
1

GenoCline v. 1.3 User Manual 12


 
and the geographic distance by linear regression (considering all pairs of populations), thus 
estimating the slope and the intercept of this relationship (Wright, 1943; Rousset, 1997).  
An  example  of  this  method  can  be  consulted  in  Castric  and  Bernatchez  (2003).  An 
analysis  like  this  can  also  be  accomplished  by  using  the  logarithmic  transformation  of  the 
geographic distance in the x‐axis, as indicated in Fuselli et al. (2003). 
 
 
Isolation by distance ‐ kinship 
 
With the aim to assess whether the allele frequency distribution in a given region fits into the 
Malécot's  isolation‐by‐distance  model,  GenoCline  estimates  the  intercept  (a)  and  slope  (b) 
values  of  the  regression  equation  (Fig.  7).  The  image  generated  is  saved  as 
IsolationByDistanceK.eps. 
 
 

 
Fig. 7. Intercept (a) and slope (b) estimates in  Malécot’s isolation‐by‐distance model (Malécot, 1973).  
 
 
 
 
 
 
 
 
 

GenoCline v. 1.3 User Manual 13


Isolation by distance ‐ Fst 
 
The output of the analysis of the relationship between FST and geographic distance is saved as 
IsolationByDistanceF.eps (Fig. 8). 
 

 
Fig.  8.  Intercept  (a)  and  slope  (b)  estimates  for  the  relationship  between  the  quotient  Fst/(1‐Fst)  and  the 
geographic distance.  
   
 
Isolation by distance ‐ Fst log transformation 
 
The output of the analysis of the relationship between FST and geographic distance is saved 
as  IsolationByDistanceFl.eps.  Such  an  analysis  is  performed  when  the  model  requires  a 
logarithmic transformation of the distance to linearize the function.. 
 
 
 
 
 
 
 
 
 
 
 
 

GenoCline v. 1.3 User Manual 14


Heterozygosity level in a cline 
 
The centroid method can be utilized to indirectly evaluate the potential role of the gene flow 
on  the  emergence  of  a  genetic  cline  (Figs.  10  and  11).  The  resulting  image  is  saved  as 
ClineHet(allele name).eps. 
 
 

 
Fig.  10.  Plot  of  heterozygosity  (difference  between  expected  heterozigosity‐predicted  heterozigosity)  versus 
rotated coordinates in a group of populations.  
 
 
 

 
Fig. 11. The cline of reference for Fig. 10. 
 
 
 
 

GenoCline v. 1.3 User Manual 15


Centroid method  
 
The centroid method was conceived to estimate the relative intensity of gene flow in a group 
of populations (Harpending and Ward, 1982). To that end, the centroid method represents 
the  expected  Hardy‐Weinberg  proportions  of  heterozygotes  of  each  subpopulation  against 
their genetic variance ri, 
 

 
 
where pik is the frequency of allele k in population i and, 
 is the mean frequency of allele k. 
 
In the graph drawn by the centroid method, those subpopulations plotting above the 
line (which represents the expected heterozygosity values) are assumed to have experienced 
a higher impact of gene flow. On the contrary, plotting below the line indicates a deficit of 
gene flow (see Fig. 9). An example of this issue can be consulted in Gómez‐Pérez et al. (2011a). 
With GenoCline you can run analyses based on the centroid method. The program yields 
population  values  for  both  the  heterozygosity  and  the  genetic  variance,  as  well  as  a  line 
segment with the expected mean values of heterozygosity. The resulting image of this analysis 
is saved as Centroid.eps. 
 

 
 
Fig.  9.  Plot  of  heterozygosity  versus  distance  from  genetic  centroid  in  a  group  of  17  populations.  Data  from 
Gómez‐Pérez et al. (2011a). 
 
 

GenoCline v. 1.3 User Manual 16


Distances 
 
MDS ‐ Reynolds Fst 
 
Multidimensional  scaling  (Kruskal,  1964)  and  Sammon  projection  (Sammon,  1969)  are  also 
available options in the program presented herein, to help the interpretation of the genetic 
relationships among populations. The resulting image is saved as MDSFst.eps (Fig. 12) 
 

 
 
Fig. 12. An MDS analysis. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

GenoCline v. 1.3 User Manual 17


Sammon projection 
 
A Sammon projection (Sammon, 1969) to assist the interpretation of the genetic relationships 
among populations is also provided. The resulting image is saved as Sammon.eps (Fig. 13). 

 
 
Fig. 13. The Sammon projection. 
 
 
Geographical  
 
GenoCline  generates  a  geographic  distance  matrix  that  can  be  used  as  input  file  in  other 
statistical packages.  
 
 
Fst  
 
Likewise,  the  program  also  allows  exporting  of  the  genetic  distance  matrix  obtained  (FST 
genetic distance, Reynolds et al., 1983). 
 
 
Export to Arlequin / Phylip / Past / Poptree 
 
Exporting data to other statistical programs (Arlequin, Phylip, Past, or Poptree) to carry out 
complementary analyses is very easy with GenoCline since no change or specific modification 
of data format is required. 
 
 

GenoCline v. 1.3 User Manual 18


Output 
 
Saving results 
 
Once  all  analyses  have  been  done,  the  information  generated  will  be  saved  in  the  file 
Results.xls. This includes: 
 
‐ Mean frequency and Wahlund variance per allele. 
‐  Cline’s  orientation  angle,  and  Pearson’s  r  correlation  coefficient  along  with  degrees  of 
freedom and statistical significance (p‐value) per each genetic cline identified. 
‐ Moran's index and statistical significance per distance rank. 
‐ Expected and predicted heterozygosities, and genetic variance (ri) in the centroid method. 
‐ Coefficients of the isolation‐by‐distance analysis: a (measure of local kinship), and b [rate of 
exponential decline of ∅(d)].  
 
 
Graphical representation of results 
 
All illustrations of results (graphs) are saved in eps format so that there will be available for 
the researcher vectorial graphs of high quality and easily editable. 
All figures are also saved in jpg format. 
 
 
Errors 
 
Error 1: Cell A1 in Sheet 1 is empty. This cell must contain the total number of populations. 
Error 2: Cell B1 in Sheet 1 is empty. This cell must contain the total number of loci. 
Error 3: The second row of Sheet 1 must contain the number of alleles of each loci. 
Error 4: Cell A1 in Sheet 2 is empty. This cell must contain the total number of populations. 
Error 5: An allele frequency is greater than 1. 
Error 6: An allele frequency is less than 0. 
 

 
 
 
Fig. 14. An error message. 
 
 
 
 
 
 

GenoCline v. 1.3 User Manual 19


Bibliography 
 
Barton, N. H., Gale, K. S., 1993. Genetic analysis of hybrid zones (in R. Harrison, editor). Hybrid zones 
and the evolutionary process. Oxford University Press, New York, New York, USA. pp. 13‐45 
Castric V, Bernatchez L. 2003. The rise and fall of isolation by distance in the anadromous brook charr 
(Salvelinus fontinalis Mitchill). Genetics 163: 983‐96. 
Gómez‐Pérez L, Alfonso‐Sánchez MA, Sánchez D, García‐Obregón S, Espinosa I, Martínez‐Jarreta B, De 
Pancorbo MM, Peña JA. 2011a. Alu polymorphisms in the Waorani tribe from the Ecuadorian 
Amazon reflect the effects of isolation and genetic drift. Am J Hum Biol 23: 790‐5.  
Gómez‐Pérez L, Alfonso‐Sánchez MA, Dipierri JE, Alfaro E, García‐Obregón S, De Pancorbo MM, Bailliet 
G, Peña JA. 2011b. Microevolutionary processes due to landscape features in the province of 
Jujuy (Argentina). Am J Hum Biol 23: 177‐84.  
Fitzpatrick, B. M. 2013. Alternative forms for genomic clines. Ecology and evolution, 3(7), 1951‐1966. 
Fuselli  S,  Tarazona‐Santos  E,  Dupanloup  I,  Soto  A,  Luiselli  D,  Pettener  D.  2003.  Mitochondrial  DNA 
diversity in South America and the genetic history of Andean highlanders. Mol Biol Evol 20: 1682‐
91.  
Harpending H, Jenkins T. 1973. Genetic distance among southern African populations, in Methods and 
theories of anthropological genetics (MH Crawford, PL Workman, eds), 177‐199. Albuquerque: 
University of New Mexico Press. 
Harpending HC, Ward RH. 1982. Chemical systematics and human populations. In Biochemical aspects 
of evolutionary biology (M Nitecki, ed.). Chicago: University of Chicago. 213‐56. 
Hartl DL, Clark AG. 1997. Principles of Population Genetics (Third Edition). Sunderland, MA: Sinauer 
Associates. 
Legendre, P. 1993. Spatial autocorrelation: trouble or new paradigm?. Ecology, 74(6): 1659‐1673. 
Malécot G. 1973. Isolation by distance, in Genetic Structure of Populations (NE Morton, ed.), 72‐75. 
Honolulu: University of Hawaii Press. 
Moran, P. A. P. 1950. Notes on Continuous Stochastic Phenomena. Biometrika 37: 17‐23.  
Moreira AS, Horgan FG, Murray TE, Kakouli‐Duarte T. 2015 Population genetic structure of Bombus 
terrestris in Europe: Isolation and genetic differentiation of Irish and British populations. Mol 
Ecol 24: 3257‐68.  
Rousset F. 1997. Genetic differentiation and estimation of gene flow from F‐statistics under isolation 
by distance. Genetics 145: 1219‐28. 
Sammon JW 1969. A nonlinear mapping for data structure analysis. IEEE Transactions on Computers 
18: 401‐9. 
Sokal, R. R., Oden, N. L. 1978. Spatial autocorrelation in biology: 2. Some biological implications and 
four  applications  of  evolutionary  and  ecological  interest.  Biological  Journal  of  the  Linnean 
Society, 10(2): 229‐249. 
Wright S. 1943. Isolation by distance. Genetics 28: 114‐38. 
 
 
Acknowledgements 
 
Dr Michael Thomas Flanagan at http://www.ee.ucl.ac.uk/~mflanaga (Regression)  

GenoCline v. 1.3 User Manual 20

You might also like