Download as pdf or txt
Download as pdf or txt
You are on page 1of 19

Supplementary 

Figure 1: Overview of Data Preprocessing and Analysis 

Key: 
animal data  human or humanized data 

NCBI Gene Expression Omnibus 

Stellate Signature Discovery Microarrays  Stellate Signature Valida on Microarrays 

quin le normaliza on 

collapse to genes  mouse and rat datasets  human datasets 


(median of probe sets) 

signature genera on  hierarchical clustering 


(meanstellate  > 2*maxother)  (Pearson, average linkage)  humanize genes  stra fy by stellate 
(HomoloGene rel. 68)  signature expression 
humanize genes 
(HomoloGene rel. 68) 

stellate signature  gene set  outcomes analysis 


hepa c stellate cell gene expression signature 
enrichment score comparison  enrichment analysis  (Kaplan Meyer) 

gene ontology analysis  cell surface marker  comparison to exis ng 


(hypergeometric test)  explora on  outcomes signatures 

Arrows indicate the flow of informa on, while boxes indicate the steps performed.  Purple boxes represent animal data, while green boxes represent human or 
humanized data.  
Supplementary Figure 2: Expression of Canonical Hepa c Stellate Cell Genes across all Tissue and Cell Types 

 cell and  ssue samples 
zstellate cell
(quiescent)
stellate cell
(CCl4)

stellate cell
(BDL)

endothelial

epithelial

macrophage

neutrophil

B-cell

canonical stellate cell genes 
NK cell

NKT cell

CD4 T cell

CD8 T cell

hepatocyte

erythroblast

platelet/
megakaryocyte

fetal liver

whole liver

high expression

low expression

Many canonical hepa c stellate cell factors were enriched in the hepa c stellate cell samples, but were not included in the hepa c stellate cell signature due to 


concurrent expression in other  ssues. 
Supplementary Figure 3: Significantly Enriched Gene Ontologies Within the Hepa c 
Stellate Cell Signature and Leading Edge Subsets 

A B

C D E
Term  P value  Term  P value  Term  P value 
GO:0048513~organ development  7.12E‐07  GO:0032502~developmental process  3.55E‐04  GO:0032502~developmental process  2.87E‐05 
GO:0009888~ ssue development  8.76E‐07  GO:0004872~receptor ac vity  5.60E‐04  GO:0048856~anatomical structure 
GO:0048856~anatomical structure  1.29E‐06  development  6.80E‐05 
GO:0001501~skeletal system development  9.28E‐04 
development  GO:0030198~extracellular matrix  0.001969  GO:0048731~system development  3.37E‐04 
GO:0048731~system development  1.84E‐06  GO:0009653~anatomical structure 
organiza on 
GO:0009653~anatomical structure  7.94E‐06  hsa04060:Cytokine‐cytokine receptor  0.003403  morphogenesis  3.60E‐04 
morphogenesis  GO:0007275~mul cellular organismal 
interac on 
GO:0032502~developmental process  1.01E‐05  0.003615  development  3.61E‐04 
GO:0004871~signal transducer ac vity 
hsa04510:Focal adhesion  2.04E‐05  hsa04510:Focal adhesion  3.85E‐04 
GO:0060089~molecular transducer ac vity  0.003615 
2.70E‐05  GO:0048010~vascular endothelial growth 
GO:0048856~anatomical structure  0.004112 
GO:0007169~transmembrane receptor  factor receptor signaling pathway  4.24E‐04 
development 
protein tyrosine kinase signaling pathway  GO:0004872~receptor ac vity  4.77E‐04 
GO:0007275~mul cellular organismal  0.004388 
GO:0032501~mul cellular organismal  2.86E‐05  GO:0043062~extracellular structure 
development 
process  organiza on  0.001133 
GO:0032501~mul cellular organismal  0.004844 
GO:0007167~enzyme linked receptor  3.05E‐05  hsa04060:Cytokine‐cytokine receptor 
process 
protein signaling pathway  interac on  0.001296 

(A‐B) Gene ontologies enriched in the stellate cell signature.  (A) shows ontologies describing biological func on, where 
there is strong enrichment of developmentally relevant factors. (B) shows ontologies describing cell loca on, where 
there is strong enrichment of extracellular proteins and extracellular matrix components. In (C‐E), we characterized the 
most highly enriched (leading edge) hepa c stellate signature genes from each gene set enrichment analysis in Figure 1.   
The ten most significantly enriched gene ontologies within each leading edge are listed, comparing normal and cirrho c 
pa ents (C), fibro c and non‐fibro c NAFLD pa ents (D), and  inflammatory and non‐inflammatory NAFLD pa ents (E). 
Supplementary Figure 4: Interac on Network of Stellate Cell Signature Genes 
associated with Human Cirrhosis 

Hepa c stellate cell signature enrichment was assessed using gene set enrichment analysis in a dataset comparing 
normal and cirrho c pa ents.  The stellate signature genes most highly correlated with the cirrho c phenotype were 
submi ed to Ingenuity Pathway Analysis.  The highest ranking interac on network  from the analysis is shown here. 
Supplementary Figure 5: Interac on Network of Stellate Cell Signature Genes 
associated with Fibro c NASH 

Hepa c stellate cell signature enrichment was assessed using gene set enrichment analysis in a dataset comparing 
fibro c and non‐fibro c NAFLD pa ents.  The stellate signature genes most highly correlated with the fibro c phenotype 
were submi ed to Ingenuity Pathway Analysis.  The highest ranking interac on network  from the analysis is shown 
here. 
Supplementary Figure 6: Interac on Network of Stellate Cell Signature Genes 
associated with Inflammatory NAFLD 

Hepa c stellate cell signature enrichment was assessed using gene set enrichment analysis in a dataset comparing 
inflammatory and non‐inflammatory NAFLD pa ents.  The stellate signature genes most highly correlated with the 
fibro c phenotype were submi ed to Ingenuity Pathway Analysis.  The highest ranking interac on network  from the 
analysis is shown here. 
Supplementary Figure 7: Associa on of Hepa c Stellate Cell Signature Expression 
and Rodent Biological Phenotypes 

Mean group stellate signature enrichment score is plo ed for each condi on and dataset indicated.  Error bars indicate 


+/‐ SEM.  While some interes ng trends are present for mouse CCl4, mouse BDL, mouse UUO, mouse PSC, rat BDL, and 
rat DEN, no sta s cal significance was reached using a two tailed Student’s t‐test. 
Supplementary Figure 8: Overlap between Hepa c Stellate Cell Signature and 
Previously Reported Outcomes Signatures (Hoshida et al. 2008 and 2013) 

A B normalized enrichment score = 1.81 
nominal p‐value =  0.002 

hepa c stellate cell 
signature 

(122 genes) 

ITGA9 
LOXL2 
TGFB1I1 

Hoshida et al. poor  Hoshida et al. good 
outcomes correlated  outcomes correlated 

(73 genes)  (113 genes) 

C
Gene Symbol  Gene Name  Rank in Gene List  Rank Metric Score  Running  Core Enrichment? 
ITGA9  ITGA9:integrin, alpha 9  8  3.811203  0.071937  Yes 
TGFB1I1  TGFB1I1:transforming growth factor beta 1 induced transcript 1  70  2.659373  0.112968  Yes 
SEMA3A:sema domain, immunoglobulin domain (Ig), short basic domain, secreted, 
SEMA3A  (semaphorin) 3A  118  2.348283  0.150335  Yes 
LOXL2  LOXL2:lysyl oxidase‐like 2  120  2.341989  0.195187  Yes 
SDC3  SDC3:syndecan 3 (N‐syndecan)  166  2.182042  0.229689  Yes 
TPM1  TPM1:tropomyosin 1 (alpha)  206  2.09128  0.263439  Yes 
ADAMTS2  ADAMTS2:ADAM metallopep dase with thrombospondin type 1 mo f, 2  357  1.720657  0.271708  Yes 
FRZB  FRZB:frizzled‐related protein  429  1.584663  0.290427  Yes 
TLN2  TLN2:talin 2  525  1.436981  0.302339  Yes 
EDNRA  EDNRA:endothelin receptor type A  584  1.35967  0.318883  Yes 
RBMS3  RBMS3:RNA binding mo f, single stranded interac ng protein  643  1.30307  0.334339  Yes 
PDGFRB  PDGFRB:platelet‐derived growth factor receptor, beta polypep de  672  1.267684  0.354076  Yes 
DCBLD2  DCBLD2:discoidin, CUB and LCCL domain containing 2  700  1.241085  0.373468  Yes 
TNFRSF11B  TNFRSF11B:tumor necrosis factor receptor superfamily, member 11b (osteoprotegerin)  822  1.132176  0.375221  Yes 
HGF  HGF:hepatocyte growth factor (hepapoie n A; sca er factor)  833  1.122553  0.395145  Yes 
BGN  BGN:biglycan  920  1.045854  0.401026  Yes 
COL5A2  COL5A2:collagen, type V, alpha 2  978  1.006057  0.410939  Yes 
BDNF  BDNF:brain‐derived neurotrophic factor  993  0.999173  0.42783  Yes 
EDNRB  EDNRB:endothelin receptor type B  1007  0.994661  0.4448  Yes 
PDGFRA  PDGFRA:platelet‐derived growth factor receptor, alpha polypep de  1186  0.868962  0.432067  Yes 
TAGLN  TAGLN:transgelin  1269  0.818863  0.434247  Yes 
TNXB  TNXB:tenascin XB  1275  0.815062  0.449087  Yes 
ANGPTL2  ANGPTL2:angiopoie n‐like 2  1332  0.773426  0.454693  Yes 
TGFB3  TGFB3:transforming growth factor, beta 3  1444  0.710505  0.449995  Yes 
RGS7  RGS7:regulator of G‐protein signalling 7  1455  0.705168  0.461896  Yes 

(A) shows the gene overlap between the hepa c stellate cell and previously reported prognos c signature.  Only 3 genes 


are the same, indica ng that the stellate cell and prognos c signatures are substan ally different.  (B) shows the 
posi on of stellate signature genes on the resected HCC expression dataset, ranked by Cox regression score for survival.  
The stellate signature genes with the highest correla on to poor outcome are shown in (C). 
Supplementary Table 1: Datasets Used to Derive the Hepa c Stellate Cell Signature 
Sample  Sample 
accession  Descrip on  Category  accession  Descrip on  Category 
GSM686644  B220(+) B lymphocytes  B cell  GSM1301661  bone marrow neutrophils (Gr‐1 high CD48 neg)  neutrophil 
GSM686645  B220(+) B lymphocytes  B cell  GSM1301662  bone marrow neutrophils (Gr‐1 high CD48 neg)  neutrophil 
GSM1061907  B6 T1 B cells  B cell 
GSM344315  Normal BM neutrophils, c‐kit‐ Gr1+ Mac1+  neutrophil 
GSM1061908  B6 T1 B cells  B cell 
Liver sinusoidal endothelial cells isolated from MxCre‐ Fk1 L/L Fk2 L/L Afx L/L  GSM344316  Normal BM neutrophils, c‐kit‐ Gr1+ Mac1+  neutrophil 
GSM690763  mouse  endothelial  GSM344318  Normal BM neutrophils, c‐kit‐ Gr1+ Mac1+  neutrophil 
Liver sinusoidal endothelial cells isolated from MxCre‐ Fk1 L/L Fk2 L/L Afx L/L 
GSM690764  mouse  endothelial  GSM686650  NK1.1+ NK cells  NK 
Liver sinusoidal endothelial cells isolated from MxCre‐ Fk1 L/L Fk2 L/L Afx L/L 
GSM686651  NK1.1+ NK cells  NK 
GSM690765  mouse  endothelial 
NK cells were enriched by nega ve selec on using NK cell isola on kit (R&D) and 
GSM547760  Mouse, colon, normal, blood endothelial cells  endothelial  GSM1214478  then FACS sorted to obtain DX5+ cells  NK 
GSM547762  Mouse, colon, normal, blood endothelial cells  endothelial  NK cells were enriched by nega ve selec on using NK cell isola on kit (R&D) and 
GSM547764  Mouse, colon, normal, blood endothelial cells  endothelial  GSM1214479  then FACS sorted to obtain DX5+ cells  NK 
NK cells were enriched by nega ve selec on using NK cell isola on kit (R&D) and 
GSM547766  Mouse, colon, normal, blood endothelial cells  endothelial 
GSM1214480  then FACS sorted to obtain DX5+ cells  NK 
GSM765922  c57 bl/6 intes nal epithelial  epithelial 
GSM686652  CD3ε(+)NK1.1(+) NKT cells  NKT 
GSM765923  c57 bl/6 intes nal epithelial  epithelial 
GSM686653  CD3ε(+)NK1.1(+) NKT cells  NKT 
GSM765924  c57 bl/6 intes nal epithelial  epithelial 
GSM1232678  stage 2 iNKT  NKT 
GSM598999  microdissected uteric bud stalks from E12.5 kidneys  epithelial 
GSM599000  microdissected uteric bud stalks from E12.5 kidneys  epithelial  GSM1232679  stage 2 iNKT  NKT 

GSM599001  microdissected uteric bud  ps from E12.5 kidneys  epithelial  GSM1232680  stage 2 iNKT  NKT 

GSM599002  microdissected uteric bud  ps from E12.5 kidneys  epithelial  GSM389821  megakaryocytes from wild type fetal livers E14.5 (CD41+)  platelet/megakaryocyte 


GSM190795  intes nal epithelial cells  epithelial  GSM1071644  washed platelets from Smad4 f/f mice  platelet/megakaryocyte 
GSM190796  intes nal epithelial cells  epithelial  GSM361592  megakaryocytes SCL fl/fl  platelet/megakaryocyte 
GSM190797  intes nal epithelial cells  epithelial  GSM852341  Isolated primary hepa c stellate cells, macrophage depleted  stellate cell, BDL 
GSM658893  FVB/N MMTV‐rtTA  mammary epithelial cells, Doxycycline treated 7 days  epithelial  GSM852342  Isolated primary hepa c stellate cells, macrophage depleted  stellate cell, BDL 
GSM658894  FVB/N MMTV‐rtTA  mammary epithelial cells, Doxycycline treated 7 days  epithelial 
GSM852343  Isolated primary hepa c stellate cells, macrophage depleted  stellate cell, BDL 
GSM658895  FVB/N MMTV‐rtTA  mammary epithelial cells, Doxycycline treated 7 days  epithelial 
GSM852344  Isolated primary hepa c stellate cells, macrophage depleted  stellate cell, CCl4 
GSM658896  FVB/N MMTV‐rtTA  mammary epithelial cells, Doxycycline treated 7 days  epithelial 
GSM852345  Isolated primary hepa c stellate cells, macrophage depleted  stellate cell, CCl4 
GSM658897  FVB/N MMTV‐rtTA  mammary epithelial cells, Doxycycline treated 7 days  epithelial 
GSM852346  Isolated primary hepa c stellate cells, macrophage depleted  stellate cell, CCl4 
GSM658898  FVB/N MMTV‐rtTA  mammary epithelial cells, Doxycycline treated 7 days  epithelial 
GSM852330  Isolated primary hepa c stellate cells, macrophage depleted  stellate cell, quiescent 
GSM686654  Ter119(+) erythroblasts  erythroblast 
GSM686655  Ter119(+) erythroblasts  erythroblast  GSM852331  Isolated primary hepa c stellate cells, macrophage depleted  stellate cell, quiescent 

GSM216494  Sorted erythroblasts, Sod2+/+  erythroblast  GSM852332  Isolated primary hepa c stellate cells, macrophage depleted  stellate cell, quiescent 

GSM216495  Sorted erythroblasts, Sod2+/+  erythroblast  GSM852333  Isolated primary hepa c stellate cells, macrophage depleted  stellate cell, quiescent 


GSM216496  Sorted erythroblasts, Sod2+/+  erythroblast  GSM852334  Isolated primary hepa c stellate cells, macrophage depleted  stellate cell, quiescent 
GSM216497  Sorted erythroblasts, Sod2+/+  erythroblast  GSM686646  CD4(+) T lymphocytes  CD4 T cell 
GSM298115  E14.5 fetal liver Ter119 + cells  fetal liver  GSM686647  CD4(+) T lymphocytes  CD4 T cell 
GSM298116  E14.5 fetal liver Ter119 + cells  fetal liver 
GSM555381  CD4+ T cells from B6 mice  CD4 T cell 
GSM298117  E14.5 fetal liver Ter119 + cells  fetal liver 
GSM555382  CD4+ T cells from B6 mice  CD4 T cell 
GSM378250  Embryonic day 14.5 wild type (WT) mouse fetal liver from B6/129 mixed strain  fetal liver 
GSM555383  CD4+ T cells from B6 mice  CD4 T cell 
GSM378251  Embryonic day 14.5 wild type (WT) mouse fetal liver from B6/129 mixed strain  fetal liver 
GSM555384  CD4+ T cells from B6 mice  CD4 T cell 
GSM378252  Embryonic day 14.5 wild type (WT) mouse fetal liver from B6/129 mixed strain  fetal liver 
GSM686648  CD8(+) T lymphocytes  CD8 T cell 
GSM378253  Embryonic day 14.5 wild type (WT) mouse fetal liver from B6/129 mixed strain  fetal liver 
GSM686649  CD8(+) T lymphocytes  CD8 T cell 
GSM378254  Embryonic day 14.5 wild type (WT) mouse fetal liver from B6/129 mixed strain  fetal liver 
GSM1281320  freshly isolated primary mouse hepatocytes  hepatocyte  GSM1081398  Quiescent mouse CD8 T cells purified from WT control mouse spleen  CD8 T cell 

GSM1281321  freshly isolated primary mouse hepatocytes  hepatocyte  GSM1081399  Quiescent mouse CD8 T cells purified from WT control mouse spleen  CD8 T cell 

GSM1281322  freshly isolated primary mouse hepatocytes  hepatocyte  GSM1081400  Quiescent mouse CD8 T cells purified from WT control mouse spleen  CD8 T cell 


GSM525384  primary mouse hepatocytes  hepatocyte  GSM591473  normal liver from C57BL/6 mice fed a low fat diet  whole liver 
GSM525383  primary mouse hepatocytes  hepatocyte  GSM591475  normal liver from C57BL/6 mice fed a low fat diet  whole liver 
GSM525382  primary mouse hepatocytes  hepatocyte  GSM591477  normal liver from C57BL/6 mice fed a low fat diet  whole liver 
GSM686658  Mac‐1(+) monocytes/macrophages  macrophage 
GSM591480  normal liver from C57BL/6 mice fed a low fat diet  whole liver 
GSM686659  Mac‐1(+) monocytes/macrophages  macrophage 
GSM602665  Six week old male C57BL/6 mouse liver  whole liver 
GSM571897  fetal liver macrophage Mac‐1+F4/80+  macrophage  GSM602666  Six week old male C57BL/6 mouse liver  whole liver 

GSM1129665  cultured peritoneal macrophages  macrophage  GSM602667  Six week old male C57BL/6 mouse liver  whole liver 

GSM: NCBI Gene Expression Omnibus sample accession number (h p://www.ncbi.nlm.nih.gov/geo/) 
Supplementary Table 2: Gene Ontology Terms Enriched in 
the Hepa c Stellate Cell Signature 
GO Term (Molecular Function) Count % of term Genes P-Value Bonferroni FDR

BMP10, TNC, TBX20, PTH1R, TGFB3, CDH2, TPM1, EDNRA, EDNRB, TNFRSF11B, BDNF, HAND2, LHX2, CCBE1, SEMA3D, AHNAK2, ROBO2,
GO:0048856~anatomical structure development 44 3.93 HHIP, SEMA3A, CRYAB, AXL, TEAD1, HGF, FRZB, COL5A2, NTN1, TNS3, VEGFC, BGN, SEMA6D, EREG, TAGLN, PRICKLE2, PDGFRA, 6.43E-09 7.61E-06 1.04E-05
PDGFRB, GDF10, ZFPM2, RELN, ANTXR1, TGFB1I1, ADAMTS2, BMP5, NTM, NGF
BMP10, TNC, TBX20, PTH1R, TGFB3, CDH2, TPM1, EDNRA, EDNRB, TNFRSF11B, BDNF, HAND2, LHX2, CCBE1, SEMA3D, AHNAK2, ROBO2,
GO:0048731~system development 42 3.75 SEMA3A, HHIP, CRYAB, AXL, TEAD1, HGF, FRZB, COL5A2, NTN1, TNS3, VEGFC, BGN, SEMA6D, EREG, TAGLN, PDGFRA, PDGFRB, GDF10, 6.74E-09 7.99E-06 1.09E-05
ZFPM2, RELN, TGFB1I1, ADAMTS2, BMP5, NTM, NGF
BMP10, TNC, TBX20, PTH1R, TGFB3, CDH2, TPM1, FOXS1, EDNRA, EDNRB, BDNF, TNFRSF11B, HAND2, LHX2, CCBE1, SEMA3D, AHNAK2,
GO:0032502~developmental process 48 4.29 ROBO2, HHIP, SEMA3A, LOXL2, ANGPTL2, CRYAB, AXL, TEAD1, PDE3A, HGF, FRZB, COL5A2, NTN1, VEGFC, TNS3, BGN, SEMA6D, EREG, 5.82E-08 6.90E-05 9.39E-05
TAGLN, PRICKLE2, PDGFRA, PDGFRB, GDF10, ZFPM2, RELN, ANTXR1, TGFB1I1, ADAMTS2, BMP5, NTM, NGF
BMP10, TNC, TBX20, PTH1R, TGFB3, CDH2, TPM1, EDNRA, EDNRB, BDNF, HAND2, LHX2, CCBE1, AHNAK2, ROBO2, HHIP, CRYAB, AXL,
GO:0048513~organ development 34 3.04 6.66E-08 7.89E-05 1.07E-04
TEAD1, HGF, NTN1, COL5A2, TNS3, VEGFC, BGN, EREG, TAGLN, PDGFRA, PDGFRB, ZFPM2, RELN, TGFB1I1, ADAMTS2, BMP5
BMP10, TBX20, TGFB3, CDH2, TPM1, EDNRA, BDNF, HAND2, LHX2, CCBE1, ROBO2, SEMA3A, HHIP, AXL, HGF, NTN1, COL5A2, VEGFC, BGN,
GO:0009653~anatomical structure morphogenesis 27 2.41 1.97E-07 2.33E-04 3.18E-04
EREG, PRICKLE2, PDGFRA, PDGFRB, ZFPM2, RELN, ANTXR1, TGFB1I1
BMP10, TNC, TBX20, PTH1R, TGFB3, CDH2, TPM1, FOXS1, EDNRA, EDNRB, TNFRSF11B, BDNF, HAND2, LHX2, CCBE1, SEMA3D, AHNAK2,
GO:0007275~multicellular organismal development 44 3.93 ROBO2, HHIP, SEMA3A, ANGPTL2, CRYAB, AXL, TEAD1, HGF, FRZB, COL5A2, NTN1, TNS3, VEGFC, BGN, SEMA6D, EREG, TAGLN, PDGFRA, 2.83E-07 3.36E-04 4.57E-04
PDGFRB, GDF10, ZFPM2, RELN, TGFB1I1, ADAMTS2, BMP5, NTM, NGF

GO:0048468~cell development 19 1.70 BMP10, TNC, PTH1R, PDE3A, HGF, NTN1, TPM1, EDNRA, EDNRB, BDNF, EREG, HAND2, LHX2, ROBO2, RELN, ANTXR1, SEMA3A, NTM, NGF 6.21E-07 7.35E-04 1.00E-03

BMP10, TNC, PTH1R, CDH2, TPM1, EDNRA, EDNRB, BDNF, HAND2, LHX2, SEMA3D, AHNAK2, ROBO2, SEMA3A, HHIP, PDE3A, HGF, FRZB,
GO:0048869~cellular developmental process 31 2.77 1.71E-06 2.02E-03 2.76E-03
NTN1, VEGFC, SEMA6D, EREG, PRICKLE2, PDGFRA, ZFPM2, RELN, ANTXR1, TGFB1I1, NTM, BMP5, NGF
BMP10, TNC, PTH1R, CDH2, TPM1, EDNRA, EDNRB, BDNF, HAND2, LHX2, SEMA3D, AHNAK2, ROBO2, SEMA3A, HHIP, PDE3A, HGF, FRZB,
GO:0030154~cell differentiation 30 2.68 2.34E-06 2.76E-03 3.77E-03
NTN1, VEGFC, EREG, SEMA6D, PDGFRA, ZFPM2, RELN, ANTXR1, TGFB1I1, NTM, BMP5, NGF

GO:0035295~tube development 11 0.98 EDNRA, TNS3, BDNF, HAND2, TBX20, PDGFRA, TGFB3, ZFPM2, ROBO2, HHIP, ADAMTS2 3.84E-06 4.55E-03 6.21E-03

BMP10, TNC, PTH1R, HGF, TPM1, COL5A2, EDNRA, EDNRB, VEGFC, EREG, HAND2, LHX2, PDGFRB, AHNAK2, ZFPM2, TGFB1I1, ADAMTS2,
GO:0009888~tissue development 18 1.61 4.44E-06 5.25E-03 7.17E-03
BMP5
GO:0007167~enzyme linked receptor protein signaling
13 1.16 BMP10, GDF2, AXL, TGFB3, HGF, DDR2, VEGFC, EREG, PDGFRA, GDF10, PDGFRB, TGFB1I1, NGF 5.81E-06 6.86E-03 9.38E-03
pathway

GO:0001558~regulation of cell growth 10 0.89 DCBLD2, RERG, VEGFB, BMP10, GDF2, CRYAB, SEMA3A, NTN1, DDR2, NGF 1.02E-05 1.20E-02 1.65E-02

BMP10, TBX20, TGFB3, FOXS1, EDNRA, EDNRB, TNFRSF11B, BDNF, CCBE1, SEMA3D, GUCY1A3, ROBO2, SEMA3A, HHIP, KHDRBS3,
GPR176, CRYAB, MMP10, VEGFC, TNS3, BGN, TAGLN, EREG, PDGFRA, PDGFRB, ZFPM2, RELN, TGFB1I1, ADAMTS2, NGF, TNC, PTH1R,
GO:0032501~multicellular organismal process 52 4.65 1.67E-05 1.95E-02 2.69E-02
CDH2, TPM1, HAND2, KIRREL, LHX2, AHNAK2, ANGPTL2, TNXB, EFEMP2, AXL, TEAD1, PDE3A, HGF, FRZB, COL5A2, NTN1, SEMA6D, GDF10,
BMP5, NTM
GO:0010769~regulation of cell morphogenesis involved
7 0.63 TGFB3, ROBO2, TGFB1I1, SEMA3A, CDH2, NTN1, NGF 1.82E-05 2.13E-02 2.93E-02
in differentiation
GO:0022603~regulation of anatomical structure
10 0.89 BDNF, TNFRSF11B, TGFB3, ROBO2, TGFB1I1, HGF, SEMA3A, CDH2, NTN1, NGF 2.68E-05 3.13E-02 4.33E-02
morphogenesis
GO:0051239~regulation of multicellular organismal BMP10, TGFB3, AFAP1L2, CDH2, HGF, NTN1, TPM1, FOXS1, EDNRB, VEGFC, TNFRSF11B, BDNF, EREG, HSPB7, GDF10, GUCY1A3, ROBO2,
20 1.79 3.12E-05 3.63E-02 5.04E-02
process SEMA3A, TGFB1I1, NGF

GO:0007155~cell adhesion 17 1.52 DCBLD2, SVEP1, TNXB, TLN2, TNC, CDH2, PCDH7, DDR2, SDC3, SCARF2, ITGA9, RELN, ROBO2, ANTXR1, TGFB1I1, LOXL2, NTM 3.49E-05 4.05E-02 5.63E-02

GO:0022610~biological adhesion 17 1.52 DCBLD2, SVEP1, TNXB, TLN2, TNC, CDH2, PCDH7, DDR2, SDC3, SCARF2, ITGA9, RELN, ROBO2, ANTXR1, TGFB1I1, LOXL2, NTM 3.55E-05 4.12E-02 5.73E-02

                 

GO Term (Cellular Component) Count % Genes P-Value Bonferroni FDR

BMP10, GDF2, MASP1, TNC, PAMR1, TGFB3, TNFRSF11B, BDNF, RSPO3, C1QTNF2, CCBE1, SEMA3D, SEMA3A, HHIP, LOXL2, ANGPTL2, PI15,
GO:0005576~extracellular region 36 3.217 TNXB, SVEP1, EFEMP2, HGF, FRZB, COL5A2, NTN1, VEGFB, MMP10, TSLP, VEGFC, BGN, EREG, SRPX2, GDF10, RELN, ADAMTS2, BMP5, 8.62E-08 1.37E-05 1.04E-04
NGF
BMP10, GDF2, TNXB, MASP1, EFEMP2, TNC, TGFB3, NTN1, COL5A2, MMP10, TSLP, VEGFC, TNFRSF11B, BGN, EREG, C1QTNF2, GDF10,
GO:0044421~extracellular region part 23 2.055 4.69E-07 7.45E-05 5.65E-04
RELN, LOXL2, ANGPTL2, ADAMTS2, BMP5, NGF

GO:0005615~extracellular space 16 1.430 BMP10, GDF2, TNXB, MASP1, TGFB3, MMP10, VEGFC, TSLP, EREG, C1QTNF2, GDF10, RELN, LOXL2, ANGPTL2, BMP5, NGF 6.57E-05 1.04E-02 7.92E-02

GO:0031012~extracellular matrix 11 0.983 MMP10, TNFRSF11B, BGN, TNXB, TNC, EFEMP2, TGFB3, RELN, COL5A2, NTN1, ADAMTS2 1.29E-04 2.02E-02 1.55E-01

DCBLD2, IL1R1, TLN2, GNAI1, PTH1R, TGFB3, SYT9, CDH2, DDR2, AMOTL2, TPM1, EDNRA, EDNRB, ROBO2, HHIP, GPR176, AXL, PCDH7,
GO:0044459~plasma membrane part 30 2.681 3.10E-04 4.81E-02 3.74E-01
NEXN, TNS3, ITGA9, ABCC9, EREG, PRICKLE2, PDGFRA, RGS7, PDGFRB, ANTXR1, TGFB1I1, STEAP1

GO:0005578~proteinaceous extracellular matrix 10 0.894 MMP10, TNFRSF11B, BGN, TNXB, TNC, EFEMP2, RELN, COL5A2, NTN1, ADAMTS2 3.53E-04 5.45E-02 4.25E-01

GO:0031093~platelet alpha granule lumen 4 0.357 VEGFB, VEGFC, TGFB3, HGF 2.76E-03 3.56E-01 3.28E+00

GO:0060205~cytoplasmic membrane-bounded vesicle


4 0.357 VEGFB, VEGFC, TGFB3, HGF 3.38E-03 4.16E-01 4.00E+00
lumen

GO:0031983~vesicle lumen 4 0.357 VEGFB, VEGFC, TGFB3, HGF 3.83E-03 4.57E-01 4.53E+00

                 

GO Term (Molecular Function) Count % Genes P-Value Bonferroni FDR

GO:0008083~growth factor activity 11 0.98 VEGFB, VEGFC, BMP10, GDF2, BDNF, EREG, TGFB3, GDF10, HGF, BMP5, NGF 2.86E-07 7.47E-05 3.74E-04

BMP10, IL1R1, GDF2, TNXB, TNC, TGFB3, HGF, RERG, VEGFB, TSLP, EDNRB, VEGFC, TNFRSF11B, BDNF, EREG, C1QTNF2, PDGFRA, GDF10,
GO:0005102~receptor binding 23 2.06 3.83E-07 9.99E-05 5.01E-04
PDGFRB, TGFB1I1, ANGPTL2, BMP5, NGF
BMP10, GDF2, MASP1, GPR124, TLN2, TBX20, TGFB3, SYT9, ANKRD1, NAP1L5, DDR2, AMOTL2, SDC3, EDNRA, EDNRB, BDNF, TNFRSF11B,
BOK, PLOD2, GUCY1A3, ROBO2, LMOD1, HHIP, PPP1R14A, CDK14, RPP25, KHDRBS3, CRYAB, LRRC27, PCDH7, NEXN, MSC, VEGFB, TNS3,
GO:0005515~protein binding 80 7.15 VEGFC, BGN, TAGLN, EREG, HSPB7, PDGFRA, PDGFRB, ZFPM2, RELN, TGFB1I1, FKBP10, IRAK1BP1, NGF, DCBLD2, IL1R1, GNAI1, TNC, 1.35E-04 3.45E-02 1.76E-01
AFAP1L2, CDH2, TPM1, SCARF2, HAND2, PDE1A, C1QTNF2, AHNAK2, ANGPTL2, SVEP1, TNXB, LRRN4, EFEMP2, LMCD1, AXL, TEAD1, HGF,
FRZB, NTN1, COL5A2, RERG, TSLP, ITGA9, ABCC9, RGS7, GDF10, ANTXR1, NTM, BMP5

                 

Term (KEGG Pathways) Count % Genes P-Value Bonferroni FDR

hsa04510:Focal adhesion 11 0.98 VEGFB, ITGA9, VEGFC, TNXB, TLN2, TNC, PDGFRA, PDGFRB, RELN, HGF, COL5A2 5.70E-06 3.08E-04 5.58E-03

hsa04512:ECM-receptor interaction 6 0.54 ITGA9, TNXB, TNC, RELN, COL5A2, SDC3 7.14E-04 3.79E-02 6.98E-01

hsa04060:Cytokine-cytokine receptor interaction 9 0.80 VEGFB, VEGFC, TSLP, IL1R1, TNFRSF11B, PDGFRA, TGFB3, PDGFRB, HGF 1.57E-03 8.12E-02 1.52E+00
Supplementary Table 3: Transcriptome Datasets Used  
for Hepa c Stellate Cell Signature Valida on 

Organism  Disease / Model  GEO accession 


Human  Non‐alcoholic fa y liver disease  GSE48452 

Cirrhosis  GSE6764 
Mouse  Carbon tetrachloride  GSE27640  
Bile duct liga on  GSE40041 
Primary sclerosing cholangi s  GSE11507 
Unilateral urethral obstruc on  GSE36496 

Lung bleomycin  GSE37635 
Rat  Carbon tetrachloride  GSE32891 
Bile duct liga on  GSE13747  
Diethylnitrosamine  GSE19057  
GSE: NCBI Gene Expression Omnibus sample accession number 
(h p://www.ncbi.nlm.nih.gov/geo/) 
Supplementary Table 4: List of Gene Ontology and LOCATE Categories Used 
for Cell Surface Marker Discovery 

Gene Ontology Cellular Component  LOCATE 
ADHERENS_JUNCTION  GPI anchored membrane protein 
ANCHORED_TO_PLASMA_MEMBRANE  Mul ‐span membrane protein 
APICAL_PLASMA_MEMBRANE  Type I membrane protein 
APICOLATERAL_PLASMA_MEMBRANE  Type II membrane protein 
BASAL_LAMINA  locate.imb.uq.edu.au/ 
BASEMENT_MEMBRANE 
BASOLATERAL_PLASMA_MEMBRANE 
BRUSH_BORDER 
CELL_JUNCTION 
CELL_MATRIX_JUNCTION 
CELL_PROJECTION 
CELL_PROJECTION_PART 
CELL_SUBSTRATE_ADHERENS_JUNCTION 
CELL_SURFACE 
DYSTROPHIN_ASSOCIATED_GLYCOPROTEIN_COMPLEX 
EXTERNAL_SIDE_OF_PLASMA_MEMBRANE 
EXTRACELLULAR_MATRIX 
EXTRINSIC_TO_PLASMA_MEMBRANE 
FOCAL_ADHESION 
INTEGRAL_TO_PLASMA_MEMBRANE 
INTEGRIN_COMPLEX 
INTRINSIC_TO_PLASMA_MEMBRANE 
LIPID_RAFT 
PLASMA_MEMBRANE 
PLASMA_MEMBRANE_PART 
PROTEINACEOUS_EXTRACELLULAR_MATRIX 
RECEPTOR_COMPLEX 
SYNAPSE 
SYNAPSE_PART 
TIGHT_JUNCTION 
geneontology.org/page/cellular‐component‐ontology‐guidelines 
Supplementary Table 5: Prognos c Associa on of Clinical Variables, Clinical Indices,  
and Hepa c Stellate Cell Signature Expression with Survival (Prognos c Index 
Deriva on Set, HCV‐related Cirrhosis) 
Univariable Regression Multivariable Regression
   
n 216 216
   
Bilirubin  
(>1.0 mg/dL)  
hazard ratio 3.1 3.8
HR, 95% CI 1.8-5.4 1.5-9.6
p-value <0.001 0.004
   
Platelet count  
(<100k / mm3)  
hazard ratio 3.1 2.4
HR, 95% CI 1.8-5.5 1.2-4.8
p-value <0.001 0.015
   
Hepatic stellate cell
 
signature expression
(>75th percentile)  
hazard ratio 2.5 3.0
HR, 95% CI 1.5-4.1 1.5-5.7
p-value <0.001 0.001
   
FIB4 > 3.25  
hazard ratio 2.0 -
95%CI 0.76-5.1 -
p-value 0.16 -
   
Albu < 4.1 (median)  
hazard ratio 1.9 1.9
95%CI 1.1-3.1 0.97-3.8
p-value 0.014 0.06
   
MELD >6.4 (median)  
hazard ratio 2.3 1.1
95%CI 1.2-4.3 0.52-2.3
p-value 0.009 0.83
Supplementary Table 6: Comparison of Prognos c Indices with and without Hepa c 
Stellate Cell Signature Expression 
  c‐sta s c for  p‐value for model 
  clinical model  c‐sta s c for stellate signature  comparison 
(including bilirubin  model (including bilirubin,  (likelihood ra o 
Cohort  Outcome  and platelets)  platelets and stellate signature)  test) 

Death  0.66 (0.59-0.74)  0.70 (0.62-0.78)  0.0015 


Prognos c 
index  Child progression  0.68 (0.61-0.75)  0.70 (0.63-0.78)  0.0043 
training set 
(HCV cohort)  Decompensa on  0.61 (0.54-0.68)  0.62 (0.55-0.69)  0.075 

Development of HCC  0.63 (0.55-0.70)  0.63 (0.56-0.71)  0.75 


Prognos c 
index  Death  0.58 (0.48-0.68)  0.62 (0.51-0.72)  0.026 
valida on 
set (HCC 
cohort)  HCC recurrence  0.51 (0.44-0.59)  0.54 (0.46-0.62)  0.11 

c‐sta s c was calculated using mul variable Cox regression model adjusted for bilirubin >= 1 mg/dl and platelet count 


<100,000/mm3. 

Discrimina on of the models was assessed by the c‐sta s c and improvement of overall model fit between models was 


assessed by the likelihood ra o test. 
Supplementary Table 7: Correla on of Hepa c Stellate Cell Signature Subsets with 
Cirrhosis, Fibrosis, and Inflamma on 

  Correla on with  Correla on with  Correla on with 


Cirrhosis  Fibrosis in NASH  Inflamma on in NASH  
Signature Subset  NES  p‐value  NES  p‐value  NES  p‐value 
Whole hepa c stellate cell signature   ‐2.08  < 0.001  ‐1.97  < 0.001  ‐1.49  0.009 

Genes significantly higher in quiescent stellate cells*   ‐1.92  < 0.001  ‐1.93  < 0.001  ‐1.36  0.051 

Genes significantly higher in ac vated stellate cells*  ‐2.19  < 0.001  ‐1.93  < 0.001  ‐1.47  0.028 

Genes with no substan al change in expression  ‐1.94  < 0.001  ‐1.88  0.003  ‐1.32  0.1 


between ac vated and quiescent HSC 
NES: normalized enrichment score in gene set enrichment analysis 
*significantly higher as defined by a p‐value < 0.05 in two tailed Student's t‐test between quiescent and ac vated 
stellate cell groups 
            GSEA Leading Edge Enrichment? 
     
Supplementary Table 8: Hepa  
c Stellate Cell Signature Associa  on with    Experimental Data  Outcomes Data 
Resec
ted 
Experimental Phenotypes and Pa ent Outcomes  Hepa s C 
Human  Mouse  Rat  HCC 
Cohort 
Cohor
            t 
Mouse Symbol  Ensembl Gene ID  Human Symbol  Ensembl Gene ID  Descrip on  Group*  1  2  3  4  5  6  7  8  9  10  11  12  13  14  15 
E430002G05RIK     PAMR1  ENSG00000149090  RIKEN cDNA E430002G05 gene  quiescent              1        1                      
RSPO3  ENSMUSG00000019880  RSPO3  ENSG00000146374  R‐spondin 3 homolog (Xenopus laevis)  quiescent                                              
NTN1  ENSMUSG00000020902  NTN1  ENSG00000065320  netrin 1  quiescent                                         1    
5830408B19RIK           RIKEN cDNA 5830408B19 gene  quiescent                                              
EDNRB  ENSMUSG00000022122  EDNRB  ENSG00000136160  endothelin receptor type B  quiescent  1           1        1  1  1  1             
CCBE1  ENSMUSG00000046318  CCBE1  ENSG00000183287  collagen and calcium binding EGF domains 1  quiescent  1                                1  1  1  1 
HNT     NTM  ENSG00000182667  neurotrimin  quiescent     1  1                                     
TLN2 /// LOC639214     TLN2  ENSG00000171914  talin 2 /// similar to talin 2  quiescent                             1  1             
RELN  ENSMUSG00000042453  RELN  ENSG00000189056  Reelin  quiescent           1           1  1                   
DENND2A  ENSMUSG00000038456  DENND2A  ENSG00000146966  DENN/MADD domain containing 2A  quiescent                 1     1                 1    
BMP5  ENSMUSG00000032179  BMP5  ENSG00000112175  bone morphogene c protein 5  quiescent  1                                           
RGS7  ENSMUSG00000026527  RGS7  ENSG00000182901  regulator of G protein signaling 7  quiescent                             1     1  1  1    
PTHR1     PTH1R  ENSG00000160801  parathyroid hormone receptor 1  quiescent                                              
VEGFB  ENSMUSG00000024962  VEGFB  ENSG00000173511  vascular endothelial growth factor B  quiescent                    1              1  1  1  1 
DDR2  ENSMUSG00000026674  DDR2  ENSG00000162733  discoidin domain receptor family, member 2  quiescent  1  1  1        1     1           1  1  1  1 
EDNRA  ENSMUSG00000031616  EDNRA  ENSG00000151617  endothelin receptor type A  quiescent  1     1              1     1  1             
C76566     B3GNT9     expressed sequence C76566  quiescent              1                               
MASP1  ENSMUSG00000022887  MASP1  ENSG00000127241  mannan‐binding lec n serine pep dase 1  quiescent                                   1          
SDC3  ENSMUSG00000025743  SDC3  ENSG00000162512  syndecan 3  quiescent  1  1     1  1  1           1  1  1  1     1 
SEMA6D  ENSMUSG00000027200  SEMA6D  ENSG00000137872  sema domain, transmembrane domain (TM), and cytoplasmic domain, (semaphorin) 6D  quiescent        1        1     1           1  1     1 
ANGPTL2  ENSMUSG00000004105  ANGPTL2  ENSG00000136859  angiopoie n‐like 2  quiescent     1  1           1  1     1                
NAP1L5  ENSMUSG00000055430  NAP1L5  ENSG00000177432  nucleosome assembly protein 1‐like 5  quiescent                       1           1  1     1 
RBMS3  ENSMUSG00000039607  RBMS3  ENSG00000144642  RNA binding mo f, single stranded interac ng protein  quiescent  1              1           1                
PFTK1     CDK14  ENSG00000058091  PFTAIRE protein kinase 1  quiescent                                              
HGF  ENSMUSG00000028864  HGF  ENSG00000019991  hepatocyte growth factor  quiescent  1  1  1        1  1  1     1  1             
IL1R1  ENSMUSG00000026072  IL1R1  ENSG00000115594  interleukin 1 receptor, type I  quiescent              1  1  1           1             
GDF2  ENSMUSG00000072625  GDF2  ENSG00000128802  growth differen a on factor 2  quiescent                                              
HHIP  ENSMUSG00000064325  HHIP  ENSG00000164161  Hedgehog‐interac ng protein  quiescent                                   1  1  1    
SEMA3D  ENSMUSG00000040254  SEMA3D  ENSG00000153993  sema domain, immunoglobulin domain (Ig), short basic domain, secreted, (semaphorin) 3D  quiescent     1  1        1  1                         
TNXB  ENSMUSG00000033327  TNXB  ENSG00000168477  tenascin XB  quiescent  1                          1     1  1  1  1 
C1QTNF5 /// MFRP     C1QTNF2  ENSG00000145861  C1q and tumor necrosis factor related protein 5 /// membrane‐type frizzled‐related protein  quiescent                       1                      
RERG  ENSMUSG00000030222  RERG  ENSG00000134533  RAS‐like, estrogen‐regulated, growth‐inhibitor  quiescent  1  1  1     1  1     1           1  1  1    
LOC441376     AARD     ‐  quiescent                 1        1                   
SRPX2  ENSMUSG00000031253  SRPX2  ENSG00000102359  sushi‐repeat‐containing protein, X‐linked 2  quiescent  1  1  1        1     1        1           1 
NT5DC3  ENSMUSG00000054027  NT5DC3  ENSG00000111696  5'‐nucleo dase domain containing 3  quiescent                                         1    
E130306M17RIK     SAMD5  ENSG00000203727  RIKEN cDNA E130306M17 gene  quiescent              1                               
GDF10  ENSMUSG00000021943  GDF10  ENSG00000107623  growth differen a on factor 10  quiescent           1  1                 1  1  1  1  1 
ABCC9  ENSMUSG00000030249  ABCC9  ENSG00000069431  ATP‐binding casse e, sub‐family C (CFTR/MRP), member 9  quiescent                                              
BCMO1  ENSMUSG00000031845  BCMO1  ENSG00000135697  beta‐carotene 15,15'‐monooxygenase  quiescent     1  1                             1  1    
SYT9  ENSMUSG00000062542  SYT9  ENSG00000170743  synaptotagmin IX  quiescent                    1                         
PDGFRA  ENSMUSG00000029231  PDGFRA  ENSG00000134853  platelet derived growth factor receptor, alpha polypep de  quiescent  1  1  1  1  1  1     1     1  1             
ZFPM2  ENSMUSG00000022306  ZFPM2  ENSG00000169946  zinc finger protein, mul type 2  quiescent  1     1                                     
6720469N11RIK     KIRREL  ENSG00000183853  RIKEN cDNA 6720469N11 gene  quiescent  1           1                    1  1     1 
*p<0.05 two tailed Student's t‐test between quiescent and ac vated stellate cell groups 
1 = Cirrhosis, 2= Fibro c NAFLD, 3= Inflammatory NAFLD, 4= CCl4, 5= BDL, 6= UUO, 7= CCl4, 8= BDL, 9= DEN, 10= Death, 11= Recurrence, 12= Death, 13= Child Pugh Class Progression, 14= Decompensa on, 15= HCC Incidence 
            GSEA Leading Edge Enrichment? 
   
Supplementary Table 8 (con  
  nued): Hepa  
c Stellate Cell Signature Associa on with    Experimental Data  Outcomes Data 

Resec
Experimental Phenotypes and Pa ent Outcomes  ted  Hepa s C 
Human  Mouse  Rat 
HCC  Cohort 
Cohor
           
Mouse Symbol  Ensembl Gene ID  Human Symbol  Ensembl Gene ID  Descrip on  Group*  1  2  3  4  5  6  7  8  9  10  11  12  13  14  15 
TBX20  ENSMUSG00000031965  TBX20  ENSG00000164532  T‐box 20  quiescent              1                             1 
CYGB  ENSMUSG00000020810  CYGB  ENSG00000161544  cytoglobin  quiescent  1        1  1        1  1        1  1  1  1 
LHX2  ENSMUSG00000000247  LHX2  ENSG00000106689  LIM homeobox protein 2  quiescent                                            1 
PCDH7  ENSMUSG00000029108  PCDH7  ENSG00000169851  protocadherin 7  quiescent              1                             1 
E130203B14RIK  ENSMUSG00000050666  VSTM4     RIKEN cDNA E130203B14 gene  quiescent                                              
6330407I18RIK     GUCY1A2  ENSG00000152402  RIKEN cDNA 6330407I18 gene  quiescent                                1             
C1QTNF2  ENSMUSG00000046491  C1QTNF2  ENSG00000145861  C1q and tumor necrosis factor related protein 2  quiescent                       1                      
PDE1A  ENSMUSG00000059173  PDE1A  ENSG00000115252  phosphodiesterase 1A, calmodulin‐dependent  quiescent  1  1  1                          1     1    
MSC  ENSMUSG00000025930  MSC  ENSG00000178860  musculin  quiescent     1  1  1     1                 1  1     1 
SCARF2  ENSMUSG00000012017  SCARF2  ENSG00000099910  scavenger receptor class F, member 2  quiescent           1  1  1                            
PDGFRB  ENSMUSG00000024620  PDGFRB  ENSG00000113721  platelet derived growth factor receptor, beta polypep de  quiescent  1  1  1     1  1           1  1  1     1  1 
PRICKLE2  ENSMUSG00000030020  PRICKLE2  ENSG00000163637  prickle‐like 2 (Drosophila)  stellate        1     1  1     1                      
TNFRSF11B  ENSMUSG00000063727  TNFRSF11B  ENSG00000164761  tumor necrosis factor receptor superfamily, member 11b (osteoprotegerin)  stellate  1  1  1     1  1  1  1  1  1  1             
HAND2  ENSMUSG00000038193  HAND2  ENSG00000164107  Heart and neural crest deriva ves expressed transcript 2  stellate                                   1     1  1 
BOK  ENSMUSG00000026278  BOK  ENSG00000176720  Bcl‐2‐related ovarian killer protein  stellate                 1     1  1                   
HS3ST3A1  ENSMUSG00000047759  HS3ST3A1  ENSG00000153976  heparan sulfate (glucosamine) 3‐O‐sulfotransferase 3A1  stellate                                              
EFEMP2  ENSMUSG00000024909  EFEMP2  ENSG00000172638  epidermal growth factor‐containing fibulin‐like extracellular matrix protein 2  stellate  1  1  1  1     1  1  1  1           1  1    
GPR124  ENSMUSG00000031486  GPR124  ENSG00000020181  G protein‐coupled receptor 124  stellate  1  1  1        1     1                    1 
AI450948     AHNAK2  ENSG00000185567  expressed sequence AI450948  stellate     1        1                               
RHOX5           reproduc ve homeobox 5  stellate                                              
TNS3  ENSMUSG00000020422  TNS3  ENSG00000136205  Tensin 3  stellate                 1                 1  1       
BGN  ENSMUSG00000031375  BGN  ENSG00000182492  biglycan  stellate  1     1  1     1     1  1  1  1     1  1    
GUCY1A3  ENSMUSG00000033910  GUCY1A3  ENSG00000164116  guanylate cyclase 1, soluble, alpha 3  stellate  1  1  1           1  1           1  1  1  1 
ROBO2  ENSMUSG00000052516  ROBO2  ENSG00000185008  roundabout homolog 2 (Drosophila)  stellate                    1                    1    
IRAK1BP1  ENSMUSG00000032251  IRAK1BP1  ENSG00000146243  interleukin‐1 receptor‐associated kinase 1 binding protein 1  stellate        1     1        1           1          
NGFB     NGF  ENSG00000134259  nerve growth factor, beta  stellate              1                             1 
AU041783     AFAP1L2  ENSG00000169129  expressed sequence AU041783  stellate        1              1                      
ADAMTS2  ENSMUSG00000036545  ADAMTS2  ENSG00000087116  a disintegrin‐like and metallopep dase (reprolysin type) with thrombospondin type 1 mo f, 2  stellate  1  1  1     1  1           1     1  1     1 
SYDE1  ENSMUSG00000032714  SYDE1  ENSG00000105137  synapse defec ve 1, Rho GTPase, homolog 1 (C. elegans)  stellate              1  1                 1  1       
LRRC27  ENSMUSG00000015980  LRRC27  ENSG00000148814  leucine rich repeat containing 27  stellate        1                          1  1  1  1 
LOXL2  ENSMUSG00000034205  LOXL2  ENSG00000134013  lysyl oxidase‐like 2  stellate  1  1  1     1  1     1     1  1        1  1 
CDH2  ENSMUSG00000024304  CDH2  ENSG00000170558  cadherin 2  stellate                                1             
BMP10  ENSMUSG00000030046  BMP10  ENSG00000163217  bone morphogene c protein 10  stellate                                      1       
FRZB  ENSMUSG00000027004  FRZB  ENSG00000162998  frizzled‐related protein  stellate  1  1  1     1     1        1  1             
RPP25  ENSMUSG00000062309  RPP25  ENSG00000178718  ribonuclease P 25 subunit (human)  stellate        1     1                    1  1  1    
LOC633285     RBM46  ENSG00000151962  similar to apobec‐1 complementa on factor  stellate        1     1                    1        1 
2610203C20RIK           RIKEN cDNA 2610203C20 gene  stellate                                              
BB146404     FAM26E  ENSG00000178033  expressed sequence BB146404  stellate              1                               
TGFB1I1  ENSMUSG00000030782  TGFB1I1  ENSG00000140682  transforming growth factor beta 1 induced transcript 1  stellate  1           1  1     1     1  1             
PDE3A  ENSMUSG00000041741  PDE3A  ENSG00000172572  phosphodiesterase 3A, cGMP inhibited  stellate     1           1  1                         
FKBP10  ENSMUSG00000001555  FKBP10  ENSG00000141756  FK506 binding protein 10  stellate     1  1  1  1  1     1                 1    
EREG  ENSMUSG00000029377  EREG  ENSG00000124882  epiregulin  stellate  1           1                    1        1 
SEMA3A  ENSMUSG00000028883  SEMA3A  ENSG00000075213  sema domain, immunoglobulin domain (Ig), short basic domain, secreted, (semaphorin) 3A  stellate     1  1     1              1  1     1  1    

*p<0.05 two tailed Student's t‐test between quiescent and ac vated stellate cell groups 
1 = Cirrhosis, 2= Fibro c NAFLD, 3= Inflammatory NAFLD, 4= CCl4, 5= BDL, 6= UUO, 7= CCl4, 8= BDL, 9= DEN, 10= Death, 11= Recurrence, 12= Death, 13= Child Pugh Class Progression, 14= Decompensa on, 15= HCC Incidence 
            GSEA Leading Edge Enrichment? 
   
Supplementary Table 8 (con  
  nued): Hepa  
c Stellate Cell Signature Associa on with    Experimental Data  Outcomes Data 

Resec
Experimental Phenotypes and Pa ent Outcomes  ted  Hepa s C 
Human  Mouse  Rat 
HCC  Cohort 
Cohor
           
Mouse Symbol  Ensembl Gene ID  Human Symbol  Ensembl Gene ID  Descrip on  Group*  1  2  3  4  5  6  7  8  9  10  11  12  13  14  15 
DCBLD2  ENSMUSG00000035107  DCBLD2  ENSG00000057019  discoidin, CUB and LCCL domain containing 2  stellate              1     1        1  1             
NEXN  ENSMUSG00000039103  NEXN  ENSG00000162614  Nexilin  stellate  1  1  1        1                            
ITGA9  ENSMUSG00000039115  ITGA9  ENSG00000144668  integrin alpha 9  stellate  1              1     1     1  1             
PLOD2  ENSMUSG00000032374  PLOD2  ENSG00000152952  procollagen lysine, 2‐oxoglutarate 5‐dioxygenase 2  stellate              1  1  1  1  1                   
FKHL18     FOXS1  ENSG00000179772  forkhead‐like 18 (Drosophila)  stellate     1  1                                     
B430119L13RIK     LRRN4  ENSG00000125872  RIKEN cDNA B430119L13 gene  stellate     1  1     1                               
C130075A20RIK           RIKEN cDNA C130075A20 gene  stellate                                              
2610024B07RIK     TEAD1  ENSG00000187079  RIKEN cDNA 2610024B07 gene  stellate              1                 1             
PPP1R14A  ENSMUSG00000037166  PPP1R14A  ENSG00000167641  protein phosphatase 1, regulatory (inhibitor) subunit 14A  stellate  1                 1                 1  1    
ANKRD1  ENSMUSG00000024803  ANKRD1  ENSG00000148677  ankyrin repeat domain 1 (cardiac muscle)  stellate     1  1     1  1     1  1           1       
PLF /// PLF2 /// MRPPLF3           proliferin /// proliferin 2 /// mitogen regulated protein, proliferin 3  stellate                                              
MARK1  ENSMUSG00000026620  MARK1  ENSG00000116141  MAP/microtubule affinity‐regula ng kinase 1  stellate                 1                            
TSLP  ENSMUSG00000024379  TSLP  ENSG00000145777  thymic stromal lymphopoie n  ac vated                                   1          
LOC627626     PTCHD4     similar to CG11212‐PA  ac vated     1  1                                     
BDNF  ENSMUSG00000048482  BDNF  ENSG00000176697  brain derived neurotrophic factor  ac vated                             1                
KHDRBS3  ENSMUSG00000022332  KHDRBS3  ENSG00000131773  KH domain containing, RNA binding, signal transduc on associated 3  ac vated                                1             
GM22  ENSMUSG00000043903  ZNF469     gene model 22, (NCBI)  ac vated              1  1                            
STEAP1  ENSMUSG00000015652  STEAP1  ENSG00000164647  six transmembrane epithelial an gen of the prostate 1  ac vated              1                 1  1          
AMOTL2  ENSMUSG00000032531  AMOTL2  ENSG00000114019  angiomo n like 2  ac vated              1        1                      
TNC  ENSMUSG00000028364  TNC  ENSG00000041982  Tenascin C  ac vated        1     1  1                            
CRYAB  ENSMUSG00000032060  CRYAB  ENSG00000109846  crystallin, alpha B  ac vated  1           1        1  1     1  1        1 
TAGLN  ENSMUSG00000032085  TAGLN  ENSG00000149591  transgelin  ac vated  1  1     1  1  1     1  1  1  1             
PI15  ENSMUSG00000067780  PI15  ENSG00000137558  pep dase inhibitor 15  ac vated                 1                            
SVEP1  ENSMUSG00000028369  SVEP1  ENSG00000165124  sushi, von Willebrand factor type A, EGF and pentraxin domain containing 1  ac vated  1  1  1     1  1     1           1  1     1 
COL5A2  ENSMUSG00000026042  COL5A2  ENSG00000204262  procollagen, type V, alpha 2  ac vated  1  1  1     1  1     1  1  1  1             
MMP10  ENSMUSG00000047562  MMP10  ENSG00000166670  matrix metallopep dase 10  ac vated                                              
TGFB3  ENSMUSG00000021253  TGFB3  ENSG00000119699  transforming growth factor, beta 3  ac vated     1  1     1  1     1     1                
LMOD1  ENSMUSG00000048096  LMOD1  ENSG00000163431  leiomodin 1 (smooth muscle)  ac vated  1              1              1     1  1    
AXL  ENSMUSG00000002602  AXL  ENSG00000167601  AXL receptor tyrosine kinase  ac vated  1        1  1  1     1        1             
VEGFC  ENSMUSG00000031520  VEGFC  ENSG00000150630  vascular endothelial growth factor C  ac vated  1     1     1        1  1        1  1     1 
STEAP2  ENSMUSG00000015653  STEAP2  ENSG00000157214  six transmembrane epithelial an gen of prostate 2  ac vated              1                       1       
RBM9  ENSMUSG00000033565  RBFOX2     RNA binding mo f protein 9  ac vated                                              
HSPB7  ENSMUSG00000006221  HSPB7  ENSG00000173641  heat shock protein family, member 7 (cardiovascular)  ac vated              1     1                         
HS6ST2  ENSMUSG00000062184  HS6ST2  ENSG00000171004  heparan sulfate 6‐O‐sulfotransferase 2  ac vated        1     1  1                            
KDELR3  ENSMUSG00000010830  KDELR3  ENSG00000100196  KDEL (Lys‐Asp‐Glu‐Leu) endoplasmic re culum protein reten on receptor 3  ac vated     1  1     1  1     1        1        1    
ANTXR1  ENSMUSG00000033420  ANTXR1  ENSG00000169604  Anthrax toxin receptor 1  ac vated  1  1  1     1  1              1  1  1  1  1 
GPR176  ENSMUSG00000040133  GPR176  ENSG00000166073  G protein‐coupled receptor 176  ac vated  1  1  1     1  1                 1     1  1 
TPM1  ENSMUSG00000032366  TPM1  ENSG00000140416  tropomyosin 1, alpha  ac vated  1                          1  1  1  1  1  1 
1700110N18RIK     VGLL3  ENSG00000206538  RIKEN cDNA 1700110N18 gene  ac vated  1  1  1     1                               
LMCD1  ENSMUSG00000057604  LMCD1  ENSG00000071282  LIM and cysteine‐rich domains 1  ac vated  1  1  1     1        1           1  1       
GNAI1  ENSMUSG00000057614  GNAI1  ENSG00000127955  guanine nucleo de binding protein, alpha inhibi ng 1  ac vated              1     1  1           1  1     1 

*p<0.05 two tailed Student's t‐test between quiescent and ac vated stellate cell groups 
1 = Cirrhosis, 2= Fibro c NAFLD, 3= Inflammatory NAFLD, 4= CCl4, 5= BDL, 6= UUO, 7= CCl4, 8= BDL, 9= DEN, 10= Death, 11= Recurrence, 12= Death, 13= Child Pugh Class Progression, 14= Decompensa on, 15= HCC Incidence 
Supplementary Table 9: Use of Fewer Genes in the Gene Signature Improves 
Outcomes Associa on in the Resected HCC and Hepa s C Cirrhosis Cohorts 
                          
      # signature genes used 
         122  81  55  31  17  6 
NES  1.655  2.188  2.797  3.048  2.485  2.107 
Survival 
FDR q‐val  0.014  <0.001  <0.001  <0.001  <0.001  0.001 
Child‐Pugh class  NES  1.704  2.475  2.953  3.258  2.873  2.001 
HCV  progression  FDR q‐val  0.014  <0.001  <0.001  <0.001  <0.001  <0.001 
Cirrhosis 
Cohort    NES  1.705  2.369  2.669  2.974  2.708  1.929 
Decompensa on 
FDR q‐val  0.009  <0.001  <0.001  <0.001  <0.001  0.003 
NES  1.199  1.905  2.103  2.882  2.578  2.024 
HCC incidence 
FDR q‐val  0.221  0.003  <0.001  <0.001  <0.001  0.002 
NES  1.971  2.153  2.47  1.62  1.989  1.662 
Resected  Survival  FDR q‐val  0.001  <0.001  <0.001  0.028  0.001  0.023 
HCC 
Cohort    HCC recurrence  NES  2.169  2.526  2.739  2.079  1.808  1.792 
FDR q‐val  <0.001  <0.001  <0.001  0.001  0.011  0.01 
NES: normalized enrichment score (GSEA, poor versus good outcomes)     
FDR q‐val: false discovery rate q‐value (GSEA, poor versus good outcomes)   

Associa on of reduced gene signatures with survival in prognos c valida on set (n=82, log‐rank)  


   HR  95%CI  p‐value 
55‐gene hepa c stellate signature: posi ve (vs. nega ve)  2.78  1.28 – 6.06  0.007 

31‐gene hepa c stellate signature: posi ve (vs. nega ve)  2.06  0.96 – 4.39  0.055 

You might also like