• menu1
  • menu2
  • menu3
  • menu4
LOGIN

Home > 표준게놈데이터 > 단염기다형성


한국인 단염기 다형성 데이터


SNP ID:
(예: ks5, rs201752861, chr1:10177)







한국인 변이체 참조표준 데이터 다운로드
 
KoVariome.0.9 (한국인 250명)
국가참조표준센터
 
한국인 변이체 참조표준 데이터 바로가기
한국인 변이체 참조표준 데이터 생산절차서
 
다운로드





한국인 변이체 참조표준 데이터 파일 설명

 

 

한국인 일반군 단염기 다형성 정보 (유효참조표준)
Standard_Reference_Data/snp/variomeData.snp.allSite.{CHR_NAME}.txt.gz
CHROM (Chromosome) : 단염기 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 단염기 변이의 염색체 상의 위치.
REF (Reference allele) : 인간표준게놈지도에서의 단염기.
SNP (SNP allele) : 한국인 표본집단에서의 단염기.
SUM (Total number of monoploids) : 한국인 표본집단에서 단염기 발굴에 성공한 전체 일배체 수.
NUM (No. of monoploids of the SNP allele) : 한국인 표본집단에서 해당 단염기(SNP allele)가  발굴된 일배체 수.
FREQ (SNP allele frequency) : 한국인 표본집단에서의 해당 단염기의 빈도.
KSID (SNP id) : 표준게놈데이터센터에서 지정한 단염기 다형성 아이디.
RSID (dbSNP rs id) : dbSNP에서 제공되는 rs id.
KPGP-00001 (Genotype of KPGP-00001) : KPGP-00001 한국인의 유전형. 유전형이 결정되지 않은 경우 -/-로 표시.
 
한국인 일반군 단염기 다형성 통계 정보 (참조데이터)
Supplementary_Data/snp_pvalue/variomeData.snp.allSite.{CHR_NAME}.pvalue.txt.gz
CHROM (Chromosome) : 단염기 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 단염기 변이의 염색체 상의 위치.
REF (Reference allele) : 인간표준게놈지도에서의 단염기.
SNP (SNP allele) : 한국인 표본집단에서의 단염기.
SUM (Total number of monoploids) : 한국인 표본집단에서 단염기 발굴에 성공한 전체 일배체 수.
NUM (No. of monoploids of the alternative allele) : 한국인 표본집단에서 해당 단염기(SNP allele)가 발굴된 일배체 수.
FREQ (SNP allele frequency) : 한국인 표본집단에서의 해당 단염기의 빈도.
SUM_HiSeq2000 (Total number of monoploids of each sequencer) : 표본 내 HiSeq2000 해독기로 해독된 집단에서 유전형이 결정된 전체 일배체의 수.
NUM_HiSeq2000 (No. of SNP allele of each sequencer) : 표본 내 HiSeq2000 해독기로 해독된 집단에서 각 단염기 별 유전형이 발굴된 일배체의 수.
PVAL_HiSeq2000 (P-value of SNP allele enrichment test of each sequencer) : 표본 내 HiSeq2000 해독기로 해독된 집단에서 각 단염기 발굴의 편향성에 대한 p-value.
 
한국인 일반군 단염기 변이의 기능 예측 정보 (참조데이터)
Supplementary_Data/snp_annotation/variomeData.snpAnnotation.varSite.{CHR_NAME}.txt.gz
CHROM (Chromosome) : 단염기 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 단염기 변이의 염색체 상의 위치.
REF (Reference allele) : 인간표준게놈지도에서의 단염기.
KSID (SNP id) : 표준게놈데이터센터에서 지정한 단염기 다형성 아이디.
ALT (Alternative allele) : 단염기 변이형.
SUM (Total number of monoploids) : 한국인 표본집단에서 단염기 발굴에 성공한 전체 일배체 수.
NUM (No. of monoploids of the alternative allele) : 한국인 표본집단에서 해당 단염기 변이형이 발굴된 일배체 수.
FREQ (Alternative allele frequency) : 한국인 표본집단에서의 해당 단염기 변이형의 빈도.
GENE (Gene name) : 단염기 변이가 위치한 유전자의 이름 [BRCA]. Intergenic 영역에 위치하는 경우 -로 표시.
RNA (RNA id) : 단염기 변이가 위치한 RNA의 아이디.
FUNC (Function) : 단염기 변이의 기능적 위치 정보 [intergenic, intronic, splice-site, exonic, 5'UTR, 3'UTR, synonymous, non-synonymous].
 
한국인 일반군 개체 별 단염기 유전형 정보 (참조데이터)
Supplementary_Data/genotype/{INDIVIDUAL_ID}/variomeData.genotype.allSite.{INDIVIDUAL_ID}.{CHR_NAME}.txt.gz
CHROM (Chromosome) : 단염기 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 단염기 변이의 염색체 상의 위치.
REF (Reference allele) : 인간표준게놈지도에서의 단염기.
GT (Genotype) : 한국인 표본에서의 유전형 [A/G].
GTDP (Genotype depth) : 한국인 표본에서의 유전형의 해독된 DNA 개수 [10/10].
GTEDP (Effective coverage) : 한국인 표본에서의 유전형의 해독된 DNA의 실질적 개수 [9.00/9.00]. 해당영역에서 해독된 DNA의 개수에 해독 및 매핑 품질을 반영하여 산출.
RSID (dbSNP rs id) : dbSNP에서 제공되는 rs id.
 
한국인 일반군 삽입결실 다형성 정보 (참조데이터)
Supplementary_Data/indel/variomeData.indel.{CHR_NAME}.txt.gz
CHROM (Chromosome) : 삽입결실 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 삽입결실 변이의 염색체 상의 위치.
REF (Reference allele) : 인간표준게놈지도에서의 서열.
INDEL (Indel allele) : 한국인 표본집단에서의 삽입결실.
SUM (Total number of monoploids) : 한국인 표본집단에서 삽입결실 발굴에 성공한 전체 일배체 수.
NUM (No. of monoploids of the indel alleles) : 한국인 표본집단에서 해당 삽입결실(indel allele)이 발굴된 일배체 수.
FREQ (Indel allele frequency) : 한국인 표본집단에서의 해당 삽입결실의 빈도.
KIID (Indel id) : 표준게놈데이터센터에서 지정한 삽입결실 다형성 아이디.
RSID (dbSNP rs id) : dbSNP에서 제공되는 rs id.
KPGP-00001 (Genotype of KPGP-00001) : KPGP-00001 샘플의 유전형. 유전형이 결정되지 않은 경우 -/-으로 표시.
 
한국인 일반군 삽입결실 변이의 기능 예측 정보 (참조데이터)
Supplementary_Data/indel_annotation/variomeData.indelAnnotation.{CHR_NAME}.txt.gz
CHROM (Chromosome) : 삽입결실 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 삽입결실 변이의 염색체 상의 위치.
TYPE (Type) : 삽입결실 종류 [INS, DEL].
REF (Reference allele) : 인간표준게놈지도에서의 서열.
ALT (Alternative allele) : 삽입결실 변이형.
SUM (Total number of monoploids) : 한국인 표본집단에서 삽입결실 확인에 성공한 전체 일배체 수.
NUM (No. of monoploids of the alternative allele) : 한국인 표본집단에서 해당 삽입결실 변이형이 발굴된 일배체 수.
FREQ (Alternative allele frequency) : 한국인 표본집단에서의 해당 삽입결실 변이형의 빈도.
GENE (Gene name) : 삽입결실 변이가 위치한 유전자의 이름 [BRCA]. Intergenic 영역에 위치하는 경우 -로 표시.
RNA (RNA id) : 삽입결실 변이가 위치한 RNA의 아이디.
FUNC (Function) : 삽입결실 변이의 기능적 위치 정보 [INTERGENIC, INTRONIC, SPLICE-SITE, EXONIC, 5'UTR, 3'UTR, CODON_CHANGE, FRAME_SHIFT].
 
한국인 일반군 게놈배수 변이 정보 (참조데이터)
Supplementary_Data/cnv/{INDIVIDUAL_ID}.cnv.cnvnator.tsv
CNV_type (CNV type) : 게놈배수 변이의 종류 [deletion, duplication].
coordinates (Coordinate) : 게놈배수 변이의 염색체 상의 위치 [chr1:10001-11000].
CNV_size (CNV size) : 게놈배수 변이의 크기 [1000].
normalized_RD (Normalized read depth) : 정규화 된 게놈배수 값 [0.5].
e-val1 (E-value 1) : E-value 1.
e-val2 (E-value 2) : E-value 2.
e-val3 (E-value 3) : E-value 3.
e-val4 (E-value 4) : E-value 4.
q0 (Rate of zero mapping quality reads) : 게놈배수 변이 영역에 매핑된 단서열 중 매핑 점수가 0인 단서열의 비율 [0.1].
 
한국인 일반군 표본 정보 (참조데이터)
Supplementary_Data/sample_information/sample_information.tsv
SAMPLE (Sample id) : 표본 등록번호.
COUNTRY (Country code) : 국적 (한국의 경우 KR).
ETHNICITY (Ethnicity) : 인족 (순수 한국인의 경우 KR).
GENDER (Gender) : 성별 [1=male(남성), 2=female(여성)].
AGE (Age) : 나이.
SEQUENCER (Sequencer) : 해독기 기종.
 
한국인 일반군 확장표본 단염기 다형성 정보 (참조데이터)
Supplementary_Data/extension_set/snp/variomeData.extensionSet.snp.allSite.{CHR_NAME}.txt.gz
CHROM (Chromosome) : 단염기 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 단염기 변이의 염색체 상의 위치.
REF (Reference allele) : 인간표준게놈지도에서의 단염기.
SNP (SNP allele) : 한국인 표본집단에서의 단염기.
SUM (Total number of monoploids) : 한국인 표본집단에서 단염기 발굴에 성공한 전체 일배체 수.
NUM (No. of monoploids of the SNP allele) : 한국인 표본집단에서 해당 단염기(SNP allele)가  발굴된 일배체 수.
FREQ (SNP allele frequency) : 한국인 표본집단에서의 해당 단염기의 빈도.
KSID (SNP id) : 표준게놈데이터센터에서 지정한 단염기 다형성 아이디.
RSID (dbSNP rs id) : dbSNP에서 제공되는 rs id.
 
한국인 일반군 확장표본 단염기 변이의 기능 예측 정보 (참조데이터)
Supplementary_Data/extension_set/snp_annotation/variomeData.extensionSet.snpAnnotation.varSite.{CHR_NAME}.txt.gz
CHROM (Chromosome) : 단염기 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 단염기 변이의 염색체 상의 위치.
REF (Reference allele) : 인간표준게놈지도에서의 단염기.
KSID (SNP id) : 표준게놈데이터센터에서 지정한 단염기 다형성 아이디.
ALT (Alternative allele) : 단염기 변이형.
SUM (Total number of monoploids) : 한국인 확장 표본집단에서 단염기 발굴에 성공한 전체 일배체 수.
NUM (No. of monoploids of the alternative allele) : 한국인 확장 표본집단에서 해당 단염기 변이형이 발굴된 일배체 수.
FREQ (Alternative allele frequency) : 한국인 확장 표본집단에서의 해당 단염기 변이형의 빈도.
GENE (Gene name) : 단염기 변이가 위치한 유전자의 이름 [BRCA]. Intergenic 영역에 위치하는 경우 -로 표시.
RNA (RNA id) : 단염기 변이가 위치한 RNA의 아이디.
FUNC (Function) : 단염기 변이의 기능적 위치 정보 [intergenic, intronic, splice-site, exonic, 5'UTR, 3'UTR, synonymous, non-synonymous].
 
한국인 일반군 확장표본 삽입결실 다형성 정보 (참조데이터)
Supplementary_Data/extension_set/indel/variomeData.extensionSet.indel.{CHR_NAME}.txt.gz
CHROM (Chromosome) : 삽입결실 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 삽입결실 변이의 염색체 상의 위치.
REF (Reference allele) : 인간표준게놈지도에서의 서열.
INDEL (Indel allele) : 한국인 확장 표본집단에서의 삽입결실.
SUM (Total number of monoploids) : 한국인 확장 표본집단에서 삽입결실 발굴에 성공한 전체 일배체 수.
NUM (No. of monoploids of the indel alleles) : 한국인 확장 표본집단에서 해당 삽입결실(indel allele)이 발굴된 일배체 수.
FREQ (Indel allele frequency) : 한국인 확장 표본집단에서의 해당 삽입결실의 빈도.
KIID (Indel id) : 표준게놈데이터센터에서 지정한 삽입결실 다형성 아이디.
RSID (dbSNP rs id) : dbSNP에서 제공되는 rs id.
 
한국인 일반군 확장표본 삽입결실 변이의 기능 예측 정보 (참조데이터)
Supplementary_Data/extension_set/indel_annotation/variomeData.extensionSet.indelAnnotation.{CHR_NAME}.txt.gz
CHROM (Chromosome) : 삽입결실 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 삽입결실 변이의 염색체 상의 위치.
TYPE (Type) : 삽입결실 종류 [INS, DEL].
REF (Reference allele) : 인간표준게놈지도에서의 서열.
ALT (Alternative allele) : 삽입결실 변이형.
SUM (Total number of monoploids) : 한국인 확장 표본집단에서 삽입결실 확인에 성공한 전체 일배체 수.
NUM (No. of monoploids of the alternative allele) : 한국인 확장 표본집단에서 해당 삽입결실 변이형이 발굴된 일배체 수.
FREQ (Alternative allele frequency) : 한국인 확장 표본집단에서의 해당 삽입결실 변이형의 빈도.
GENE (Gene name) : 삽입결실 변이가 위치한 유전자의 이름 [BRCA]. Intergenic 영역에 위치하는 경우 -로 표시.
RNA (RNA id) : 삽입결실 변이가 위치한 RNA의 아이디.
FUNC (Function) : 삽입결실 변이의 기능적 위치 정보 [INTERGENIC, INTRONIC, SPLICE-SITE, EXONIC, 5'UTR, 3'UTR, CODON_CHANGE, FRAME_SHIFT].

 

* 확장표본은 유전정보 공개에 동의한 한국인 일반군 표본(한국인 200명)에 유전정보 공개에 동의하지 않은 한국인이 추가되어 구성된 표본입니다. 확장표본으로부터 제작된 데이터에는 개체 별 유전형 정보가 포함되어 있지 않습니다.