• menu1
  • menu2
  • menu3
  • menu4
LOGIN

Home > 표준게놈데이터 > 단일염기다형성


한국인 단일염기 다형성 데이터


SNP ID:
(예: ks5, rs201752861, chr1:10177)







한국인 변이체 참조표준 데이터 다운로드
 
VariomeData.0.6 (한국인 80명)
국가참조표준센터
 
한국인 변이체 참조표준 데이터 바로가기
한국인 변이체 참조표준 데이터 생산절차서
 
다운로드





한국인 변이체 참조표준 데이터 파일 설명

 

 

한국인 일반군 단일염기 다형성 정보 (유효참조표준)
Standard_Reference_Data/snp/variomeData.snp.allSite.{CHR_NAME}.txt.gz
CHROM (Chromosome) : 단일염기 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 단일염기 변이의 염색체 상의 위치.
REF (Reference allele) : 인간표준게놈지도에서의 단일염기.
SNP (SNP allele) : 한국인 표본집단에서의 단일염기.
SUM (Total number of monoploids) : 한국인 표본집단에서 단일염기 발굴에 성공한 전체 일배체 수.
NUM (No. of monoploids of the SNP allele) : 한국인 표본집단에서 해당 단일염기(SNP allele)가  발굴된 일배체 수.
FREQ (SNP allele frequency) : 한국인 표본집단에서의 해당 단일염기의 빈도.
KSID (SNP id) : 표준게놈데이터센터에서 지정한 단일염기 다형성 아이디.
RSID (dbSNP rs id) : dbSNP에서 제공되는 rs id.
KPGP-00001 (Genotype of KPGP-00001) : KPGP-00001 샘플의 유전형. 유전형이 결정되지 않은 경우 -/-로 표시.
 
한국인 일반군 표본 별 단일염기 유전형 정보 (참조데이터)
Supplementary_Data/genotype/{INDIVIDUAL_ID}/variomeData.genotype.allSite.{INDIVIDUAL_ID}.{CHR_NAME}.txt.gz
CHROM (Chromosome) : 단일염기 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 단일염기 변이의 염색체 상의 위치.
REF (Reference allele) : 인간표준게놈지도에서의 단일염기.
GT (Genotype) : 한국인 표본에서의 유전형 [A/G].
GTDP (Genotype depth) : 한국인 표본에서의 유전형의 해독된 DNA 개수 [10/10].
GTEDP (Effective coverage) : 한국인 표본에서의 유전형의 해독된 DNA의 실질적 개수.
RSID (dbSNP rs id) : dbSNP에서 제공되는 rs id.
 
한국인 일반군 단일염기 변이의 기능 예측 정보 (참조데이터)
Supplementary_Data/snp_annotation/variomeData.snpAnnotation.varSite.{CHR_NAME}.txt.gz
CHROM (Chromosome) : 단일염기 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 단일염기 변이의 염색체 상의 위치.
REF (Reference allele) : 인간표준게놈지도에서의 단일염기.
KSID (SNP id) : 표준게놈데이터센터에서 지정한 단일염기 다형성 아이디.
ALT (Alternative allele) : 단일염기 변이형.
SUM (Total number of monoploids) : 한국인 표본집단에서 단일염기 발굴에 성공한 전체 일배체 수.
NUM (No. of monoploids of the alternative allele) : 한국인 표본집단에서 해당 단일염기 변이형이 발굴된 일배체 수.
FREQ (Alternative allele frequency) : 한국인 표본집단에서의 해당 단일염기 변이형의 빈도.
GENE (Gene name) : 단일염기 변이가 위치한 유전자의 이름 [BRCA]. Intergenic 영역에 위치하는 경우 -로 표시.
RNA (RNA id) : 단일염기 변이가 위치한 RNA의 아이디.
FUNC (Function) : 단일염기 변이의 기능적 위치 정보 [intergenic, intronic, splice-site, exonic, 5'UTR, 3'UTR, synonymous, non-synonymous].
 
한국인 일반군 삽입결실 다형성 정보 (참조데이터)
Supplementary_Data/indel/variomeData.indel.{CHR_NAME}.txt.gz
CHROM (Chromosome) : 삽입결실 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 삽입결실 변이의 염색체 상의 위치.
REF (Reference allele) : 인간표준게놈지도에서의 서열.
INDEL (Indel allele) : 한국인 표본집단에서의 삽입결실.
SUM (Total number of monoploids) : 한국인 표본집단에서 삽입결실 발굴에 성공한 전체 일배체 수.
NUM (No. of monoploids of the indel alleles) : 한국인 표본집단에서 해당 삽입결실(indel allele)이 발굴된 일배체 수.
FREQ (Indel allele frequency) : 한국인 표본집단에서의 해당 삽입결실의 빈도.
KIID (Indel id) : 표준게놈데이터센터에서 지정한 삽입결실 다형성 아이디.
RSID (dbSNP rs id) : dbSNP에서 제공되는 rs id.
KPGP-00001 (Genotype of KPGP-00001) : KPGP-00001 샘플의 유전형. 유전형이 결정되지 않은 경우 -/-으로 표시.
 
한국인 일반군 삽입결실 변이의 기능 예측 정보 (참조데이터)
Supplementary_Data/indel_annotation/variomeData.indelAnnotation.{CHR_NAME}.txt.gz
CHROM (Chromosome) : 삽입결실 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 삽입결실 변이의 염색체 상의 위치.
TYPE (Type) : 삽입결실 종류 [INS, DEL].
REF (Reference allele) : 인간표준게놈지도에서의 서열.
ALT (Alternative allele) : 삽입결실 변이형.
SUM (Total number of monoploids) : 한국인 표본집단에서 삽입결실 확인에 성공한 전체 일배체 수.
NUM (No. of monoploids of the alternative allele) : 한국인 표본집단에서 해당 삽입결실 변이형이 발굴된 일배체 수.
FREQ (Alternative allele frequency) : 한국인 표본집단에서의 해당 삽입결실 변이형의 빈도.
GENE (Gene name) : 삽입결실 변이가 위치한 유전자의 이름 [BRCA]. Intergenic 영역에 위치하는 경우 -로 표시.
RNA (RNA id) : 삽입결실 변이가 위치한 RNA의 아이디.
FUNC (Function) : 삽입결실 변이의 기능적 위치 정보 [INTERGENIC, INTRONIC, SPLICE-SITE, EXONIC, 5'UTR, 3'UTR, CODON_CHANGE, FRAME_SHIFT].
 
한국인 일반군 게놈배수 변이 정보 (참조데이터)
Supplementary_Data/cnv/{INDIVIDUAL_ID}.cnv.cnvnator.tsv
CNV_type (CNV type) : 게놈배수 변이의 종류 [deletion, duplication].
coordinates (Coordinate) : 게놈배수 변이의 염색체 상의 위치 [chr1:10001-11000].
CNV_size (CNV size) : 게놈배수 변이의 크기 [1000].
normalized_RD (Normalized read depth) : 정규화 된 게놈배수 값 [0.5].
e-val1 (E-value 1) : E-value 1.
e-val2 (E-value 2) : E-value 2.
e-val3 (E-value 3) : E-value 3.
e-val4 (E-value 4) : E-value 4.
q0 (Rate of zero mapping quality reads) : 게놈배수 변이 영역에 매핑된 단서열 중 매핑 점수가 0인 단서열의 비율 [0.1].
 
한국인 일반군 게놈구조 변이 정보 (참조데이터)
Supplementary_Data/sv/{INDIVIDUAL_ID}/{INDIVIDUAL_ID}.sv.delly.{SV_TYPE}.bcf
CHROM (Chromosome) : 게놈구조 변이가 존재하는 염색체의 번호 [chr1].
POS (Chromosomal position) : 게놈구조 변이의 염색체 상의 위치 [10000].
ID (Identifier) : 게놈구조 변이의 아이디.
REF (Reference sequence) : 인간표준게놈지도 상의 서열 [ATGCG].
ALT (Alternative sequence) : 게놈구조 변이의 서열 [A]. 변이의 크기가 큰 경우 <DEL> 등으로 표시.
QUAL (Quality) : 게놈구조 변이의 품질에 대한 점수. 점수가 계산되지 않은 경우, 점(.)으로 표시.
FILTER (Filter indicator) : 게놈구조 변이의 품질이 낮은 경우, 해당 품질 조건에 대한 명칭 [LowQual]. 품질이 높은 경우에는 PASS로 표시.
INFO (Information) : 게놈구조 변이에 대한 전반적인 추가 정보.
FORMAT (Format) : 게놈구조 변이에 대한 샘플별 추가 정보의 표현 형식.
KPGP-00001 (Values) : 게놈구조 변이에 대한 샘플(KPGP-00001)별 추가 정보.
 
한국인 일반군 표본 정보 (참조데이터)
Supplementary_Data/sample_information/sample_information.tsv
SAMPLE (Sample id) : 표본 등록번호.
COUNTRY (Country code) : 국적 (한국의 경우 KR).
ETHNICITY (Ethnicity) : 인족 (순수 한국인의 경우 KR).
GENDER (Gender) : 성별 [1=male(남성), 2=female(여성)].
AGE (Age) : 나이.
SEQUENCER (Sequencer) : 해독기 기종.