|
데이터베이스집회
조립된 게놈의 구조, 어셈블리 이름 및 기타 메타데이터, 통계 보고서 및 게놈 서열 데이터에 대한 링크에 대한 정보를 제공하는 데이터베이스입니다.
문화 컬렉션, 박물관, 식물표본관 및 기타 자연사 컬렉션을 위한 엄선된 메타데이터 세트입니다. 기록에는 컬렉션 코드, 컬렉션의 본국 기관에 대한 정보 및 NCBI의 관련 데이터에 대한 링크가 표시됩니다.
유전체학, 기능 유전체학, 유전학 연구 모음과 결과 데이터 세트에 대한 링크입니다. 이 리소스는 프로젝트 범위, 자료 및 목표를 설명하고 일관되지 않은 주석, 여러 개의 독립적인 제출 및 종종 다른 데이터베이스에 저장되는 다양한 데이터 유형의 다양한 특성으로 인해 찾기 어려운 데이터 세트를 검색하는 메커니즘을 제공합니다.
BioSample 데이터베이스에는 실험 분석에 사용되는 생물학적 원료에 대한 설명이 포함되어 있습니다.
지속적으로 주석이 추가되고 품질이 우수한 인간 및 마우스 단백질 코딩 영역의 핵심 세트를 식별하기 위한 공동 노력입니다.
단일 뉴클레오티드 변이, 미세부수체, 소규모 삽입 및 삭제가 포함됩니다. dbSNP에는 집단별 빈도 및 유전자형 데이터, 실험 조건, 분자적 맥락, 중립 변이 및 임상 돌연변이 모두에 대한 매핑 정보가 포함되어 있습니다.
NIH 유전자 서열 데이터베이스는 공개적으로 이용 가능한 모든 DNA 서열에 대한 주석이 달린 모음입니다. GenBank는 일본의 DNA DataBank(DDBJ), 유럽 분자 생물학 연구소(EMBL) 및 NCBI의 GenBank로 구성된 국제 염기서열 데이터베이스 협력의 일부입니다. 이 세 조직은 매일 데이터를 교환합니다. GenBank는 여러 부서로 구성되어 있으며 대부분은 Nucleotide 데이터베이스를 통해 접근할 수 있습니다. 예외는 각각 Nucleotide EST 및 Nucleotide GSS 데이터베이스를 통해 액세스되는 EST 및 GSS 부문입니다.
NIAID 인플루엔자 게놈 시퀀싱 프로젝트와 GenBank의 데이터를 편집한 것입니다. 이는 독감 서열 분석, 주석 및 GenBank 제출을 위한 도구를 제공합니다. 이 리소스에는 다른 독감 시퀀스 리소스, 출판물 및 독감 바이러스에 대한 일반 정보에 대한 링크도 포함되어 있습니다.
식품, 환경 및 환자 분리물에서 유래된 박테리아 병원체 게놈 서열의 수집 및 분석을 포함하는 프로젝트입니다. 현재 자동화된 파이프라인은 식품 매개 질병 발생 조사를 지원하고 식품 오염의 잠재적 원인을 발견하기 위해 주로 공중 보건 실험실에서 제공하는 시퀀스를 클러스터링하고 식별합니다.
GenBank, RefSeq, TPA(제3자 주석) 데이터베이스 및 PDB를 포함한 여러 소스의 뉴클레오티드 서열 모음입니다. 뉴클레오티드 데이터베이스를 검색하면 각 구성 요소 데이터베이스에서 사용 가능한 결과를 얻을 수 있습니다.
비교 연구에서 유래한 관련 DNA 서열 데이터베이스: 계통발생, 개체군, 환경, 그리고 정도는 덜하지만 돌연변이. 데이터베이스의 각 레코드는 DNA 서열 세트입니다. 예를 들어, 개체군 세트는 유기체 내의 유전적 변이에 대한 정보를 제공하는 반면, 계통발생 세트는 여러 관련 유기체에서 얻은 단일 유전자의 서열과 정렬을 포함할 수 있습니다.
시약 유통업체, 프로브 효율성 및 계산된 서열 유사성에 대한 정보와 함께 다양한 생물 의학 연구 응용 분야에 사용하도록 설계된 핵산 시약의 공개 레지스트리입니다.
RefSeqGene인간 유전자 특이적 참조 게놈 서열의 모음입니다. RefSeq 유전자는 NCBI의 RefSeq 데이터베이스의 하위 집합이며 유전자좌별 데이터베이스 큐레이터와 유전자 검사 커뮤니티의 검토를 기반으로 정의됩니다. 이는 돌연변이 보고, 일관된 인트론 및 엑손 번호 지정 규칙 설정, 기타 생물학적으로 중요한 변이의 좌표 정의를 위한 안정적인 기반을 형성합니다. RefSeqGene은 LRG (Locus Reference Genomic) 협업의 일부입니다 .참조 서열(RefSeq)
NCBI에서 생성된 선별된 중복되지 않는 게놈 DNA, 전사체(RNA) 및 단백질 서열의 모음입니다. RefSeq는 게놈 주석, 유전자 식별 및 특성화, 돌연변이 및 다형성 분석, 발현 연구 및 비교 분석을 위한 안정적인 참조를 제공합니다. RefSeq 컬렉션은 뉴클레오티드 및 단백질 데이터베이스를 통해 액세스됩니다.
SRA(Sequence Read Archive)는 Roche 454 GS System®, Illumina Genome Analyser®, Life Technologies AB SOLiD System®, Helicos Biosciences Heliscope®, Complete Genomics® 및 Pacific Biosciences SMRT®를 포함한 차세대 시퀀싱 플랫폼의 시퀀싱 데이터를 저장합니다. .
GenBank의 기존 기본 시퀀스 데이터에서 구축된 시퀀스가 포함된 데이터베이스입니다. 시퀀스와 해당 주석은 실험적으로 지원되며 동료 검토 과학 저널에 게시되었습니다. TPA 기록은 뉴클레오티드 데이터베이스를 통해 검색됩니다.
다운로드BLAST(독립형)
로컬 사용을 위한 BLAST 실행 파일은 Solaris, LINUX, Windows 및 MacOSX 시스템용으로 제공됩니다. 자세한 내용은 ftp 디렉토리의 README 파일을 참조하십시오. BLAST 뉴클레오티드, 단백질 및 번역된 검색을 위해 사전 형식화된 데이터베이스도 db 하위 디렉터리에서 다운로드할 수 있습니다.
독립 실행형 BLAST 프로그램과 함께 사용하기 위한 시퀀스 데이터베이스입니다. 이 디렉터리의 파일은 BLAST와 함께 사용할 수 있도록 미리 형식화된 데이터베이스입니다.
독립 실행형 BLAST 프로그램과 함께 사용하기 위한 FASTA 형식의 시퀀스 데이터베이스입니다. 이러한 데이터베이스는 BLAST와 함께 사용하기 전에 formatdb를 사용하여 형식을 지정해야 합니다.
이 사이트에는 GenBank의 모든 서열 기록에 대한 파일이 기본 플랫 파일 형식으로 포함되어 있습니다. 파일은 GenBank 구분별로 구성되어 있으며 전체 내용은 README.genbank 파일에 설명되어 있습니다.
이 사이트에는 참조 서열(RefSeq) 컬렉션의 모든 뉴클레오티드 및 단백질 서열 기록이 포함되어 있습니다. ""출시"" 디렉토리에는 전체 컬렉션의 최신 릴리스가 포함되어 있으며, 선택된 유기체(예: 인간, 마우스 및 쥐)에 대한 데이터는 별도의 디렉토리에서 사용할 수 있습니다. 데이터는 FASTA 및 플랫 파일 형식으로 제공됩니다. 자세한 내용은 README 파일을 참조하세요.
FTP: SRA(Sequence Read Archive) 다운로드 기능
본 사이트에는 제출된 염기서열분석 프로젝트별로 정리된 차세대 염기서열분석 데이터가 포함되어 있습니다.
이 사이트에는 FASTA 형식의 UniVec 및 UniVec_Core 데이터베이스가 포함되어 있습니다. 자세한 내용은 README.uv 파일을 참조하세요.
이 사이트에는 4자리 프로젝트 코드로 구성된 전체 게놈 샷건 시퀀스 데이터가 포함되어 있습니다. 데이터에는 GenBank 및 GenPept 플랫 파일, 품질 점수 및 요약 통계가 포함됩니다. 자세한 내용은 README.genbank.wgs 파일을 참조하세요.
제출물바이오프로젝트 제출
연구자, 컨소시엄 및 조직이 바이오프로젝트를 등록할 수 있는 인터페이스를 제공하는 온라인 양식입니다. 이는 연구를 위한 게놈 및 유전 데이터 제출의 출발점이 됩니다. BioProject 등록 시 데이터를 제출할 필요가 없습니다.
GenBank 데이터베이스에 하나 또는 몇 개의 제출을 위한 웹 기반 시퀀스 제출 도구로, 제출 프로세스를 빠르고 쉽게 만들 수 있도록 설계되었습니다.
종 식별에 사용하기 위해 표준 유전자 위치의 바코드 짧은 뉴클레오티드 서열을 GenBank 데이터베이스에 제출하기 위한 도구입니다.
Sequin과 동일한 기능을 많이 사용하여 GenBank에 제출할 시퀀스 레코드 생성을 자동화하는 명령줄 프로그램입니다. 이는 주로 완전한 게놈과 대량의 서열 배치를 제출하는 데 사용됩니다.
이 링크는 SRA 데이터 제출자가 데이터에 대한 안전한 NCBI FTP 사이트를 얻을 수 있는 방법을 설명하고 허용되는 데이터 형식 및 디렉터리 구조도 설명합니다.
제출자가 NCBI의 모든 데이터 제출 프로세스에 연결하고 이에 대한 정보를 찾을 수 있는 단일 진입점입니다. 현재 이는 생물프로젝트 및 생물샘플 등록과 WGS 및 GTR용 데이터 제출을 위한 인터페이스 역할을 합니다. 이 사이트에 대한 향후 추가가 계획되어 있습니다.
생물학적 서열 간의 국소적 유사성 영역을 찾습니다. 이 프로그램은 뉴클레오티드 또는 단백질 서열을 서열 데이터베이스와 비교하고 일치 항목의 통계적 유의성을 계산합니다. BLAST는 서열 간의 기능적, 진화적 관계를 추론하고 유전자 계열의 구성원을 식별하는 데 사용될 수 있습니다.
뉴클레오티드 또는 단백질 데이터베이스의 GI 파일이나 접근 번호 또는 다른 Entrez 데이터베이스의 고유 식별자 파일을 업로드하여 많은 Entrez 데이터베이스에서 레코드를 검색할 수 있습니다. 검색 결과는 다양한 형식으로 컴퓨터의 로컬 파일에 직접 저장할 수 있습니다.
일반 웹 쿼리 인터페이스 외부에서 NCBI의 Entrez 시스템 내 데이터에 대한 액세스를 제공하는 도구입니다. 이는 소프트웨어 애플리케이션 내에서 Entrez 작업을 자동화하는 방법을 제공합니다. 각 유틸리티는 특수한 검색 작업을 수행하며 특별히 형식화된 URL을 작성하여 간단히 사용할 수 있습니다.
이 도구는 뉴클레오티드 또는 단백질 서열을 게놈 서열 데이터베이스와 비교하고 BLAST(Basic Local Alignment Search Tool) 알고리즘을 사용하여 일치 항목의 통계적 유의성을 계산합니다.
시퀀스 데이터를 보고 분석하기 위한 통합 애플리케이션입니다. Genome Workbench를 사용하면 NCBI에서 공개적으로 사용 가능한 시퀀스 데이터베이스의 데이터를 보고 이러한 데이터를 자신의 데이터와 혼합할 수 있습니다.
사용자의 시퀀스 또는 이미 데이터베이스에 있는 시퀀스에서 모든 열린 판독 프레임을 찾는 그래픽 분석 도구입니다. 16개의 서로 다른 유전 코드를 사용할 수 있습니다. 추론된 아미노산 서열은 다양한 형식으로 저장이 가능하며, BLAST를 이용하여 단백질 데이터베이스를 검색할 수 있습니다.
Primer-BLAST 도구는 Primer3를 사용하여 서열 템플릿에 대한 PCR 프라이머를 디자인합니다. 그런 다음 잠재적인 제품은 사용자가 지정한 데이터베이스에 대한 BLAST 검색을 통해 자동으로 분석되어 의도한 대상에 대한 특이성을 확인합니다.
게놈 뉴클레오티드 서열에 대한 단백질 정렬을 계산하는 유틸리티입니다. 이는 Needleman Wunsch 전역 정렬 알고리즘의 변형을 기반으로 하며 특히 인트론 및 스플라이스 신호를 설명합니다. 이 알고리즘으로 인해 ProSplign은 스플라이스 사이트를 정확하게 결정하고 시퀀싱 오류를 허용합니다.
뉴클레오티드 또는 단백질 서열과 해당 서열에 주석이 달린 특징에 대한 구성 가능한 그래픽 표시를 제공합니다. NCBI 시퀀스 데이터베이스 페이지에서 사용하는 것 외에도 이 뷰어는 내장 가능한 웹 페이지 구성 요소로도 사용할 수 있습니다. API 참조 가이드를 포함한 자세한 문서는 자신의 페이지에 뷰어를 포함하려는 개발자에게 제공됩니다.
cDNA-to-Genomic 서열 정렬을 계산하기 위한 유틸리티입니다. 이는 Needleman-Wunsch 전역 정렬 알고리즘의 변형을 기반으로 하며 특히 인트론 및 스플라이스 신호를 설명합니다. 이 알고리즘으로 인해 Splign은 스플라이스 위치를 정확하게 결정하고 시퀀싱 오류를 허용합니다.
벡터 유래일 수 있는 핵산 서열의 세그먼트를 신속하게 식별하기 위한 시스템입니다. VecScreen은 특수한 비중복 벡터 데이터베이스(UniVec)의 시퀀스와 일치하는 세그먼트에 대한 쿼리 시퀀스를 검색합니다.
어떻게