NCBI 핸드북 [인터넷]. 2차 개정판.상세 정보 표시
Search term
< 페이지다음 >
용어집
식별 번호
식별 번호는 GenBank와 같은 시퀀스 데이터베이스의 레코드에 할당된 고유 식별자입니다. 여러 NCBI 데이터베이스는 [사전순 접두사][일련의 숫자] 형식을 사용합니다. 일부 데이터베이스(예: GenBank)에서 레코드의 변경은 식별 번호의 정수 확장자인 Accession.version 식별자로 추적됩니다. 시퀀스의 초기 버전 확장자는 ".1"입니다. GenBank 레코드의 시퀀스가 변경되면 Accession.version 식별자의 버전 확장자가 증가합니다. 시퀀스 NM_000245.3의 경우 ".3"은 레코드가 두 번 업데이트되었음을 나타냅니다. 레코드 전체의 식별 번호는 변경되지 않은 상태로 유지되며 항상 레코드의 최신 버전을 검색합니다. 이전 버전은 원래 Accession.version 식별자로 계속 사용할 수 있습니다.
AGP 파일
AGP('A Golden Path') 파일은 콘티그, 스캐폴드 또는 염색체 염기서열을 작성하기 위한 지침을 설명하는 데 사용됩니다. 이 파일은 각 게놈 염기서열의 순서, 방향, 전환점을 지정합니다.
맞춤
정렬은 2개의 뉴클레오티드 또는 단백질 서열 간의 유사성을 나타내는 것입니다. 단백질 서열의 경우, 보존된 서열을 설명하기 위해 조상 서열에서 유래한 아미노산이 정렬에서 고려됩니다. 쌍별 정렬에는 2개의 시퀀스가 포함되고 다중 정렬에는 3개 이상의 시퀀스가 포함됩니다. 전역 정렬에는 전체 시퀀스 정렬이 포함되는 반면 로컬 정렬에는 하위 시퀀스 정렬이 포함됩니다. 최적의 정렬은 주어진 시스템에 대한 가장 높은 점수에 의해 결정됩니다. 구조적 정렬에서는 고려 중인 단백질의 3차원 구조가 중첩됩니다(Koonin and Galperin 2003a).
대립 유전자
염색체의 특정 유전자좌에 있는 유전자의 변이 형태 중 하나. 서로 다른 대립유전자는 머리카락 색깔이나 혈액형과 같은 유전적 특성의 변화를 일으킵니다. 개체에서 대립 유전자의 한 형태 (우성 유전자)는 다른 형태 (열성 유전자)보다 더 많이 발현 될 수 있습니다. "유전자"가 단순히 뉴클레오티드 서열의 세그먼트로 간주될 때, 대립유전자는 서열의 특정 위치에 있는 가능한 대안적 뉴클레오티드 각각을 지칭한다. 예를 들어, CCT[C/T]CCAT와 같은 CT 다형성은 C와 T의 두 대립유전자를 갖습니다.
대립유전자 빈도
모집단의 모든 유전자 사본 중 특정 유전자 변이의 비율.
대체 궤적
궤적의 대체 표현을 제공하는 시퀀스입니다. 대체 loci는 추가 조립 단위(즉, 기본 조립품에 없음)로 수집됩니다.
알루
Alu 반복 가족은 인간과 다른 영장류의 게놈에 여러 복사본으로 존재하는 짧은 산재 요소(SINES)로 구성됩니다. Alu 염기서열은 길이가 약 300bp이며 인트론, 유전자의 3′ 번역되지 않은 영역 및 유전자 간 게놈 영역에서 일반적으로 발견됩니다. 그들은 이동할 수 있는 성분이고 극단적으로 높은 사본 수로 인간 게놈에서 출석합니다. 거의 100만 개의 Alu 서열이 존재하는 것으로 추정되며, 이는 가장 풍부한 이동 원소입니다. Alu 서열은 Alu 서열의 중간에 AluI 엔도뉴클레아제에 대한 인식 부위가 존재하기 때문에 그렇게 명명되었습니다. 게놈에서 Alu 반복이 광범위하게 발생하기 때문에 Alu 서열은 동물 세포주에서 PCR을 위한 범용 프라이머로 사용됩니다. 정방향과 역방향으로 결합합니다.
아미노산
펩타이드와 단백질의 기본 빌딩 블록 분자. 단백질의 아미노산 서열은 RNA 코돈 서열에 의해 결정됩니다.
앵커 시퀀스
앵커 서열은 여러 종의 유전적 연결 맵에서 고유한 유전자좌인 분자 마커이며 동일 선형 게놈 영역을 따라 종 간 매핑을 위한 비교 유전체학에 사용됩니다.
증권 시세 표시기
응용 프로그래밍 인터페이스. API는 소프트웨어 애플리케이션을 구축하기 위한 루틴, 데이터 구조, 변수, 상수 및/또는 클래스의 집합입니다. API는 소프트웨어 구성 요소가 서로 통신하는 방법을 정의합니다. 예를 들어 그래픽 사용자 인터페이스를 실행하는 컴퓨터의 경우 API는 애플리케이션의 창, 아이콘, 메뉴 및 대화 상자를 관리합니다.
ASN.1입니다.
추상 구문 표기법 1은 컴퓨터 플랫폼 간의 상호 운용성을 달성하는 데 사용되는 국제 표준 데이터 표현 형식입니다. 이를 통해 모든 유형의 컴퓨터 및 소프트웨어 시스템에서 구조와 내용 측면에서 데이터를 안정적으로 교환할 수 있습니다.
집회
유기체의 게놈을 나타내는 데 사용되는 염색체 세트, 국소화되지 않고 배치되지 않은 (무작위) 서열 및 대체 유전자좌. 어셈블리는 하나 이상의 어셈블리 단위로 구성됩니다. 대부분의 현재 어셈블리는 유기체의 게놈의 반수체 표현이지만 일부 유전자좌는 두 번 이상 표현될 수 있습니다(대체 유전자좌 참조). 이 표현은 단일 개체(예: 침팬지 또는 마우스) 또는 여러 개체(예: 인간 참조 어셈블리)로부터 얻을 수 있습니다. 동형접합성으로 사육된 유기체의 경우를 제외하고, 반수체 어셈블리는 전형적으로 단일 하플로타입이 아니라 하플로타입의 혼합을 나타냅니다. 이배체 게놈 어셈블리는 개인의 염색체 세트 모두에 사용할 수 있는 염색체 어셈블리입니다. 이배체 게놈 어셈블리는 개인의 게놈을 나타낼 것으로 예상됩니다. 따라서 이 어셈블리에 대해 대체 loci가 정의될 것으로 예상되지 않지만, 국소화되지 않거나 배치되지 않은 시퀀스가 어셈블리의 일부가 될 수 있습니다. 조립품은 하나 이상의 조립품 단위로 구성됩니다.
assembly release 조립품
게놈 어셈블리의 방출. 주요 릴리스는 염기서열을 변경하거나 기본 어셈블리에 정의된 염색체 좌표계를 변경하는 업데이트입니다. 부 릴리즈는 좌표계를 변경하지 않지만 정보를 추가하거나 수정할 수 있는 업데이트입니다. 이러한 이벤트에는 게놈 패치의 추가, 염색체에 배치되지 않은 염기서열 할당 또는 대체 유전자좌에 대한 새로운 배치가 포함됩니다.
조립 단위
어셈블리의 개별 파트를 정의하는 데 사용되는 시퀀스의 컬렉션입니다. 모든 조립품에는 "기본 조립품"을 나타내는 하나의 조립품 단위가 포함되어야 합니다.
asserted position (주장된 위치)
변형이 특정 위치에 있다는 실험적 증거를 기반으로 한 진술(주장)입니다. 주장된 입장은 실험적 증거를 기반으로 하기 때문에 특정 대안에 대한 특정 입장에 대한 여러 제출자의 주장이 여러 개 있더라도 대안 입장의 형태로 볼 수 없습니다.
NCBI는 어설션을 독립적으로 검증하지 않으며 정확성을 보증할 수 없습니다.
메모: 어설션된 위치를 기반으로 하는 제출은 NCBI 어셈블리 리소스에 표시되는 어셈블리의 일부인 시퀀스 액세스를 참조해야 합니다. 그러나 사용할 수 있는 어셈블리가 없는 경우 참조 시퀀스는 INSDC 시퀀스 액세스가 될 수 있습니다. 제출물이 어셈블리에 정렬할 수 없는 Accession을 사용하여 변형에 대한 위치를 주장하는 경우, 해당 변형에 대한 rs는 인간 어셈블리에 주석을 달 수 없으므로 어셈블리의 맵 또는 그래픽 표현에 나타나지 않습니다.
백(BAC)
박테리아 인공 염색체. BAC 클로닝 시스템은 박테리아 클로닝을 위해 게놈 DNA의 큰 부분(100–300 bp)을 운반할 수 있는 박테리아 플라스미드 벡터를 기반으로 합니다. BAC는 클로닝 효율이 높고 클로닝된 DNA의 안정성이 높기 때문에 복잡한 게놈 라이브러리 구축에 사용됩니다.
백엔드
웹 응용 프로그램과 관련하여 백엔드는 사용자가 직접 액세스하지 않는 구성 요소(서버, 응용 프로그램 및 데이터베이스)를 나타냅니다.
바에프
B-대립유전자 빈도
기본 시퀀스
핵산과 폴리뉴클레오티드에 있는 퓨린과 피리미딘의 서열. 뉴클레오티드 서열이라고도 합니다.
생물정보학(Bioinformatics)
생물 정보학은 생물학적 발견 또는 예측을 수행하기 위해 대규모 데이터 세트를 포함한 생물학적 데이터의 수집, 저장, 조작 및 분석을 위해 계산 접근 방식을 적용하는 학제 간 분야입니다. 최소한 컴퓨터 과학, 생물학, 유전학, 유전체학, 통계학, 수학 및 공학을 포함하여 생물학적 데이터를 해석합니다. 그것은 계산 생물학과 밀접한 관련이 있습니다.
돌풍
기본 로컬 정렬 검색 도구(Altschul et al. 1990). 쿼리에 대한 최적의 로컬 맞춤을 위해 시퀀스 데이터베이스를 검색하는 데 사용되는 시퀀스 비교 알고리즘입니다. BLAST 챕터를 참조하십시오.
블래스트N
뉴클레오티드-뉴클레오티드 BLAST. BLASTN은 뉴클레오티드 염기서열을 NCBI 뉴클레오티드 데이터베이스와 비교합니다.
블래스트피
단백질-단백질 BLAST. BLASTP는 단백질 염기서열을 NCBI 단백질 데이터베이스와 비교합니다.
블래스트
BLASTX는 단백질 데이터베이스에 대해 뉴클레오티드 쿼리를 검색하여 6개 프레임 모두에서 쿼리를 동적으로 변환하는 애플리케이션입니다.
얼룩
Binary Large OBject입니다. BLOB는 비트맵과 같은 큰 데이터 조각을 나타냅니다. BLOB는 큰 필드 값, 예측할 수 없는 테이블 크기 및 프로그램 관점에서 형식이 없는 데이터를 특징으로 합니다. 또한 데이터 블록에 대한 정보를 포함하는 BLOB 구조를 지정하는 키워드이기도 합니다.
부울
이 용어는 논리 연산자 AND, OR, XOR 및 NOT을 사용하는 이항 대수를 나타냅니다. 결과는 논리 값(TRUE 또는 FALSE)으로 구성됩니다.
바이트
컴퓨터 용어로 8비트와 같은 저장 단위입니다.
시디
보존된 도메인. CD는 진화 과정에서 보존된 도메인(단백질의 뚜렷한 기능적 및/또는 구조적 단위)을 나타냅니다. 진화 동안, 단백질에서 아미노산 서열의 특정 위치에서의 변화는 원래 잔기의 물리화학적 특성과 따라서 단백질의 해당 영역의 구조적 및/또는 기능적 특성을 보존하는 방식으로 발생했을 수 있습니다.
증권 시세 표시기
보존된 도메인 데이터베이스. 이 데이터베이스는 분자 진화 중에 보존된 단백질 도메인을 나타내는 염기서열 정렬 및 프로파일의 모음입니다.
씨DNA
상보적 DNA. 메신저 RNA(mRNA) 염기서열의 역전사에 의해 얻어진 DNA 염기서열.
증권 시세 표시기
코딩 영역, 코딩 순서. CDS는 게놈 DNA 염기서열에서 시작 코돈에서 정지 코돈까지 번역되는 부분을 말합니다. 부분 CDS에는 염기서열의 일부가 없습니다(시작 및 중지 코돈 중 하나 또는 둘 다 부족할 수 있음). CDS의 성공적인 번역은 단백질의 합성으로 이어집니다.
CGI (CGI)
공통 게이트웨이 인터페이스. 웹 서버가 서버에서 프로그램이나 스크립트를 실행하고 출력을 웹 브라우저로 보낼 수 있도록 하는 메커니즘입니다.
칩
DNA 칩을 참조하십시오.
염색체
진핵 세포의 핵에 포함되고 유전 물질 또는 유전자를 포함하는 DNA와 단백질로 구성된 실 모양의 구조; 원핵생물에서 유전 정보를 전달하는 원형 DNA.
임상적 주장
변이가 임상 표현형을 가지고 있다는 실험적 증거를 기반으로 한 진술(주장)입니다. 변이체와 함께 제출된 임상적 주장은 관련 표현형의 특성에 대해 특이적일 수도 있고 그렇지 않을 수도 있습니다. 임상적 주장은 실험적 증거를 기반으로 하기 때문에 특정 변이체에 대한 특정 임상 표현형에 대한 여러 제출자의 주장이 여러 개인 경우에도 임상 표현형의 형태로 볼 수 없습니다.
임상적 주장은 다음 범주 중 하나에 속할 수 있습니다.
병원성
병원성일 가능성이 높음
아마도 비병원성
비병원성 [양성]
약물 반응에 영향
조직적합성에 영향 미치기
알려지지 않은
거치지
다른
어설션 범주가 변경될 수 있으므로 최신 어설션 정의는 ClinVar 를 참조하십시오.
예: rs328에 대한 rs 보고서의 경우, 군집에 대해 주장된 임상적 유의성은 보고서 상단과 "대립유전자" 하위 섹션에 명확하게 명시되어 있습니다.
임상적 주장에 대한 자세한 내용은 "VCF 형식의 인간 변이 세트"의 clinvar.vcf.gz 섹션 또는 NCBI 변이 리소스에 대한 FAQ를 참조하세요.
참고: NCBI는 어설션을 독립적으로 검증하지 않으며 정확성을 보증할 수 없습니다. 이 자료를 통해 얻은 정보는 전문적인 유전 상담을 대체할 수 없으며 의학적 의사 결정의 기초로 사용하기 위한 것이 아닙니다.
클로브
캐릭터 대형 OBject
클론
클론은 관심 있는 DNA 단편을 포함하는 자가 복제 시스템으로 간주될 수 있습니다.
클로닝 벡터
숙주 세포 내에서 자율적으로 복제할 수 있고 복제할 게놈 DNA 또는 cDNA의 단편을 운반하는 데 사용되는 작은 DNA 분자; 일반적으로 박테리아 플라스미드 또는 변형된 박테리오파지 게놈입니다.
클러스터
특정 기준에 따라 만들어지는 그룹입니다. 예를 들어, 유전자 클러스터는 특정 기준에 따라 발현 프로파일이 유사한 것으로 밝혀진 유전자 세트를 포함할 수 있거나, 클러스터는 상동성에 의해 서로 관련된 클론 그룹을 지칭할 수 있다.
씨엠에스
콘텐츠 관리 시스템
코돈
단백질 합성 중 특정 아미노산을 지정하는 DNA 또는 mRNA의 3개 뉴클레오티드 서열; 삼중항이라고도 합니다. 64개의 가능한 코돈 중 3개는 아미노산을 지정하지 않는 정지 코돈입니다.
코딩 영역(coding region)
그것은 단백질로 번역되는 DNA의 염기서열이며 개시 코돈과 종결 코돈을 포함합니다.
상보적 DNA
cDNA 참조.
전산생물학
계산 생물학은 데이터 분석 및 이론적 방법, 알고리즘, 수학적 모델링 및 계산 시뮬레이션 기술을 개발하고 적용하여 생물학적 시스템을 이해하고 대규모 데이터 세트를 포함한 생물학적 데이터에서 예측 및 발견을 수행하는 것을 포함합니다. 이 분야는 컴퓨터 과학, 응용 수학, 통계, 생물 물리학, 유전체학, 분자 생물학 및 생물학의 여러 분야에서 시작되었습니다. 생물정보학과 밀접한 관련이 있습니다.
합의 순서
대표적이거나 가장 전형적인 뉴클레오티드 또는 아미노산 서열로, 각 뉴클레오티드 또는 아미노산이 관련 서열 그룹의 각각의 위치에서 가장 자주 발견됩니다.
보존된 도메인
단백질의 보존된 도메인은 하나 이상의 단백질 서열 모티브로 구성된 불연속적인 3차원 독립적으로 접히는 구조입니다. 단백질 서열 모티프는 단백질 기능에 중요한 것으로 밝혀진 2차 구조(예: 나선-루프-나선)의 조합인 보존된 아미노산 서열입니다(Koonin and Galperin 2003b).
콘티그
정렬된 구성 요소 시퀀스 집합을 따라 중복되지 않은 경로를 결정하여 생성된 연속 시퀀스입니다. contig에는 간격이 없어야 합니다.
증권 시세 표시기
CSS(Cascading Style Sheet)는 HTML 및 XML 요소의 표현 및 레이아웃을 제어하는 서식 세부 정보를 지정합니다. CSS는 단순하게 구조화된 XML 문서의 서식 동작 및 텍스트 장식을 설명하는 데 사용할 수 있지만 소스 데이터의 구조와 다른 구조를 표시할 수는 없습니다.
함의
Entrez의 도구인 Cubby는 업데이트할 수 있는 검색 전략과 PubMed에 표시해야 하는 LinkOut 공급자를 지정하고 기본 문서 전달 서비스를 변경하기 위한 LinkOut 기본 설정을 저장하는 데 사용되었습니다. MyNCBI로 대체되었습니다.
쿠이
개념 고유 식별자
세포유전학(cytogenetics)
염색체의 세포학적 및 분자 분석(세포 위치, 구조, 기능 및 이상)을 다루는 유전학의 하위 분야입니다.
증권 시세 표시기
데이터 액세스 위원회(Data Access Committee)
데몬
백그라운드 프로세스 또는 서비스로 실행되며 사용자가 제어하지 않는 컴퓨터 프로그램입니다.
DAR (다)
데이터 액세스 요청
데이터베이스
논리적으로 관련된 데이터 집합 또는 스크립트 또는 컴퓨터에서 검색할 수 있는 파일 모음을 저장합니다.
데이터셋(dataset)
공유, 재배포, 처리 및 분석을 위해 조직화된 데이터 모음을 영구적으로 저장합니다.
dbGSS (영문)
게놈 조사 서열 데이터베이스(Genome Survey Sequences Database)는 게놈 염기서열을 위한 GenBank의 한 부서입니다.
디비제이(DDBJ)
DNA 데이터 뱅크 오브 재팬(DNA Data Bank of Japan)은 DNA 뉴클레오티드 염기서열 수집 센터이자 INSDC의 회원입니다.
DDD (디디디)
Digital Differential Display는 EST 발현 프로파일을 분석할 수 있는 Unigene의 기능입니다.
삭제 변형
단일 뉴클레오티드 또는 DNA 세그먼트의 제거와 관련된 돌연변이 유형.
디옥시리보핵산(Deoxyribonucleic Acid)
DNA 참조.
디지털 디퍼렌셜 디스플레이
DDD를 참조하십시오.
DNA (디엔제이
디옥시리보핵산은 살아있는 유기체를 만들기 위한 유전적 지시를 전달하는 세포핵 내부의 화학 물질입니다. DNA는 두 개의 반평행 가닥으로 구성되며, 각 가닥은 뉴클레오티드의 선형 중합체입니다. 각 뉴클레오티드는 포스포에스테르 결합에 의해 펜토스(5탄소 당 분자, 디옥시리보스)에 연결된 인산기를 가지고 있으며, 이는 차례로 4가지 유기 염기, 아데닌, 구아닌, 시토신 또는 티민(각각 A, G, C, T로 약칭) 중 하나에 연결됩니다. 염기는 두 가지 유형이 있습니다 : 퓨린은 두 개의 고리가 있고 약간 더 큽니다 (A 및 G). 그리고 피리미딘은 고리가 하나만 있습니다(C와 T). 각 뉴클레오티드는 한 데옥시리보스기의 5′ 탄소와 다음 데옥시리보스기의 3′ 탄소 사이의 공유 포스포디에스테르 결합에 의해 사슬의 다음 뉴클레오티드에 결합됩니다. DNA는 바깥쪽에 당-인산염 골격이 있고 중심축을 향해 뻗어 있는 뉴클레오티드가 있는 나선형 분자입니다. A는 항상 T와 쌍을 이루고 G는 항상 C와 쌍을 이루는 방식으로 반대 가닥의 염기 사이에 특정 염기 쌍이 있습니다.
DNA 칩
DNA 칩(DNA 마이크로어레이라고도 함)은 표면에 공유 결합 또는 비공유 결합한 2차원(2D) 또는 3D 방식으로 고체 표면에 DNA 서열을 조직화한 배열입니다. 어레이에는 올리고뉴클레오티드 프로브 또는 짧은 뉴클레오티드 "알려진" 서열이 포함되어 있으며, 이는 유전자 발현 수준을 측정하거나 특정 관심 돌연변이를 식별하는 것과 같은 다양한 응용 분야를 위해 샘플의 서열에 하이브리드화하는 데 사용할 수 있습니다.
도이(DOI)
Digital Object Identifier는 출판물과 같은 객체에 적용할 수 있는 지속적이고 실행 가능하며 상호 운용 가능한 식별자에 대한 국제 표준입니다.
디티디(DTD)
문서 유형 정의. DTD는 문서의 규칙을 정의하는 XML 문서 프롤로그의 선택적 부분입니다. 문서에 존재하는 요소와 요소 간의 관계(예: 다른 태그를 포함할 수 있는 태그, 태그의 수와 순서, 태그의 속성)를 지정하여 XML 문서에 대한 제약 조건을 설정합니다. DTD는 수신 응용 프로그램에 들어오는 데이터에 대한 기본 제공 설명이 없는 경우 데이터의 유효성을 검사하는 데 도움이 됩니다.
둑
데이터 사용 인증
E-유틸리티
EInfo( 데이터베이스 통계), ESearch(텍스트 검색), EPost(UID 업로드), ESummary(문서 요약 다운로드), EFetch(데이터 레코드 다운로드), ELink(Entrez 링크), EGQuery(글로벌 쿼리), ESpell(맞춤법 제안), ECitMatch(PubMed에서 일괄 인용 검색).
엠블
유럽 분자 생물학 연구소
에나
유럽 분자 생물학 연구소(EMBL)의 유럽 뉴클레오티드 아카이브)
끝 시퀀스
게놈 클론 삽입물의 단방향 염기서열분석에서 얻은 염기서열. 삽입이 양쪽 끝에서 시퀀스되는 경우 쌍을 이루는 끝 시퀀스 세트를 생성할 수 있습니다.
엔트레즈
Entrez는 PubMed, GenBank 및 PMC와 같은 여러 연결된 데이터베이스를 검색하기 위한 NCBI의 검색 시스템입니다. Entrez 챕터를 참조하십시오.
후성유전체학(epigenomics)
DNA 염기 서열의 변화의 결과가 아닌 DNA 메틸화 또는 히스톤 변형과 같은 후성유전학적 메커니즘에 의한 유전자의 발현 또는 억제의 변화에 대한 연구.
eQTL (이퀀틀)
표현식 Quantitative Trait Loci
동부 표준시
표현된 시퀀스 태그입니다. EST는 짧고(보통 약 300–500 염기쌍), cDNA에서 단일 패스 서열을 읽습니다. 일반적으로 대량으로 생산됩니다. 그들은 주어진 조직 및/또는 주어진 발달 단계에서 발현되는 유전자를 나타냅니다. 그들은 주어진 cDNA 도서관을 위한 표정의 꼬리표 (몇몇 코딩, 다른 사람 아닙니다)입니다. 그들은 전장 유전자를 식별하고 매핑하는 데 유용합니다.
진핵생물
핵막으로 둘러싸인 진정한 핵을 가진 세포를 가진 유기체를 말합니다.
엑손
해당 유전자의 mRNA의 일부를 암호화하는 유전자 부분을 나타냅니다. 유전자는 많은 엑손(exon)을 포함할 수 있으며, 그 중 일부는 단백질 코딩 서열만을 포함할 수 있습니다. 그러나, 엑손은 또한 5' 또는 3' 번역되지 않은 서열을 포함할 수 있다. 각 엑손은 전체 단백질의 특정 부분을 암호화합니다. 일부 종(인간 포함)에서 유전자의 엑손은 종종 명백한 기능이 없지만 번역되지 않은 작은 RNA 또는 조절 정보를 암호화하는 것으로 밝혀진 긴 DNA 영역(인트론 또는 때로는 "정크 DNA"라고 함)으로 분리됩니다.
표현된 시퀀스 태그(express sequence tag)
EST를 참조하십시오.
파스타
단백질 및 DNA 염기서열 데이터베이스의 유사성 검색에 널리 사용되는 최초의 알고리즘입니다. 프로그램은 "단어"라는 작은 일치 항목에 대한 시퀀스를 스캔하여 최적의 로컬 정렬을 찾습니다. 처음에는 여러 단어 조회가 있는 세그먼트의 점수가 계산됩니다("init1"). 나중에, 여러 세그먼트의 점수를 합산하여 "initn" 점수를 생성할 수 있습니다. 간격을 포함하는 최적화된 정렬은 출력에 "opt"로 표시됩니다. 검색의 민감도와 속도는 반비례하며 "단어"의 크기를 지정하는 "k-tup" 변수에 의해 제어됩니다(Pearson and Lipman 1988). 또한 핵산 또는 단백질 서열의 형식을 나타냅니다.
FLAN
FLu Annotation
FlyBase
FlyBase is the primary database of genetic and genomic data for the insect family Drosophilidae.
frameshift
A mutation in which the number of nucleotides inserted or deleted from a protein coding sequence of DNA is not a multiple of 3, which results in a shift in the codon reading frame, creating an altered protein product.
frontend
With reference to web applications, the frontend refers to the interface which is directly accessible to the user through which other components such as databases and servers can be accessed.
FTP
File Transfer Protocol. A method of retrieving files over a network directly to the user's computer or to his/her home directory using a set of protocols that govern how the data are to be transported.
gap
A gap is a space introduced into an alignment to compensate for insertions and deletions in one sequence relative to another. To prevent the accumulation of too many gaps in an alignment, introduction of a gap causes the deduction of a fixed amount (the gap score) from the alignment score. Extension of the gap to encompass additional nucleotides or amino acids is also penalized in the scoring of an alignment.
GB
Gigabytes; 109 bytes.
Gbps
Gigabits per second. Refers to the speed of data transfer.
gene expression
It is the process by which a gene is modulated for transcription to mRNA and translation to a protein. It can be measured by the levels of mRNA, protein, or observable phenotype of the cell.
gene frequency
See allele frequency.
gene trap
Gene trapping is a technique for determining gene function whereby specialized vector sequences are randomly inserted into the genome and can be used to tag genes, allowing for genetic or phenotypic approaches to study the effect of the mutation.
genetic code
The instructions in a gene that tell the cell how to make a specific protein. A, T, G, and C are the “letters” of the DNA code; they stand for the chemicals adenine, thymine, guanine, and cytosine, respectively, that make up the nucleotide bases of DNA. Each gene's code combines the four chemicals in various ways to spell out three-letter “words” that specify which amino acid is needed at every position for making a protein.
genetic recombination
Genetic recombination is the process by which DNA is broken and rejoined resulting in new arrangements, such as by crossing over of chromosomes during meiosis or by chromosomal exchange during genetic conjugation, transduction, or transformation.
genetic testing
The analysis of an individual’s genome for determining the presence of a mutation, carrier status of a mutation, disease risk, or relationship to other individuals.
genome
The genome is the complete genetic material of an organism. For eukaryotic organisms, it is the DNA in all chromosomes and in mitochondria or chloroplasts; for procaryotes, it includes the circular double-stranded DNA molecule. For viruses, it comprises DNA or RNA.
genome assembly
See assembly.
genome library
A DNA library which includes the complete sequences from the genome of an organism, i.e., introns and exons.
genomics
A field of study in genetics that applies molecular tools such as recombinant DNA technology and high-throughput sequencing, and bioinformatics approaches such as genome alignment and assembly towards the analysis of genome structure and function.
genotype
The genetic identity of an individual that does not show as outward characteristics. The genotype refers to the pair of alleles for a given region of the genome that an individual carries.
GFF
General Feature Format; it is used for the annotation of biological sequences
gnomon
Gene model prediction program. See http://www.ncbi.nlm.nih.gov/genome/guide/gnomon.shtml
haplotype
A haplotype is a set of DNA variants, SNPs, or other polymorphisms that are closely located on the same chromosome and are thus inherited together.
HapMap
Haplotype map, a now retired tool for finding genes and genetic variations that affect health and disease.
HGNC
HUGO Gene Nomenclature Committee
HGP
Human Genome Project
HIPAA
Health Insurance Portability and Accountability Act of 1996
HLA
Human Leukocyte Antigen
HMM
Hidden Markov Model
HMP
HomoloGene
HomoloGene is a system that automatically detects homologs, including paralogs and orthologs, among the genes of several completely sequenced eukaryotic genomes.
homology
See homologous.
homologous
The term refers to similarity attributable to descent from a common ancestor. Homologous chromosomes are members of a pair of essentially identical chromosomes, each derived from one parent. They have the same or allelic genes with genetic loci arranged in the same order. Homologous chromosomes synapse during meiosis.
HPO
HUGO
HUP
Hold-until-published
initiation codon
The canonical AUG codon or any alternative non-canonical start codon in the messenger RNA which serves as the recognition codon for binding of N-formylmethionyl transfer RNA (tRNAfmet) and addition of the first methionine during the initiation of protein translation.
INSDC
International Nucleotide Sequence Database Collaboration
insert sequence
A piece of DNA inserted into a cloning vector by recombinant DNA techniques. For genomic cloning vectors, insert sequences typically range in size from 10’s of kilobases (cosmids, fosmids), to 100’s of kilobases (BAC, PACs) up to ~2MB (YACs).
intergenic
Regions of the genome that lie between genes and have no known function. Intergenic DNA is mainly made up of 2 types of repeated sequences: interspersed repeats and tandemly repeated DNA.
intervening sequence
See intron.
intron
Non-coding region of the DNA that gets transcribed in the primary messenger RNA but the sequence is removed from the mature RNA transcript when exons are spliced together.
IRB
Internal Review Board
ISSN
An ISSN is an 8-digit code used to identify newspapers, journals, magazines, periodicals, and electronic and print media. See http://www.issn.org
JATS
Journal Article Tag Suite, a NISO DTD Standard.
JPEG
Joint Photographic Experts Group; suffix for digital image file format.
locus
The position on a chromosome where a gene is located.
long repeat
See long terminal repeat.
long terminal repeat
Retroviruses integrate a reverse-transcribed double-stranded DNA copy of their RNA genome into host DNA. The human genome contains many copies of endogenous retroviral DNA sequences integrated in the genome. The viral DNA is flanked by long terminal repeat sequences (LTR) that contain regulatory elements, signal sequences, transcription factor binding sites, and polyadenylation signals that play a role in modulating gene expression.
LTR
Long Terminal Repeat
mapping
In genomics, mapping refers to the various techniques for determining the position and relative order of markers or genes (loci) on a chromosome and relative distance between them based on recombination frequency (genetic map), the absolute position of genes and the distance between them in nucleotide base pairs (physical map), or the position of markers or genes on the chromosome based on hybridization (cytogenetic map).
MapViewer
MapViewer는 유기체의 게놈을 보고 검색하고 염색체 지도를 표시하는 데 사용되는 게놈 탐색 도구입니다.
수학ML
수학적 마크업 언어; XML에서 수학 방정식을 처리하는 데 사용됩니다.
MD5 시리즈
MD5(Message-Digest Algorithm 5)는 데이터 무결성의 유효성을 검사하는 데 사용되는 데이터베이스 해시 함수입니다.
메드젠
MedGen은 유전적 기여가 있는 질환의 특성과 같은 인간 의학 유전학과 관련된 정보를 제공하는 NCBI 리소스입니다.
메쉬
Medical Subject Headings는 PubMed의 논문을 색인화하는 데 사용되는 National Library of Medicine의 통제된 어휘 동의어 사전입니다.
메타게놈
메타게놈(metagenome)은 미생물과 같은 유기체 군집을 대표하는 집단 게놈으로, 그 중 다수는 환경 밖에서 배양될 수 없습니다.
MHC (에이치씨씨)
주요 조직적합성 복합체(Major Histocompatibility Complex)
미아메
마이크로어레이 실험에 대한 최소 정보
마이크로어레이
DNA 칩을 참조하십시오.
내 NCBI
My NCBI는 사용자 정보 및 데이터베이스 기본 설정을 유지하여 많은 NCBI 데이터베이스에 대한 맞춤형 서비스를 제공하는 도구입니다.
N50 시리즈
N50 값은 게놈의 50%가 N50 이상의 크기의 콘티그에 포함되도록 가장 작은 콘티그(또는 스캐폴드)의 크기입니다. 게놈 어셈블리에 사용되는 통계입니다.
엔씨비
국립 생명 공학 정보 센터
미국 국립보건원(NIHMS)
미국 국립보건원(National Institutes of Health) 원고 제출 시스템
니소
국가정보표준기구(National Information Standards Organization)
증권 시세 표시기
오아이
오밈
오픈 액세스
오픈 액세스는 온라인 출판물, 종종 공적 자금 지원을 받는 연구 결과물을 말하며, 액세스에 대한 제한(예: 사용자 수수료 없음)이 없고 사용 제한(라이선스 및 저작권)이 적용되지 않습니다.
독서 프레임 열기
개시 코돈으로 시작하여 종결 코돈으로 끝나는 DNA 염기서열로, 유전자 염기서열을 지정합니다.
반대 가닥
템플릿 가닥을 향하는 DNA 가닥입니다.
ORF (오르프)
독서 프레임 열기
오르토로그
상동 유전자는 다른 종에서 발견되며 공통 조상의 단일 게놈 자리에서 발생합니다. Ortholog는 유사한 기능을 갖지 않을 수 있습니다.
중첩 유전자
뉴클레오티드 서열의 일부 또는 전부를 조절 요소 또는 인트론 서열을 포함할 수 있는 다른 유전자와 공유하는 유전자.
p-값
p-값 또는 확률 값은 통계적 유의성의 측도입니다. 귀무 가설이 참이라고 가정하면 p-값은 특정 결과 또는 결과를 관찰할 확률을 나타냅니다. p-값이 낮을수록 결과가 우연히 발생할 확률이 낮아지므로 유의성이 커집니다. p-값 0.05는 확률 결과가 나올 확률이 5%라는 것을 나타냅니다. 역사적인 이유로 p-값 0.05가 유의성의 구분점으로 사용되었습니다. 0.05보다 작은 값은 중요한 것으로 간주됩니다. p 값이 0.001 이하인 경우(결과가 우연히 발생할 확률이 0.1% 미만인 경우) 결과는 매우 유의한 것으로 간주됩니다.
PAC (팩)
P1 유래 인공 염색체; BAC 클로닝 시스템과 박테리오파지 P1 벡터의 조합을 기반으로 하는 게놈 DNA의 대형 DNA 삽입물(100-300kb)을 위한 클로닝 시스템.
쌍별 정렬
구조적 또는 기능적 관계를 나타낼 수 있는 유사성 영역을 결정하기 위한 두 단백질 또는 핵산 서열의 정렬.
PDB
paralog
Paralogs are homologous genes within a species that arose from a duplication event.
Portable Document Format
pedigree
In genetics, a pedigree is a multigenerational family hierarchy tree with symbol convention used to depict inheritance of normal or disease traits by individuals in the tree.
PheGenI
Phenotype Genotype Integrator, a resource for phenotypes compiled by merging NHGRI genome-wide association study (GWAS) catalog data with data from NCBI databases including Gene, dbGaP, OMIM, GTEx and dbSNP.
phenotype
The observable characteristics or features of a living organism.
phylogenetic tree
An evolutionary tree for organismal species or cellular macromolecules (example tRNA) that is built using inheritance or molecular sequence information.
PIR
Protein Information Resource. A free resource of protein databases and analysis tools.
PI
Principal Investigator
PLink
PLink is a free, open-source whole genome association analysis toolset.
PMCI
PubMed Central International
PMID
PubMed Identifier; a unique identifier for each PubMed record.
pNIHMS
Portable NIHMS
polyadenylation signal
Polyadenylation is a post-transcriptional modification to the 3' end of eukaryotic mRNA involving the addition of a sequence of ~250 adenosine nucleotides in a template-independent manner, and occurs about 30 base-pairs downstream from a short signal sequence in the primary transcript, typically AAUAAA.
polyprotein
Precursor protein that is enzymatically processed to form the mature protein.
ProtEST
A view in the Unigene browser for comparing proteins to the EST cDNA sequences.
pseudogene
An altered copy of the original gene, which may either arise from reverse transcription of mRNA followed by integration of the double-stranded cDNA into the chromosome at a break event (processed pseudogene) or by a gene duplication event (unprocessed pseudogene). For a long time, pseudogenes were thought to be non-functional transcriptionally and translationally, but new roles are emerging for pseudogenes as regulatory modulators.
PSI-BLAST
Position-Specific Iterative BLAST (PSI-BLAST) is an iterative search using the protein BLAST algorithm in which the amino acid frequency at each position determination built after the initial search is then used in subsequent searches. The process may be repeated, if desired, with new sequences found in each cycle used to refine the profile (Altschul et al. 1997).
PSSM
Position-Specific Scoring Matrix; a type of scoring matrix used in protein BLAST searches providing position-specific amino acid substitution scores for each position in a protein multiple-sequence alignment.
public access
See open access.
Pubreader
A viewer for reading books and journal articles at NCBI on tablet devices.
QA
See quality assurance.
QC
Quality Control
quality assessment
An assessment of quality is a part of quality assurance.
quality assurance
Standardized process designed and undertaken to avoid mistakes or errors in a released product.
quality control
A set of procedures that are performed to ensure that a product meets a specified standard.
query
Query refers to the term used in the search.
query translation
The full search expression including MeSH expansion and automatic term mapping, shown in the details box in Entrez search results.
reading frame
See open reading frame.
recombinant
Referring to the product of recombination, either DNA or gene or protein.
recombination
Recombination results from crossing-over events involving exchange of DNA sequences between structurally similar chromosomes during meiosis in the diploid cell. It is a process whereby new gene combinations are formed in the progeny. It can also be performed enzymatically on DNA in vitro.
reference sequence
See RefSeq.
RefSeq
RefSeq, NCBI's Reference Sequence project, is a non-redundant, annotated set of sequences that serve as reference standards. They are derived from the INSDC databases and include chromosomes, complete genomes (plasmids, organelles, viruses, archaea, bacteria, and eukaryotes), intermediate assembled genomic contigs, curated genomic regions, mRNAs, RNAs, and proteins.
RefSeqGene
A subset of RefSeq, RefSeqGene defines genomic sequences to be used as reference standards for well-characterized genes. It provides more stable gene-specific genomic sequence for each gene including upstream and downstream flanking regions, and versioning information for conversion of coordinates in case of updates.
refSNP
In dbSNP, variant information that results from aggregation of submission data by location on the genome and type of variation is assigned a refSNP (rs) identifier. The rs identifier is used as a reference for that variant location, but does not indicate the explicit sequence change at a location.
RepeatMasker
RepeatMasker is a program that analyzes a query sequence for repeat sequences, creating an output showing the annotation of the repeats as well as a modified query sequence that masks the annotated repeats.
RH map
A Radiation Hybrid (RH) map is obtained by fusing irradiated human cells with rodent cells to create hybrids. The radiation causes chromosomal breakage in a dose-dependent manner. Following fusion with the rodent cell line, the chromosomal fragments get integrated into the rodent chromosomes. The collection of hybrid cells forms a panel and can be used for mapping.
RPSBLAST
Reverse-Position-Specific BLAST (RPSBLAST) is a tool that is used to search a protein query against a database of PSSMs that were usually produced by PSI-BLAST.
scaffold
A scaffold is an ordered and oriented set of contigs. It can contain gaps, but there is typically some evidence to support the contig order, orientation, and gap size estimates.
Schema
Representation
SEF
Serials Extract File, required for Medline indexing.
sequence masking
In determining similarities between homologous sequences, it is sometimes necessary to exclude non-specific or non-homologous similarities. This is done using standard techniques by which sequences which are of low complexity or short-period tandem repeat sequences are masked.
sequence pair
Two aligned component sequences used in the generation of a contig.
sequence tagged site
See STS
SGD
Saccharomyces Genome Database. A database for the molecular biology and genetics of Saccharomyces cerevisceae, also known as baker's yeast.
SGML
Standard Generalized Markup Language. The international standard for specifying the structure and content of electronic documents. SGML is used for the markup of data in a way that is self-describing. SGML is not a language but a way of defining languages that are developed along its general principles. A subset of SGML called XML is more widely used for the markup of data. HTML (Hypertext Markup Language) is based on SGML and uses some of its concepts to provide a universal markup language for the display of information and the linking of different pieces of that information.
similarity score
Quantitative measure of the similarity between two sequences.
single nucleotide polymorphism
See SNP
small RNA
Refer to snRNA? [CHECKING WITH thibaudf]
small nuclear RNA
See snRNA
snRNA
snRNAs (small nuclear RNAs) are small non-coding RNAs that are localized to the nucleus and that play a role in splicing of introns from premature transcripts.
SNOMED–CT
Systematized Nomenclature of Medicine–Clinical Terms. Vocabulary of clinical terminology, maintained by International Health Terminology Standards Development Organisation (IHTSDO).
SNP
Single Nucleotide Polymorphism. Common, but minute, variations that occur in human DNA at a frequency of 1 every 1,000 bases. An SNP is a single base-pair site within the genome at which more than one of the four possible base pairs is commonly found in natural populations. Over 10 million SNP sites have been identified and mapped on the sequence of the genome, providing the densest possible map of genetic differences. SNP is pronounced “snip”.
source file
A source file refers to the original file or the file provided by the submitter.
Spidey
A software program used to align cDNA (spliced mRNA sequences) to genomic sequences (Wheelan et al. 2001).
splice form
See splice site
splice signal
See splice site.
splice site
Refers to the location of the exon-intron junctions in a pre-mRNA (i.e., the primary transcript that must undergo additional processing to become a mature RNA for translation into a protein). Splice sites can be determined by comparing the sequence of genomic DNA with that of the cDNA sequence. In mRNA, introns (non-protein coding regions) are removed by the splicing machinery; however, exons can also be removed. Depending on which exons (or parts of exons) are removed, different proteins can be made from the same initial RNA or gene. Different proteins created in this way are “splice variants” or “splice forms” or “alternatively spliced”.
Splign
A software program comprising a set of algorithms for computing cDNA-to-Genome alignments (Kapustin et al. 2008).
Splitd
NCBI queuing system for processing BLAST requests.
SQL
Structured Query Language; a programming language for managing and processing data in relational databases.
ssRNA
single-stranded RNA; viruses such as Ebola virus and Marburg virus of the Family Filoviridae and Dengue virus and Yellow fever virus of the Family Flaviviridae have a single stranded RNA genome.
structural variation
Genomic structural variation includes insertions, deletions, duplications, inversions, or chromosomal translocations longer than 50 bp. These variants can occur in coding or noncoding DNA and they can be inherited or arise sporadically in the germline or somatic cells. Some of these variants may be benign, with or without phenotypic manifestations whereas others result in disease, for example, 22q11.2 Deletion Syndrome.
structured output
Results written to a file in a way that they conform to an external schema or set of rules, permitting validation and machine-readability.
STS
Sequence Tagged Site. A short DNA segment that occurs only once in the human genome, the exact location and order of bases of which are known. Because each is unique, STSs are helpful for chromosome placement of mapping and sequencing data from many different laboratories. STSs serve as landmarks on the physical map of the human genome.
style sheet
A style sheet is a mechanism to separate content from presentation and contains information necessary for formatting the text. For example, Cascading Style Sheets (CSS) are used to format HTML pages.
Swiss-Prot
Swiss-Prot is a curated protein sequence database which is a part of the UniProt knowledgebase, UniProtKB. It provides a high level of annotation (such as the description of protein function, nomenclature and taxonomy, structure, domains, sequence, post-translational modifications, variants, publications, etc.) and integration with other databases.
switch point
The switch point is the base at which a contig sequence stops being generated from one component sequence and switches to being generated from the next component sequence. There must be at least one switch point between adjacent component sequences in a contig.
tagserver
The TagServer is a database in PMC that is used for storing metadata about the journal article based on information mined from the article, such as Gene and protein names and identifiers.
TBLASTN
TBLASTN is an application which searches a protein query against a nucleotide database, dynamically translating the database.
term mapping
Untagged terms that are entered in the search box are matched against a series of translation tables (example, for Medical Subject Headings [MeSH], journals, author names etc.) and indexes in a defined order until a match is found. Once the match is found, the mapping process is complete.
termination codon
Canonical or non-canonical codon at which the ribosome is released from the RNA and translation of protein synthesis ends.
termination signal
See termination codon.
tiling path
An ordered list or map that defines a set of overlapping clones that covers a chromosome or other extended segment of DNA.
TPF
Tiling Path Format. A table format used to specify the set of clones that will provide the best possible sequence coverage for a particular chromosome, the order of the clones along the chromosome, and the location of any gaps in the clone tiling path. Also used to refer to a file (Tiling Path File) in which the minimal tiling path of clones covering a chromosome is specified in Tiling Path Format.
traceback
The traceback is the process which converts the High Scoring Segment Pairs (HSPs) and generates alignments in BLAST.
transcriptome
The transcriptome refers to the full set of transcripts in a cell assembled by a method called RNA-seq in which RNA from cells is collected, sampled, and sequenced. It includes alternative splice variants, variants created by alternative transcription initiation and alternative transcription termination, and noncoding RNA genes.
transfer RNA
See tRNA.
translation initiation site
translation start site
The position within an mRNA at which synthesis of a protein begins. The translation start site is usually an AUG codon, but occasionally, GUG or CUG codons are used to initiate protein synthesis.
translation stop signal
See termination codon.
tree viewer
Graphical representation of a tree hierarchy showing the root, branches, and leaves (nodes).
tRNA
Transfer RNA (tRNA) is a small RNA molecule that plays a role in protein synthesis. Typically tRNAs have highly conserved sequences and four-armed cloverleaf secondary structures formed by base pairing within the tRNA resulting in the formation of hairpin loops. Exceptions to this cloverleaf structure occur in mitochondrial and nematode tRNAs. There are two parts to the tRNA that are involved in protein synthesis: the anticodon that recognizes and binds to the complementary codon in the mRNA transcript; and the amino-acid binding site. The aminoacyl-tRNA synthetase are involved in pairing the amino acid with its cognate tRNA. Amino acids are transferred from the amino-acyl tRNA to the growing peptide chain via the formation of a peptide bond.
tRNAscan-SE
tRNAscan-SE is a program for identifying tRNA genes in DNA sequence.
UID
Identifier for a public record (e.g., publication or sequence) in the NCBI Entrez system.
UMLS
Unified Medical Language System
UniGene
UniGene is a computational system for analyzing the transcriptome, expression of transcripts, and the libraries from which they were derived, allowing evaluation of expression pattern by various parameters such as tissue or health status.
UniProt
Universal Protein Resource (UniProt) is a resource for protein sequence and annotation data. The UniProt databases are the UniProt Knowledgebase (UniProtKB), the UniProt Reference Clusters (UniRef), and the UniProt Archive (UniParc). UniProt is a collaboration between the European Bioinformatics Institute (EMBL-EBI), Swiss Institute of Bioinformatics (SIB) and the Protein Information Resource (PIR).
URI
Uniform Resource Identifier (URI)
UTR
Untranslated region (UTR) is the region of mRNA at the 5' or 3' end that does not code for protein and typically includes regulatory sequence.
WAM
Weight Array Method (WAM), a method for sequence analysis (Zhang and Mar3 1993).
WGS
Whole Genome Shotgun; refers to sequencing approach in which the whole genome is fragmented and sequenced using a shotgun approach, and then the sequence of the fragments are reassembled for genome assembly. [CHECK – IMPROVE]
WMM
Weight Matrix Method (WMM), [CHECK, NEED REFERENCE]
XHTML
Extensible Hypertext Markup Language (XHTML)
XML
Extensible Markup Language
XQuery
XML Query; a query language for structured data such as XML.
XSL
Extensible Stylesheet Language
YAC
Yeast artificial chromosomes (YACs) were developed for cloning large fragments of genomic DNA into yeast. YACs can carry large, megabase-size inserts of genomic DNA. BACs or PACs have advantages over YACs. Cloned DNA in the YAC system is more difficult to manipulate and is often chimeric. Also, recombination events in yeast can lead to deletions or rearrangements of the insert DNA, thus YACs are less stable than BACs or PACs.
References
Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ. Basic local alignment search tool. J Mol Biol. 1990 Oct 5;215(3):403–10. [PubMed]
Altschul SF, Madden TL, Schäffer AA, Zhang J, Zhang Z, Miller W, Lipman DJ. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 1997 Sep 1;25(17):3389–402. Review. [PMC free article] [PubMed]
교회 DM, 슈나이더 버지니아, 그레이브스 T, 오거 K, 커닝햄 F, 부크 N, 첸 HC, 아가르왈라 R, 맥라렌 WM, 리치 GR, 알브라흐트 D, 크레미츠키 M, 록 S, Kotkiewicz H, 크레미츠키 C, Wollam A, Trani L, 풀턴 L, 풀턴 R, 매튜스 L, 화이트헤드 S, 차우 W, 토랜스 J, 던 M, 하든, G, 스레드골드 G, 우드 J, 콜린스 J, Heath P, Griffiths G, Pelan S, Grafham D, Eichler EE, Weinstock G, Mardis ER, Wilson RK, Howe K, Flicek P, Hubbard T. 참조 게놈 어셈블리 현대화. PLoS 비올. 2011년 7월; 9(7):e1001091입니다. [PMC 무료품] [펍메드] [교차 참조]
게놈 참조 컨소시엄(GRC) 어셈블리 용어. 다음에서 사용 가능 http://www.ncbi.nlm.nih.gov/projects/genome/assembly/grc/info/definitions.shtml [2017년 10월 12일 액세스].
Kapustin Y, Souvorov A, Tatusova T, Lipman D. Splign: paralog 식별을 통한 접합 정렬 계산 알고리즘. 바이올 다이렉트. 2008년 5월 21일; 3:20. [PMC 무료품] [펍메드] [교차 참조]
쿠닌 EV, 갈페린 MY. 시퀀스 - 진화 - 기능: 비교 유전체학의 계산 접근법. 보스턴: Kluwer Academic; 2003ᄀ. 4장, 염기서열 분석의 원리 및 방법. 다음에서 사용 가능: https://www.ncbi.nlm.nih.gov/books/NBK20261/ [펍메드]
쿠닌 EV, 갈페린 MY. 시퀀스 - 진화 - 기능: 비교 유전체학의 계산 접근법. 보스턴: Kluwer Academic; 2003년b. 3장, 유전체학을 위한 정보 소스. 다음에서 사용 가능: https://www.ncbi.nlm.nih.gov/books/NBK20256/ [펍메드]
피어슨 WR, 립먼 DJ. 생물학적 염기서열 비교를 위한 도구가 개선되었습니다. Proc Natl Acad Sci 미국 S. A. 1988년 4월; 85(8):2444–8 참조. [PMC 무료품] [펍메드]
Wheelan SJ, 교회 DM, Ostell JM. 스파이디(Spidey): mRNA-게놈 정렬을 위한 도구. 게놈 해상도 2001년 11월; 11(11):1952년–7년. [PMC 무료품] [펍메드]
장 MQ, Marr TG. 신호 분석을 접합하기 위한 가중치 배열 방법. Comput Appl Biosci. 1993년 10월; 9(5):499–509 참조. [펍메드]
책장 ID: NBK470040
< 페이지다음 >
레이아웃