|
wwPDB 2020 뉴스목차
12/31/2020 | PDB의 50주년 |
12/09/2020 | 탄수화물 정화 |
12/06/2020 | NMR 구속 검증은 이제 OneDep을 통해 사용할 수 있습니다. |
10/20/2020 | PDB, 49주년 |
09/22/2020 | 릴리스된 PDB 구조에 대한 업데이트된 유효성 검사 보고서 |
07/28/2020 | PDB에서 향상된 탄수화물 데이터 활용 |
07/07/2020 | 7월 29일 출시 예정: PDB의 탄수화물 데이터 개선 |
04/09/2020 | 업데이트된 PDB-Dev 웹 사이트 |
04/07/2020 | EMDB의 맵 입력 릴리스 프로세스 간소화 |
02/25/2020 | 2020년 PDB의 탄수화물 개선 |
02/18/2020 | 이전에 릴리스된 좌표를 개선하고 원래 PDB ID: 2단계 유지 |
02/04/2020 | 신종 코로나바이러스 프로테아제 구조 사용 가능 |
01/14/2020 | PDB 아카이브에서 NMR 데이터를 통합 형식으로 배포 |
01/10/2020 | EMDB 정책 및 절차 문서 사용 가능 |
01/08/2020 | PDB 및 EMDB 아카이브의 타임스탬프 사본 |
12/31/2020
PDB의 50주년
PDB는 1971년 10월 20일 Crystallography: Protein Data Bank Nature New Biology 233:223 (1971) doi: 10.1038/newbio233223b0에 발표되었다.
50년이 지난 지금, PDB 아카이브에는 >170,000개의 단백질, 핵산 및 복잡한 어셈블리 구조가 포함되어 있어 학생과 연구자가 단백질 합성에서 건강 및 질병에 이르기까지 생물 의학 및 농업의 모든 측면을 이해하는 데 도움이 됩니다. PDB를 글로벌 커뮤니티에서 자유롭게 공개적으로 사용할 수 있도록 하는 wwPDB(Worldwide PDB) 조직에서 관리합니다.
아카이브 50주년을 기념하는 새로운 달력을 다운로드할 수 있습니다. 각 달의 이미지는 가상 회의 배경으로 사용할 수 있습니다.
wwPDB는 2021년 내내 심포지엄과 행사를 통해 이 황금 기념일을 축하할 것입니다.
5월 4-5일 온라인 심포지엄 등록은 이달 말에 시작될 예정입니다. 이 행사에는 구조 생물학 및 생물 정보학 분야에서 엄청난 발전을 이룬 전 세계 연사들의 프레젠테이션이 포함됩니다. 학생과 박사 후 연구원은 특히 참석하도록 권장되며 포스터 상을 받을 수 있습니다.
50주년을 맞이하는 이 해에 wwPDB 재단에 기부하여 PDB의 개방성, 협력 및 교육 정신을 지원하는 것을 고려해 보십시오.
wwPDB 재단은 2010년 wwPDB의 봉사 활동을 지원하기 위한 기금을 마련하기 위해 설립되었습니다. 재단은 아카이브 40주년을 기념하는 심포지엄인 PDB40을 지원하기 위해 기금을 모금했습니다. 워크샵; 및 교육 간행물.
재단은 과학, 문학, 자선 및 교육 목적만을 위한 501(c)(3) 단체로 인가되었습니다.
12/09/2020
탄수화물 정화
2020년 7월에 14,000개 이상의 PDB 구조를 재출시한 아카이브 수준의 탄수화물 정화 프로젝트입니다. 이 업데이트에는 다양한 올리고당이 포함됩니다: 당화(glycosylation); 대사 산물, 예컨대 맥아당, 자당, 셀룰로오스 단편; 글리코사미노글리칸, 예컨대 헤파린 및 헤파란 설페이트의 단편들; 에피토프 패턴, 예컨대 A/B 혈액형 항원 및 H형 또는 루이스형 줄기; 그리고 천연 제품을 모방하거나 이에 대응하는 많은 인공 탄수화물(문서 참조).
2017년부터 시작된 이 PDB 개선은 탄수화물 커뮤니티(PDF)에서 수립한 IUPAC-IUBMB 권장 사항에 따라 탄수화물 성분의 생화학적 명명법을 표준화하고 PDB 구조에서 모델링된 올리고당의 식별 및 검색 가능성을 개선하기 위해 올리고당의 균일한 표현을 제공하는 것을 목표로 했습니다. 수정 계획 기간 동안 wwPDB는 커뮤니티 사용자 및 PDBx/mmCIF 워킹 그룹과 상의하고 커뮤니티 피드백을 위해 2020년 초에 GitHub에서 데이터 파일을 사용할 수 있도록 했습니다. wwPDB는 미국 조지아 대학의 로버트 우즈(Robert Woods), 일본 노구치 연구소(Noguchi Institute)와 소카 대학(Soka University)의 연구원, 독일의 토마스 루테케(Thomas Lutteke)와 협력하여 올리고당 서열에 대한 균일한 선형 디스크립터를 생성했습니다.
이러한 커뮤니티 목표를 달성하기 위해 각 올리고당은 완전한 생화학적 설명과 지정된 각 글리코시드 연결을 가진 분지된 개체로 표시됩니다. 탄수화물의 전체 표현은 mmCIF 형식 파일에 제공되지만 레거시 PDB 형식 파일에서는 불가능합니다(형식이 2012년 이후 고정되었기 때문에).
적절한 인덱싱은 분기된 엔터티 표현과 선형 설명자의 생성에 필요하므로 순서(번호 지정)는 글리코실화가 발생하는 축소 끝(#1)에서 시작하여 오름차순으로 비축소 끝으로 시작합니다. 고유한 사슬 ID는 분지화된 개체(올리고당)에 할당되어 단백질 잔기와 겹치는 잔기 번호 지정을 방지하고 모든 올리고당에 대해 일관된 번호 지정을 가능하게 합니다. 예를 들어, PDB ID 6WPS에는 동일한 단백질 사슬 A와 관련된 5개의 올리고당이 있으며, PDBx/mmCIF 및 PDB 형식 파일 모두에서 각 올리고당에 대해 고유한 사슬 ID로만 일관된 순서 및 번호 지정을 유지할 수 있습니다
보관 일관성을 위해 단일 단당류는 비중합체로 정의되고 PDB의 다른 비중합체 리간드와 일관되게 처리됩니다. 당화 부위에서 발생하는 단일 단당류는 PDBx/mmCIF 파일(_atom_site.label_asym_id)에서 고유한 사슬 ID를 갖지만 PDB 형식 파일에서는 그렇지 않습니다.
PDB ID 6WPS를 예로 들면, PDBx/mmCIF 데이터 아이템(_atom_site.label_asym_id)은 atom_site 좌표 섹션의 열 #7에 대응하며, 단백질 사슬 'A'의 ASN 61에 결합된 단일 단당류, NAG의 제1 인스턴스에 대한 비대칭 ID 'Y'를 갖는다. 'Y' 값은 이 단당류에 대해 고유합니다. 이 NAG에 대한 PDB 포맷 파일에 매핑된 PDBx/mmCIF 파일의 추가 체인 ID(_atom_site.auth_asym_id)는 사슬 'A'이며, 이는 단백질 사슬 A와 관련된 다른 비중합체 리간드로 일관되게 표현됩니다.
#
loop_ _atom_site.group_PDB
_atom_site.id
_atom_site.type_symbol
_atom_site.label_atom_id
_atom_site.label_alt_id
_atom_site.label_comp_id
_atom_site.label_asym_id
_atom_site.label_entity_id
_atom_site.label_seq_id
_atom_site.pdbx_PDB_ins_code
_atom_site.
Cartn_x _atom_site.
Cartn_y _atom_site.
Cartn_z _atom_site.점유
_atom_site.
B_iso_or_equiv _atom_site.pdbx_formal_charge
_atom_site.auth_seq_id
_atom_site.auth_comp_id
_atom_site.auth_asym_id
_atom_site.auth_atom_id
_atom_site.pdbx_PDB_model_num
...
헤타TM 27655 C C1 . NAG Y 6 입니다. ? 191.103 162.375 206.665 1.00 47.28 ? 1301년 NAG A C1 1
HETATM 27656 C C2 . NAG Y 6 입니다. ? 191.067 161.665 208.065 1.00 47.22 ? 1301년 NAG A C2 1
HETATM 27657 C C3 . NAG Y 6 입니다. ? 190.138 160.434 207.960 1.00 47.42 ? 1301년 NAG A C3 1
HETATM 27658 C C4 . NAG Y 6 입니다. ? 188.730 160.906 207.541 1.00 48.73 ? 1301년 NAG A C4 1
HETATM 27659 C C5. NAG Y 6 입니다. ? 188.838 161.622 206.176 1.00 48.66 ? 1301년 NAG A C5 1
HETATM 27660 C C6 . NAG Y 6 입니다. ? 187.494 162.153 205.709 1.00 48.17 ? 1301년 NAG A C6 1
HETATM 27661 C C7 . NAG Y 6 입니다. ? 193.233 161.885 209.217 1.00 47.40 ? 1301년 NAG A C7 1
HETATM 27662 C C8 . NAG Y 6 입니다. ? 194.594 161.311 209.471 1.00 47.45 ? 1301년 NAG C8 1
HETATM 27663 N N2 . NAG Y 6 입니다. ? 192.418 161.218 208.414 1.00 47.36 ? 1301년 NAG N2 1
HETATM 27664 O O3 . NAG Y 6 입니다. ? 190.069 159.774 209.231 1.00 47.22 ? 1301년 NAG A O3 1
HETATM 27665 O O4 . NAG Y 6 입니다. ? 187.867 159.778 207.435 1.00 48.89 ? 1301년 NAG A O4 1
HETATM 27666 O O5 . NAG Y 6 입니다. ? 189.760 162.757 206.285 1.00 47.83 ? 1301년 NAG A O5 1
HETATM 27667 O O6 . NAG Y 6 입니다. ? 186.953 163.102 206.622 1.00 49.06 ? 1301년 NAG A O6 1
HETATM 27668 O O7 . NAG Y 6 입니다. ? 192.879 162.950 209.739 1.00 47.58 ? 1301년 NAG O7 1
...
올리고당에 대한 저자 제공 체인 ID 및 잔기 번호 지정은 PDBx/mmCIF 파일(각각 _pdbx_branch_scheme.auth_mon_id 및 _pdbx_branch_scheme.auth_seq_num)에 유지됩니다. 사용자는 매핑 범주를 사용하여 해당 기본 인용에서 탄수화물을 설명하는 방법을 PDBx/mmCIF 파일에 매핑_pdbx_branch_scheme 수 있습니다. wwPDB는 예금자가 모든 출판물 자료에 wwPDB가 할당한 체인 ID와 잔여 번호를 사용할 것을 강력히 권장합니다.
예를 들어, PDB 항목 6WPS에서
loop_ _pdbx_branch_scheme.asym_id
_pdbx_branch_scheme.entity_id
_pdbx_branch_scheme.mon_id
_pdbx_branch_scheme.num
_pdbx_branch_scheme.pdb_asym_id
_pdbx_branch_scheme.pdb_mon_id
_pdbx_branch_scheme.pdb_seq_num
_pdbx_branch_scheme.auth_asym_id
_pdbx_branch_scheme.auth_mon_id
_pdbx_branch_scheme.auth_seq_ 숫자
_pdbx_branch_scheme.헤테테로
J 4 NAG 1 I NAG 1 A NAG 1310 n
J 4 NAG 2 I NAG 2 A NAG 1311 n
K 4 NAG 1 J NAG 1 A NAG 1312 n
K 4 NAG 2 J NAG 2 A NAG 1313 n
L 4 NAG 1 K NAG 1 A NAG 1315 n
L 4 NAG 2 K NAG 2 A NAG 1316 n
M 4 NAG 1 M NAG 1 NAG 1 NAG 1317 N
M 4 NAG 2 M NAG 2 A NAG 1318 N
N 5 NAG 1 N NAG 1 A NAG 1321 N
N 5 NAG 2 N NAG 2 A NAG 1322 N
N 5 BMA 3 N BMA 3 A BMA 1323 N
N 5 남자 4 N 남자 4 A 남자 1325 N
N 5 남자 5 N 남자 5 남자 1324 N
N 5 FUC 6 N FUC 6 A FUC 1320 N
O 4 NAG 1 O NAG 1 B NAG 1310 N
O 4 NAG 2 O NAG 2 B NAG 1311 n
P 4 NAG 1 P NAG 1 B NAG 1312 N
P 4 NAG 2 P NAG 2 B NAG 1313 n
Q 4 NAG 1 Q NAG 1 B NAG 1315 n
Q 4 NAG 2 Q NAG 2 B NAG 1316 n
R 4 NAG 1 R NAG 1 B NAG 1317 N
R 4 NAG 2 R NAG 2 B NAG 1318 N
S 5 NAG 1 S NAG 1 B NAG 1321 N
S 5 NAG 2 S NAG 2 B NAG 1322 N
S 5 BMA 3 S BMA 3 B BMA 1323년 N
S 5 남자 4 S 남자 4 B 남자 1325 N
S 5 남자 5 S 남자 5 B 남자 1324 N
S 5 FUC 6 S FUC 6 B FUC 1320 n
...
일부 사용자가 지적했듯이 대부분의 천연 N-글리칸은 PDB ID 6WPS에서 모델링된 것과 같은 5개의 단당류 또는 푸코실화된 버전의 공통 코어의 줄기를 가져야 하기 때문에 단일 NAG는 저자가 구축하기로 선택한 글라이칸의 일부일 수 있습니다. 그러나 PDB는 지원 실험 데이터를 기반으로 모델 좌표가 구축되는 3D 원자 좌표 아카이브입니다. 그러므로, 탄수화물은 추정된 올리고당 서열의 누락된 성분에 대한 참조 없이 모델링된 구조에서 있는 그대로 설명됩니다. 저자가 단당류만 만드는 경우 이 단당류는 비중합체 리간드로 설명됩니다.
모든 당화(glycosylation) 부위를 쉽게 검색할 수 있도록 당화(glycosylation) 주석이 제공되었습니다. 총 45,000개의 당화 부위가 7,500개 이상의 PDB 구조에서 _struct_conn.pdbx_role에 주석을 달아 모든 당화 부위와 이러한 부위에 결합된 단당류를 식별했습니다. 주석은 당화 부위, 단당류 동일성 및 사슬 ID를 PDB 형식 또는 mmCIF 형식으로 지정합니다. PDB ID 6WPS에서 사용자는 '_struct_conn.pdbx_role'에서 N-Glycosylation을 검색하고, A쇄에서만 ASN과 NAG 사이의 16개의 당화 부위를 찾을 수 있다.
또한, 총 1040개의 탄수화물 리간드를 검토했으며 1996년 IUPAC 권장 사항을 따르기 위해 PDB에서 명명법을 표준화했습니다. 화학 성분 사전의 단당류 업데이트에는 화학 이름, 동의어, 원자 라벨, 변형 대 일반 당 태그, 화학 유형(예: 이성질체), 구조 특징 유형(예: 아노머) 및 기호 식별자(예: IUPAC 응축 기호)가 포함됩니다. PDBx/mmCIF 데이터 항목 _chem_comp.name에 제공된 화학명은 IUPAC 권장 사항에 설명된 대로 입체 및 고리별 계통 이름을 포함하도록 균일하게 업데이트되었습니다. 단순하거나 일반적인 이름은 새 PDBx/mmCIF 범주 _pdbx_chem_comp_synonyms에서 행당 하나의 이름으로 주석이 추가됩니다. 1996년 권고안의 섹션 2-Carb-38.3에 기술된 바와 같은 IUPAC 확장 형태 기호와 2-Carb-38.4의 압축된 형태 기호는 모두 PDBx/mmCIF 데이터 항목의 식별자_pdbx_chem_comp_identifier.identifier에 제공된다. PDBx/mmCIF 범주 _pdbx_chem_comp_feature에 설명된 이성질체, 고리 크기, 아노머 및 알도오스/케토오스 분류와 같은 탄수화물 특징.
wwPDB는 커뮤니티가 고정된 레거시 PDB 파일 형식 대신 PDB/mmCIF 형식 파일을 사용하도록 권장합니다. 레거시 형식은 큰 구조를 지원할 수 없습니다. 현재 PDB 형식 파일은 62개 이상의 체인 또는 99,999개 이상의 원자가 있는 대형 구조에는 사용할 수 없습니다. 또한 레거시 형식은 향후 몇 년 동안 필요할 3자 이상의 리간드 ID 코드를 지원할 수 없습니다.
wwPDB는 PDB 아카이브의 데이터 표현을 개선하기 위해 최선을 다하고 있습니다. 부담없이 info@wwpdb.org 로 문의하십시오.
12/06/2020
NMR 구속 검증은 이제 OneDep을 통해 사용할 수 있습니다.
OneDep에서 제공되는 wwPDB 유효성 검사 보고서에는 이제 사용자가 데이터의 잠재적인 불일치를 식별하는 데 도움이 되는 NMR 항목에 대한 제한 유효성 검사가 포함됩니다.
구속 데이터를 검증하는 방법에 대한 wwPDB NMR 검증 태스크 포스(VTF)의 권장 사항이 게시되었습니다(10.1016/j.str.2013.07.021). 그 이후로 wwPDB는 NMR 커뮤니티와 협력하여 구속 데이터의 검증을 가능하게 하는 NMR 교환 형식(NEF) 사전(10.1038/nsmb.3041)을 개발했습니다.
2020년 3월, OneDep은 NMR 실험 데이터(화학적 이동 및 구속)를 NMR-STAR 또는 NEF 형식의 단일 파일로 수락하도록 구성되었습니다. 이제 NMR 제한 데이터 유효성 검사가 wwPDB 유효성 검사 패키지에 통합되었습니다. OneDep에서 생성된 검증 보고서는 구속이 NEF 또는 NMR-STAR 형식으로 증착될 때 NMR 구속 분석을 포함하도록 확장되었습니다.
wwPDB 검증 보고서의 구속조건 분석 내용에는 구조적 제한 구속조건, 잔여 구속조건 위반, 모델당 평균 거리 및 이면각 구속 위반 횟수, 각 모델 및 앙상블에 대한 거리 및 이면각 위반 분석이 그래픽 및 표 형식 통계를 사용하여 포함됩니다.
이러한 기능은 예금자와 사용자 모두 NMR 데이터의 잠재적인 오류를 식별하는 데 도움이 됩니다.
NMR 항목에 대한 검증 보고서에 대한 추가 정보를 사용할 수 있습니다.
wwPDB 유효성 검사에 대한 질문이나 질문이 있는 경우 validation@mail.wwpdb.org 로 문의하십시오.
거리 제한 및 위반 분포
이면체 각도 및 위반의 분포.
10/20/2020
PDB, 49주년
PDB는 1971년 10월 20일 Crystallography: Protein Data Bank Nature New Biology 233:223 (1971) doi: 10.1038/newbio233223b0에 발표되었다.
오늘날 PDB 아카이브에는 ~170,000개의 단백질, 핵산 및 복잡한 어셈블리 구조가 포함되어 있어 학생과 연구원이 단백질 합성에서 건강 및 질병에 이르기까지 생물 의학 및 농업의 모든 측면을 이해하는 데 도움이 됩니다. PDB를 글로벌 커뮤니티에서 자유롭게 공개적으로 사용할 수 있도록 하는 wwPDB(Worldwide PDB) 조직에서 관리합니다.
wwPDB는 2021년에 계획된 황금 기념일 심포지엄 및 행사를 앞두고 축하하고 있습니다. 웹사이트 wwpdb.org/pdb50 는 정기적으로 업데이트됩니다.
50주년이 다가옴에 따라 wwPDB 재단에 기부 하여 PDB의 개방, 협력 및 교육 정신을 지원하는 것을 고려하십시오.
wwPDB 재단은 2010년 wwPDB의 봉사 활동을 지원하기 위한 기금을 마련하기 위해 설립되었습니다. 재단은 아카이브 40주년을 기념하는 심포지엄인 PDB40을 지원하기 위해 기금을 모금했습니다. 워크샵; 및 교육 간행물.
재단은 과학, 문학, 자선 및 교육 목적만을 위한 501(c)(3) 단체로 인가되었습니다.
개인 기부($100 이상 권장)는 헤모글로빈 옷깃 핀을 특별 선물로 드립니다.
09/22/2020
릴리스된 PDB 구조에 대한 업데이트된 유효성 검사 보고서
이제 PDB 아카이브에 릴리스된 모든 X선, NMR 및 3DEM 구조에 대한 업데이트된 검증 보고서를 사용할 수 있습니다.
업데이트에는 2019년 12월 31일의 PDB 아카이브 상태를 반영하는 새로운 백분위수 통계와 유효성 검사 보고서 생성에 사용되는 계산된 맵 계수가 포함됩니다.
업데이트된 보고서는 다음 FTP 사이트에서 액세스할 수 있습니다.
6월 10일 이전 버전의 스냅샷은 RCSB PDB 및 PDBj에 보관됩니다.
이 업데이트된 wwPDB 검증 보고서는 검증 태스크 포스에서 근무하는 커뮤니티 전문가가 권장하는 널리 인정되는 표준 및 기준을 사용하여 구조 품질에 대한 평가를 제공합니다.
탄수화물 개선 프로젝트에서 최근 도입된 탄수화물 섹션 및 올리고당에 대한 2D Symbol Nomenclature For Glycan(SNFG) 이미지 외에도 이 보고서는 이제 리간드 검증의 시각화 및 X선 리간드의 전자 밀도 맵에 대한 모델 적합성을 통합합니다. 여기에는 리간드의 2차원 다이어그램이 포함되며, 기하학적 검증 기준을 강조하고, 결정학에 의해 결정된 구조의 경우 전자 밀도에 대한 3차원 보기가 포함됩니다.
또한 EM 맵 분석 및 맵 볼륨에 대한 EM 모델의 적합성. FSC 곡선은 또한 절반 맵 또는 FSC 데이터가 업로드된 보고된 해상도와 예상 해상도를 비교하기 위해 포함되어 있습니다.
검증 보고서는 구조 데이터의 검증, 증착 및 바이오큐레이션을 위한 wwPDB 포털인 OneDep을 통해 예금자에게 제공됩니다. wwPDB 파트너는 데이터 증착 전에 언제든지 독립형 유효성 검사 서버 및 웹 서비스 API를 사용할 것을 권장합니다. 예치자는 데이터 제출 절차의 일환으로 보고서를 검토하고 수락해야 합니다. 검증 보고서는 X-ray, NMR, EM에 대한 전문 VTF(Validation Task Force)의 권장 사항을 받고 예금자 및 사용자로부터 피드백을 수집함에 따라 계속 개발 및 개선될 것입니다.
wwPDB 파트너는 저널 편집자와 심사위원이 원고 제출 및 검토 과정의 일환으로 저자의 보고서를 요청할 것을 강력히 권장하며, 이는 Nature, eLife, The Journal of Biological Chemistry, IUCr(International Union of Crystallography) 저널, FEBS 저널, Journal of Immunology 및 Angew Chem Int Ed Engl에서 이미 요구하고 있습니다. 보고서에는 날짜가 지정되고, wwPDB 로고가 표시되며, 표준화된 wwPDB 유효성 검사를 나타냅니다.
추가 정보 및 샘플 검증 보고서는 wwpdb.org 에서 확인할 수 있습니다.
귀하의 피드백, 의견 및 질문은 validation@mail.wwpdb.org 에서 환영합니다.
07/28/2020
PDB에서 향상된 탄수화물 데이터 활용
PDB 항목 및 참조 데이터에서 탄수화물에 대한 새로운 데이터 표현은 고분자 구조에서 이러한 분자의 발견 가능성과 상호 운용성을 향상시킵니다. 이제 PDB 아카이브에 다음이 반영됩니다.
수정된 PDB 항목 목록을 포함하여 이 프로젝트에 대한 자세한 정보는 wwPDB 웹 사이트에서 확인할 수 있습니다. PDB 데이터를 생성, 액세스 또는 시각화하는 소프트웨어 패키지 개발자는 2020년 2월 공지에서 강조한 대로 이 정보를 검토하고 가능한 한 빨리 소프트웨어를 조정하는 것이 좋습니다.
이 수정을 위해 PDB 항목, CCD, PRD 및 PDB와 호환되지 않는 항목의 목록이 작성되었습니다.
wwPDB는 다당류에 대한 새로운 '분기된' 엔티티 표현을 만들어 PDB 항목에서 이들의 모든 개별 단당류 구성 요소를 설명합니다. 이 과정의 일환으로 CCD(Chemical Component Dictionary)에서 >1,000개의 단당류에 대한 원자 명명법을 표준화하고 올리고당에 분지화된 개체 표현을 적용했습니다(>8,000개의 PDB 항목). 영향을 받는 PDB 항목에서 올리고당의 명확한 화학적 설명을 보장하기 위해, 이들의 단당류 단위 간의 공유 결합 정보에 대한 명시적인 설명이 포함되어 있습니다. 또한 wwPDB 검증 보고서는 이러한 올리고당에 대한 일관된 표현을 제공하며 SNFG(Symbol Nomenclature for Glycans)를 기반으로 하는 2D 표현을 포함합니다.
탄수화물 표현의 개선을 지원하기 위해 PDB 데이터를 당생물학자가 일반적으로 사용하는 다른 표현으로 쉽게 변환할 수 있도록 당과학 커뮤니티와 협력하여 선형 설명자를 제공하는 소프트웨어 도구를 개발했습니다. 여기에는 조지아 대학의 GMML의 Condense IUPAC, 일본 노구치 연구소의 PDB2Glycan의 WURCS, 독일 pdb-care의 LINUCS가 포함됩니다.
wwPDB는 또한 이 기회를 활용하여 새로운 _pdbx_chem_comp_synonyms 데이터 범주를 도입하여 CCD에서 화학 동의어의 구성을 개선했습니다. 이를 통해 PDB의 소분자에 대한 대체 이름을 보다 포괄적으로 캡처할 수 있습니다. 사용자 중단을 최소화하기 위해 레거시 데이터 항목인 _chem_comp.pdbx_synonyms는 2021년까지 전환 기간 동안 유지됩니다.
탄수화물 정화 프로젝트는 뉴저지 주립대학교 럿거스(Rutgers)의 RCSB PDB가 주로 수행하는 wwPDB 협력 프로젝트로, 럿거스(Rutgers)의 RCSB PDB의 하위 수혜자인 재스민 영(Jasmine Young) 박사와 협력하여 조지아 대학교 복합 탄수화물 연구 센터의 로버트 우즈(Robert Woods) 박사와 국립암연구소(National Cancer Institute) 협력 계약 U01 CA221216를 통해 NIH Common Fund Glycoscience Program의 자금 지원을 받습니다.
이러한 변경 사항에 대한 의견이나 질문이 있는 경우 wwPDB 탄수화물 수정 웹사이트를 방문하거나 deposit-help@mail.wwpdb.org 로 문의하십시오.
07/07/2020
7월 29일 출시 예정: PDB의 탄수화물 데이터 개선
PDB 데이터는 PDB 항목의 탄수화물에 대한 새로운 데이터 표현과 고분자 구조에서 이러한 분자의 발견 가능성과 상호 운용성을 개선하는 참조 데이터를 통합합니다. 아카이브 전체에서 탄수화물의 표현을 수정하고 개선하기 위해 wwPDB는 다음을 수행합니다.
2020년 7월 29일부터 사용자는 FTP 또는 wwPDB 파트너 웹사이트를 통해 개선된 데이터에 액세스할 수 있습니다. PDB 데이터를 생성, 액세스 또는 시각화하는 소프트웨어 패키지 개발자는 2020년 2월 공지에서 강조한 대로 이 정보를 검토하고 가능한 한 빨리 소프트웨어를 조정하는 것이 좋습니다. 이 프로젝트에 대한 자세한 정보는 wwPDB 웹 사이트에서 확인할 수 있습니다. 영향을 받는 항목 및 화학 성분 목록은 데이터 발표 후 이 페이지에 게시됩니다.
wwPDB는 다당류에 대한 새로운 '분기된' 엔티티 표현을 만들어 PDB 항목에서 이들의 모든 개별 단당류 구성 요소를 설명합니다. 이 프로세스의 일환으로 CCD(Chemical Component Dictionary)에서 >1,000개의 단당류에 대한 원자 명명법을 표준화하고 >8000개의 PDB 항목에 대해 올리고당에 분지화된 개체 표현을 적용했습니다. 영향을 받는 PDB 항목에서 올리고당의 명확한 화학적 설명을 보장하기 위해, 이들의 단당류 단위 간의 공유 결합 정보에 대한 명시적인 설명이 포함되어 있습니다. 또한 wwPDB 검증 보고서는 이러한 올리고당에 대한 일관된 표현을 제공하며 SNFG(Symbol Nomenclature for Glycans)를 기반으로 하는 2D 표현을 포함합니다.
탄수화물 표현의 개선을 지원하기 위해 PDB 데이터를 당생물학자가 일반적으로 사용하는 다른 표현으로 쉽게 변환할 수 있도록 당과학 커뮤니티와 협력하여 선형 설명자를 제공하는 소프트웨어 도구를 개발했습니다. 여기에는 조지아 대학의 GMML의 Condense IUPAC, 일본 노구치 연구소의 PDB2Glycan의 WURCS, 독일 pdb-care의 LINUCS가 포함됩니다.
또한, 118개의 일반적인 올리고당(예: 자당, Lewis Y 항원)의 지속적인 발견 가능성을 보장하기 위해 이러한 분자에 대한 공유 결합 정보와 공통 동의어를 포함하는 생물학적으로 흥미로운 분자 참조 사전(BIRD)을 확장했습니다.
wwPDB는 또한 이 기회를 활용하여 새로운 _pdbx_chem_comp_synonyms 데이터 범주를 도입하여 CCD에서 화학 동의어의 구성을 개선했습니다. 이를 통해 PDB의 소분자에 대한 대체 이름을 보다 포괄적으로 캡처할 수 있습니다. 사용자 중단을 최소화하기 위해 레거시 데이터 항목인 _chem_comp.pdbx_synonyms는 2021년까지 전환 기간 동안 유지됩니다.
탄수화물 정화 프로젝트는 주로 뉴저지 주립 대학교 럿거스의 RCSB PDB가 수행하고 조지아 대학교의 복합 탄수화물 연구 센터와 협력하여 NIGMS 보조금 U01 CA221216 자금을 지원하는 wwPDB 협력 프로젝트입니다.
이러한 변경 사항에 대한 의견이나 질문이 있는 경우 wwPDB 탄수화물 수정 웹사이트를 방문하거나 deposit-help@mail.wwpdb.org 로 문의하십시오.
04/09/2020
업데이트된 PDB-Dev 웹 사이트
이제 새롭고 향상된 PDB-Dev 웹 사이트를 사용할 수 있습니다. PDB-Dev는 wwPDB 파트너가 통합 구조 보관의 요구 사항을 이해하는 데 도움이 되는 프로토타입 시스템입니다. wwPDB 통합/하이브리드 방법(I/HM) 태스크 포스의 권장 사항을 기반으로 구축되었습니다. PDB-Dev는 현재 37개의 고분자 복합체의 통합 구조로 구성되어 있습니다.
업데이트된 PDB-Dev 웹 인터페이스는 동적 및 응답형 웹 페이지를 제공하며 다음과 같은 두 가지 새로운 기능을 포함합니다.
PDB-Dev 팀은 사용자의 피드백을 환영합니다. pdb-dev@mail.wwpdb.org 에 의견과 제안을 보내주십시오.
04/07/2020
EMDB의 맵 입력 릴리스 프로세스 간소화
2020년 4월 15일부터 EMDB(Electron Microscopy Data Bank)는 기본 맵 및 관련 파일을 릴리스하기 전에 맵 항목 메타데이터(소위 XML 헤더 파일)를 공개하는 관행을 종료합니다.
새 EMDB 맵 증착의 경우 이 메타데이터는 맵이 릴리스될 때까지 EMDB FTP 공개 아카이브에서 공개적으로 사용할 수 없습니다. 메타데이터가 이미 릴리스된 보류 항목의 경우 맵이 릴리스될 때까지 사용 가능한 데이터가 변경되지 않습니다. EMDB는 예금자들이 가능한 한 빨리 맵 항목을 공개할 것을 강력히 권장합니다.
EMDB 헤더 파일의 시험판 폐지는 EMDB와 wwPDB의 정책 및 절차를 조화시키는 프로세스의 일부입니다. EMDB 정책에 대한 자세한 내용은 https://www.ebi.ac.uk/pdbe/emdb/policies.html 참조하십시오.
02/25/2020
2020년 PDB의 탄수화물 개선
2020년 7월, wwPDB는 탄수화물 분자의 표준화된 표현으로 업데이트된 PDB 구조 및 참조 데이터 파일을 출시하여 PDB 데이터의 검색 가능성과 상호 운용성을 개선할 예정입니다. 이 작업에 대한 자세한 정보는 PDBx/mmCIF 사전 확장 및 500개 이상의 예제 파일을 포함하여 wwPDB 웹 사이트에서 확인할 수 있습니다. PDB 데이터를 생성, 액세스 또는 시각화하는 소프트웨어 패키지 개발자는 이 정보를 검토하고 소프트웨어를 조정하는 것이 좋습니다.
당과학 커뮤니티와의 협력을 통해 CCD(Chemical Component Dictionary)에 있는 약 800개의 단당류에 대한 원자 명명법을 표준화하기 위한 소프트웨어 도구를 개발했으며, PDB 아카이브 내의 올리고 및 다당류에 분지형 고분자 표현을 적용하여 당생물학자가 일반적으로 사용하는 다른 표현으로 쉽게 번역할 수 있도록 했습니다. 영향을 받는 약 12,000개의 PDB 항목 각각에서 올리고/다당류에 대한 명확한 화학적 설명을 보장하기 위해 단량체 단위 간의 공유 결합 정보에 대한 명시적인 설명을 포함했습니다. 일반적인 올리고당(예: 자당, Lewis X 인자)의 지속적인 발견 가능성을 보장하기 위해 당사는 이러한 분자에 대한 공유 결합 정보와 공통 동의어를 포함하는 생물학적으로 흥미로운 분자 참조 사전(BIRD)을 확장했습니다.
wwPDB는 또한 이 기회를 통해 새로운 _pdbx_chem_comp_synonyms 데이터 범주를 도입하여 CCD의 화학 동의어 구성을 개선하고 있습니다. 이를 통해 PDB의 소분자에 대한 대체 이름을 보다 포괄적으로 캡처할 수 있습니다. 사용자의 중단을 최소화하기 위해 레거시 데이터 항목인 _chem_comp.pdbx_synonyms가 유지되는 초기 전환 기간이 있습니다.
표시된 PDB 구조: 1b5f
02/18/2020
이전에 릴리스된 좌표를 개선하고 원래 PDB ID: 2단계 유지
2020년 2월 18일부터 릴리스된 PDB 구조의 작성자(PI)가 동일한 PDB 액세스 코드를 유지하면서 모델 좌표를 업데이트하여 원본 게시와의 링크를 유지할 수 있음을 발표하게 되어 기쁩니다. 이 프로젝트의 두 번째이자 마지막 단계에서는 증착, 검증 및 바이오큐레이션을 위한 일반적인 wwPDB 시스템인 OneDep을 출시하기 전에 예치된 구조로 버전 관리 기능을 확장했습니다.
OneDep을 통해 입금된 항목의 경우 입금자는 deposit.wwpdb.org 에 해당 세션에 로그인하고 OneDep 커뮤니케이션 패널을 통해 요청을 제출해야 합니다. 레거시 시스템을 통해 제출된 항목의 경우 deposit-help@mail.wwpdb.org 에 이메일을 보내고 이메일 제목과 본문에 PDB 코드를 포함하여 요청을 시작해야 합니다. 제출된 수정된 모델은 wwPDB 생물 큐레이터에 의해 처리되고 업데이트된 버전은 기탁자의 승인 즉시 공개됩니다. PDB 항목의 버전 관리는 좌표 파일의 변경으로 제한되며 기탁된 실험 데이터에 대한 변경은 허용되지 않습니다. wwPDB 바이오큐레이션 리소스에 미치는 영향을 제한하기 위해 PDB 버전 관리는 현재 PDB 항목당 연간 1회, 연구책임자당 연간 3회로 제한됩니다. 이 제한은 2021년에 검토될 예정입니다.
최신 버전의 항목은 PDB 보관 FTP(ftp.wwpdb.org)에서 사용할 수 있습니다. PDB 구조의 모든 주 버전은 버전이 지정된 FTP 보관 파일(ftp-versioned.wwpdb.org)에 보존되며, 자세한 내용은 wwPDB 웹 사이트에서 확인할 수 있습니다. 버전이 지정된 FTP 아카이브의 구조는 PDB 코드 형식의 향후 확장을 허용하도록 구축되었습니다. 따라서 PDB 항목 1abc는 pdb_00001abc 폴더에서 찾을 수 있습니다.
Changes made to entries during versioning are considered to be either major or minor. Updates to atomic coordinates, polymer sequence, or chemical description trigger a major version increment, while changes to any other categories are classified as minor. Changes introduced are recorded in the PDBx/mmCIF audit categories.
If you have any further queries regarding the process of PDB versioning, please contact the wwPDB at deposit-help@mail.wwpdb.org.
02/04/2020
New Coronavirus Protease Structure Available
PDB data provide a starting point for structure-guided drug discovery
A high-resolution crystal structure of COVID-19 (2019-nCoV) coronavirus 3CL hydrolase (Mpro) has been determined by Zihe Rao and Haitao Yang's research team at ShanghaiTech University. Rapid public release of this structure of the main protease of the virus (PDB 6lu7) will enable research on this newly-recognized human pathogen.
Recent emergence of the COVID-19 coronavirus has resulted in a WHO-declared public health emergency of international concern. Research efforts around the world are working towards establishing a greater understanding of this particular virus and developing treatments and vaccines to prevent further spread.
https://doi.org/10.2210/pdb6lu7/pdb
While PDB entry 6lu7 is currently the only public-domain 3D structure from this specific coronavirus, the PDB contains structures of the corresponding enzyme from other coronaviruses. The 2003 outbreak of the closely-related Severe Acute Respiratory Syndrome-related coronavirus (SARS) led to the first 3D structures, and today there are more than 200 PDB structures of SARS proteins. Structural information from these related proteins could be vital in furthering our understanding of coronaviruses and in discovery and development of new treatments and vaccines to contain the current outbreak.
The coronavirus 3CL hydrolase (Mpro) enzyme, also known as the main protease, is essential for proteolytic maturation of the virus. It is thought to be a promising target for discovery of small-molecule drugs that would inhibit cleavage of the viral polyprotein and prevent spread of the infection.
Comparison of the protein sequence of the COVID-19 coronavirus 3CL hydrolase (Mpro) against the PDB archive identified 95 PDB proteins with at least 90% sequence identity. Furthermore, these related protein structures contain approximately 30 distinct small molecule inhibitors, which could guide discovery of new drugs. Of particular significance for drug discovery is the very high amino acid sequence identity (96%) between the COVID-19 coronavirus 3CL hydrolase (Mpro) and the SARS virus main protease (PDB 1q2w). Summary data about these closely-related PDB structures are available (CSV) to help researchers more easily find this information. In addition, the PDB houses 3D structure data for more than 20 unique SARS proteins represented in more than 200 PDB structures, including a second viral protease, the RNA polymerase, the viral spike protein, a viral RNA, and other proteins (CSV).
Public release of the COVID-19 coronavirus 3CL hydrolase (Mpro), at a time when this information can prove most vital and valuable, highlights the importance of open and timely availability of scientific data. The wwPDB strives to ensure that 3D biological structure data remain freely accessible for all, while maintaining as comprehensive and accurate an archive as possible. We hope that this new structure, and those from related viruses, will help researchers and clinicians address the COVID-19 coronavirus global public health emergency.
01/14/2020
Distribution of NMR data in a unified format at the PDB archive
The wwPDB partners are pleased to announce that as of March 2020 the OneDep system will begin accepting upload of NMR experimental data as a single file, either in NMR-STAR or NEF format. This will start the transition from the current practice where distinct types of NMR data such as assigned chemical shifts, restraints, and peak lists are uploaded separately.
NMR-STAR is the official wwPDB format for storing NMR data, supported by an extensive dictionary [GitHub; Ulrich, E. L. et al. (2019) NMR-STAR: comprehensive ontology for representing, archiving and exchanging data from nuclear magnetic resonance spectroscopic experiments Journal of Biomolecular NMR, 73: 5–9. doi: 10.1007/s10858-018-0220-3], while NEF (NMR exchange format; Gutmanas et al. (2015) NMR Exchange Format: a unified and open standard for representation of NMR restraint data Nature Structural & Molecular Biology 22: 433–434 doi: 10.1038/nsmb.3041) is a light-weight format and dictionary, supported by the leading software in NMR structure determination. The use of these two interconvertible standard formats as single data files will simplify the process of deposition, as well as the storage and distribution of this data.
For newly deposited entries accompanied by such a unified data file, the NMR data will be distributed in the PDB FTP area as single files in the NMR-STAR format. A best effort conversion to the NEF format will also be provided. These unified NMR data files will be added to a new FTP directory, “nmr_data” in parallel to the existing directories, nmr_restraints and nmr_chemical shifts. In addition, to support existing users these unified files that contain both restraints and chemical shift data will be copied to the existing directories “nmr_restraints” and “nmr_chemical_shifts”.
A standardized naming convention for NMR unified data will also be developed to simplify access of the relevant NMR data. File naming will start with PDB accession code, followed by nmr_data with format type extension, for example ‘2lcb_nmr_data.nef’ or ‘2lcb_nmr_data.str’.
We plan to begin accepting and distributing NMR data as unified files from March 2020.
01/10/2020
EMDB policy and procedures document now available
A comprehensive policy and procedures document for the EMDB archive has been drawn up by the EMDB team in order to ensure consistent and coherent rules for its data. The document is now available to view on the EMDB website.
Since its foundation in 2002, the Electron Microscopy Data Bank (EMDB; https://emdb-empiar.org/) archives publicly available three-dimensional (3D) electron cryo-microscopy (cryo-EM) maps and tomograms of biomacromolecules, their complexes and cellular structures. Following the release of the first eight EMDB entries in 2002, the EMDB archive grew steadily and currently stands at almost 10000 released maps. From 2016, EMDB entries are deposited and processed through the wwPDB OneDep system while the biocuration workload is shared geographically by the EMDB, PDBe, RCSB PDB and PDBj teams.
The policy outlines the requirements for data deposition, accepted formats, entry modifications and release. For example, the policy recommends for single-particle depositions to include a primary map (as shown in the accompanying publication), a raw map (unmasked, unfiltered, unsharpened) and unmasked half-maps, as well as any auxiliary files such as Fourier Shell Correlation (FSC) data. In the document EMDB also advises that the official wwPDB validation report generated after biocuration, which now includes EM map/tomogram validation and, if applicable, map-model validation, is provided to journal editors and referees as part of the manuscript submission and review process.
In response to the cryo-EM community’s increasing demand to make all data publicly available, EMDB strongly encourages the deposition of all atomic models to the Protein Data Bank (PDB), all 3D EM reconstructions to EMDB and all raw data (including tilt series for tomograms) to the Electron Microscopy Public Image Archive (EMPIAR ). Related entries in these archives reference one another, making the deposited data easily discoverable and accessible to the community.
The EMDB team and its umbrella organisation wwPDB, welcome feedback from EMDB users and depositors on the policies and procedures through emdbhelp@ebi.ac.uk.
01/08/2020
Time-stamped Copies of PDB and EMDB Archives
2020년 1월 1일 현재 PDB Core 아카이브(ftp://ftp.wwpdb.org)의 스냅샷이 ftp://snapshots.wwpdb.org 및 ftp://snapshots.pdbj.org 에 추가되었습니다. 스냅샷은 2005년부터 매년 보관되어 PDB 아카이브 연구를 위해 쉽게 식별할 수 있는 데이터 세트를 제공합니다.
20200101 디렉토리에는 실험적으로 결정된 159,140개의 구조와 그 당시 사용 가능한 실험 데이터가 포함되어 있습니다. 원자 좌표 및 관련 메타데이터는 PDBx/mmCIF, PDB 및 XML 파일 형식으로 사용할 수 있습니다. 각 파일의 날짜 및 타임스탬프는 파일이 마지막으로 수정된 시간을 나타냅니다. PDB Core 아카이브의 스냅샷은 575GB입니다.
2020년 1월 1일 현재 EMDB 코어 아카이브(ftp://ftp.ebi.ac.uk/pub/databases/emdb/)의 스냅샷은 ftp://ftp.ebi.ac.uk/pub/databases/emdb_vault/20200101/ 및 ftp://snapshots.pdbj.org/20200101/ 에서 찾을 수 있습니다. EMDB 코어 아카이브의 스냅샷에는 릴리스된 항목과 사용되지 않는 항목(각각 10370 및 130)에 대한 XML 파일 내의 맵 파일 및 해당 메타데이터가 포함되어 있으며 크기는 1.7TB입니다.
RCSB PDB 명령 | PDBe 명령 | PDBj
지침
스냅샷 보관
RCSB PDB(https) | RCSB PDB(FTP) | PDBj
wwPDB 인용 :
Nature Structural Biology 10, 980 (2003년)
doi: 10.1038/nsb1203-980
wwPDB 회원:
© wwPDB (wwPDB)