RESEARCH DESCRIPTION

Project Name: การจำลองลักษณะการเกิดพันธะไดซัลไฟด์ภายในโครงสร้างโปรตีนโดยการสร้างตัวแบบจำลองสายลำดับร่วมกับวิธีพลศาสตร์เชิงโมเลกุล (Simulation of Disulphide Bonding in Protein Structure Using Sequence Modeling and Molecular Dynamics Approach)

Researcher: Jeerayut Chaijaruwanich

Organization:Science/Computer Science

Time:1 October 2007 - 30 September 2008

RESEARCHER

  1. Jeerayut Chaijaruwanich (Head of project)

BUDGET

  1. BioMedical Engineering Center 80,000 Baht

ABSTRACT

การฟอร์มตัวของพันธะไดซัลไฟด์ระหว่างซิสเทอินมีบทบาทความสำคัญในการม้วนตัว, โครงสร้าง, หน้าที่, และวิวัฒนาการ รวมถึงมีความสำคัญกับการช่วยหาแก้ปัญหาการม้วนตัวของโปรตีน การที่พันธะไดซัลไฟด์มีความห่างกันของตำแหน่งของการเกิดพันธะส่งผลให้โปรตีนตัวนั้นมีความแข็งแรงของโครงสร้าง โดยกรณีที่เมื่อสองซิสเทอินมีการเชื่อมกันด้วยพันธะไดซัลไฟด์ระหว่าง สองโปรตีนส่งผลทำให้มีความซับซ้อนทางด้านโครงสร้างและหน้าที่ สำหรับปัญหาของการทำนายการม้วนตัวของโปรตีน หรือการระบุตำแหน่งของการเกิดพันธะไดซัลไฟด์มีผลทำให้การหาโครงสร้างที่เสถียรได้รวดเร็วขึ้น ที่ผ่านมามีการเสนอวิธีทางการคำนวณเพื่อทำนายสภาวะการเกิดพันธะไดซัลไฟด์โดยอาศัยบริบทจำเพาะบริเวณและตัวบ่งชี้โดยรวมของโปรตีน คณะผู้วิจัยได้เสนอวิธีการคำนวณใหม่ที่อาศัยแบบจำลองทางคณิตศาสตร์และสถิติที่เรียกว่า conditional random fields เพื่อทำนายสภาวะการเกิดพันธะไดซัลไฟด์จากข้อมูลสายลำดับโปรตีน โครงสร้างระดับที่สองของโปรตีน และ ความสามารถในการเข้าถึงแบบสัมพัทธ์ของสารละลาย จากการทดสอบกับชุดข้อมูลที่มีซิสเทอินจำนวน 9,662 ตำแหน่งในโปรตีนจำนวน 1,018 สายพบว่าเราสามารถทำนายสภาวะการเกิดพันธะไดซัลไฟด์ของซิสเทอินได้อย่างถูกต้องสูงถึง 92.3 % โดยมีค่า precision และ recall สูงถึง 93.3% และ 93.7 %  ตามลำดับ


The formation of disulfide bonding between cysteines plays a major role in protein folding, structure, function, and evolution. It conveys important information about the protein conformation and folding. This bond connects the distant portions of the protein chain (intra-chain disulfide bond) and strengthens protein structure. For two cysteines may form a disulfide bond between different proteins (inter-chain disulfide bond), it enables a more complicated protein structures and function. In protein folding prediction, the localization of disulfide bonds can greatly reduce the search in conformational space. There have been a number of studies in the prediction of disulfide bond state of cysteines from protein sequences using computational approaches. Previously proposed methods for predicting the cysteine-bonding state in proteins have used local context and global protein descriptors. In our work, we have developed a novel method based on conditional random fields to predict the disulfide bonding state from protein primary sequence, secondary structures, and relative solvent accessibilities. Our experimental results achieve a simultaneous overall prediction accuracy, precision, and recall as high as 92.3 %, 93.3%, and 93.7 %, respectively using a dataset of 1,018 proteins containing 9,662 cysteines.