การศึกษาประสิทธิภาพกระบวนการสร้างโพรไฟล์ด้วยการวิเคราะห์ค่าความคล้ายคลึง

ณลักขณา คิดเหมาะ

Abstract


งานวิจัยนี้มีวัตถุประสงค์เพื่อวิเคราะห์ผลกระทบของการกำหนดค่าความคล้ายคลึง (Similarity rate) ของสายลำดับ เพื่อนำไปใช้ในกระบวนการสร้างโพรไฟล์ให้แก่สายลำดับอินพุตและสายลำดับในฐานข้อมูล โดยการศึกษาครั้งนี้ได้นำข้อมูลจากฐานข้อมูล Greengenes ประกอบด้วย รหัสสายลำดับ ชื่อสายลำดับและลำดับดีเอ็นเอ โดยที่ความยาวของสายลำดับอินพุตจะต้องไม่เกินความยาวสายลำดับในฐานข้อมูล การประเมินผล จะวัดประสิทธิภาพจากจำนวนที่ลดลงของสายลำดับในฐานข้อมูล ความไว (Sensitivity) ของแต่ละเงื่อนไข และค่าเฉลี่ยเวลาที่ใช้ในการระบุชื่อสายลำดับ ซึ่งจะทำการเปรียบเทียบการระบุชื่อสายลำดับด้วยวิธีการแบบดั้งเดิม (Original Search) และการระบุชื่อสายลำดับด้วยโปรแกรม BLAST ร่วมกับเทคนิคที่นำเสนอ ผลการศึกษาพบว่า การกำหนดอัตราค่าความคล้ายคลึงที่ >80% ให้ผลลัพธ์ดีที่สุด สามารถลดเวลาค้นหาโดยเฉลี่ย 51.96% (1.59 วินาทีต่อสายลำดับจาก 3.31 วินาทีต่อสายลำดับ) และค่าความไวอยู่ที่ 1.00 จากผลการเปรียบเทียบประสิทธิภาพนี้สามารถนำค่าความคล้ายคลึงที่ >80% มาใช้ในกระบวนการสร้างโพรไฟล์ให้แก่สายลำดับอินพุตและสายลำดับในฐานข้อมูล

Full Text:

Untitled

Refbacks

  • There are currently no refbacks.