ความไวและความจำเพาะ

ความไวและความจำเพาะ เป็นค่าวัดทางสถิติที่ใช้ประเมินประสิทธิภาพของการทดสอบที่ให้ผลเป็นสองส่วน (เช่นเป็นบวกและลบ) โดย

ความไว^[1] (อังกฤษ: sensitivity) คือสัดส่วนของผลบวกที่เป็นจริงสำหรับภาวะนั้น ๆ (เช่น สัดส่วนของการตรวจพบโรคในผู้ที่ป่วยจริง) มีไวพจน์เป็นคำอื่น ๆ รวมทั้ง อัตราผลบวกจริง (true positive rate), recall, probability of detection ซึ่งใช้ในสาขาต่าง ๆ^[2]
ความจำเพาะ^[3] (อังกฤษ: specificity) คือสัดส่วนของผลลบที่เป็นจริงสำหรับภาวะนั้น ๆ (เช่น สัดส่วนของการตรวจไม่พบโรคในผู้ที่ไม่ป่วย) มีไวพจน์เป็นคำอื่น ๆ รวมทั้ง อัตราผลลบจริง (true negative rate)

ความไวจึงมีประโยชน์ในการวินิจฉัยแยกกันผลลบปลอม (false negative) เพราะว่าการทดสอบยิ่งไวเท่าไร โอกาสการได้ผลลบ (เช่น การพบว่าไม่มีโรค) ที่ไม่เป็นจริง (เช่น บุคคลจริง ๆ มีโรค) ก็น้อยลงเท่านั้น และดังนั้น ถ้าความไวอยู่ที่ 100% โอกาสได้ผลลบปลอมก็อยู่ที่ 0%^[4] และความจำเพาะจึงมีประโยชน์ในการยืนยันภาวะที่มี โดยกันผลบวกปลอม (false positive) เพราะว่าการทดสอบยิ่งจำเพาะเท่าไร โอกาสการได้ผลบวก (เช่น การพบว่ามีโรค) ที่ไม่เป็นจริง (เช่น บุคคลจริง ๆ ไม่มีโรค) ก็น้อยลงเท่านั้น และดังนั้น ถ้าความจำเพาะอยู่ที่ 100% โอกาสได้ผลบวกปลอมก็อยู่ที่ 0%^[4]

ในการทดสอบหนึ่ง ๆ ปกติจะต้องแลกเปลี่ยนข้อดีข้อเสีย ยกตัวอย่างเช่น เพื่อความปลอดภัยของท่าอากาศยาน เครื่องตรวจโลหะอาจจะตั้งให้ส่งสัญญาณเตือนแม้สำหรับวัตถุที่เสี่ยงน้อย เช่น หัวเข็มขัดหรือลูกกุญแจ (คือการตรวจมีความจำเพาะต่ำ) เพื่อลดโอกาสเสี่ยงพลาดวัตถุอันตราย (คือการตรวจมีความไวสูง) การแลกเปลี่ยนข้อดีข้อเสียเช่นนี้สามารถแสดงในกราฟเส้นโค้ง receiver operating characteristic (ROC) การทดสอบที่สมบูรณ์จะไว 100% (เช่น คนป่วยทั้งหมดมีผลบวก) และจำเพาะ 100% (เช่น คนปกติทั้งหมดมีผลลบ) แต่ว่า โดยทฤษฎีแล้ว การทดสอบทุกอย่างจะมีขอบเขตความผิดพลาดต่ำสุดที่เรียกว่า Bayes error rate

ศัพท์เฉพาะและคำอนุพันธ์
จาก confusion matrix
true positive (TP) เท่ากับ hit true negative (TN) เท่ากับ correct rejection false positive (FP) เท่ากับ false alarm, ความผิดพลาดชนิดที่ 1 false negative (FN) เท่ากับ miss, ความผิดพลาดชนิดที่ 2 sensitivity หรือ true positive rate (TPR) เท่ากับ hit rate, recall ${\mathit {TPR}}={\mathit {TP}}/P={\mathit {TP}}/({\mathit {TP}}+{\mathit {FN}})$ specificity (SPC) หรือ true negative rate ${\mathit {SPC}}={\mathit {TN}}/N={\mathit {TN}}/({\mathit {TN}}+{\mathit {FP}})$ precision หรือ positive predictive value (PPV) ${\mathit {PPV}}={\mathit {TP}}/({\mathit {TP}}+{\mathit {FP}})$ negative predictive value (NPV) ${\mathit {NPV}}={\mathit {TN}}/({\mathit {TN}}+{\mathit {FN}})$ fall-out หรือ false positive rate (FPR) ${\mathit {FPR}}={\mathit {FP}}/N={\mathit {FP}}/({\mathit {FP}}+{\mathit {TN}})=1-{\mathit {SPC}}$ false negative rate (FNR) ${\mathit {FNR}}={\mathit {FN}}/({\mathit {TP}}+{\mathit {FN}})=1-{\mathit {TPR}}$ false discovery rate (FDR) ${\mathit {FDR}}={\mathit {FP}}/({\mathit {TP}}+{\mathit {FP}})=1-{\mathit {PPV}}$ accuracy (ACC) ${\mathit {ACC}}=({\mathit {TP}}+{\mathit {TN}})/({\mathit {TP}}+{\mathit {FP}}+{\mathit {FN}}+{\mathit {TN}})$ F1 score คือ มัชฌิมฮาร์มอนิก (HM) ของ precision กับ sensitivity ${\mathit {F1}}=2{\mathit {TP}}/(2{\mathit {TP}}+{\mathit {FP}}+{\mathit {FN}})$ Matthews correlation coefficient (MCC) ${\frac {{\mathit {TP}}\times {\mathit {TN}}-{\mathit {FP}}\times {\mathit {FN}}}{\sqrt {({\mathit {TP}}+{\mathit {FP}})({\mathit {TP}}+{\mathit {FN}})({\mathit {TN}}+{\mathit {FP}})({\mathit {TN}}+{\mathit {FN}})}}}$ Informedness ${\mathit {TPR}}+{\mathit {SPC}}-1$ Markedness ${\mathit {PPV}}+{\mathit {NPV}}-1$ Sources: Fawcett (2006) and Powers (2011).^[5]^[6]

ลองสมมุติว่ากำลังประเมินการทดสอบชนิดใหม่ที่ตรวจคัดกรองโรคชนิดหนึ่ง แต่ละคนที่ทดสอบจริง ๆ มีหรือไม่มีโรค ผลสอบอาจเป็นบวก คือจัดบุคคลว่ามีโรค หรือเป็นลบ คือจัดบุคคลว่าไม่มีโรค แต่ผลของแต่ละคนอาจจะไม่เหมือนกับภาวะจริง ๆ ดังนั้น จะมีกรณีต่าง ๆ 4 อย่าง คือ

ผลบวกจริง (true positive) ผู้ป่วยตรวจพบว่ามีโรคอย่างถูกต้อง
ผลบวกปลอม (false positive) คนปกติตรวจพบว่ามีโรคอย่างไม่ถูกต้อง
ผลลบจริง (true negative) คนปกติตรวจพบว่าไม่มีโรคอย่างถูกต้อง
ผลลบปลอม (false negative) คนป่วยตรวจพบว่าไม่มีโรคอย่างไม่ถูกต้อง

โดยทั่วไป Positive = identified และ negative = rejected ดังนั้น

True positive = correctly identified
False positive = incorrectly identified
True negative = correctly rejected
False negative = incorrectly rejected

เราจะพิจารณากลุ่มทดสอบที่มีผลบวกมีจำนวน P และผลลบมีจำนวน N เนื่องจากโรคบางอย่าง ผล 4 อย่างสามารถทำเป็นตาราง contingency table หรือ confusion matrix ดังต่อไปนี้

		ภาวะ/โรค (ตรวจด้วยการตรวจมาตรฐานสูงสุด)
		เป็นโรค	ไม่เป็นโรค
ผล การตรวจ	ผล การตรวจ เป็นบวก	ผลบวกจริง	ผลบวกลวง (ความผิดพลาดชนิดที่ 1)	ค่าทำนายผลบวก = Σ ผลบวกจริง Σ ผลตรวจทั้งหมดที่เป็นบวก
ผล การตรวจ	ผล การตรวจ เป็นลบ	ผลลบลวง (ความผิดพลาดชนิดที่ 2)	ผลลบจริง	ค่าทำนายผลลบ = Σ ผลลบจริง Σ ผลตรวจทั้งหมดที่เป็นลบ
		ความไว = Σ ผลบวกจริง Σ ผู้ป่วยทั้งหมดที่เป็นโรค	ความจำเพาะ = Σ ผลลบจริง Σ ผู้ป่วยทั้งหมดที่ไม่เป็นโรค

ความไว

ความไวหมายถึงสมรรถภาพของการทดสอบในการตรวจหาคนที่มีภาวะนั้น ๆ ในตัวอย่างของเรา ค่าความไวคือสัดส่วนของบุคคลที่ได้ผลบวกจากการทดสอบในบรรดาคนที่มีโรค ซึ่งเขียนเป็นสมการได้ดังต่อไปนี้

{\begin{aligned}{\text{sensitivity}}&={\frac {\text{number of true positives}}{{\text{number of true positives}}+{\text{number of false negatives}}}}\\\\&={\frac {\text{number of true positives}}{\text{total number of sick individuals in population}}}\\\\&={\text{probability of a positive test given that the patient has the disease}}\end{aligned}}

ผลลบจากการทดสอบที่ไวสูงจะมีประโยชน์ในการกันโรคออก (ruling out) คือเชื่อถือได้เมื่อผลเป็นลบ เพราะว่ามันไม่ค่อยวินิจฉัยผู้ที่มีโรคผิด การทดสอบที่ไว 100% จะตรวจเจอคนไข้ที่มีโรคทั้งหมดโดยให้ผลบวก ดังนั้น ผลลบจึงกันออกได้อย่างแน่นอนว่า คนไข้ไม่มีโรค แต่ผลบวกของการทดสอบที่ไวสูงไม่สามารถยืนยันว่ามีโรค (ruling in) คือ ลองสมมุติว่ามีการทดสอบ "ปลอม" ที่ออกแบบให้ออกแต่ผลบวกเท่านั้น ดังนั้น เมื่อทดสอบคนไข้ที่มีโรค คนไข้ทั้งหมดก็จะได้ผลบวก ซึ่งบ่งว่าการทดสอบมีความไว 100% แต่ว่า โดยนิยามแล้ว ค่าความไวไม่สามารถกันผลบวกปลอมได้ เพราะว่า การทดสอบปลอมก็จะออกผลบวกสำหรับคนปกติทั้งหมด ซึ่งบ่งว่าการทดสอบมีอัตราผลบวกปลอม 100% ทำให้ไม่มีประโยชน์อะไรในการตรวจจับ หรือยืนยันว่ามีโรค ความไวไม่ใช่อย่างเดียวกับความเที่ยง (precision) หรือค่าทำนายเมื่อผลเป็นบวก (positive predictive value) ซึ่งเป็นอัตราส่วนของผลบวกจริงต่อค่ารวมของผลบวกจริงกับผลบวกปลอม คือเป็นสัดส่วนของผลบวกจริงต่อประชากรที่แสดงผลบวก

การคำนวณค่าความไวไม่รวมผลการทดสอบที่คลุมเครือ ถ้าไม่สามารถทดสอบใหม่ได้ ตัวอย่างที่คลุมเครือไม่ควรจะรวมเข้าเพื่อวิเคราะห์ (โดยให้ระบุจำนวนตัวอย่างที่ยกเว้นเมื่อแสดงค่าความไว) หรือสามารถปฏิบัติเหมือนกับผลลบปลอม (ซึ่งจะเป็นการแสดงค่าต่ำสุดของความไว และดังนั้น อาจจะเป็นค่าประเมินที่น้อยเกินจริง)

ความจำเพาะ

ความจำเพาะเป็นสมรรถภาพของการทดสอบในการตรวจหาบุคคลที่ไม่มีภาวะนั้น ๆ ลองพิจารณาตัวอย่างการทดสอบคนไข้ของเรา ค่าความจำเพาะของการทดสอบก็คือสัดส่วนของบุคคลปกติที่ไม่มีโรค ผู้จะทดสอบได้ผลลบ ซึ่งสามารถเขียนเป็นสมการ

{\begin{aligned}{\text{specificity}}&={\frac {\text{number of true negatives}}{{\text{number of true negatives}}+{\text{number of false positives}}}}\\\\&={\frac {\text{number of true negatives}}{\text{total number of well individuals in population}}}\\\\&={\text{probability of a negative test given that the patient is well}}\end{aligned}}

การได้ผลบวกจากการทดสอบจำเพาะสูงมีประโยชน์ในการวินิจฉัยว่าเป็นโรค (ruling in) เพราะว่า การทดสอบนี้ไม่ค่อยให้ผลบวกในคนปกติ เมื่อผลทดสอบเป็นบวก การทดสอบที่จำเพาะ 100% แสดงว่า ทั้งหมดเป็นผู้ป่วยโดยไม่มีคนปกติ^[7]

ผลลบในการทดสอบที่จำเพาะสูงจะไม่มีประโยชน์ในการกันโรคออก ลองสมมุติว่ามีการทดสอบ "ปลอม" ที่ออกแบบให้แสดงผลลบเท่านั้น ซึ่งเมื่อทดสอบคนปกติทุกคน ก็จะแสดงผลลบทุกคน และนี่ก็จะให้ค่าจำเพาะ 100% ต่อการทดสอบ แต่การทดสอบเดียวกันก็จะให้ผลลบต่อผู้ป่วยทั้งหมดเหมือนกัน ดังนั้น ก็จะมีอัตราอัตราผลลบปลอมที่ 100% ซึ่งไม่มีประโยชน์อะไรในการกันโรคออก (ruling out) ความจำเพาะโดยนิยามไม่สามารถกันผลลบปลอมได้ การทดสอบที่จำเพาะสูงจะมีอัตราความผิดพลาดชนิดที่ 1 ต่ำ

ตัวอย่างแสดงเป็นรูป

การทดสอบที่มีความไวสูงความจำเพาะต่ำ ซ้ายแสดงผลลบที่มีผลลบปลอม (น้ำเงินตัน) น้อย ขวาแสดงผลบวกที่มีผลบวกปลอม (แดง) มาก
การทดสอบที่มีความไวต่ำความจำเพาะสูง ซ้ายแสดงผลบวกที่มีผลลบปลอม (น้ำเงินตัน) มาก ขวาแสดงผลบวกที่มีผลบวกปลอม (แดง) น้อย

ในการวินิจฉัยทางการแพทย์ ความไวเป็นสมรรถภาพของการทดสอบในการระบุคนที่มีโรคอย่างถูกต้อง (อัตราผลบวกจริง) เทียบกับความจำเพาะที่เป็นสมรรถภาพในการระบุผู้ที่ไม่มีโรคอย่างถูกต้อง (อัตราผลลบจริง) ถ้ามีผู้ป่วย 100 คนที่ทดสอบ แต่มีเพียง 43 คนที่ได้ผลบวก การทดสอบนี้ก็จะมีความไว 43% ถ้ามีคนปกติ 100 คนที่ทดสอบ แต่มีคน 96 ที่ได้ผลลบ การทดสอบนี้ก็จะมีความจำเพาะ 96% ความไวและความจำเพาะเป็นคุณสมบัติของการทดสอบที่เป็นอิสระจากความชุกของโรค เพราะว่า ค่าของมันเฉพาะกับการทดสอบและไม่ได้ขึ้นอยู่กับความชุกของกลุ่มประชากรที่เป็นประเด็น^[8] เทียบกับค่าทำนายเมื่อผลเป็นบวก (positive predictive value) และค่าทำนายเมื่อผลเป็นลบ (negative predictive value) ซึ่งเป็นค่าที่ขึ้นกับความชุกของกลุ่มประชากรที่ทดสอบ แต่ความจำเพาะและความไวไม่ใช่ ค่าเหล่านี้แสดงให้ดูเป็นกราฟในแอปเพล็ตนี้ (Bayesian clinical diagnostic model) ซึ่งแสดงค่าทำนายเมื่อผลเป็นบวกและเมื่อผลเป็นลบโดยเป็นฟังก์ชันของความชุกของโรค ความไว และความจำเพาะ

สิ่งที่อาจทำให้เข้าใจผิด

มักกล่าวกันว่า การทดสอบที่จำเพาะสูงมีประโยชน์ในการยืนยันว่ามีโรคเมื่อได้ผลบวก และการทดสอบที่ไวสูงในการกันโรคออกเมื่อได้ผลลบ^[9]^[10] มีแม้แต่รหัสช่วยจำ คือ SPIN และ SNOUT ที่ใช้กันอย่างกว้างขวาง ซึ่งมาจากวลีว่า a highly 'SPecific' test, when Positive, rules IN disease (SP-P-IN) คือ การทดสอบที่จำเพาะสูง เมื่อได้ผลบวก จะยืนยันโรค และจากวลีว่า a highly 'SeNsitive' test, when Negative rules OUT disease (SN-N-OUT) คือ การทดสอบที่ไวสูง เมื่อได้ผลลบ จะกันโรคออก แต่กฎทั้งสองนี้อาจทำให้เข้าใจเหตุผลผิดได้ เพราะว่า กำลังการวินิจฉัยของการทดสอบอย่างใดอย่างหนึ่งจะขึ้นอยู่กับทั้งความไวและความจำเพาะ^[11]^[12]^[13]

ตัวอย่างใส่ตัวเลขสำหรับการทดสอบวินิจฉัยที่มีความไว 67% และความจำเพาะ 91% เมื่อทดสอบกับบุคคล 2,030 คนเพื่อตรวจหาโรคที่มีความชุกในกลุ่มประชากรที่ 1.48%

		คนไข้ที่มีมะเร็งลำไส้ ดังที่ยืนยันโดย การส่องกล้อง (endoscopy)
		มีโรคจริง	ไม่มีโรค
ผลการ ตรวจเลือด ในอุจจาระ	ผล บวก	ผลบวกจริง (TP) = 20	ผลบวกปลอม (FP) = 180	ค่าทำนายเมื่อผล เป็นบวก (PPV) = TP / (TP + FP) = 20 / (20 + 180) = 10%
ผลการ ตรวจเลือด ในอุจจาระ	ผล ลบ	ผลลบปลอม (FN) = 10	ผลลบจริง (TN) = 1820	ค่าทำนายเมื่อผล เป็นลบ (NPV) = TN / (FN + TN) = 1820 / (10 + 1820) ≈ 99.5%
		ความไว = TP / (TP + FN) = 20 / (20 + 10) ≈ 67%	ความจำเพาะ = TN / (FP + TN) = 1820 / (180 + 1820) = 91%

การคำนวณที่เกี่ยวข้อง

False positive rate (α) = type I error = 1 − specificity = FP / (FP + TN) = 180 / (180 + 1820) = 9%
False negative rate (β) = type II error = 1 − sensitivity = FN / (TP + FN) = 10 / (20 + 10) = 33%
Power = sensitivity = 1 − β
Likelihood ratio positive = sensitivity / (1 − specificity) = 0.67 / (1 − 0.91) = 7.4
Likelihood ratio negative = (1 − sensitivity) / specificity = (1 − 0.67) / 0.91 = 0.37

เพราะมีผลบวกปลอมจำนวนมาก และผลลบปลอมจำนวนน้อย ดังนั้น การตรวจคัดกรองที่แสดงผลบวกอย่างเดียวจะไม่สามารถยืนยันว่ามีโรคได้ดี (PPV = 10%) และจึงต้องตรวจสอบเพิ่มขึ้น แต่ว่า มันก็ยังสามารถระบุคนที่มีโรคจริง ๆ ได้ถึง 66.7% (ซึ่งเป็นค่าความไว) ถึงอย่างนั้น ถ้าผลเป็นลบ มันดีมากที่จะยืนยันว่าคนไข้ไม่มีโรค (NPV = 99.5%) และการตรวจคัดกรองในเบื้องต้นที่ได้ผลลบจะระบุคน 91% ที่ไม่มีโรคได้อย่างถูกต้อง (ซึ่งเป็นค่าความจำเพาะ)

ค่าความไวและความจำเพาะเพียงอย่างเดียวอาจทำให้เข้าใจผิด คือ จะต้องคำนวณค่าแย่ที่สุด (worst-case) ของค่าทั้งสองเพื่อเลี่ยงการพึ่งผลการทดลองที่มีจำนวนน้อย ยกตัวอย่างเช่น การทดสอบหนึ่งไว 100% เมื่อเทียบกับวิธีการมาตรฐาน (gold standard) 4 ครั้ง แต่ว่าการทดสอบอีกครั้งหนึ่งแสดงผลที่ไม่เท่าเทียม คือเท่ากับแสดงความไวแค่ 80% วิธีสามัญอย่างหนึ่งก็คือมีการบ่ง binomial proportion confidence interval (คือ ช่วงความเชื่อมั่นในสัดส่วนหนึ่งของประชากรทางสถิติ) ซึ่งบ่อยครั้งคำนวณโดยใช้ Wilson score interval ดังนั้น ช่วงความเชื่อมั่น (confidence intervals) ของค่าความไวและความจำเพาะสามารถคำนวณได้ โดยให้พิสัยของค่า (คือกำหนดค่าสูงและต่ำ) ที่อยู่ในระดับความเชื่อมั่นขั้นหนึ่ง (เช่น ความเชื่อมั่นที่ 95% ว่าค่าอยู่ระหว่างค่านี้กับค่านี้)^[14]

ในการค้นคืนสารสนเทศ (information retrieval) ค่าทำนายเมื่อผลเป็นบวกเรียกว่า precision (ความเที่ยง) และค่าความไวเรียกว่า recall แต่ไม่เหมือนกับการแลกเปลี่ยนข้อดีข้อเสียระหว่างความจำเพาะเทียบกับความไว ค่าทั้งสองนี้เป็นอิสระจากผลลบจริง (true negative) ซึ่งปกติจะเป็นข้อมูลที่ไม่รู้โดยมีจำนวนมากกว่าจำนวนเอกสารที่เกี่ยวข้องและต้องการค้นคืนมาก และข้อสมมุติในเรื่องนี้ว่า ผลลบจริงเป็นจำนวนที่ใหญ่กว่ามากจะไม่ค่อยมีในการประยุกต์ใช้ค่าสองอย่างนี้ในประเด็นอื่น ๆ^[6] จึงมีการใช้ F-score เป็นค่าเดียวที่แสดงประสิทธิภาพของการทดสอบที่ได้ผลบวก โดยเป็น harmonic mean ของ precision และ recall คือ

F=2\times {\frac {{\text{precision}}\times {\text{recall}}}{{\text{precision}}+{\text{recall}}}}

ในการศึกษาโดยการตรวจสอบสมมติฐานทางสถิติ (statistical hypothesis testing) ความไวของการทดสอบจะเรียกว่า กำลังทางสถิติ (statistical power) ของการทดสอบ แต่คำว่า กำลัง (power) ในเรื่องนี้มีความหมายกว้างกว่าความไวที่ใช้ในบทความนี้ การทดสอบที่ไวจะมีความผิดพลาดชนิดที่ 2 จำนวนน้อยกว่า

[1]
"sensitivity", ศัพท์บัญญัติอังกฤษ-ไทย, ไทย-อังกฤษ ฉบับราชบัณฑิตยสถาน (คอมพิวเตอร์) รุ่น ๑.๑ ฉบับ ๒๕๔๕, (แพทยศาสตร์) ความไว
[2]
"Detector Performance Analysis Using ROC Curves - MATLAB & Simulink Example". www.mathworks.com. สืบค้นเมื่อ 2016-08-11.
[3]
"specificity", ศัพท์บัญญัติอังกฤษ-ไทย, ไทย-อังกฤษ ฉบับราชบัณฑิตยสถาน (คอมพิวเตอร์) รุ่น ๑.๑ ฉบับ ๒๕๔๕, (แพทยศาสตร์) ความจำเพาะ
[4]
รองศาสตราจารย์ ดร. วารุณี เทศะกรณ์, ผู้ช่วยศาสตราจารย์ พญ. วิภา ธนาชาติเวทย์ (2554). ศาสตราจารย์แพทย์หญิงพรรณี ปิติสุทธิธรรม, รองศาสตราจารย์ ดร.ชยันต์ พิเชียรสุนทร (บ.ก.). "บทที่ 16 วิธีการตรวจวินิจฉัย" (PDF). ตำราการวิจัยทางคลินิก (Textbook of Clinical Research). มหาวิทยาลัยมหิดล. pp. 449–450. ISBN 978-974-11-1462-7. เก็บ (PDF)จากแหล่งเดิมเมื่อ 2015-07-07. สืบค้นเมื่อ 2016-12-19.{{cite web}}: CS1 maint: uses authors parameter (ลิงก์)
[5]
Fawcett, Tom (2006). "An Introduction to ROC Analysis". Pattern Recognition Letters. 27 (8): 861–874. doi:10.1016/j.patrec.2005.10.010.
[6]
Powers, David M W (2011). "Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation" (PDF). Journal of Machine Learning Technologies. 2 (1): 37–63. คลังข้อมูลเก่าเก็บจากแหล่งเดิม (PDF)เมื่อ 2017-08-10. สืบค้นเมื่อ 2016-12-19.
[7]
"SpPins and SnNouts". Centre for Evidence Based Medicine (CEBM). คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2014-07-20. สืบค้นเมื่อ 2013-12-026. {{cite web}}: ตรวจสอบค่าวันที่ใน: |accessdate= (help)
[8]
Mangrulkar, Rajesh. "Diagnostic Reasoning I and II". คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2011-08-01. สืบค้นเมื่อ 2012-01-24.
[9]
"Evidence-Based Diagnosis". Michigan State University. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2013-07-06. สืบค้นเมื่อ 2016-12-19.
[10]
"Sensitivity and Specificity". Emory University Medical School Evidence Based Medicine course.
[11]
Baron, JA (Apr–Jun 1994). "Too bad it isn't true...". Medical decision making : an international journal of the Society for Medical Decision Making. 14 (2): 107. doi:10.1177/0272989X9401400202. PMID 8028462.{{cite journal}}: CS1 maint: date format (ลิงก์)
[12]
Boyko, EJ (Apr–Jun 1994). "Ruling out or ruling in disease with the most sensitive or specific diagnostic test: short cut or wrong turn?". Medical decision making : an international journal of the Society for Medical Decision Making. 14 (2): 175–179. doi:10.1177/0272989X9401400210. PMID 8028470.{{cite journal}}: CS1 maint: date format (ลิงก์)
[13]
Pewsner, D; Battaglia, M; Minder, C; Marx, A; Bucher, HC; Egger, M (2004-07-24). "Ruling a diagnosis in or out with "SpPIn" and "SnNOut": a note of caution". BMJ (Clinical research ed.). 329 (7459): 209–13. doi:10.1136/bmj.329.7459.209. PMC 487735. PMID 15271832.
[14]
"Diagnostic test online calculator calculates sensitivity, specificity, likelihood ratios and predictive values from a 2x2 table - calculator of confidence intervals for predictive parameters". medcalc.org.

Altman, DG; Bland, JM (1994). "Diagnostic tests. 1: Sensitivity and specificity". BMJ. 308 (6943): 1552. doi:10.1136/bmj.308.6943.1552. PMC 2540489. PMID 8019315.{{cite journal}}: CS1 maint: uses authors parameter (ลิงก์)
Loong, T (2003). "Understanding sensitivity and specificity with the right side of the brain". BMJ. 327 (7417): 716–719. doi:10.1136/bmj.327.7417.716. PMC 200804. PMID 14512479.
UIC Calculator
Vassar College's Sensitivity/Specificity Calculator
MedCalc Free Online Calculator
Bayesian clinical diagnostic model applet

[RoyalDictSN-1] [1]
"sensitivity", ศัพท์บัญญัติอังกฤษ-ไทย, ไทย-อังกฤษ ฉบับราชบัณฑิตยสถาน (คอมพิวเตอร์) รุ่น ๑.๑ ฉบับ ๒๕๔๕, (แพทยศาสตร์) ความไว

[2] [2]
"Detector Performance Analysis Using ROC Curves - MATLAB & Simulink Example". www.mathworks.com. สืบค้นเมื่อ 2016-08-11.

[RoyalDictSP-3] [3]
"specificity", ศัพท์บัญญัติอังกฤษ-ไทย, ไทย-อังกฤษ ฉบับราชบัณฑิตยสถาน (คอมพิวเตอร์) รุ่น ๑.๑ ฉบับ ๒๕๔๕, (แพทยศาสตร์) ความจำเพาะ

[TCR2554-449-450-4] [4]
รองศาสตราจารย์ ดร. วารุณี เทศะกรณ์, ผู้ช่วยศาสตราจารย์ พญ. วิภา ธนาชาติเวทย์ (2554). ศาสตราจารย์แพทย์หญิงพรรณี ปิติสุทธิธรรม, รองศาสตราจารย์ ดร.ชยันต์ พิเชียรสุนทร (บ.ก.). "บทที่ 16 วิธีการตรวจวินิจฉัย" (PDF). ตำราการวิจัยทางคลินิก (Textbook of Clinical Research). มหาวิทยาลัยมหิดล. pp. 449–450. ISBN 978-974-11-1462-7. เก็บ (PDF)จากแหล่งเดิมเมื่อ 2015-07-07. สืบค้นเมื่อ 2016-12-19.{{cite web}}: CS1 maint: uses authors parameter (ลิงก์)

[Fawcett2006-5] [5]
Fawcett, Tom (2006). "An Introduction to ROC Analysis". Pattern Recognition Letters. 27 (8): 861–874. doi:10.1016/j.patrec.2005.10.010.

[Powers2011-6] [6]
Powers, David M W (2011). "Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation" (PDF). Journal of Machine Learning Technologies. 2 (1): 37–63. คลังข้อมูลเก่าเก็บจากแหล่งเดิม (PDF)เมื่อ 2017-08-10. สืบค้นเมื่อ 2016-12-19.

[cebm-7] [7]
"SpPins and SnNouts". Centre for Evidence Based Medicine (CEBM). คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2014-07-20. สืบค้นเมื่อ 2013-12-026. {{cite web}}: ตรวจสอบค่าวันที่ใน: |accessdate= (help)

[8] [8]
Mangrulkar, Rajesh. "Diagnostic Reasoning I and II". คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2011-08-01. สืบค้นเมื่อ 2012-01-24.

[9] [9]
"Evidence-Based Diagnosis". Michigan State University. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2013-07-06. สืบค้นเมื่อ 2016-12-19.

[10] [10]
"Sensitivity and Specificity". Emory University Medical School Evidence Based Medicine course.

[pmid8028462-11] [11]
Baron, JA (Apr–Jun 1994). "Too bad it isn't true...". Medical decision making : an international journal of the Society for Medical Decision Making. 14 (2): 107. doi:10.1177/0272989X9401400202. PMID 8028462.{{cite journal}}: CS1 maint: date format (ลิงก์)

[pmid8028470-12] [12]
Boyko, EJ (Apr–Jun 1994). "Ruling out or ruling in disease with the most sensitive or specific diagnostic test: short cut or wrong turn?". Medical decision making : an international journal of the Society for Medical Decision Making. 14 (2): 175–179. doi:10.1177/0272989X9401400210. PMID 8028470.{{cite journal}}: CS1 maint: date format (ลิงก์)

[pmid15271832-13] [13]
Pewsner, D; Battaglia, M; Minder, C; Marx, A; Bucher, HC; Egger, M (2004-07-24). "Ruling a diagnosis in or out with "SpPIn" and "SnNOut": a note of caution". BMJ (Clinical research ed.). 329 (7459): 209–13. doi:10.1136/bmj.329.7459.209. PMC 487735. PMID 15271832.

[14] [14]
"Diagnostic test online calculator calculates sensitivity, specificity, likelihood ratios and predictive values from a 2x2 table - calculator of confidence intervals for predictive parameters". medcalc.org.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]