चाचणीचा निकाल आणि चाचणीचा निष्कर्ष

चाचणी म्हणजे काय?

एखाद्या शंकेबाबत शहानिशा करायचे ठरवले तर काय करावे? चाचणी करावी. हे तर आपल्याला ठाऊकच आहे. स्वयंपाकघरात शितावरून आपण भाताची परीक्षा करतो. शीत शिजले असेल, तर पुरता भात शिजला; शीत कच्चे, तर पुरता भात कच्चा. मॅट्रिकच्या परीक्षेपूर्वी आमच्या शाळेत विद्यार्थ्यांना चाचणी परीक्षा देत. चाचणी परीक्षेच्या निकालावरून विद्यार्थ्याच्या मॅट्रिक तयारीबाबत शाळा आडाखे बांधे. आणि त्यावरून विद्यार्थ्यांना मॅट्रिक परीक्षेचे अर्ज भरू देई. वैद्यकात थोड्याशा रक्ताची चाचणी करून शरीरभर पसरलेल्या रोगाबाबत अंदाज करतात. कारखान्यात घाऊक मालापैकी थोड्याच नगांना कसाला लावतात. काही हजार लोकांची सर्वेक्षण-चाचणी करून पूर्ण देशाच्या अर्थकारणाबाबत काही अंदाज लावतात. आयुष्यातल्या क्षुल्लक वैयक्तिक बाबींपासून देशाच्या परिस्थितीपर्यंत सर्व स्तरांवर "चाचण्या" केलेल्या दिसतात.

चाचणी म्हणजे कधीकधी मोठ्या समूहातला मोजका नमुना (sample survey) असू शकतो, पण सर्व चाचण्या तशा नसतात. उदाहरणार्थ मॅट्रिकच्या आधीच्या चाचणी परीक्षेत सर्वच विषयांचे पूर्ण परीक्षापत्र असते, आणि सर्वच विद्यार्थ्यांची चाचणी घेतात. तर चाचणीचे वैशिष्ट्य काय? जे काय खरेच जाणायचे असेल, त्याचा निर्देश चाचणी देते, पण चाचणी म्हणजे थेट दर्शन किंवा मोजमाप नव्हे. म्हणूनच जेव्हा काहीतरी पुरते आणि थेट अनुभवात येते, तेव्हा त्याला आपण "चाचणी" म्हणत नाही.

चाचण्या स्खलनशील असतात :

हे आपण कधीकधी विसरतो. पण विचार करता आपल्याला ठाऊकच असते : जे-जे थेट नाही ते-ते काही प्रमाणात स्खलनशील असते. क्वचित शितावरून भाताची परीक्षा चुकतेच. चुकते म्हणजे दोन वेगवेगळ्या प्रकारे चुकू शकते : (१) शीत शिजलेले असते, पण पुरता भात शिजलेला नसतो. किंवा त्याउलट (२) शीत कच्चे असते, भात मात्र शिजलेला असतो. दोन वेगवेगळ्या प्रकारच्या चुकांचे परिणाम विरुद्ध टोकाचे असतात. पहिल्या परिस्थितीत आपण शिजवणे थांबवतो, आणि कच्चा भात ताटात वाढतो, तर दुसर्‍या परिस्थितीत आपण भात अधिक वेळ शिजत ठेवतो, आणि गच्चगोळा भात ताटात वाढतो.

निकाल आणि निष्कर्ष यांच्यातला फरक :

चाचणी शिताच्या बाबतीत स्खलनशील नसते! ते शीत खरोखरच शिजलेले असते, किंवा कच्चे असते - हा चाचणीचा "निकाल" होय. निकाल म्हणजे शिताचे थेट अनुभवलेले रूप. त्यात चूक ते काय? चुकू शकतो तो पूर्ण भाताबाबतचा निष्कर्ष. निकाल आणि निष्कर्ष यांच्यामध्ये फरक करणे जरुरीचे असते.

चाचणीचा निष्कर्ष कितपत चुकतो, हे जाणलेले बरे :

निकाल काळजीपूर्वक लावला, तरी निष्कर्ष कधीकधी चुकतो. म्हणून काय आपण धीर गाळून बसतो काय? तर नव्हे. अमुक चाचणी स्खलनशील, तमुकसुद्धा स्खलनशील, मग ही घ्या वा ती घ्या, काय फरक पडतो... असे उदासीन व्हावे काय? मुळीच नव्हे. कारण स्खलनशीलतेतही उजवेडावे असते.काही चाचण्या अधिक स्खलनशील असतात, तर काही चाचण्या कमी स्खलनशील असतात. जर चाचणीचा निष्कर्ष चुकणे महागात पडणार असेल, तर परवडेल तितकी किमान-स्खलनशील चाचणी निवडली पाहिजे. त्यामुळे स्खलनाचा दर किती त्याचे मोजमाप करणे आवश्यक आहे.

अचूकतेची अथवा स्खलशीलतेची मोजमापे :

अचूकता आणि तिच्या व्यस्त प्रमाणात स्खलनशीलता ही काही एक-मितीची बाब नाही. अचूकतेच्या म्हणा, स्खलनशीलतेच्या म्हणा, अनेक मिती असतात. आपण शिता-भाताच्या उदाहरणात दोन प्रकारच्या चुका बघितल्या - एखादी चाचणी एका बाजूची चूक अधिक करत असेल, तर दुसरी कुठली चाचणी दुसर्‍या बाजूची चूक अधिक करत असेल.शिता-भाताचे उदाहरण बाजूला ठेवून आपण याकरिता वैद्यकातले उदाहरण घेऊया. मधुमेह म्हणजे साखरेचा उपयोग आणि निचरा करण्याबाबत शरिराचा दोष. हा दोष जर थेटच बघायचा असेल, तर भरपूर गोड अन्न खाऊन साखरेचा निचरा होतो की नाही ते थेटच मोजावे लागेल. परंतु साधारणपणे डॉक्टर एकदाच आणि थोडेसेच रक्त चाचणी करण्यासाठी घेतो. रक्ताच्या वेगवेगळ्या चाचण्या करता येतात : विरघळलेली साखर मोजणे ही नेहमीची चाचणी अनशापोटी करावी लागते, तर हिमोग्लोबिन प्रथिनाशी संयुक्त साखर (HbA1c) मोजायची चाचणी सोयीस्कररीत्या दिवसात कधीही करता येते. म्हणजे थेट साखरेचा निचरा मोजत नाही - रक्तातील एककालिक चाचणीचा निकाल बघून निष्कर्ष लावतात. "फार जास्त साखर" निकालानुसार "पुरेसा निचरा नाही" असा निष्कर्ष लावतात, वा "साखर जास्त नाही" निकलानुसार "निचरा पुरेसा आहे" असा निष्कर्ष लावतात. आता या नव्या HbA1c चाचणीत किती प्रमाण असले (उदाहरणार्थ >६.५ की >७.०) तर "साखर अधिक" म्हणावे, ही बाब अजून नीट ठरलेली नाही. खरे म्हटले तर हे दोन निकालाचे स्तर म्हणजे दोन वेगवेगळ्या चाचण्या आहेत. अर्थात कुठलाही स्तर घेतला तरी चाचणी स्खलनशील आहे, त्या स्खलनाच्या वेगवेगळ्या मिती कुठल्या ते पाहूया.

चाचणीची "संवेदनक्षमता" (sensitivity): मधुमेह झालेल्या रुग्णांपैकी किती टक्क्यांमध्ये रक्ताची चाचणी केल्यास "साखर जास्त" असे आढळेल? ही टक्केवारी म्हणजे त्या चाचणीची संवेदनक्षमता.

चाचणीची विशिष्टता : (specificity) मधुमेह नाही अशा बिगररुग्णांपैकी किती टक्क्यांमध्ये रक्ताची चाचणी केल्यास "साखर जास्त नाही" असे आढळेल? ही टक्केवारी म्हणजे त्या चाचणीची विशिष्टता.

(लक्षात असू द्या, मधुमेह हे फक्त उदाहरण झाले. संवेदनक्षमता आणि विशिष्टता ही अचूकतेच्या दोन मितींची मोजमापे कुठल्याही चाचणीबाबत वापरता येतात - वैद्यकाबाहेरच्या चाचण्यांबाबतही वापरता येतात.)

वर सांगितलेल्या दोन स्तरांची संवेदनक्षमता आणि विशिष्टता मला एका अभ्यासनिबंधांत सापडली (कुमार व साथी : http://jcem.endojournals.org/content/95/6/2832.full)

HbA1c स्तर

>६.५

> ७.०

संवेदनक्षमता

६५%

४२%

विशिष्टता

८८%

९२%

(विशेष सूचना : फक्त एखाददुसर्‍या सर्वेक्षणावरून चाचण्यांबाबत अखेरचा निर्णय करू नये. येथे फक्त उदाहरणाकरिता हे आकडे दिले आहेत.)

एखाद्या चाचणीची संवेदनक्षमता आणि विशिष्टता दोन्ही वरचढ असली, तर निवड सोपी असते. परंतु तक्त्यात लक्षात आलीच असेल, अशी ही बाब पुष्कळदा दिसते : संवेदनक्षमता जास्त असली तर विशिष्टता कमी असते. आणि त्याचा व्यत्यासही दिसतो - विशिष्टता जास्त असली तर संवेदनक्षमता कमी असते. त्यामुळे या ठिकाणी शृंगापत्ती आहे : आखूडशिंगी ती बहुदुधी नाही, आणि बहुदुधी ती आखूडशिंगी नाही!

चाचणीच्या निष्कर्षाच्या अचूकतेबाबत या मिती समर्पक आहेत काय?

संवेदनक्षमता आणि विशिष्टता या मिती अर्थपूर्ण आहेत, पण चाचणीच्या निष्कर्षाच्या अचूकतेबाबत समर्पक नाहीत. वरील मितींचा तार्किक पाया पुढीलप्रमाणे :

जर मधुमेह तर किती टक्के चाचणीत-साखर-जास्त (संवेदनक्षमता)

जर मधुमेह-नाही तर किती टक्के चाचणीत-साखर-जास्त-नाही (विशिष्टता)

पण आपले प्रत्यक्ष निष्कर्ष व्यत्यासाचे असतात :

जर चाचणीत-साखर-जास्त तर किती टक्के मधुमेह (होकारात्मक चाचणीचे मूल्य positive predictive value)

जर चाचणीत-साखर-जास्त-नाही तर किती टक्के मधुमेह-नाही (नकारात्मक चाचणीचे मूल्य negative predictive value)

(नोंद घ्यावी : जर-तर च्या कलमांचे क्रम व्यत्यासामुळे पालटले आहेत)

आणि जर-तर या तार्किक मांडणीचा व्यत्यास थेट होत नाही, त्याची नीट व्यवस्था लावावी लागते.

चाचणीची ही दोन मूल्ये संवेदनक्षमता-विशिष्टतेवर अवलंबून असतात, हे तर आहेच.पण व्यवस्था लावताना आणखी कशावर अवलंबून असतात, हे पहिल्यांदा अनपेक्षित आणि आश्चर्यकारक वाटू शकेल. त्या समाजात मधुमेहाचे प्रमाण कितपत आहे, त्यावर ही दोन चाचणी-मूल्ये अवलंबून असतात. थोडाच विचार केल्यास ही बाब स्पष्ट होईल.

कमी संवेदनक्षमता असल्यामुळे होणारे प्रमाद फक्त मधुमेहाच्या रुग्णांमध्ये होतात. जर समाजात मधुमेहाचे प्रमाण थोडे असेल तर हे प्रमादही थोडे असतात. जर समाजात मधुमेहाचे प्रमाण फार असेल, तर हे प्रमाद मोठ्या संख्येने होतात. त्याउलट कमी विशिष्टता असल्यामुळे होणारे प्रमाद फक्त बिगर-मधुमेही व्यक्तींमध्ये होतात. जर समाजात मधुमेहाचे प्रमाण थोडे असेल तर उरलेल्या बिगर-मधुमेह्यांमध्ये हे प्रमादही फार असतात.जर समाजात मधुमेहाचे प्रमाण फार असेल, तर उर्वरित थोड्या बिगरमधुमेह्यांत हे प्रमाद थोडे होतात.

समजा भारताच्या एखाद्या जिल्ह्यात १०,००,००० लोकसंख्येत मधुमेहाचे प्रमाण केवळ १०% (१,००,००० व्यक्ती) असेल तर चुका कशा होतील? आधी HbA1c >६.५ चाचणी बघूया.

त्या १,००,००० मधुमेह्यांपैकी ६५% चाचणी"+" सापडतीत = ६५,००० (हे चांगले)

पण १,००,०००-६५,००० = ३५,००० चाचणी"-" सापडतील (हे स्खलनशील झाले)

तसेच ९,००,००० बिगरमधुमेह्यांपैकी ८८% चाचणी"-" सापडतीत = ७,९२,००० (हे चांगले)

पण ९,००,००० - ७,९२,००० = १,०८,००० चाचणी"+" सापडतील (हे स्खलनशील झाले)

अबब! १,०८,००० + ६५,००० = १,७३,००० चाचण्या"+" सापडतील पण त्यांच्यापैकी फक्त ६५,००० खरे मधुमेही असतील. म्हणजे होकारात्मक चाचणीचे मूल्य ३७.६% आहे (इतके काही वाईट नाही). तर नकारात्मक चाचणीचे मूल्य ९५.८% आहे (हे तरी बरे.)

हीच बाब आपण HbA1c >७.० बाबत बघूया, आणि शिवाय दुसर्‍या एखाद्या समाजात बघूया - उदाहरणार्थ एखाद्या मेद-सुधार-क्लिनिकमध्ये मधुमेहाचे प्रमाण ६०% असेल :

HbA1c स्तर

>६.५

> ७.०

मधुमेहाचे प्रमाण १०%

होकार-मूल्य

३७.५%

५.५%

नकार-मूल्य

९५.८%

९३.५%

मधुमेहाचे प्रमाण ६०%

होकार-मूल्य

८९.०%

४४.१%

नकार-मूल्य

६२.६%

५१.४%

या तक्त्यावरून दोन गोष्टी अधिक स्पष्ट होतात :

(१) चाचणीचा निकाल नव्हे, तर जो निष्कर्ष आहे, त्याचे होकार आणि नकारमूल्य "त्या समाजात मधुमेहाचे प्रमाण किती आहे" या बाबीवर कितपत अवलंबून आहे, आणि

(२) केवळ संवेदनक्षमता आणि विशिष्टता पाहिल्यास HbA1c >६.५ वा >७.० मध्ये भला मोठा फरक असेल असे स्पष्ट दिसत नाही. पण विवक्षित समाज-परिस्थितीच्या संदर्भात फारच मोठा फरक आहे, हे होकार आणि नकारमूल्यांतून दिसून येते.

सारांश : चाचण्या स्वभावतः स्खलनशील असतात. परंतु ती स्खलनशीलता चार वेगवेगळ्या मितींमध्ये मोजता येते : (१) संवेदनक्षमता (२) विशिष्टता (३) होकारमूल्य (४) नकारमूल्य. पैकी संवेदनशीलता आणि विशिष्टता चाचणीत अंगभूत असतात, आणि "जे शोधायचे ते त्या समाजात किती प्रमाणात आहे" यावर अवलंबून नसतात. पण निष्कर्ष किती अचूक आहेत, हे जोखण्याकरिता होकारमूल्य आणि नकारमूल्य या मिती समर्पक आहेत. आणि त्या मात्र "जे शोधायचे ते त्या समाजात किती प्रमाणात आहे" या अवलंबून असतात. कुठल्याही चाचणीच्या निष्कर्षांच्या स्खलनशीलता वा अचूकता जाणली, तर चाचणीच्या मर्यादा समजतात, आणि चाचणीचा सदुपयोग करता येतो.