भारत सरकार इस राष्ट्रीय आनुवंशिक संसाधन ज्ञान का लोकतंत्रीकरण और प्रसार करके सतत विकास को बढ़ावा देने के लिए प्रतिबद्ध है।
सरकार हमारे शोधकर्ताओं द्वारा जीनोमइंडिया डेटा तक निष्पक्ष और न्यायसंगत पहुंच सुनिश्चित करने के लिए प्रतिबद्ध है।
केंद्र सरकार के जैव प्रौद्योगिकी विभाग द्वारा वित्तपोषित ‘जीनोमइंडिया’ ने देश भर में सभी प्रमुख जनसंख्या समूहों का प्रतिनिधित्व करने वाले 10,000 से अधिक व्यक्तियों का संपूर्ण जीनोम अनुक्रमण (WGS) डेटाबेस पूरा कर लिया है। जीनोमइंडिया डेटा वैज्ञानिक जांच के लिए भारत सरकार की प्रतिबद्धता को दर्शाता है और यह भारत और उसके बाहर स्वास्थ्य और विज्ञान को नया आकार देने के लिए तैयार है, इस राष्ट्रीय आनुवंशिक संसाधन ज्ञान को लोकतांत्रिक बनाने और प्रसारित करने के माध्यम से सतत विकास को बढ़ावा देता है।
आईबीडीसी की स्थापना, बायोटेक प्राइड दिशा-निर्देशों को जारी करना, फीड प्रोटोकॉल का निर्माण, आईबीडीसी में जीनोम इंडिया डेटा का स्थानांतरण और भंडारण की दिशा में विभाग द्वारा की गई परिणामोन्मुखी संचयी सक्रिय कार्रवाइयां; इसके बाद देश के शीर्ष नेतृत्व द्वारा की गई घोषणाएं, महत्वपूर्ण सूचनाओं के विश्लेषण, जैविक विज्ञान में खोजों और प्रगति में तेजी लाने के लिए हमारे शोधकर्ताओं के साथ इस डेटा को साझा करने के लिए सरकार के दृढ़ संकल्प का संकेत देती हैं।
देश में पहली बार, विभाग ने मार्च 2020 में भारतीय जैविक डेटा केंद्र (IBDC) की स्थापना की है, जिसमें 2912 CPU का उपयोग करके 96 TF कंप्यूटिंग क्षमता, 39 TB RAM, 64 GPU का उपयोग करके 865 TF कंप्यूटिंग क्षमता, 4 PB समानांतर फ़ाइल सिस्टम है जिसमें हर सेकंड 100GB डेटा लिखने की क्षमता है और डेटा की बैकअप कॉपी स्टोर करने के लिए 1.5 PB डिस्क और टेप है। विभाग ने बायोटेक-PRIDE दिशा-निर्देश, 2021 जारी किए हैं, जिसके बाद जिम्मेदार डेटा शेयरिंग के लिए ‘डेटा एक्सचेंज (FeED) प्रोटोकॉल के लिए रूपरेखा’ तैयार की गई है।
9 जनवरी 2025 को ‘ जीनोमिक्स डेटा कॉन्क्लेव’ के दौरान, भारत के प्रधानमंत्री श्री नरेंद्र मोदी द्वारा ‘जीनोमइंडिया डेटा’ शोधकर्ताओं को समर्पित किया गया। प्रधानमंत्री ने कहा कि यह राष्ट्रीय डेटाबेस भारत के असाधारण आनुवंशिक परिदृश्य को समाहित करता है और मानव स्वास्थ्य के लिए आनुवंशिक और चिकित्सा अनुसंधान को बढ़ावा देने के लिए एक अमूल्य वैज्ञानिक संसाधन के रूप में काम करेगा। इसके अलावा, 25 जनवरी, 2025 की शाम को राष्ट्र के नाम संबोधन के दौरान , भारत की राष्ट्रपति महामहिम श्रीमती द्रौपदी मुर्मू ने कहा कि जीनोमइंडिया परियोजना भारतीय विज्ञान के इतिहास में एक महत्वपूर्ण अध्याय है।
विभाग ने जीनोमइंडिया डेटा का उपयोग करके ट्रांसलेशनल रिसर्च के अवसरों का दोहन करने के लिए शोधकर्ताओं से ‘प्रस्तावों के लिए आह्वान’ की भी घोषणा की। शोधकर्ताओं के प्रश्नों का समाधान करने के लिए, विभाग ने शोध के लिए उपलब्ध डेटा के प्रकार और श्रेणी का उल्लेख करते हुए परिशिष्ट जारी किया, साथ ही “संबंधित फेनोटाइप डेटा” भी साझा किया जाएगा। यह स्पष्ट किया जाता है कि जीनोमइंडिया डेटा तक पहुँच ‘कॉल’ तक सीमित नहीं है, बल्कि बायोटेक PRIDE दिशा-निर्देशों और FeED प्रोटोकॉल के दायरे में IBDC द्वारा डेटा एक्सेस के लिए स्वतंत्र अनुरोध प्राप्त किए जा रहे हैं।
आज की तिथि तक, जीनोमइंडिया परियोजना के अंतर्गत सृजित इस राष्ट्रीय संसाधन में 9772 नमूनों की फास्टक्यू फाइलें (~700 टीबी), 9772 जीवीसीएफ: (~35 टीबी), 9330 नमूनों से फेनोटाइपिक डेटा और संयुक्त कॉल फाइलें (~3.5 टीबी) शामिल हैं तथा इसे राष्ट्रीय भंडार, आईबीडीसी में संग्रहीत किया गया है।
एक प्रमुख समाचार पत्र में प्रकाशित समाचार लेखों में से एक में उल्लिखित फेनोटाइप डेटा के मुद्दे के बारे में संक्षेप में, यहाँ बताया गया है कि 9772 नमूनों पर फेनोटाइपिक डेटा का क्यूरेशन और क्लीनिंग किया गया था, जो WGS से गुजरे थे और संयुक्त कॉलिंग में उपयोग किए गए थे। इन 9772 नमूनों में से, 9330 नमूनों के फेनोटाइपिक डेटा का उपयोग किया जा सका क्योंकि शेष नमूनों (संख्या 442) के लिए उपलब्ध डेटा उपयोग करने योग्य नहीं था। कई फेनोटाइपिक मापदंडों में बहुत अधिक स्तर की कमी थी, इसलिए 9330 नमूनों के लिए शीर्ष 27 चर के लिए डेटा शोध के लिए उपलब्ध है। ये 27 चर हैं एल्ब्यूमिन, एल्केलाइन_फॉस्फेट, ALT_SGPT, AST_SGOT, बेसोफिल्स, कोलेस्ट्रॉल, क्रिएटिनिन, डायरेक्ट_बिलीरुबिन, ईोसिनोफिल्स, FBS_फास्टिंग_ब्लड_ग्लूकोज, HB_हीमोग्लोबिन, HbA1C_ग्लाइकोसिलेटेड_हीमोग्लोबिन, HDL, इनडायरेक्ट_बिलीरुबिन, LDL, लिम्फोसाइट्स, MCH_मीन_कॉर्पसकुलर_Hb, मोनोसाइट्स, न्यूट्रोफिल्स, प्लेटलेट_काउंट, प्रोटीन, RBC_रेड_ब्लड_सेल_काउंट, RBS, टोटल_बिलीरुबिन, ट्राइग्लिसराइड्स, यूरिया, WBC_टोटल_व्हाइट_ब्लड_सेल_काउंट। एंथ्रोपोमेट्री डेटा जैसे: आयु, लिंग, ऊंचाई, वजन, शारीरिक वसा भी उपलब्ध है।
इसके अलावा, कुछ समाचार लेखों ने FASTQ फ़ाइलों के लिए ‘नो एक्सेस’ बनाने के बारे में भी चिंता जताई है। यहाँ यह उल्लेख करना उचित है कि FASTQ फ़ाइलों का कुल आकार लगभग 700 TB है। इन फ़ाइलों को स्थानांतरित करने की तार्किक और तकनीकी चुनौतियाँ बहुत बड़ी हैं। अनुरोधकर्ताओं द्वारा डाउनलोड की पूर्णता और पवित्रता सुनिश्चित करना कठिन है। कच्ची अनुक्रमण फ़ाइलों का विश्लेषण करने के लिए अक्सर दो से तीन गुना अधिक कम्प्यूटेशनल क्षमता की आवश्यकता होती है, जिससे राष्ट्रीय स्तर पर अनावश्यक वर्कफ़्लो और बर्बाद बुनियादी ढाँचा होता है। इसके बजाय gVCF फ़ाइलों (जो लगभग 35 TB के बराबर है) तक समान पहुँच प्रदान करके, डेटा को अधिक तेज़ी से साझा किया जा सकता है और कम्प्यूटेशनल संसाधनों का संरक्षण किया जा सकता है। 2 दशकों से अधिक समय से स्थापित अंतरराष्ट्रीय अग्रणी डेटा बैंक भी डेटा को डाउनलोड करने की अनुमति नहीं देते हैं; डेटा उनके क्लाउड प्लेटफ़ॉर्म द्वारा प्रदान किया जाता है। इसलिए, विभाग के ‘कॉल’ में FASTQ फ़ाइलों तक ‘नो एक्सेस’ का अर्थ है कि ये फ़ाइलें वर्तमान में डाउनलोड के लिए उपलब्ध नहीं होंगी। यह नीति अन्य वैश्विक संघों के अनुरूप है। जैसे-जैसे भविष्य में आईबीडीसी का विकास और विस्तार होगा, इसी प्रकार के प्रावधान इसमें शामिल किए जा सकते हैं।
***
एनकेआर/पीएसएम