back to top
23 दिसम्बर, 2024
spot_img

Artificial Intelligence, मातृभाषा से स्टार्टअप की चमत्कृत नई दुनिया, अर्थ पक्ष की मजबूती

टाइम मैगजीन की कवर स्टोरी, जो आप पढ़ रहे हैं देशज टाइम्स पर, उन्हीं के साभार बिली पेरिगो की ओर से

spot_img
spot_img
spot_img

मुख्य बातें: आर्टिफिशियल इंटेलिजेंस (एआई) का मातृभाषा के जरिए आर्थिक संबल, यह स्टार्टअप उन लाखों लोगों की मदद के लिए आगे आया है जिनकी मातृभाषाएं हाशिए पर हैं। एआई से उन्हें आर्थिक लाभ हो सकेगा।

नारियल पेड़ की छाया में, चंद्रिका सूरज की रोशनी से बचने के लिए अपने स्मार्टफोन की स्क्रीन थोड़ा तिरछा कर लेती हैं। दक्षिण भारत के एक राज्य कर्नाटक के अलहल्ली गांव में सुबह का वक्त है लेकिन गर्मी और उमस बहुत है।

स्क्रॉल करने के साथ ही चंद्रिका एक के बाद एक कई ऑडियो क्लिप पर क्लिक करती हैं। यह उस ऐप की आसानी को प्रदर्शित करता है जिसका उन्होंने हाल ही में उपयोग करना शुरू किया है। हर टैप पर फोन से उन्हें मातृभाषा में अपनी आवाज सुनाई देती है।

इस ऐप का इस्तेमाल शुरू करने से पहले, 30 वर्षीया चंद्रिका (अन्य दक्षिण भारतीयों की तरह, अपने पिता के नाम के पहले अक्षर के. का उपयोग करती हैं, लास्ट नेम के बजाय) के बैंक खाते में पहले केवल 184 रुपए (2.25 डॉलर) थे। अप्रैल के आखिर में उन्होंने कई दिनों तक लगभग छह घंटे काम किया। उन्हें 2,570 रुपए (31.30 डॉलर) की आय हुई।

दूर के स्कूल में शिक्षिका के रूप में काम करने के दौरान वह लगभग उतनी ही राशि कमाती थीं, जितनी उन्हें वहां जाने और वापस आने में लगने वाले बस के किराए के बाद बचती थी। आने-जाने में उन्हें तीन बस बदलनी पड़ती थी। अब अपने काम के भुगतान के लिए उन्हें महीने के अंत तक इंतजार नहीं करना पड़ता। कुछ ही घंटों में पैसा उनके बैंक खाते में आ जाता है।

केवल अपनी मातृभाषा कन्नड़, जो लगभग 60 मिलियन लोगों द्वारा बोली जाती है, ज्यादातर मध्य और दक्षिणी भारत में, भाषा के पाठ को जोर से पढ़कर, चंद्रिका ने इस ऐप का उपयोग करते हुए प्रतिघंटे लगभग 5 डॉलर का वेतन अर्जित किया है, जो भारतीयों की न्यूनतम आय से लगभग 20 गुना ज्यादा है। और कुछ ही दिनों में 50 फीसद बोनस के रूप में उनके खाते में और पैसा आ जाएगा। एक बार आवाज को सिर्फ वायस क्लिप से मिलाने की जरूरत है।

चंद्रिका की आवाज उन्हें इतनी राशि दिला सकती है? यह सम्भव हुआ है आर्टिफिशियल इंटेलिजेंस (एआई) में आए उछाल की वजह से। फिलहाल, अत्याधुनिक एआई- उदाहरण के लिए चैटजीपीटी अंग्रेजी जैसी भाषाओं में सबसे अच्छा काम कर रहे हैं, जहां टेक्स्ट और ऑडियो डेटा प्रचुर मात्रा में ऑनलाइन उपलब्ध हैं। चैटजीपीटी, कन्नड़ जैसी भाषाओं में बहुत अच्छा नहीं कर पा रहा है क्योंकि यह भाषा लाखों लोगों द्वारा बोले जाने के बावजूद इंटरनेट पर दुर्लभ है। (उदाहरण- विकिपीडिया पर अंग्रेजी में 6 मिलियन लेख हैं, जबकि कन्नड़ में सिर्फ 30,000) तो क्या एआई “कम संसाधन वाली” भाषाओं के लिए पक्षपाती हो सकते हैं? उदाहरण के लिए, एआई का हमेशा यह मानकर चलना कि डॉक्टर पुरुष ही होते हैं और महिलाएं नर्स। इससे भी समस्या गहरा सकती है।

अंग्रेजी भाषा बोलने वाले एआई बनाने के लिए, केवल डेटा एकत्र करना ही पर्याप्त है। डेटा तो पहले से ही बड़ी संख्या में जमा है लेकिन कन्नड़ जैसी भाषाओं के लिए आपको बाहर निकल कर बहुत कुछ तलाशना होगा।

एआई ने दुनिया के कुछ सबसे गरीब लोगों द्वारा बोली जाने वाली भाषाओं के डेटासेट- टेक्स्ट या वॉयस डेटा के संग्रह- की भारी मांग उत्पन्न की है। ऐसी मांग उन तकनीकी कंपनियों द्वारा की जाती है जो अपने एआई उपकरण बनाना चाहती हैं।

शिक्षा जगत और सरकारों की ओर से भी बड़ी मांग होती है खासकर भारत में, जहां 22 आधिकारिक भाषाओं और कम से कम 780 से अधिक स्वदेशी भाषाओं वाले लगभग 1.4 अरब लोगों के देश में अंग्रेजी और हिन्दी को लंबे समय से प्राथमिकता दी गई है। बढ़ती हुई मांग का मतलब है-करोड़ों भारतीयों का अचानक से एक दुर्लभ और नव-मूल्यवान संपत्ति के मालिक होना। वह मूल्यवान सम्पत्ति है उनकी मातृभाषा।

एआई को केन्द्रित करते हुए डेटा उत्पन्न करना या रिफाइन करना, भारत के लिए कोई नया काम भी नहीं है। 20वीं सदी के अंत में जिस अर्थव्यवस्था ने कॉल सेंटरों और कपड़ा कारखानों को उत्पादकता इंजन में बदलने के लिए बहुत कुछ किया, 21वीं सदी में चुपचाप डेटा वर्क के साथ वही किया जा रहा है। इंडस्ट्री में एक बार फिर श्रम मध्यस्थता आधारित कंपनियों, जिसका अर्थ है आउटसोर्सिंग, का प्रभुत्व है।

ये कंपनियां न्यूनतम के करीब ही वेतन का भुगतान करती हैं, जबकि भारी शुल्क वसूलने के लिए डेटा विदेशी ग्राहकों को बेचती हैं। वर्ष 2022 में डेटा सेक्टर का वैश्विक मूल्य लगभग 2 बिलियन डॉलर से ज्यादा था जिसके 2030 तक बढ़कर 17 बिलियन डॉलर हो जाने का अनुमान है। इस धन का बहुत कम हिस्सा ही भारत, केन्या और फिलीपींस के डेटा वर्कर्स को मिला है।

ये स्थितियां व्यक्तिगत रूप से काम कर रहे श्रमिकों की जिन्दगी को कहीं अधिक नुकसान पहुंचा सकती हैं। ऑक्सफोर्ड यूनिवर्सिटी के इंटरनेट इंस्टीट्यूट में डिजिटल वर्क प्लेटफॉर्म के विशेषज्ञ जोनास वैलेंटे कहते हैं- ‘हम उस व्यवस्था के बारे में चर्चा कर रहे हैं जो हमारे पूरे समाज को प्रभावित कर रही है और वर्कर्स उन व्यवस्थाओं को विश्वसनीय और कम पक्षपाती बनाते हैं।’ वह आगे कहते हैं- ‘अगर आपके पास मूलभूत अधिकारों की जानकारी रखने वाले कर्मचारी हैं और ज्यादा सशक्त भी, तो मेरा मानना है कि तकनीकि व्यवस्था के जरिए जो परिणाम आएंगे, उनका गुणवत्ता बेहतर होगी।’

अलहल्ली और चिलुकावाड़ी के निकटवर्ती गांवों में, एक भारतीय स्टार्टअप नए मॉडल का परीक्षण कर रहा है। चंद्रिका, ‘कार्या’ के लिए काम करती हैं। ‘कार्या’ एक गैर-लाभकारी संस्था है जिसे 2021 में बेंगलुरु (पूर्व नाम बैंगलोर) में लॉंच किया गया था जो खुद को ‘दुनिया की पहली एथिकल डेटा कंपनी’ के रूप में पेश करती है।

अपने अन्य प्रतिद्वंद्वियों की तरह, यह भी बाजार दर पर बड़ी तकनीकि कंपनियों और अन्य ग्राहकों को डेटा बेचती है। अपनी लागत को कवर करती है लेकिन उस रकम का अधिकांश हिस्सा लाभ के रूप में अपने पास रखने के बजाय शेष राशि भारत के ग्रामीण इलाकों के गरीबों को भेज देती है। (कार्या ने स्थानीय गैर सरकारी संगठनों के साथ साझेदारी की है ताकि यह सुनिश्चित किया जा सके कि उसकी नौकरियों तक पहुंच सबसे गरीब लोगों के साथ-साथ हाशिए पर रहने वाले समुदायों की हो।) अपने वर्कर्स को प्रति घंटे न्यूनतम 5 डॉलर देने वाला ‘कार्या’ श्रमिकों को उनकी ओर से बनाए गए डेटा का वास्तविक स्वामित्व भी देता है। जब श्रमिक इसे फिर बेचते हैं तो श्रमिकों को उनके पिछले वेतन के अलावा आय भी हासिल होती है। यह एक ऐसा मॉडल है जो इंडस्ट्री में कहीं अन्य जगह नहीं है।

‘कार्या’ जो काम कर रही है, उसका मतलब यह भी है कि लाखों लोग जिनकी भाषाएं ऑनलाइन हाशिए पर हैं, एआई सहित प्रौद्योगिकी के लाभों तक बेहतर पहुंच हासिल कर सकती हैं। 23 वर्षीय छात्रा विनुथा, जिसने माता-पिता पर अपनी वित्तीय निर्भरता कम करने के लिए ‘कार्या’ में काम किया है, कहती हैं-‘गांवों में ज्यादातर लोगों को अंग्रेजी नहीं आती। यदि कम्प्यूटर कन्नड़ समझ सकता तो यह बड़ा फायदेमंद होगा।’

कार्या के 27 वर्षीय सीईओ मनु चोपड़ा कहते हैं-‘अभी जो वेतन दिया जा रहा है, वह बाजार की विफलता है।’ वह आगे कहते हैं-‘हमने कार्या को गैर-लाभकारी संस्था बनाने का फैसला इसलिए किया क्योंकि मौलिक रूप से आप बाजार में बाजार की विफलता का समाधान नहीं कर सकते।’ आप इसे इस तरह भी कह सकते हैं कि काम तो पूरक है।

कार्या अपने कर्मचारियों से पहली बात जो कहता है, वह यह हैः यह कोई स्थायी नौकरी नहीं है, बल्कि यह जल्दी से आय बढ़ाने का एक तरीका है जो आपको आगे बढ़ने और अन्य काम करने की अनुमति देगा। ऐप के जरिए एक कर्मचारी अधिकतम 1,500 डॉलर की आय अर्जित कर सकता है जो भारत में औसत वार्षिक आय है। उस बिंदु के बाद, वर्कर्स किसी और के लिए रास्ता बनाते हैं।

कार्या का कहना है कि उसने देश भर में लगभग 30,000 ग्रामीण भारतीयों को मजदूरी के रूप में 65 मिलियन रुपए (लगभग 8,00,000 डॉलर) का भुगतान किया है। चोपड़ा चाहते हैं कि कार्या की पहुंच 2030 तक 100 मिलियन लोगों तक हो।

गरीबी में जन्मे और स्टैनफोर्ड में छात्रवृत्ति हासिल करने वाले चोपड़ा कहते हैं- ‘मुझे वास्तव में लगता है कि अगर सही तरीके से काम किया जाए तो लाखों लोगों को गरीबी से बाहर निकालने का यह सबसे गतिशील और अच्छा तरीका है।’ वह कहते हैं कि निश्चित रूप से यह सामाजिक परियोजना है। वेल्थ इज पावर। हम उन समुदायों को धन का पुनर्वितरण करना चाहते हैं जो पीछे छूट गए हैं।

ऐसा भी नहीं है कि चोपड़ा एआई डेटा वर्क की क्षमता के बारे में बात करने वाले ऐसे पहले तकनीकि संस्थापक हों, जिन्होंने दुनिया के निम्नतम गरीबों को लाभ पहुंचाने का बीड़ा उठाया है। सामा- एक आउटसोर्सिंग कंपनी, जिसने ओपनएआई के चैटजीपीटी और मेटा के फेसबुक की हैंडलिंग के लिए कार्य अनुबंध किए हैं, ने ग्लोबल साउथ में लोगों को गरीबी से निजात दिलाने के लिए तकनीकी कंपनियों को “नैतिक” तरीके से प्रोत्साहित किया है। लेकिन जैसाकि मैंने जनवरी में खबर दी थी कि केन्या में चैटजीपीटी के कई कर्मचारियों-जिनमें से कुछ 2 डॉलर प्रतिघंटे से भी कम कमाते थे – ने मुझे बताया कि उन्हें ट्रेनिंग डेटा के सम्पर्क में लाया गया जिससे उन्हें आघात पहुंचा।

कंपनी ने फेसबुक के लिए भी इसी तरह का कंटेंट मॉडरेशन कार्य किया; उस परियोजना के एक कर्मचारी ने मुझे बताया कि जब उसने बेहतर कामकाजी परिस्थितियों के लिए अभियान चलाया तो उसे निकाल दिया गया।

बीबीसी ने वर्ष 2018 में जब कम वेतन के बारे में पूछा तो सामा के दिवंगत संस्थापक ने तर्क दिया था कि श्रमिकों को अधिक वेतन देने से स्थानीय अर्थव्यवस्थाएं बाधित हो सकती हैं, जिससे लाभ की तुलना में नुकसान अधिक हो सकता है। पिछले 18 महीनों में मैंने इस इंडस्ट्री पर रिपोर्टिंग की है। इस दौरान मैंने जिन डेटा कर्मियों से बात की है, उनमें से कई ने इस तर्क पर जोर देते हुए कहा कि यह उन कंपनियों के लिए सुविधाजनक आख्यान है जो अपने श्रमिकों की आय से अमीर हो रही हैं।

चैटजीपीटी पर मेरे जनवरी के लेख के जवाब में ट्वीट्स की एक श्रृंखला में चोपड़ा ने लिखा था-‘पिछले 5 वर्षों में मैंने सबसे बड़ा जो सबक सीखा है, वह यह है कि सब कुछ संभव है। यह कोई सपना नहीं है जिसमें हम किसी काल्पनिक और बेहतर दुनिया को देख रहे हैं। हम अपने श्रमिकों को न्यूनतम वेतन से 20 गुना अधिक भुगतान कर सकते हैं और फिर भी एक टिकाऊ संगठन बने रह सकते हैं।’

यह पहला मौका था जब मैंने कार्या के बारे में सुना और मेरी तत्काल और सहज प्रवृत्ति संदेहभरी थी। सामा ने भी अपना जीवन गरीबी उन्मूलन पर केंद्रित एक गैर-लाभकारी संस्था के रूप में शुरू किया था, लेकिन बाद में वह एक लाभकारी व्यवसाय में बदल गया। क्या कार्या एआई उद्योग के लिए वास्तव में और अधिक समावेशी और नैतिक मॉडल हो सकता है? अगर ऐसा है तो इसका पैमाना क्या हो सकता है?

एक चीज तो स्पष्ट हैः जमीनी स्तर पर बेहतर परीक्षण के कुछ आधार हो सकते हैं- एक ऐसा देश जहां मोबाइल डेटा दुनिया में सबसे सस्ता है और जहां गरीब ग्रामीणों की भी स्मार्टफोन और बैंक खाता दोनों तक पहुंच आम है। एआई से और भी सम्भावित लाभ हो सकते हैं। विश्व बैंक के अनुसार कोविड महामारी से पहले भी भारत में लगभग 140 करोड़ लोग रोजाना 2.15 डॉलर से कम पर जीवनयापन करते थे। उन लोगों के लिए, चोपड़ा जिस वित्तीय स्थिरता की बात कर रहे हैं, वह जीवन बदलने वाला हो सकता है।

बेंगलुरु से सिर्फ 70 किमी की दूरी पर एक गांव है-चिलुकावडी। यह गांव प्रौद्योगिकी के महानगरीय कोलाहल से दूर गन्ने के खेतों के पीछे और खिले हुए गुलमोहर पेड़ों से आच्छादित है। कंक्रीट से बनी एक इमारत में, एक स्थानीय कृषि सहकारी समिति का मुख्यालय है। यहां लगभग दर्जनभर स्त्री-पुरुष एकत्रित हैं जिन्होंने हफ्तेभर पहले ही कार्या के लिए काम करना शुरू किया है।

इन्हीं लोगों में से एक हैं 21 वर्षीय दुबले-पतले कनकराज एस., जो ठंडे फर्श पर पालथी मारकर बैठे हैं। वह पास के एक कॉलेज में पढ़ते हैं और पढ़ाई एवं आने-जाने में लगने वाले किराए का खर्च निकालने के लिए कभी-कभी आसपास के खेतों में दिहाड़ी मजदूर के रूप में काम कर लेते हैं। एक दिन काम करने के बदले में वे 350 रुपए (लगभग 4 डॉलर) कमा लेते हैं लेकिन ऐसी मेहनत उनके लिए असहनीय होती जा रही है क्योंकि गर्मी सामान्य से भी बहुत ज्यादा है।

पास के शहर में एक कारखाने में काम करने पर उन्हे पैसे तो जरूर ज्यादा मिल जाएंगे लेकिन यह आय बहुत बड़ी कीमत लिए है। रोजाना आने-जाने में बसों में लगने वाला घंटों का वक्त, बस का किराया, अविश्वसनीय रूप से शारीरिक परेशानी, और सबसे बदतर तो यह कि अगर वे शहर में कमरा लेकर कहीं रहते हैं तो वे अपने नेटवर्क से दूर होते जाएंगे। मित्रों से मिलना भी दूर की कौड़ी रह जाएगा।

कार्या में, कनकराज एक घंटे में उससे ज्यादा कमा सकते हैं जितना वह खेतों में पूरा एक दिन काम करने के बाद कमा पाते। वह कहते हैं- “काम तो अच्छा है और आसान भी।” इस मुद्दे पर चोपड़ा का कहना है कि जब वह आम लोगों से मिलते हैं तो लोग अक्सर और हमेशा ही ऐसी प्रशंसा भरी बात कहते हैं।

वह कहते हैं- ‘लोग खुश हैं कि हम उन्हें अच्छा वेतन देते हैं।’ लेकिन ज्यादा महत्वपूर्ण तो यह है कि ‘यह मुश्किलभरा और मेहनत वाला काम नहीं है। यह शारीरिक काम नहीं है।’ कनकराज को उस वक्त आश्चर्यमिश्रित खुशी हुई जब उनके बैंक खाते में भुगतान पहली बार आया। चोपड़ा कहते हैं कि कनकराज ने उन्हें बताया है- ‘इसके पहले घोटालों में उसका ढेर सारा धन लुट गया था।’

उसने यह भी कहा कि ग्रामीणों को अक्सर ही उनके मोबाइल पर एसएमएस आते हैं कि यदि वे उनके यहां धन जमा करें तो वापसी में दस गुना से भी ज्यादाधन लौटाया जाएगा। जब किसी ने उन्हें पहली बार कार्या के कामकाज के बारे में बताया तो उसकी भी प्रारम्भिक प्रतिक्रिया कुछ ऐसी ही थी।

लोगों की बचत बहुत कम है। स्थानीय लोग इमर्जेंसी जरूरतों के लिए कर्ज लेते हैं। लुटेरी एजेंसियां इन कर्जों पर ऊंची ब्याज दरें वसूलती हैं जिससे यहां के कुछ ग्रामीण कर्ज के चक्र में फंस जाते हैं। उदाहरण के लिए, चंद्रिका को कार्या से जब अपने काम के पैसे मिलेंगे तो वह इस राशि में से कुछ का उपयोग अपने परिवार के कर्ज की भरपाई के लिए करेगी। जब उसकी बहन बीमार हो गई थी तब चंद्रिका के परिवार ने इलाज के लिए बड़ा कर्ज लिया था। इलाज के बावजूद, उसकी बहन को बचाया नहीं जा सका। परिवार पर एक शिशु और कर्ज का पहाड़ दोनों का बोझ आ गया।

चंद्रिका रोते हुए कहती है कि उसे यह समझ में नहीं आ रहा था कि कर्ज को कैसे चुकाया जाएगा। हम अपनी बहन को तो वापस नहीं ला सकते थे। कार्य के अन्य वर्कर्स की भी कमोवेश यही स्थिति है। 25 वर्षीय अजय कुमार भी कर्ज मे डूबे हैं। उनकी मां को पीठ में चोट लग गई थी। मां के इलाज के लिए उन्होंने कर्ज लिया था। ऐसे ही एक हैं 38 वर्षीय शिवन्ना एन.। उनका बचपन में ही पटाखे की एक फैक्ट्री में हुई दुर्घटना में हाथ चला गया था। उन पर कोई कर्ज तो नहीं है लेकिन उनकी दिव्यांगता का मतलब है-आजीवन अपने जीवन-यापन के लिए संघर्ष करना।

ये ग्रामीण जो काम कर रहे हैं, वह नई परियोजना का हिस्सा है जिसे कार्या स्वास्थ्य सेवा क्षेत्र के एनजीओ के साथ कर्नाटक राज्य में शुरू कर रहा है। टीबी को लेकर स्पीच डेटा (आवाज का डेटा संग्रह करने की प्रक्रिया) का संग्रह किया जा रहा है।

टीबी इलाज योग्य और रोकथाम योग्य बीमारी है। इस बीमारी से अभी भी हर साल लगभग दो लाख भारतीयों की जान चली जाती है। आवाज की रिकॉर्डिंग कन्नड़ भाषा की दस अलग-अलग बोलियों में की जा रही है जिससे एआई स्पीच मॉडल के लिए प्रशिक्षित किया जाएगा।

टीबी के बारे में एआई स्थानीय लोगों के सवालों, उनकी समस्याओं को समझेगा और जवाब भी देगा जिससे बीमारी के फैलने का खतरा कम हो सकेगा। उम्मीद यही है कि यह ऐप जब तैयार हो जाएगा, अशिक्षित लोगों को विश्वसनीय जानकारी देने में सक्षम होगा, जानकारी तक पहुंच को आसान बनाएगा।

टीबी के मरीज को भी इस कलंक से निपटने में आसानी मिलेगी। यह रिकॉर्डिंग कन्नड़ डेटासेट के हिस्से के रूप में कार्या के प्लेटफॉर्म पर बिक्री के लिए भी जाएगी। एआई कम्पनियां इससे फायदा उठा सकेंगी। हर बार जब इसे दोबारा बेचा जाएगा तो 100 फीसद राजस्व उन कार्या कार्यकर्ताओं में बांटा जाएगा जिन्होंने डेटासेट में योगदान दिया था। राशि का वितरण इस काम में उनके द्वारा खर्च किए गए घंटों के अनुसार किया जाएगा।

ऐसी ही एक महिला हैं 30 वर्षीया राजम्मा एम, जो पास के ही गांव में रहती हैं। वह कोविड-19 में सरकार की तरफ से सर्वेयर का काम करती थीं। घर-घर जाकर वह आंकड़े जुटाती थीं कि किसे टीका लगा है और किसे नहीं। लेकिन यह काम जनवरी में खत्म हो गया। अब वह कार्या के लिए काम करती है और उन्हें आय होती है। वह काम मिलने के लिए कार्या की एहसानमंद तो हैं ही, साथ ही वह इस बात की भी प्रशंसा करती हैं कि उन्हें सीखने को बहुत कुछ मिला।

वह कहती हैं- ‘इस काम ने मुझे टीबी के बारे में, लोगों को इसकी दवा कैसे लेनी चाहिए, कैसे बचना चाहिए, के संदर्भ में बहुत ज्यादा जानकारी और जागरूकता दी है। भविष्य में यह अनुभव मेरी नौकरी में सहायक होगा।’

कार्या हालंकि छोटी सी इकाई है। फिर भी पहले से ही माइक्रोसॉफ्ट, एमआईटी और स्टैनफोर्ड समेत कई हाई-प्रोफाइल कंपनियां उसकी क्लाइंट हैं और कार्या की सूची में हैं। फरवरी में, इसने बिल और मेलिंडा गेट्स फाउंडेशन के लिए एक नई परियोजना पर काम शुरू किया है। लगभग एक अरब भारतीयों की ओर से बोली जाने वाली पांच भाषाओं-मराठी, तेलुगु, हिंदी, बंगाली और मलयालम में वॉयस डेटासेट बनाने का लक्ष्य है। यह परियोजना उसी का हिस्सा है।

अंतिम लक्ष्य एक चैटबॉट बनाना है जो स्वास्थ्य देखभाल, कृषि, स्वच्छता, बैंकिंग और कैरियर विकास के बारे में ग्रामीण भारतीयों के सवालों का उनकी मूल भाषाओं और बोलियों में जवाब दे सके। यह प्रौद्योगिकी (इसे गरीबी उन्मूलन के लिए चैटजीपीटी के रूप में सोचें) जीवन की गुणवत्ता में सुधार के लिए उपमहाद्वीप के विशाल क्षेत्र में आवश्यक जानकारी साझा करने में मदद कर सकती है।

माइक्रोसॉफ्ट रिसर्च की भाषाविद् और प्रमुख शोधकर्ता कालिका बाली कहती हैं कि, ‘मुझे लगता है कि एक ऐसी दुनिया होनी चाहिए जहां भाषा प्रौद्योगिकी के लिए कोई बाधा न बने ताकि हर कोई प्रौद्योगिकी का उपयोग कर सके, चाहे वह कोई भी भाषा, बोली बोलता हो।’ कालिका बाली परियोजना पर गेट्स फाउंडेशन के साथ काम कर रही हैं तथा परियोजना और कार्या के निरीक्षण बोर्ड की अवैतनिक सदस्य हैं।

उन्होंने विशेष रूप से लिंग पूर्वाग्रह को कम करने पर काम किया है। उन्होंने श्रमिकों को जोर से पढ़ने के लिए दिए जाने वाले संकेतों को डिजाइन किया है। उनका काम सिर्फ संकेतों के बारे में ही नहीं है। बाली कहती हैं- कार्या का ज्यादा वेतन ‘डेटा की गुणवत्ता को बढ़ाने में बड़ा सहायक है। इससे सिस्टम के आउटपुट की बेहतर सटीकता तुरंत मिल सकेगी।’ वह आगे यह भी कहती हैं आमतौर पर उन्हें कार्या से जो डेटा मिलता है, उसमें एक फीसद से भी कम गलती होती है। जिस डेटा के साथ हम एआई का मॉडल बनाते हैं, उसके मामले में ऐसा लगभग कभी नहीं होता है।

मैं और चोपड़ा कई दिनों तक एकसाथ रहे। इस दौरान चोपड़ा ने मेरे साथ अपनी जिन्दगी के कुछ अंतरंग क्षण साझा किए। चौपड़ा ने ऐसा ही एक वाक्या सुनाया जो कार्या से उनके जुड़ाव को आत्मसात करता है। उनका जन्म 1996 में दिल्ली में रेलवे लाइन के बगल की एक बस्ती में हुआ था। उनके दादा-दादी 1947 में भारत के विभाजन के दौरान पाकिस्तान से शरणार्थी के रूप में वहां आए थे और परिवार दो पीढ़ियों तक वहीं रह रहा था।

वह कहते हैं कि हालांकि, उनके माता-पिता सुशिक्षित थे फिर भी कभी-कभी उन्हें भोजन जुटाने के लिए संघर्ष करना पड़ता था। उनके पिता ट्रेन के कल-पुर्जे बनाने वाली एक छोटी फैक्ट्री चलाते थे। डिनर में उनके खाने में सस्ती दाल नहीं, बल्कि अपेक्षाकृत महंगी मैगी इंस्टेंट रेमन होती थी।

पर, हर मानसून में बस्ती में गंदा पानी भर जाता था और उनका परिवार कुछ दिनों के लिए पास में ही स्थित दादी के घर चला जाता था। कार्या टीम के बारे में चोपड़ा कहते हैं कि मैं सोचता हूं कि हम सभी इस विचार से प्रेरित हैं कि धन सहारा है जो एक सच्चाई है। हमारा लक्ष्य यथासंभव अधिक से अधिक लोगों को वह सहायता प्रदान करना है।

चोपड़ा ने अपनी बस्ती के स्कूल में उत्कृष्ट प्रदर्शन किया है। यह स्कूल एक एनजीओ चलाता था। जब वह नौंवी कक्षा में थे, उन्हें दिल्ली के एक निजी स्कूल से छात्रवृत्ति मिली। गरीब पृष्ठभूमि के बच्चों को स्कूल में दाखिला देने के लिए प्रतियोगिता हुई थी जिसमें उन्हें सफलता मिली। हालांकि, उन्हें तंग किया गया।

वह स्वीकार करते हैं कि कुछ विशेषाधिकारों ने उनके लिए दरवाजे खोलने में मदद की। वह कहते हैं- ‘मेरी जिन्दगी जितनी कठिन थी, भारत में अधिकांश लोगों की तुलना में वह काफी आसान थी क्योंकि मेरा जन्म एक बड़े शहर में, दो शिक्षित माता-पिता के घर और उच्च-जाति के परिवार में हुआ था।’

चोपड़ा जब 17 वर्ष के थे, दिल्ली में एक बस में एक महिला के साथ घृणतापूर्ण तरीके से दुष्कर्म किया गया था। यह एक ऐसा अपराध था जिसने भारत और दुनिया को झकझोर कर रख दिया। चोपड़ा का उस समय कंप्यूटर साइंस के प्रति लगाव बढ़ गया था और वे स्टीव जॉब्स को अपना आदर्श मानते थे। उ

न्होंने हाथ की घड़ी के स्टाइल में ‘छेड़छाड़-रोधी उपकरण’ बनाया जो बढ़ी हुई हृदयगति का पता लगा सकता था और हमलावर को धीमा बिजली का झटका दे सकता था ताकि पीड़ित को भाग निकलने का समय मिल सके। इस डिवाइस ने मीडिया का ध्यान खींचा और भारत के पूर्व राष्ट्रपति डॉ. ए.पी.जे. अब्दुल कलाम ने चोपड़ा को स्टैनफोर्ड में छात्रवृत्ति के लिए आवेदन करने के लिए प्रोत्साहित किया। (चोपड़ा याद करते हुए कहते हैं कि उन्हें स्टेनफोर्ड के बारे में केवल एक बात ही पता थी कि स्टीव जॉब्स ने वहां पढ़ाई की है।

बाद में उन्हें पता चला कि उनकी जानकारी सच नहीं थी) बाद में, चोपड़ा को गैजेट के जरिए यौन हिंसा की समस्या हल करने की कोशिश की नादानी का एहसास हुआ। वह कहते हैं कि प्रौद्योगिकीविदों में किसी समस्या को देखने और उसे हल करने की प्रवृत्ति बहुत अधिक होती है। 11वीं कक्षा के बच्चे की आलोचना करना कठिन है, लेकिन यह बहुत ही तकनीकी समाधान था।

जैसा कि वह बताते हैं कि कैलिफोर्निया में उनका आना कई मायनों में एक सांस्कृतिक झटका था। चोपड़ा कहते हैं- पहली रात को ही उनके छात्रावास में हर छात्र ने यही बताया कि वह अपना पहला अरब डॉलर कैसे कमाएगा। किसी ने ‘पिल्लों (कुत्ते के बच्चों) के लिए स्नैपचैट’ बनाने का सुझाव दिया।

उन्हें एहसास हुआ कि यहां तो हर किसी की योजना अरबपति बनने की है, सिवाय उनके। चोपड़ा आगे कहते हैं कि स्टैनफोर्ड में बहुत पहले, उन्हें अकेलापन महसूस होता था, जैसे गलत जगह पर आ गए हों। फिर भी वह कॉलेज में “टेक्नो-यूटोपियन” के रूप में आए थे।

धीरे-धीरे उनका अकेलापन दूर होता गया क्योंकि उन्होंने कक्षा में सीखा कि आईबीएम ने कैसे दक्षिण अफ्रीका में अपना श्रमबल बढ़ाने के लिए व्यवस्था बनाई और प्रौद्योगिकी कंपनियों ने कैसे खुद ही लाभ कमाने के लिए दुनिया को नुकसान पहुंचाया।

भारत लौटने के बाद, चोपड़ा माइक्रोसॉफ्ट रिसर्च, जो बिग टैक कंपनी की सहायक कंपनी है, में शामिल हो गए। यह कंपनी मुश्किलभरी सामाजिक समस्याओं पर काम करने के लिए शोधकर्ताओं को बहुत छूट देती है। अपने सहयोगी विवेक शेषाद्रि के साथ, उन्होंने इस मुद्दे पर शोध करना शुरू किया कि क्या डिजिटल का उपयोग करके ग्रामीण भारतीयों तक पैसा पहुंचाना संभव हो सकेगा।

चोपड़ा की पहली फील्ड विजिट मुंबई में एक एआई डेटा कंपनी द्वारा संचालित केंद्र की हुई। वह याद करते हुए कहते हैं कि कमरा गंदा, बहुत ही गरम था और लोगों से भरा हुआ था। इमेज एनोटेशन पर काम करने वाले लोग लैपटॉप पर झुके हुए थे।

जब उन्होंने इन लोगों से पूछा कि वे कितना कमा लेते हैं, उनका जबाव था 30 रुपए यानी 0.40 डॉलर प्रतिघंटा। उन्हें यह बताने का साहस नहीं था कि जिस डेटा को वे एनोटेट कर रहे थे, उसकी दर, परंपरागत रूप से, उस राशि से 10 गुना है। वह कहते हैं कि मैंने सोचा, काम करने का यह एकमात्र तरीका नहीं हो सकता।

चोपड़ा और शेषाद्रि ने माइक्रोसॉफ्ट रिसर्च में चार वर्ष तक इस विचार पर काम किया, फील्ड-स्टडी की और एक प्रोटोटाइप ऐप बनाया। 2019 में चार सहयोगियों के साथ उन्होंने एक रिसर्च प्रकाशित की। भारत के गांवों में रहने वाले गरीबों के बीच काम करने की उत्साह से भरी यह रिसर्च थी।

रिसर्च से चोपड़ा और शेषाद्रि के इस गुमान की पुष्टि हुई कि काम को बिना किसी प्रशिक्षण, कार्यालय के बजाए सिर्फ स्मार्टफोन से, अंग्रेजी न जानने वाले कार्यकर्ताओं के जरिए उच्च मानकों की सटीकता के साथ किया जा सकता है। इस प्रकार न केवल शहर के लोगों तक बल्कि ग्रामीण भारत के सबसे गरीब लोगों तक भी पहुंचना संभव हो गया।

2021 में चोपड़ा और शेषाद्रि ने, माइक्रोसॉफ्ट रिसर्च से अपनी नौकरी छोड़ दी और कार्या को एक स्वतंत्र गैर-लाभकारी संस्था के रूप में स्थापित किया। इसमें तीसरे सह-संस्थापक सफिया हुसैन भी शामिल हुए हैं। (माइक्रोसॉफ्ट की कार्या में कोई इक्विटी नहीं है।)

सिलिकॉन वैली के गरीबों से अमीर बनने की कई कहानियों के विपरीत, चोपड़ा कहते हैं कि उनकी सफलता उनके खुद की कड़ी मेहनता का परिणाम नहीं है। वह कहते हैं- ‘मैं लगातार 100 बार भाग्यशाली रहा। मैं गैर-लाभकारी संस्थाओं, स्कूलों, सरकार की अतार्किक करुणा का उत्पाद हूं-जिनसे हर किसी की मदद करने की अपेक्षा की जाती है, लेकिन वे ऐसा करते नहीं है। जब मुझे इतनी दया मिली है तो मैं कम से कम इतना तो कर ही सकता हूं कि उसे वापस लौटा दूं।’

हर कोई कार्या में काम करने के लिए उपयुक्त नहीं है। चोपड़ा कहते हैं कि शुरुआत में उन्होंने और उनकी टीम ने हर किसी के लिए ऐप को खोला। पर सामने आया कि पहले सौ साइन-अप करने वाले सभी लोग एक ही प्रमुख जाति- समुदाय के पुरुष थे। अनुभव ने उन्हें सिखा दिया है, ‘ज्ञान सत्ता के चैनलों के जरिए बहता है।’ चोपड़ा को पहले ही पता चल गया था कि उन्हें ग्रामीण क्षेत्रों में जमीनी स्तर पर खुद की मौजूगी के साथ गैर-लाभकारी संस्थाओं के साथ मिलकर काम करना होगा।

सबसे गरीब समुदायों और हाशिये की जातियों तक पहुंचने के लिए यही रास्ता भी था। यह भी मालुम था कि ये संगठन आय और विविध आवश्यकताओं के अनुरूप कार्या की ओर से एक्सेस कोड वितरित कर सकते हैं। वह कहते हैं कि उन्हें ज्ञात है कि पैसा किसके लिए अच्छा है और किसके लिए यह जीवन बदलने वाला है। यह प्रक्रिया श्रमिकों द्वारा तैयार किए जाने वाले डेटा में ज्यादा विविधता भी सुनिश्चित करती है, जिसकी वजह से एआई पूर्वाग्रह को कम करने में मदद मिल सकती है।

चोपड़ा अपनी इस पद्धति को हिन्दी के एक शब्द -ठहराव- का उपयोग करके परिभाषित करते हैं। भारतीय शास्त्रीय संगीत में उपयोग किए जाने वाला यह एक शब्द है। इसका अनुवाद वह ‘विराम’ और ‘विचारशील प्रभाव’ के मिश्रण के रूप में करते हैं। उनका कहना है कि ठहराव एक अवधारणा है, जो न केवल अंग्रेजी भाषा से गायब है, बल्कि सिलिकॉन वैली, तकनीकी कंपनियों के व्यापार दर्शन से भी गायब है, जो अक्सर पैमाने और गति को बाकी सभी चीजों से ऊपर रखती हैं।

उनके लिए ठहराव का अर्थ है-‘हर कदम पर आप रुक रहे हैं और सोच रहे हैं: क्या मैं सही काम कर रहा हूं? क्या हमारा काम उस समुदाय के लिए सही है जिसकी मैं सेवा करने का प्रयास कर रहा हूं?’ वह कहते हैं कि इस तरह की विचारशीलता बहुत से उपक्रमों से गायब है। अब नया मंत्र है- ‘तेजी से आगे बढ़ो और चीजों को अलग कर दो।’ उद्यमों के इसी दृष्टिकोण के कारण कार्या ने कंटेट मॉडरेशन करने के लिए चार ग्राहकों के प्रस्तावों को स्पष्ट रूप से अस्वीकार कर दिया।

यह कथन सम्मोहक है. लेकिन यह कथन एक ऐसे इंसान की तरफ से कहा जा रहा है जिसका कहना है कि वह अपने ऐप को 2030 तक 100 मिलियन भारतीयों तक पहुंचाना चाहता है। क्या जमीनी स्तर के गैर सरकारी संगठनों पर निर्भरता का मतलब यह नहीं है कि कार्या को एक महत्वपूर्ण बाधा का सामना करना पड़ रहा है?

दरअसल, चोपड़ा ने मुझसे कहा, कार्या के विस्तार में नए कर्मचारी नहीं तलाश पाना सीमित कारक है। ऐसे लाखों लोग हैं जो उच्च वेतन के अवसर का लाभ उठाएंगे और कार्या ने उन्हें अपने साथ जोड़ने के लिए 200 से अधिक जमीनी स्तर के गैर सरकारी संगठनों का एक जांचा-परखा नेटवर्क बनाया है।

वह कहते हैं कि हमें बड़े पैमाने पर जागरूकता बढ़ाने की जरूरत है। चोपड़ा का मानना है कि ऐप के प्रभाव के लिए, उन्हें अधिक ग्राहकों के भरोसे की जरूरत है। ज्यादा प्रौद्योगिकी कंपनियों, सरकारों और शैक्षणिक संस्थानों को राजी करना होगा कि वे कार्या से अपना एआई प्रशिक्षण डेटा प्राप्त करें।

लेकिन अक्सर होता यह है कि नैतिकता पर गर्व करने वाली कंपनियां नए ग्राहकों की तलाश के लिए समझौता कर सकती हैं। ऐसा न होने देने के लिए कार्या क्या करेगी? अपने जवाब के हिस्से में, चोपड़ा कहते हैं कि इसका जवाब कार्या की कॉर्पोरेट संरचना में निहित है।

कार्या अमेरिका में एक गैर-लाभकारी संस्था के रूप में पंजीकृत है जो भारत में दो संस्थाओं को नियंत्रित करती है: एक गैर-लाभकारी और एक लाभ के लिए। लाभ कमाने वाली संस्था कानूनी रूप से अपने किसी भी लाभ को (कर्मचारियों को प्रतिपूर्ति करने के बाद) गैर-लाभकारी संस्था को दान देने के लिए बाध्य है जिससे री-इन्वेस्ट होता है। चोपड़ा कहते हैं, कार्या अनुदान निधि लेता है। यह अपने सभी 24 पूर्णकालिक कर्मचारियों के वेतन को कवर करता है लेकिन आंतरिक रूप से गैर-लाभकारी मॉडल संभव होने के लिए पर्याप्त नहीं है। चोपड़ा का कहना है कि इस व्यवस्था से उन्हें या उनके सह-संस्थापकों को आकर्षक अनुबंधों के बदले में श्रमिकों के वेतन या कल्याण से समझौता करने के लिए किसी भी प्रोत्साहन को हटाने का लाभ मिलेगा।

द/नज इंस्टीट्यूट की मैनेजिंग पार्टनर सुभाश्री दत्ता, जिन्होंने कार्या को 20 हजार डॉलर के अनुदान के साथ अपना सहयोग दिया है, कहती हैं-‘कार्या बहुत युवा संस्था है। उसके पास अपने मूल्यों के प्रति ईमानदार रहने और फिर भी पूंजी को आकर्षित करने की क्षमता है। मुझे नहीं लगता कि कार्या लाभ के लिए अथवा गैर-लाभ के लिए कशमकश की स्थिति में रहेगी।

दक्षिणी कर्नाटक में कार्या कार्यकर्ताओं के साथ दो दिन बिताने के बाद कार्या की मौजूदा व्यवस्था की सीमाएं दिखने लगीं। हर कार्यकर्ता का कहना था कि उन्होंने ऐप पर 1,287 टास्क पूरे कर लिए हैं। मेरे दौरे के समय, टीबी परियोजना पर उपलब्ध कार्यों की संख्या में यह अधिकतम है। श्रमिकों को मिलने वाली राशि एक स्वागत योग्य प्रोत्साहन है, लेकिन लंबे समय तक ऐसा नहीं चलने वाला है। अपनी यात्रा में, मैं ऐसे किसी भी कर्मचारी से नहीं मिला, जिसे रॉयल्टी मिली हो। चोपड़ा ने मुझसे कहा कि कार्या ने खरीदारों के लिए पर्याप्त पुनर्विक्रय योग्य डेटा एकत्र किया है; अब तक लगभग 4,000 श्रमिकों को 1,16,000 डॉलर की रॉयल्टी बांटी गई है।

मैंने चोपड़ा से बातचीत में कहा कि इन ग्रामीणों के जीवन पर सार्थक असर पड़ने में अभी बहुत समय लगेगा? उन्होंने जवाब दिया कि टीबी परियोजना तो अभी इन कामगारों के लिए शुरुआत है। वे जल्द ही ट्रांसक्रिप्सन टास्क पर काम शुरू करने जा रहे हैं। ट्रांसक्रिप्सन टास्क कन्नड़ सहित कई क्षेत्रीय भाषाओं में एआई मॉडल बनाने के लिए भारत सरकार के प्रयासों का हिस्सा है।

उनका कहना है कि इससे कार्या को चिलुकावडी में ग्रामीणों को “बहुत ज्यादा” काम देने की अनुमति मिलेगी। फिर भी कामगार 1,500 डॉलर से बहुत दूर हैं जो कार्या के सिस्टम में है। चोपड़ा ने स्वीकार भी किया कि कार्या के 30,000 कर्मचारियों में से एक भी 1,500 डॉलर की सीमा तक नहीं पहुंचा है। फिर भी काम के प्रति उनका लगाव, काम के प्रति उनकी अधिक इच्छा स्पष्ट है। शेषाद्रि, जो अब कार्या के मुख्य प्रौद्योगिकी अधिकारी हैं, ने जब कामगारों से भरे कमरे में जब उनसे पूछा कि क्या वह कन्नड़ वाक्यों में अशुद्धियों को चिह्नित करने वाले नए कार्य में खुद को सक्षम महसूस करेंगे तो वे उत्साहित हो गए. उन्होंने सर्वसम्मति से हां में जवाब दिया।

मैं चिलुकावाडी और अलहल्ली गांव में जिन लोगों से मिला और बात की तो लगा कि उनकी ऑर्टिफिशियल इंटेलीजेंस के बारे में समझ सीमित है। चोपड़ा कहते हैं कि श्रमिकों को यह समझाना चुनौतीपूर्ण हो सकता है कि वे क्या कर रहे हैं। उनका कहना है कि उनकी टीम ने समझाने का जो सबसे सफल तरीका खोजा है, वह है कर्मचारियों को यह बताना कि वे ‘ कंप्यूटर को कन्नड़ बोलना सिखा रहे हैं’।

यहां कोई भी चैटजीपीटी के बारे में नहीं जानता, लेकिन गांव वालों को मालुम है कि गूगल असिस्टेंट (जिसे वे ‘ओके गूगल’ कहते हैं) तब बेहतर काम करता है जब आप इससे अपनी मातृभाषा की तुलना में अंग्रेजी में कहते हैं। तीन बच्चों के 35 वर्षीय बेरोजगार पिता सिद्धाराजू एल. का कहना है कि उन्हें नहीं मालुम कि एआई क्या होता है, लेकिन अगर कंप्यूटर उनकी भाषा बोल सके तो उन्हें गर्व महसूस होगा। मेरे मन में अपने माता-पिता के लिए जितना सम्मान है, उतना ही सम्मान अपनी मातृभाषा के लिए भी है। जिस तरह भारत 4जी मामले में बाकी दुनिया से आगे निकलने में सक्षम था, क्योंकि उस पर मौजूदा मोबाइल डेटा इंफ्रास्ट्रक्चर का बोझ नहीं था। उम्मीद है कि उसी तरह कार्या की कोशिशों से भारतीय भाषा की एआई परियोजनाओं को सीखने में मदद मिलेगी। कहीं अधिक विश्वसनीय और निष्पक्ष बिंदु से शुरुआत करें। स्पीच शोधकर्ता बाली अपने उच्चारण को संदर्भित करते हुए कहती हैं, ‘कुछ वक्त पहले तक अंग्रेजी के लिए स्पीच-पहचान इंजन मेरी अंग्रेजी भी नहीं समझता था।’ वह यह भी कहती हैं-‘एआई प्रौद्योगिकियों के होने का क्या मतलब, अगर वे उपयोगकर्ताओं की जरूरत पूरा नहीं कर पाएं?’
टाइम मैगजीन की कवर स्टोरी जो आप पढ़ रहे हैं देशज टाइम्स पर,उन्हीें के साभार
बिली पेरिगो की ओर से

--Advertisement--

ताज़ा खबरें

Editors Note

लेखक या संपादक की लिखित अनुमति के बिना पूर्ण या आंशिक रचनाओं का पुर्नप्रकाशन वर्जित है। लेखक के विचारों के साथ संपादक का सहमत या असहमत होना आवश्यक नहीं। सर्वाधिकार सुरक्षित। देशज टाइम्स में प्रकाशित रचनाओं में विचार लेखक के अपने हैं। देशज टाइम्स टीम का उनसे सहमत होना अनिवार्य नहीं है। कोई शिकायत, सुझाव या प्रतिक्रिया हो तो कृपया [email protected] पर लिखें।

- Advertisement -
- Advertisement -
error: कॉपी नहीं, शेयर करें