OCR कैसे काम करता है? सरल और बोधगम्य तरीके से समझाया गया
इस लेख में हम बताते हैं कि ओसीआर कैसे काम करता है। OCR का अर्थ "ऑप्टिकल कैरेक्टर रिकॉग्निशन" है और इसे जर्मन में टेक्स्ट रिकग्निशन के रूप में संदर्भित किया जाता है। इसका मतलब यह है कि एक कंप्यूटर OCR का उपयोग करके स्कैन की गई छवि पर पाठ को पहचान सकता है और फिर इसे एक साधारण पाठ दस्तावेज़ में बदल सकता है।
यह OCR कैसे काम करता है
कल्पना करें कि आपको एक सहकर्मी से एक पेपर प्रस्तुति मिली। अब आप इन्हें पीसी पर संपादित करना चाहते हैं क्योंकि आपको अलग-अलग मार्ग पसंद नहीं हैं। इसलिए इसे स्कैन करें और अपने ओसीआर प्रोग्राम पर जाएं। अब निम्नलिखित होता है:
- सॉफ्टवेयर पहले एक तथाकथित लेआउट विश्लेषण करता है। ऐसा करने के लिए, वह पृष्ठ लेआउट को देखती है और छवियों को पाठ से अलग करती है। वह पृष्ठ पर अपनी स्थिति भी नोट करती है। फिर पैराग्राफ की संख्या को गिना जाता है और व्यक्तिगत तत्वों जैसे पेज नंबर को सहेजा जाता है।
- अब कठिन हिस्सा आता है। सॉफ्टवेयर व्यक्तिगत पाठ ब्लॉक को देखता है और उन्हें वाक्यों में तोड़ देता है। इसके बाद वाक्यों को अलग-अलग शब्दों में और शब्दों को अक्षरों में विभाजित किया जाता है।
- OCR सॉफ्टवेयर में अक्षरों और वर्णों के पैटर्न होते हैं। कार्यक्रम अब इन पैटर्नों के साथ स्कैन किए गए अक्षरों की तुलना करता है। यदि वे 99% समान हैं, तो एल्गोरिथ्म तय करता है कि यह संभवतः वह पत्र होना चाहिए। यह बहुत सटीक है क्योंकि यह थोड़े समय में कई पैटर्न की तुलना कर सकता है। इस तरह वह सफलतापूर्वक "8" और "बी" के बीच अंतर करता है।
- इसलिए अक्षर और वर्ण धीरे-धीरे पहचाने जाते हैं। फिर उन्हें फिर से शब्दों के रूप में संयोजित किया जाता है और वाक्य में वापस उनके स्थान पर रखा जाता है। जैसे ही सॉफ़्टवेयर समाप्त हो जाता है, पूरी चीज़ एक सामान्य दस्तावेज़ में सहेज ली जाती है, जिसे आप तब संपादित कर सकते हैं। हो गया!
क्या आप अपने सॉफ़्टवेयर ज्ञान का परीक्षण करना चाहते हैं? हमारे बड़े सॉफ्टवेयर क्विज़ में भाग लें!