सर्च इंजन इंटरनेट संसाधनों जैसे वेब पेजों, समाचार समूहों, कार्यक्रमों, छवियों (images) आदि के एक विशाल डेटाबेस को संदर्भित करता है। यह वर्ल्ड वाइड वेब पर जानकारी का पता लगाने में मदद करता है।
उपयोगकर्ता कीवर्ड या वाक्यांश के रूप में क्वेरी पास करके किसी भी जानकारी की खोज कर सकता है। इसके बाद यह अपने डेटाबेस में प्रासंगिक जानकारी खोजता है और उपयोगकर्ता के पास वापस आ जाता है।
सर्च इंजन क्या है?
सर्च इंजन एक वेब-आधारित उपकरण है जो उपयोगकर्ताओं को वर्ल्ड वाइड वेब पर जानकारी का पता लगाने में सक्षम बनाता है। सर्च इंजन के लोकप्रिय उदाहरण गूगल, याहू, बिंग, डकडकगो और एमएसएन सर्च आदि हैं।
खोज इंजन स्वचालित सॉफ़्टवेयर एप्लिकेशन (जिन्हें रोबोट, बॉट या स्पाइडर कहा जाता है) का उपयोग करते हैं जो वेब पर यात्रा करते हैं, पृष्ठ से पृष्ठ, साइट से साइट तक लिंक का अनुसरण करते हैं। मकड़ियों द्वारा एकत्रित की गई जानकारी का उपयोग वेब की खोज योग्य अनुक्रमणिका बनाने के लिए किया जाता है।
सर्च इंजन किस से बना होता है?
आम तौर पर एक खोज इंजन के तीन बुनियादी घटक होते हैं जो नीचे सूचीबद्ध हैं:
- वेब क्रॉलर
- डेटाबेस
- खोज इंटरफेस
वेब क्रॉलर
इसे स्पाइडर या बॉट्स के नाम से भी जाना जाता है। यह एक सॉफ्टवेयर घटक है जो जानकारी एकत्र करने के लिए वेब को पार करता है।
डेटाबेस
वेब पर सभी जानकारी डेटाबेस में संग्रहीत होती है। इसमें विशाल वेब संसाधन शामिल हैं।
खोज(सर्च) इंटरफेस
यह घटक उपयोगकर्ता और डेटाबेस के बीच एक इंटरफ़ेस है। यह उपयोगकर्ता को डेटाबेस के माध्यम से खोजने में मदद करता है।
सर्च इंजन कैसे काम करते हैं?
प्रत्येक खोज इंजन खोज परिणाम उत्पन्न करने के लिए विभिन्न जटिल गणितीय सूत्रों का उपयोग करता है। एक विशिष्ट क्वेरी के परिणाम तब SERP(Search Engine Results Page) पर प्रदर्शित होते हैं।
खोज इंजन एल्गोरिदम एक वेब पेज के प्रमुख तत्वों को लेता है, जिसमें पृष्ठ शीर्षक, सामग्री और कीवर्ड घनत्व शामिल है, और एक रैंकिंग के साथ आते हैं जहां पृष्ठों पर परिणाम रखना है। प्रत्येक खोज इंजन का एल्गोरिथम अद्वितीय है, इसलिए Yahoo! Google पर एक प्रमुख रैंकिंग की गारंटी नहीं देता है, और इसके विपरीत।
चीजों को और अधिक जटिल बनाने के लिए, खोज इंजन द्वारा उपयोग किए जाने वाले एल्गोरिदम न केवल बारीकी से संरक्षित रहस्य हैं, वे लगातार संशोधन और संशोधन के दौर से गुजर रहे हैं।
इसका मतलब यह है कि किसी साइट को सर्वोत्तम रूप से अनुकूलित करने के मानदंड को अवलोकन, साथ ही परीक्षण और त्रुटि के माध्यम से निर्धारित किया जाना चाहिए – और न केवल एक बार, बल्कि लगातार।
नौटंकी कम प्रतिष्ठित एसईओ फर्म बेहतर साइट रैंकिंग के जवाब के रूप में खोज इंजन के डेवलपर्स रणनीति के लिए बुद्धिमान बनने और उनके एल्गोरिदम को बदलने से पहले केवल एक छोटी अवधि के लिए सबसे अच्छा काम कर सकते हैं। अधिक संभावना है, इन तरकीबों का उपयोग करने वाली साइटों को खोज इंजन द्वारा स्पैम के रूप में लेबल किया जाएगा और उनकी रैंकिंग गिर जाएगी।
खोज इंजन केवल वेब पेजों पर टेक्स्ट को “देखते हैं”, और प्रासंगिकता निर्धारित करने के लिए अंतर्निहित HTML संरचना का उपयोग करते हैं। बड़ी तस्वीरें, या गतिशील फ्लैश एनीमेशन का खोज इंजन से कोई मतलब नहीं है, लेकिन आपके पृष्ठों पर वास्तविक टेक्स्ट का कोई मतलब नहीं है।
ऐसी फ़्लैश साइट बनाना कठिन है जो खोज इंजनों के अनुकूल हो; नतीजतन, फ्लैश साइटें उतनी ऊंची रैंक नहीं देंगी जितनी अच्छी तरह से कोडित एचटीएमएल और सीएसएस (कैस्केडिंग स्टाइल शीट्स – नियमित एचटीएमएल के ऊपर और परे वेबसाइट पेजों में शैलियों को जोड़ने के लिए एक जटिल तंत्र) के साथ विकसित साइटें।
यदि आप जिन शब्दों को खोजना चाहते हैं, वे आपकी वेबसाइट के टेक्स्ट में नहीं दिखाई देते हैं, तो आपकी वेबसाइट के लिए SERPs में उच्च स्थान प्राप्त करना बहुत मुश्किल होगा।
सर्च इंजन वर्किंग in Hindi
वेब क्रॉलर, डेटाबेस और सर्च इंटरफेस सर्च इंजन के प्रमुख घटक हैं जो वास्तव में सर्च इंजन को काम करने के लिए बनाता है। खोज इंजन द्वारा किए जाने वाले चरण निम्नलिखित हैं:
- खोज इंजन कीवर्ड की खोज के लिए सीधे वेब पर जाने के बजाय पूर्वनिर्धारित डेटाबेस के लिए अनुक्रमणिका में कीवर्ड की तलाश करता है।
- यह तब डेटाबेस में जानकारी खोजने के लिए सॉफ़्टवेयर का उपयोग करता है। इस सॉफ़्टवेयर घटक को वेब क्रॉलर के रूप में जाना जाता है।
- एक बार जब वेब क्रॉलर पृष्ठों को ढूंढ लेता है, तो खोज इंजन परिणाम के रूप में प्रासंगिक वेब पेज दिखाता है। इन पुनर्प्राप्त वेब पेजों में आम तौर पर पेज का शीर्षक, टेक्स्ट भाग का आकार, पहले कई वाक्य आदि शामिल होते हैं।
ये खोज मानदंड एक खोज इंजन से दूसरे में भिन्न हो सकते हैं। पुनर्प्राप्त की गई जानकारी को विभिन्न कारकों जैसे कि कीवर्ड की आवृत्ति, सूचना की प्रासंगिकता, लिंक आदि के अनुसार रैंक किया जाता है।
सर्च इंजन की Architecture
सर्च इंजन आर्किटेक्चर में नीचे सूचीबद्ध तीन बुनियादी परतें शामिल हैं:
- सामग्री संग्रह और शोधन।
- कोर(core) खोजें
- उपयोगकर्ता और एप्लिकेशन इंटरफेस
सर्च इंजन प्रसंस्करण (Processing)
अनुक्रमण (indexing) प्रक्रिया
अनुक्रमण (indexing) प्रक्रिया में निम्नलिखित तीन कार्य शामिल हैं:
- पाठ अधिग्रहण (Text acquisition)
- पाठ परिवर्तन (Text transformation)
- सूचकांक निर्माण (Index creation)
1. पाठ अधिग्रहण (Text acquisition)
यह अनुक्रमण (indexing) के लिए दस्तावेजों की पहचान और भंडारण करता है।
2. पाठ परिवर्तन (Text Transformation)
यह दस्तावेज़ को इंडेक्स टर्म्स या फीचर्स में बदल देता है।
3. सूचकांक निर्माण (Text Creation)
यह टेक्स्ट ट्रांसफॉर्मेशन द्वारा बनाए गए इंडेक्स टर्म्स लेता है और फास्ट सर्चिंग को सपोर्ट करने के लिए डेटा स्ट्रक्चर बनाता है।
प्रश्न प्रक्रिया (Query Process)
क्वेरी प्रक्रिया (Query Process) में निम्नलिखित तीन कार्य शामिल हैं:
- उपयोगकर्ता संपर्क (user interaction)
- श्रेणी (ranking)
- मूल्यांकन (evaluation)
1. उपयोगकर्ता संपर्क (user interaction)
यह उपयोगकर्ता क्वेरी के निर्माण और परिशोधन का समर्थन करता है और परिणाम प्रदर्शित करता है।
2. श्रेणी (ranking)
यह दस्तावेजों की क्रमबद्ध सूची बनाने के लिए क्वेरी और इंडेक्स का उपयोग करता है।
3. मूल्यांकन (evaluation)
यह प्रभावशीलता और दक्षता की निगरानी और माप करता है। यह ऑफ़लाइन किया जाता है।
सर्च इंजन के उदाहरण और प्रकार 2021
आज उपलब्ध कई खोज इंजन निम्नलिखित हैं:

खोज(सर्च) इंजन | Description in Hindi |
इसे मूल रूप से BackRub कहा जाता था। यह विश्व स्तर पर सबसे लोकप्रिय सर्च इंजन है। | |
बिंग(Bing) | इसे माइक्रोसॉफ्ट द्वारा 2009 में लॉन्च किया गया था। यह नवीनतम वेब-आधारित खोज इंजन है जो याहू के परिणाम भी प्रदान करता है। |
आस्क(Ask) | इसे 1996 में लॉन्च किया गया था और इसे मूल रूप से आस्क जीव्स के नाम से जाना जाता था। इसमें मिलान, शब्दकोश और वार्तालाप प्रश्न के लिए समर्थन शामिल है। |
AltaVista | इसे डिजिटल उपकरण निगम द्वारा 1995 में लॉन्च किया गया था। 2003 से, यह Yahoo तकनीक द्वारा संचालित है। |
AOL Search | यह Google द्वारा संचालित है। |
LYCOS | मीडिया मैट्रिक्स के अनुसार लाइकोस यह शीर्ष 5 इंटरनेट पोर्टल और 13वीं सबसे बड़ी ऑनलाइन संपत्ति है। |
Alexa | यह अमेज़ॅन की सहायक कंपनी है और वेबसाइट ट्रैफ़िक जानकारी प्रदान करने के लिए उपयोग की जाती है। |
DuckDuckGo | यह नवीनतम वेब-आधारित खोज इंजन है जो Bing के परिणाम प्रदान करता है। DuckDuckGo की स्थापना गेब्रियल वेनबर्ग ने 29 फरवरी, 2008 को की थी। यह एक गोपनीयता ब्राउज़र है। |
ECOSIA | Ecosia बर्लिन, जर्मनी में स्थित एक सर्च इंजन है। यह अपने मुनाफे का 80% गैर-लाभकारी संगठनों को दान करता है जो वनों की कटाई पर ध्यान केंद्रित करते हैं। यह पर्यावरण की परवाह करता है। |
Internet Archive | इंटरनेट आर्काइव एक अमेरिकी डिजिटल लाइब्रेरी है जिसमें “सभी ज्ञान के लिए सार्वभौमिक पहुंच” के घोषित मिशन के साथ है। यह वेबसाइटों, सॉफ्टवेयर एप्लिकेशन/गेम्स, संगीत, फिल्मों/वीडियो, चलती छवियों और लाखों पुस्तकों सहित डिजीटल सामग्रियों के संग्रह के लिए मुफ्त सार्वजनिक पहुंच प्रदान करता है। |
Baidu | Baidu एक चीनी प्रौद्योगिकी, इंटरनेट खोज और इंटरनेट सेवा कंपनी है। बहुराष्ट्रीय कंपनी की स्थापना 2000 में रॉबिन ली ने की थी और इसका मुख्यालय बीजिंग, चीन में है। … इस लेखन के समय, Baidu चीन में शीर्ष इंटरनेट खोज इंजन है और चीन के बाजार हिस्सेदारी के 75% से अधिक को नियंत्रित करता है। |
खोज(सर्च) इंजन के FAQ’s
Q. क्या गूगल एक सर्च इंजन है?
Google एक पूरी तरह से स्वचालित खोज इंजन है जो “वेब क्रॉलर” नामक सॉफ़्टवेयर का उपयोग करता है जो हमारी अनुक्रमणिका में जोड़ने के लिए साइटों को खोजने के लिए नियमित रूप से वेब का अन्वेषण करता है।
Q. 5 सबसे लोकप्रिय सर्च इंजन कौन से हैं?
नेटमार्केटशेयर, स्टेटिस्टा और स्टेटकाउंटर के आंकड़ों के मुताबिक, बाजार हिस्सेदारी के मामले में दुनिया भर में शीर्ष 5 खोज इंजन Google, बिंग, याहू, Baidu और यांडेक्स हैं।
Q. क्या बिंग गूगल से बेहतर है?
बिंग वर्तमान में याहू और माइक्रोसॉफ्ट के अधिकांश खोज कार्यों को शक्ति प्रदान करता है, जिससे यह दुनिया भर में दूसरा सबसे लोकप्रिय खोज इंजन बन गया है। हालाँकि Google बहुत बड़े पैमाने पर पहले स्थान पर है, बिंग के कई बेहतरीन लाभ हैं जो Google नहीं करता है। बिंग का परिणाम पृष्ठ लेआउट Google की तुलना में बेहतर प्रस्तुत किया गया है।
Q. क्या सफारी एक सर्च इंजन है?
सफारी ऐप्पल द्वारा समर्थित और विकसित एक वेब ब्राउज़र है, जबकि Google क्रोम मूल कंपनी अल्फाबेट के तहत Google द्वारा समर्थित एक वेब ब्राउज़र है।
Q. सबसे सुरक्षित सर्च इंजन कौन सा है?
डकडकगो
DuckDuckGo सबसे प्रसिद्ध सुरक्षित सर्च इंजन में से एक है। यह एक उपयोगी मेटासर्च टूल है जो याहू, बिंग और विकिपीडिया सहित 400 से अधिक स्रोतों से परिणाम एकत्र करता है।
Q. आज इस्तेमाल किया जाने वाला #1 सर्च इंजन क्या है?
गूगल। 86% से अधिक खोज बाजार हिस्सेदारी के साथ, किसी को पाठकों को Google से परिचित कराने की आवश्यकता नहीं है। हालांकि, इसे स्पष्ट रूप से खोज इंजनों की किसी भी सूची को ऊपर उठाने की आवश्यकता है।
Q. गूगल से पहले सर्च इंजन क्या था?
हमने खोज के लिए Yahoo, Lycos, या AltaVista का उपयोग किया, इंटरनेट पर चीजों को देखने का पर्याय बनने से पहले, याहू, जिसने पहले वेब को अनुक्रमित किया, ऑनलाइन नंबर दो सबसे लोकप्रिय साइट थी।