top of page

Concept of Search Engines (सर्च इंजन की अवधारणा)

  • Writer: Siddharth Sharma
    Siddharth Sharma
  • Mar 10
  • 5 min read

Internet पर अरबों वेबसाइट्स और वेब पेज (Web Pages) मौजूद हैं। इतने बड़े सूचना के समुद्र (Ocean of information) में से अपनी जरूरत की सटीक जानकारी ढूंढना किसी इंसान के लिए असंभव है। इसी समस्या को सुलझाने के लिए Search Engines का निर्माण किया गया।

सूचना के समुद्र (Ocean of information)

Definition (परिभाषा): Search Engine एक वेब-आधारित सॉफ्टवेयर सिस्टम (Web-based Software System) है जिसे World Wide Web (WWW) पर जानकारी खोजने (Search) के लिए डिज़ाइन किया गया है। जब कोई यूज़र कोई कीवर्ड (Keyword) टाइप करता है, तो सर्च इंजन अपने विशाल डेटाबेस में से उस कीवर्ड से मेल खाने वाले वेब पेजों की एक सूची (List) दिखाता है। इस सूची को SERP (Search Engine Results Page) कहा जाता है।

 SERP (Search Engine Results Page) कहा जाता है।

How Search Engines Work (सर्च इंजन कैसे काम करते हैं?)

एक सर्च इंजन मुख्य रूप से 3 चरणों (Steps) में काम करता है:


  1. Crawling (क्रॉलिंग): सर्च इंजन के पास विशेष प्रोग्राम्स होते हैं जिन्हें Web Crawlers, Spiders, या Bots कहा जाता है (जैसे Googlebot)। इनका काम इंटरनेट पर लगातार नए और अपडेटेड वेब पेजों को खोजना है। ये एक वेबसाइट के लिंक (Link) से दूसरी वेबसाइट के लिंक पर कूदते रहते हैं और डेटा इकट्ठा करते हैं।

    Crawling (क्रॉलिंग):
  2. Indexing (इंडेक्सिंग): क्रॉलर्स द्वारा इकट्ठा किए गए डेटा (Text, Images, Videos) को सर्च इंजन अपने विशाल सर्वर में एक व्यवस्थित (Organized) तरीके से स्टोर करता है। इस प्रक्रिया को Indexing कहते हैं। यह बिल्कुल किसी किताब के पीछे दिए गए 'Index Page' की तरह होता है।

    Indexing (इंडेक्सिंग):
  3. Ranking & Retrieval (रैंकिंग और रिट्रीवल): जब आप कोई Search Query (सवाल) टाइप करते हैं, तो सर्च इंजन का Algorithm अपने इंडेक्स में से सबसे सटीक और उपयोगी (Relevant) पेजों को छांटता है और उन्हें उनकी क्वालिटी और कीवर्ड मैच के आधार पर रैंक (Rank) करके आपकी स्क्रीन पर दिखा देता है।

    Ranking & Retrieval (रैंकिंग और रिट्रीवल):

PART 2: Types of Search Engines (सर्च इंजन के प्रकार)


सर्च इंजनों को उनके काम करने के तरीके और डेटा इकट्ठा करने की तकनीक के आधार पर 4 मुख्य प्रकारों में बांटा गया है:

Types of Search Engines

1. Crawler-Based Search Engines (क्रॉलर-आधारित सर्च इंजन)

ये सबसे लोकप्रिय और आधुनिक सर्च इंजन हैं। ये अपने आप काम करते हैं और वेब पेजों को खोजने के लिए पूरी तरह से Spiders या Crawlers पर निर्भर होते हैं।

  • Working: ये इंटरनेट पर लगातार क्रॉलिंग और इंडेक्सिंग करते रहते हैं। इनका एल्गोरिदम बहुत जटिल (Complex) होता है।

  • Examples: Google, Microsoft Bing, Baidu (China).


2. Web Directories / Human-Powered Search Engines (वेब डायरेक्टरीज़)

ये सर्च इंजन ऑटोमैटिक क्रॉलर्स का उपयोग नहीं करते हैं। इनमें इंसान (Human Editors) वेबसाइट्स को देखते हैं और उन्हें अलग-अलग कैटेगरी (Categories) जैसे - Sports, Education, Technology आदि में मैन्युअली (Manually) लिस्ट करते हैं।

  • Working: वेबसाइट का मालिक अपनी साइट को डायरेक्टरी में सबमिट करता है, फिर एडिटर उसे अप्रूव (Approve) करता है।

  • Examples: DMOZ (अब बंद हो चुका है), Yahoo! Directory (शुरुआती दौर में)।


3. Hybrid Search Engines (हाइब्रिड सर्च इंजन)

जैसा कि नाम से पता चलता है, ये Crawler-based और Human-powered (Directories) दोनों तकनीकों का मिश्रण (Mixture) होते हैं।

  • Working: जब आप कुछ सर्च करते हैं, तो ये पहले क्रॉलर द्वारा लाए गए परिणाम दिखाते हैं और साथ ही डायरेक्टरी से ली गई कैटेगराइज़्ड (Categorized) जानकारी भी दिखाते हैं।

  • Examples: Yahoo! Search (यह अपने क्रॉलर का भी इस्तेमाल करता है और कुछ परिणामों के लिए बिंग पर भी निर्भर है)।


4. Meta Search Engines (मेटा सर्च इंजन)

ये सर्च इंजन अपना खुद का कोई डेटाबेस या क्रॉलर नहीं बनाते हैं।

  • Working: जब आप इनमें कुछ सर्च करते हैं, तो ये आपकी क्वेरी (Query) को एक साथ कई अन्य सर्च इंजनों (जैसे Google, Bing, Yahoo) को भेज देते हैं। फिर उन सभी से आए परिणामों को इकट्ठा (Aggregate) करके आपको दिखा देते हैं।

  • Examples: Dogpile, MetaCrawler, DuckDuckGo (यह प्राइवेसी पर फोकस करता है और मेटा-सर्च तकनीक का भी इस्तेमाल करता है)।

PART 3: Searching the Web (वेब पर सर्चिंग तकनीकें)


इंटरनेट पर कुछ भी खोजना आसान लगता है, लेकिन सटीक (Accurate) जानकारी जल्दी प्राप्त करने के लिए कुछ विशेष Search Techniques या Search Operators का उपयोग किया जाता है:

  1. Use of Keywords (कीवर्ड्स का उपयोग): पूरी कहानी लिखने के बजाय केवल मुख्य शब्दों (Keywords) का प्रयोग करें। (जैसे: "How to make a cake" की जगह "Cake recipe" लिखें)।


  2. Exact Match Search (" "): यदि आप किसी शब्द या वाक्य को बिल्कुल उसी क्रम में खोजना चाहते हैं, तो उसे Double Quotes (" ") के अंदर लिखें।

    • Example: "Global Warming causes"

      pro seacrch technique 1
  3. Boolean Operators (AND, OR, NOT/-):

    • AND: जब आप चाहते हैं कि दोनों शब्द पेज में मौजूद हों। (जैसे: Laptop AND Student)

    • OR: जब आप दोनों में से कोई एक शब्द खोजना चाहते हैं। (जैसे: College OR University)

    • Minus (-): जब आप किसी विशिष्ट शब्द को परिणामों से हटाना (Exclude) चाहते हैं। (जैसे: Apple -fruit - यह एप्पल कंपनी दिखाएगा, फल नहीं)।


  4. Site Specific Search (site:): यदि आप किसी जानकारी को केवल एक विशिष्ट वेबसाइट के अंदर खोजना चाहते हैं।

  5. File Type Search (filetype:): यदि आप कोई विशिष्ट फाइल (जैसे PDF, PPT) खोजना चाहते हैं।

    • Example: DBMS Notes filetype:pdf

      Pro search technique 2

PART 4: Web Servers (वेब सर्वर्स)

Search Engine आपको बताता है कि कौन सी जानकारी किस लिंक पर है, लेकिन जब आप उस लिंक पर क्लिक करते हैं, तो वह वेब पेज (Web Page) जहाँ से आपके कंप्यूटर पर आता है, उसे Web Server कहा जाता है।


Definition (परिभाषा): Web Server एक कंप्यूटर सिस्टम (Computer System) है जो इंटरनेट पर वेबसाइटों को होस्ट (Host) करता है। इसका मुख्य काम क्लाइंट (Client - जैसे आपका Web Browser) द्वारा मांगी गई जानकारी (HTTP Request) को प्रोसेस करना और उसे वेब पेजों (HTTP Response) के रूप में क्लाइंट को वापस भेजना है।

एक वेब सर्वर के दो मुख्य भाग होते हैं:

Web Servers
  1. Hardware (हार्डवेयर): यह एक शक्तिशाली कंप्यूटर होता है जो 24/7 चालू रहता है। इसमें वेबसाइट की सभी फाइलें (HTML, CSS, JavaScript, Images) और डेटाबेस स्टोर होते हैं।

  2. Software (सॉफ्टवेयर): यह वह प्रोग्राम (HTTP Server) है जो यह समझता है कि वेब पते (URLs) और HTTP (Hypertext Transfer Protocol) कैसे काम करते हैं।

    Anatomy of a web server

How a Web Server Works (वेब सर्वर कैसे काम करता है?)

यह पूरी प्रक्रिया Client-Server Architecture पर काम करती है:

  1. Request: जब आप अपने ब्राउज़र (Client) में कोई URL (जैसे www.example.com) टाइप करते हैं, तो ब्राउज़र इंटरनेट के माध्यम से वेब सर्वर को एक HTTP Request भेजता है।

  2. Processing: वेब सर्वर का सॉफ्टवेयर उस रिक्वेस्ट को प्राप्त करता है और अपनी हार्ड डिस्क (Storage) में उस विशिष्ट (Specific) वेब पेज की फाइल को ढूंढता है।

  3. Response: फाइल मिलने के बाद, वेब सर्वर उसे HTTP Response के रूप में वापस आपके ब्राउज़र को भेज देता है, और आपको वह वेबसाइट अपनी स्क्रीन पर दिखाई देने लगती है।

  4. Error Handling: यदि मांगी गई फाइल सर्वर पर नहीं मिलती है, तो सर्वर "404 Not Found" का एरर मैसेज भेज देता है।

    Client server Architecture

Popular Web Servers (लोकप्रिय वेब सर्वर्स)

  • Apache HTTP Server: यह दुनिया का सबसे पुराना और सबसे अधिक उपयोग किया जाने वाला ओपन-सोर्स वेब सर्वर है।

  • NGINX: यह अपनी बहुत तेज़ स्पीड (High Performance) और एक साथ हज़ारों कनेक्शन संभालने के लिए जाना जाता है।

  • Microsoft IIS (Internet Information Services): यह माइक्रोसॉफ्ट द्वारा विकसित किया गया है और Windows सर्वर पर उपयोग होता है।


Summary (सारांश): संक्षेप में कहें तो, Web Server वह घर (House) है जहाँ वेबसाइटें रहती हैं, और Search Engine वह नक्शा (Map) या गाइड (Guide) है जो आपको इंटरनेट के उस सही घर (Web Server) तक पहुँचने का रास्ता बताता है।

 
 
 

Comments


bottom of page