Sunday, September 24, 2017

वेब खोज इंजन कैसे काम करते हैं?


वेब खोज इंजन कैसे काम करते हैं?
जब आप उपयुक्त क्वेरी का उपयोग करते हैं तो वे आपको कई प्रासंगिक लेख देते हैं। यदि आपकी क्वेरी "चंद्रगुप्त मौर्य जन्म वर्ष" है तो आपको अच्छे परिणाम मिलेंगे।
आजकल चंद्रगुप्त का नाम व्यापक रूप से प्रयोग नहीं किया जाता है; यह एक प्रसिद्ध सम्राट को संदर्भित करता है। उन पर लेख व्यापक रूप से संदर्भित हैं। जब मैंने ऊपर दिखाए गए प्रश्न (queryका इस्तेमाल किया, तो मुझे पहले खोज परिणाम सम्राट पर विकिपीडिया लेख मिला था।
मैंने हालांकि "गुप्ता के साम्राज्य" वाक्यांश को याद किया और एक बार खोज इंजन बिंग का उपयोग करके "गुप्त जन्म तिथि" की खोज की थी।
बिंग द्वारा रिपोर्ट की गई पहली व्यक्ति याना गुप्ता, एक मॉडल और गायक थी, और मुझे निम्नलिखित साइट पर निर्देशित किया गया

अगली रिपोर्ट सिद्धार्थ गुप्त के बारे में थी और मुझे लेख पढ़ने के लिए निम्नलिखित साइट पर जाने को निर्देशित किया गया

"गुप्त" जैसे शब्द हजारों लेखों में कई अलग-अलग लोगों के बारे में होते हैं; इसलिए यह एक बहुत उपयोगी क्वेरी शब्द नहीं है | कृपया "शेखर गुप्ता" के रूप में दो शब्दों के संयोजन का प्रयास करें।
आप एक प्रसिद्ध भारतीय पत्रकार पर विकिपीडिया लेख का एक संदर्भ प्राप्त करते हैं। दो या तीन प्रासंगिक शब्दों वाली एक क्वेरी आमतौर पर प्रभावी होती है। वर्ल्ड वाइड वेब की खोज के लिए खोज इंजन क्रॉलर नामक सॉफ़्टवेयर का उपयोग करते हैं और वेब पेजों के यूआरएल के अनुक्रमित संग्रह बनाता है। वे शब्द जो हमें बताते हैं कि उस वेब पेज में क्या है उन्हें अनुक्रमण में उपयोग किया जाता है। 'यह', 'है' और 'वह' जैसे शब्द हमें एक वेब पेज की सामग्री के बारे में बहुत कुछ नहीं बताते हैं और इन्हें इंडेक्सिंग में उपयोग नहीं किया जाता है। यदि आप "शेखर गुप्ता" की तरह कोई क्वेरी देते हैं, तो खोज इंजन अपने डेटाबेस की जांच करेगा और आपको निम्न URL जैसे यूआरएल दिखाएगा

आपको प्रत्येक सूचीबद्ध वेबपेज से कुछ पंक्तियां भी दिखाई देंगी। आप उन्हें पढ़ सकते हैं और तय कर सकते हैं कि वेबपेज आपके लिए प्रासंगिक है या नहीं। इंडेक्सिंग खोज कुशल और तेज बनाता है |
खोज इंजन का उपयोग करने वाला एक अन्य सिद्धांत यह है कि एक लेख जिसमें प्रश्न शब्द कई बार प्रकट होते हैं, वह अधिक उपयोगी होने की संभावना है। तुलना में, क्वेरी शब्दों के एक संदर्भ वाला लेख आपके लिए बहुत उपयोगी नहीं हो सकता है।

खोज इंजन द्वारा उपयोग किया जाने वाला एक और सिद्धांत अभी भी मौजूद है। आपको कई लोगों द्वारा मान्यता प्राप्त प्रसिद्ध लेख देने के लिए सबसे अच्छा है | यदि एक लेख अच्छी तरह से लिखा हुआ है और उपयोगी है, तो कई वेबसाइटों द्वारा इसका उल्लेख किया जा सकता है। खोज इंजन क्रॉलर ऐसे "लिंक" की गणना करते हैं | अन्य साइटों से अधिक "लिंक" अर्जित करना एक लेख "अधिक प्रसिद्ध" बनाता है! खोज इंजन आपको ऐसे "प्रसिद्ध" लेख देना पसंद करते हैं 

सौ से अधिक ऐसे सिद्धांत हैं जो लोगों को बहुत ही उपयोगी खोज इंजन परिणाम पेज (एस आर पी।) देते हैं। यह तकनीक हर स्मार्ट फोन पर सभी मानव ज्ञान उपलब्ध कराती है! यदि आपको पता है कि खोज इंजन का उपयोग कैसे किया जाए, तो सभी ज्ञान आपके लिए मुफ्त हैं!

श्रीनिवासन रमणि 
हिंदी संपादन: एम वी रोहरा

How do web search engines work?

(The Hindi Version of this article will be posted shortly, to appear as the latest one in this blog)


How do web search engines work?
They give you many relevant articles when you use a suitable query. You get good results if your query is "Chandragupta Maurya year of birth".
Chandragupta's name is not widely used nowadays; it refers to a famous emperor. Articles on him are widely referred to. The first search result I got was the Wikipedia article on the emperor, when I used the query shown above. 
I had however remembered the phrase “Gupta’s empire” and had once searched for "Gupta date of birth" using the search engine Bing. 
The first person reported by Bing was Yaana Gupta, a model and singer, and I was directed to the following site address

The next report was about Siddharth Gupta and I was directed to read the following article

A word like “Gupta” occurs in thousands of articles about many different people; so it is not a very useful query word. Please try a combination of two words as in "Shekhar Gupta".
You get a reference to the Wikipedia article on a well-known Indian journalist. A query containing two or three relevant words is usually effective. Search engines use software named crawler to search the World Wide Web and makes an indexed collection of URLs of web pages. Words that tell us what is in that web page are used in indexing. Words like ‘this’, ‘is’ and ‘that’ do not tell us much about the content of a web page and so are not used in indexing. If you give a query like "Shekhar Gupta", the search engine will examine its database and give URLs like the following one
https://en.wikipedia.org/wiki/Shekhar_Gupta
You will also see a few lines from each listed webpage. You can read them and decide if the webpage is relevant to you. Indexing makes search efficient and fast.
Another principle that search engines use is that an article in which the query words appear many times is likely to be more useful. In comparison, an article with one passing reference to the query words may not be very useful to you.

There is yet another principle which is used by search engines. It is best to give you well-known articles recognized by many people. If an article is well written and is useful, it is likely to be referred to by many websites. Search Engine Crawlers keep count of such “links”. Earning more “links” from other sites makes an article more “famous”! Search engines prefer to give you such “famous” articles.


There are over a hundred such principles that give people very useful Search Engine Results Pages (S. E. R. P.).  This technology makes all human knowledge available on every smart phone! All knowledge is yours for free, if you know how to use the search engines!

Srinivasan Ramani