সার্চ ইঞ্জিন কী, সার্চ ইঞ্জিন কীভাবে কাজ করে?



সার্চ ইঞ্জিন হলো এমন একটি সফটওয়্যার সিস্টেম যা ব্যবহারকারী কতৃক ইনপুটকৃত জিজ্ঞাসা বা Query অনুযায়ী কেন্দ্রীয় ডেটাবেজ হতে উক্ত ব্যবহারকারীর SERPs - এ ক্রমানুসারে আউটপুট প্রদর্শন করে।


সার্চ ইঞ্জিন কিভাবে কাজ করে?

সার্চ ইঞ্জিন মূলত তিনটি ধাপে কাজ করে।

যথা:- 

১. ক্রোলিং (Cowling), 

২. ইনডেক্সিং (Indexing), 

৩. র‍্যাঙ্কিং (Ranking)


১. ক্রলিং (Crawling):

ইন্টারনেটে যখন কোনো নতুন ওয়েবসাইট মুক্তি পাওয়ার জন্য প্রস্তুত হয়, তখন গুগুল, বিং - সহ ইত্যাদি আরো সার্চ ইঞ্জিন থেকে একটি বট বা রোবট উক্ত ওয়েবসাইটিতে প্রবেশ করার জন্য অনুমতি প্রদান করা হয়। আর এই বট এবং ওয়েবসাইটের মধ্যে সম্পর্ক বা যোগাযোগ সৃষ্টি করে বিভিন্ন লিংক। যে বট বা বোরট ওয়েবসাইটে প্রবেশ করে তাকে বলা হয় ক্রলার/স্পাইডার। ক্রলার অনুমতি প্রাপ্ত ওয়েবসাইটের অনুমতি প্রদানকৃত পেইজ সমূহের প্রতিটি অংশ ক্রাল করে বা ওয়েব সাইটটি কি বিষয়ে তৈরি করা হয়েছে, কি ধরনের কন্টেন্ট আছে, ওয়েবসাইটের কোন জিনিস/তথ্য কোথায় আছে ইত্যাদি একটি ওয়েবসাইটের যাবতীয় তথ্য সংগ্রহ করে নেয়। এভাবে প্রতিটি ওয়েবসাইট থেকে তথ্য সংগ্রহ করা তথ্যগুলো প্রতিটি সার্চ ইঞ্জিন তার লোকাল সার্ভারে সংরক্ষণ করে।


উদাহরণ হিসেবে মনে করি: 

১. আজকে যে কোনো একটি সার্চ ইঞ্জিন স্পাইডার ২০টা সাইট ক্রল করেছে এবং ঐ ২০টা সাইটের সব তথ্য লোকাল সার্ভারে ইনপুট করেছে।


২.ইনডেক্সিং (Indexing): ক্রলার প্রতিটি ওয়েবসাইটের তথ্য লোকাল সার্ভারে ইনপুট করলেই শুরু হয় ইনডেক্সিং। এই প্রক্রিয়া সকল ওয়েব সাইট থেকে সংগ্রহ করা তথ্য গুলোকে সজ্জিত করে প্রতিটি তথ্যের জন্য আলাদা আলাদা ক্যাটাগরি তৈরি করে। তবে, সব সার্চ ইঞ্জিন প্রতিটি ওয়েবসাইটের সব উপাদান সংগ্রহ করে না। বিশেষভাবে,


🔴 ওয়েবসাইটের পেইজ সমূহের টাইটেল ও ড্রেসক্রিপশন,

🔴 কি ধরনের কন্টেন্ট আছে (কাপড় থাকলে কাপড়ের ক্যাটাগরি, গাড়ি থাকলে গাড়ি ক্যাটাগরি ইত্যাদি),

🔴 কন্টেন্ট সম্পর্কিত কি-ওর্য়াড সংগ্রহ করে,

🔴 ওয়েবসাইটে কি পরিমাণ লিংক করা হয়েছে, কোয়ালিটি লিংক বা ব্যাকলিংক আছে কি না।


ইত্যাদি বিষয়সমূহ ইনডেক্সিং করার সময় লক্ষ্য করা হয়। আমরা সার্চ ইঞ্জিনের কোনো কিছু সার্চ করলে যা ফলাফল পাই তার শতভাগ ফলাফল ইনডেক্স থেকে সার্চ ইঞ্জিন সংগ্রহ করে SERPs বা Search Engine Results Page - এ প্রদর্শন করে।


উদাহরণ: ২

মনে করি:১ - এ যে ২০ টা সাইট ক্রল করেছিলো তার মধ্যে ১০টি ই-কমার্স, ৫টি ট্রাভেল ব্লগ ও বাকি ৫টি লাইফ স্টাইল ওয়েব সাইট। এখন ইনডেক্স ক্রলার থেকে প্রাপ্ত তথ্যগুলো বিশ্লেষণ করে দেখবে কোন ১০টি ই-কমার্স সাইট, তারপর ১০টি সাইটকে সার্চ ইঞ্জিনের ই-কমার্স ক্যাটাগরিতে অন্তর্ভুক্ত করে বা প্রয়োজনে নতুন ক্যাটাগরি তৈরি করবে এটা সম্পূর্ণ সার্চ ইঞ্জিন সফটওয়্যার ও ইনডেক্সিং প্রক্রিয়ার উপর নির্ভর করে। ক্রমানুসারে, ৫টা ট্রাভেল ব্লগ ও ৫টি লাইফ স্টাইল সাইটের তথ্য বিশ্লেষণ করে ভিন্ন ভিন্ন ক্যাটাগরিতে অন্তর্ভুক্ত করবে।


৩. র‍্যাঙ্কিং (Ranking):

আমরা SERPs - এ যে ১ম, ২য়, ৩য় করে যে রেজাল্ট দেখতে পাই তা সম্পূর্ণভাবে এ্যালগোরিদম দ্বারা নিয়ন্ত্রিত। আর র‍্যাঙ্কিং এ্যালগোরিদম হলো হলো যৌগিক নিয়ম-নীতির সমন্বয়। প্রতিটি ওয়েবসাইটই ইনডেক্সিং করা হয় কিন্তু সব ইনডেক্স করা সাইট SERPs - এর প্রথম পেইজে প্রদর্শিত হয় না। র‍্যাঙ্কিং এ্যালগোরিদম, যা সিদ্ধান্ত নেয় কোনো একটি নির্দিষ্ট সার্চের জন্য কোন রেজাল্টটা প্রথম পেইজের প্রথম, দ্বিতীয় বা তৃতীয়তে দেখাবে না অন্য কোনো পেইজে দেখাবে। 

একথায় বলা যায়, র‍্যাঙ্কিং এ্যালগোরিদম হলো একটি ইনচার্জ যা ফলাফল কিভাবে বা কোথায় প্রদর্শন করে তা নির্ধারণ করে।


এবার জেনে নেই র‍্যাঙ্কিং এ্যালগোরিদম কিভাবে কাজ করে?

র‍্যাঙ্কিং এ্যালগোরিদম প্রথমে ব্যবহারকারী Query - কে বিশ্লেষণ করে। যেমন: Best tourism place in BD

এখানে প্রতিটি শব্দকে এ্যালগোরিদম একটি আলাদা আলাদা কি-ওয়ার্ড হিসেবে ধরে নিয়ে কেন্দ্রীয় সার্ভারে এই ৫টি কি-ওয়ার্ড রিলেটেড যে যে পেইজে যত কন্টেন্ট পাবে সে সকল পেইজকে SERPs - এ প্রদর্শন করবে।


সব পেইজ বিশ্লেষণ শেষে কি-ওয়ার্ড রিলেটেড সর্বোত্তম পেইজ বা সাইটগুলো সামনের দিকে নিয়ে আসে এক্ষেত্রে কিছু গুরুত্বপূর্ণ ফ্যাক্টর বিশ্লেষণ করে:


🔴 ব্যবহারকারীর Query রিলেটেড content ও title,

🔴 কন্টেন্টের কোয়ালিটি,

🔴 ওয়েবসাইট ও ওয়েব পেইজের কোয়ালিটি,

🔴 তথ্য প্রকাশের তারিখ (যদি খরব রিলেটেড বা সমধর্মী সাইট হয়),

🔴 ওয়েবসাইট বা পেইজের জনপ্রিয়তা,

ইত্যাদি বিষয় সমূহ বিবেচনা করে একটি Query- জন্য ফলাফল প্রদর্শন করে।

গুগল সার্চ করলে সাধারণত ১০টি Organic Results প্রদর্শন করে তবে তার পাশাপাশি আরও কিছু ফলাফল প্রদর্শন করে যার মধ্যে রয়েছে,

🔴 যদি Query related কোনো গুগল এডস থাকে তা,

🔴 কখনো কখনো query related সরাসরি উত্তর,

🔴 বিভিন্ন stories or related tweets,

🔴 Related video,

🔴 Related Searches,

🔴 কোনো প্রতিষ্ঠান বা ব্যক্তির ক্ষেত্রে knowledges Graph ইত্যাদি র‍্যাঙ্কিং এ্যালগোরিদম প্রদর্শন করে।


অর্থাৎ, কোনো ব্যবহারকারী তার কোনো প্রয়োজনীয় জিনিস সার্চ ইঞ্জিনে ইনপুট দিলে তা সার্চ ইঞ্জিন ব্যবহারকারীর query কে ভেঙ্গে কি-ওয়ার্ড হিসেবে র‍্যাঙ্কিং এ্যালগোরিদমের মাধ্যমে কেন্দ্রীয় সার্ভার থেকে query related সকল তথ্য সংগ্রহ করে তার মধ্যে বিভিন্ন factor যাচাই বাচাই করে ক্রমানুসারে SERPs - এ প্রদর্শন করে। আর র‍্যাঙ্কিং এ্যালগোরিদম যে সার্ভার থেকে তথ্য সংগ্রহ করে সেই সার্ভার পূর্বেই বিশ্বের সকল ওয়বসাইটে স্পাইডার/ক্রলার পাঠিয়ে ক্রলিং করে তথ্য লোকাল সার্ভারে সংরক্ষণ করে এবং লোকাল সার্ভার থেকে আলাদা আলাদা ক্যাটাগরিতে ইনডেক্সিং করে মেইন সার্ভারে সংরক্ষণ করা হয়। যেখান থেকে আমরা আমাদের প্রয়োজন অনুযায়ী তথ্য আহরণ করি।



Post a Comment

To be published, comments must be reviewed by the administrator *

নবীনতর পূর্বতন
Post ADS 1
Post ADS 1