Search Engine কি এবং Search Engine কিভাবে কাজ করে?

আজকের বিষয় বস্তুটি হচ্ছে, Search Engine কি এবং Search Engine কিভাবে কাজ করে?
SEO খুব ভালোভাবে জানতে এবং বুঝতে হলে অবশ্যই Search Engine কি, Search Engine কিভাবে কাজ করে এবং Search Engine কিভাবে আপনার ওয়েবসাইট কে র‌্যাংক দিয়ে থাকে এই বিষয় গুলো সম্পর্কে আপনাকে জানতে হবে। তাহলে আর দেড়ি না করে চলুন জেনে নেই বিষয় গুলোঃ

Search Engine কি?

Search Engine হলো একটি প্রোগ্রাম যা বিশ্বের বিভিন্ন ওয়েবসাইটের তথ্য সংগ্রহ করে রাখে এবং কোনো ইউজার যখন কিওয়ার্ড  দিয়ে সার্চ করে তখন সেই  কিওয়ার্ড সম্পর্কিত তথ্য ডাটাবেস থেকে ওয়েব সাইটে লিংক প্রদান করে। অর্থাৎ সার্চ ইঞ্জিন বলতে একটি নির্দিষ্ট প্রোগ্রামকে  বোঝায় যা নির্দিষ্ট শব্দ বা কিওয়ার্ডের ভিত্তিতে তার ডাটাবেসে সংরক্ষিত বিভিন্ন তথ্য একটি শ্রেণিবদ্ধ তালিকা তৈরি করে ইউজারদের প্রদর্শন করে। যেমনঃ গুগল, ইয়াহু, বিং, ইয়ান্ডেক্স ইত্যাদি।
একটি ওয়েব সার্চ ইঞ্জিন একটি সফটওয়্যার সিস্টেম যা ওয়ার্ল্ড ওয়াইড ওয়েবের তথ্য অনুসন্ধানের জন্য তৈরি করা হয়েছে। সার্চ ইঞ্জিন অনুসন্ধানের ফলাফল সাধারাণত সার্চ ইঞ্জিন রেজাল্ট পেজ (SERP) এ প্রদর্শিত হয়। সার্চ ইঞ্জিনের ফলাফল সমূহ  ওয়েবপেজের তথ্য, ছবি এবং অন্যান্য বিভিন্ন ধরনের ফাইলের মিশ্রণ  হতে পারে। কিছু কিছু সার্চ ইঞ্জিন ডাটাবেস বা ওপেন ডিরেক্টরিগুলোতে ডাটা সরবারহ করে। ওয়েব ডিরেক্টরি ছাড়া যে সকল তথ্য শুধুমাত্র মানুষের সম্পাদনের দ্বারা পরিচালিত হয় সেগুলো সার্চ ইঞ্জিনের ওয়েব ক্রলারের মাধ্যমে ইনডেক্স করে রিয়াল টাইম তথ্য বজায় রাখে।

Search Engine কিভাবে কাজ করে?

সার্চ ইঞ্জিন গুলো বিভিন্ন অ্যালগরিদমের মাধ্যমে কাজ করে থাকে। সার্চ ইঞ্জিন অ্যালগরিদম হচ্ছে এক ধরনের প্রক্রিয়া যে প্রক্রিয়ার মাধ্যমে সার্চ ইঞ্জিন গুলোতে ওয়েবসাইট এবং কিওয়ার্ড র‌্যাংক করানো হয়। সার্চ ইঞ্জিন রিয়াল টাইম তথ্য বজায় রাখার জন্য নিন্মলখিত ধাপ গুলো অনুসরন করে।

  • ওয়েব ক্রলিং (Web Crawling)
  • ইনডেক্সিং (Indexing)
  • সার্চইং (Searching)

ওয়েব ক্রলিং (Web Crawling)

ওয়েব ক্রলিং হচ্ছে একটি সার্চ  ইঞ্জিন অ্যালগরিদম যে অ্যালগরিদমের মাধ্যমে ওয়েব ক্রলার বিভিন্ন ওয়েবসাইট ঘুরে ডাটা সংগ্রহ করে এবং নিজস্ব সার্ভারে জমা রাখে। ওয়েব ক্রলার হচ্ছে একটি অটোমেটেড প্রোগ্রাম। সার্চ ইঞ্জিনগুলি বিভিন্ন ওয়েবসাইট থেকে ওয়েব ক্রলিং এর মাধ্যমে ওয়েবসাইটের তথ্য পেয়ে থাকে। স্পাইডার নামে সার্চ ইঞ্জিনের একটি ক্রলার রয়েছে যেটি সমস্ত ওয়েবসাইটের বিভিন্ন ফাইল এবং তথ্য পর্যবেক্ষণ করে থাকে। স্পাইডার কোন ফাইল পর্যবেক্ষণ করবে এবং কোন ফাইল পর্যবেক্ষণ করবে না সেটা নির্ভর করবে ওয়েবসাইটের স্ট্যান্ডার্ড ফাইল “robots.txt” এর উপরে। সাধারণত স্পাইডার ওয়েবসাইটের শিরোনাম, পৃষ্ঠার বিষয়বস্তু, জাভা স্ক্রিপ্ট, ক্যাশক্যাডিং স্টাইল শিটস “CSS”, হেডিং, HTML ট্যাগগুলিতে তথ্যের বিষয় বস্তু এছাড়াও HTML মেটা ট্যাগগুলো পর্যবেক্ষণ এবং ইনডেক্স  করে।

ইনডেক্সিং (Indexing)

ক্রলার বা স্পাইডার বিভিন্ন ওয়েবসাইট পর্যবেক্ষণ করে বিভিন্ন তথ্য সংগ্রহ করে রাখে, এই সংগ্রহকৃত তথ্যগুলোকেই ইনডেক্স বলা হয় আর এই প্রক্রিয়াকেই বলা হয় সার্চ ইঞ্জিন ইনডেক্সিং। অর্থাৎ ইনডেক্সিং এর মানে হলো ওয়েব পেজগুলিতে তাদের ডোমেইন নাম, HTML ফাইল গুলিতে পাওয়া তথ্য এবং অন্যান্য নির্দিষ্ট টোকেনগুলি তাদের সার্ভারে জমা রাখা। এই সমস্ত তথ্যগুলি  নিয়ে একটি সার্বজনীন ডাটাবেস তৈরি করা হয় যা ওয়েব সার্চ ইঞ্জিন গুলো কে প্রয়োজনীয় তথ্য প্রদান করে থাকে। ব্যবহারকারীর যে শব্দ গুলি লিখে সার্চ ইঞ্জিনে সার্চ করে সেগুলি কিওয়ার্ড নামে পরিচিত।
ইনডেক্সিং এবং ক্যাশিং এর মধ্যে কিছু বানিজ্যিক কৌশল রয়েছে। কিন্তু ওয়েব ক্রলিং পদ্ধতিগত  ভাবে সমস্ত ওয়েবসাইট পরিদর্শন এবং পর্যবেক্ষণ করার একটি সহজ প্রক্রিয়া।

সার্চইং (Searching)

স্পাইডার দ্বারা ওয়েবসাইট পরিদর্শনের পরে সার্চ ইঞ্জিনের ডাটাবেসে সংরক্ষন করা পেজ এর ক্যাশ দ্রুত একজন অনুসন্ধানকারীকে পাঠানো হয়। সার্চ ইঞ্জিন ওয়েবসাইটের ট্রাফিকের একটি মাধ্যম হিসাবে কাজ করে। একটি ওয়েবসাইটের পেজ সার্চ  ইঞ্জিনে ইনডেক্স করা পেজ থেকে আলাদা হতে পারে। কারন  সার্চ ইঞ্জিন গুলো প্রতি দিন ওয়েবপেজ ক্রল করে না। সেজন্য ওয়েবপেজ হালনাগাদ করা হলে সেটি সার্চ ইঞ্জিনে ইনডেক্স হতে কিছু সময় লাগে।
সাধারণত কোনো ইউজার একটি সার্চ  ইঞ্জিনে প্রবেশ করে এবং কোন কিওয়ার্ড দিয়ে সার্চ ইঞ্জিনে সার্চ করে। তখন সার্চ ইঞ্জিন খুব দ্রুত সেই কিওয়ার্ড সম্পর্কিত ইনডেক্সকৃত ডাটা প্রসেস করে এবং সার্চ ইঞ্জিন রেজাল্ট পেজ (SERP)-এ ওয়েবসাইটের লিংক গুলো প্রেরণ করে। প্রকৃপক্ষে ইনডেক্সিং এর সময় সার্চ ইঞ্জিন সার্চ রেজাল্টের জন্য একই কিওয়ার্ড সম্পর্কিত ওয়েবসাইটগুলোর পৃথক তালিকা তৈরি করে। প্রতিটা তালিকা নির্ভর করে ওয়েবসাইটের ইনডেক্সকৃত পেজের উপর। প্রতিটি সার্চ রেজাল্ট শুধুমাত্র ওয়েবপেজ ইনডেক্সিং এবং সঠিক প্রক্রিয়াকরণের অংশমাত্র।
প্রতিটি সার্চ  ইঞ্জিনের নিজস্ব GUI বা গ্রাফিকাল ইউজার ইন্টারফেস থাকে। সার্চ  ইঞ্জিনে সার্চের রেজাল্টগুলি সংশোধন করার  জন্য কিছু প্যারামিটার রয়েছে। এই প্যারামিটার গুলোকে এডভান্সড সার্চ বলে। একটি সার্চ ইঞ্জিনের রেজাল্ট কিওয়ার্ডের প্রাসজ্ঞিকতার উপর নির্ভর করে থাকে। যদিও একই কিওয়ার্ড সম্পর্কিত লক্ষ লক্ষ ওয়েব পেজ রয়েছে তবুও কিছু কিছু ওয়েবপেজ অন্যান্য সকল ওয়েবপেজের  তুলনায় সার্চ রেজাল্টের প্রথম দিকে থাকে। এই পেজ গুলো অধিক প্রাসঙ্গিক, জনপ্রিয় ও SEO ফ্রেন্ডলি। সার্চ ইঞ্জিনগুলি কিওয়ার্ড সম্পর্কিত শ্রেষ্ঠ রেজাল্টগুলি নির্বাচন করে র‌্যাংক করায়। র‌্যাংক করানোর জন্য সার্চ ইঞ্জিনগুলি বিভিন্ন টার্ম ব্যবহার  করে থাকে। কিভাবে সার্চ ইঞ্জিন শ্রেষ্ঠ পেজ নির্ধারণ করে এবং রেজাল্টটি কিভাবে SERP – এ দেখানো হবে তা  সার্চ ইঞ্জিন তার নিজস্ব অ্যালগরিদম দ্বারা পরিচালিত করে। ইন্টারনেট বাবহারের পরিবর্তন এবং নতুন প্রযুক্তি বিবর্তিত হওয়ার সাথে সাথে সার্চ ইঞ্জিনের পদ্ধতি এবং অ্যালগরিদমও পরিবর্তিত হয়। সার্চ ইঞ্জিনের প্রধানত দুই ধরণের প্রোগ্রাম রয়েছে, একটি ক্রমানুসারে সার্চ রেজাল্ট সাজানোর জন্য বিশেষ প্রোগ্রাম, অন্য আরেকটি সিস্টেম যা ওয়েব পেজ সনাক্ত করে এবং তা বিশ্লেষণ করে সার্ভারে একটি “ইনভার্টেড ইনডেক্স” তৈরি করে।
সার্চ ইঞ্জিন গুলি মূলত দুই ধরনের সার্চ রেজাল্ট প্রদর্শন করে। একটি অর্গানিক আর একটি পেইড। সার্চ ইঞ্জিনগুলি অর্গানিক সার্চ রেজাল্টের জন্য কোনো অর্থ গ্রহন করে না। তবে পেইড সার্চ রেজাল্টের জন্য সার্চ ইঞ্জিনগুলি নির্দিষ্ট পরিমান অর্থ নিয়ে থাকে। এই অর্থের পরিমান নির্ভর করে SERP এ ওয়েবসাইটের পজিশন, কত দিন বিজ্ঞাপনটি থাকবে এবং সার্চ ইঞ্জিনের বাণিজ্যিক চুক্তির উপর। সার্চ ইঞ্জিন সাধারনত অর্গানিক সার্চ রেজাল্টের পাশাপাশি সার্চ সম্পর্কিত বিজ্ঞাপনগুলি প্রদর্শনের মাধ্যমে অর্থ উপার্জন করে থাকে।
আজকের মত এ পর্যন্তই। দেখা হবে অন্য কোন টপিক নিয়ে। এই আর্টিকেলটি সম্পর্কে কোনো মতামত বা প্রশ্ন থাকলে কমেন্টবক্সে জানাতে পারেন। ধন্যবাদ।
আল্লাহ্‌ হাফেজ…

Subscribe
Notify of
guest

0 Comments
Inline Feedbacks
View all comments
Abraham Ahmed
Abraham Ahmed
5 years ago

Very helpful and lot of information in this post

NeedaLeap
NeedaLeap
4 years ago

Nice Game

furtdsolinopv
furtdsolinopv
4 years ago

I got what you intend, thanks for putting up. Woh I am happy to find this website through google.

You cannot copy content of this page