আজকের বিষয় বস্তুটি হচ্ছে, Search Engine কি এবং Search Engine কিভাবে কাজ করে?
SEO খুব ভালোভাবে জানতে এবং বুঝতে হলে অবশ্যই Search Engine কি, Search Engine কিভাবে কাজ করে এবং Search Engine কিভাবে আপনার ওয়েবসাইট কে র্যাংক দিয়ে থাকে এই বিষয় গুলো সম্পর্কে আপনাকে জানতে হবে। তাহলে আর দেড়ি না করে চলুন জেনে নেই বিষয় গুলোঃ
Search Engine কি?
Search Engine হলো একটি প্রোগ্রাম যা বিশ্বের বিভিন্ন ওয়েবসাইটের তথ্য সংগ্রহ করে রাখে এবং কোনো ইউজার যখন কিওয়ার্ড দিয়ে সার্চ করে তখন সেই কিওয়ার্ড সম্পর্কিত তথ্য ডাটাবেস থেকে ওয়েব সাইটে লিংক প্রদান করে। অর্থাৎ সার্চ ইঞ্জিন বলতে একটি নির্দিষ্ট প্রোগ্রামকে বোঝায় যা নির্দিষ্ট শব্দ বা কিওয়ার্ডের ভিত্তিতে তার ডাটাবেসে সংরক্ষিত বিভিন্ন তথ্য একটি শ্রেণিবদ্ধ তালিকা তৈরি করে ইউজারদের প্রদর্শন করে। যেমনঃ গুগল, ইয়াহু, বিং, ইয়ান্ডেক্স ইত্যাদি।
একটি ওয়েব সার্চ ইঞ্জিন একটি সফটওয়্যার সিস্টেম যা ওয়ার্ল্ড ওয়াইড ওয়েবের তথ্য অনুসন্ধানের জন্য তৈরি করা হয়েছে। সার্চ ইঞ্জিন অনুসন্ধানের ফলাফল সাধারাণত সার্চ ইঞ্জিন রেজাল্ট পেজ (SERP) এ প্রদর্শিত হয়। সার্চ ইঞ্জিনের ফলাফল সমূহ ওয়েবপেজের তথ্য, ছবি এবং অন্যান্য বিভিন্ন ধরনের ফাইলের মিশ্রণ হতে পারে। কিছু কিছু সার্চ ইঞ্জিন ডাটাবেস বা ওপেন ডিরেক্টরিগুলোতে ডাটা সরবারহ করে। ওয়েব ডিরেক্টরি ছাড়া যে সকল তথ্য শুধুমাত্র মানুষের সম্পাদনের দ্বারা পরিচালিত হয় সেগুলো সার্চ ইঞ্জিনের ওয়েব ক্রলারের মাধ্যমে ইনডেক্স করে রিয়াল টাইম তথ্য বজায় রাখে।
Search Engine কিভাবে কাজ করে?
সার্চ ইঞ্জিন গুলো বিভিন্ন অ্যালগরিদমের মাধ্যমে কাজ করে থাকে। সার্চ ইঞ্জিন অ্যালগরিদম হচ্ছে এক ধরনের প্রক্রিয়া যে প্রক্রিয়ার মাধ্যমে সার্চ ইঞ্জিন গুলোতে ওয়েবসাইট এবং কিওয়ার্ড র্যাংক করানো হয়। সার্চ ইঞ্জিন রিয়াল টাইম তথ্য বজায় রাখার জন্য নিন্মলখিত ধাপ গুলো অনুসরন করে।
- ওয়েব ক্রলিং (Web Crawling)
- ইনডেক্সিং (Indexing)
- সার্চইং (Searching)
ওয়েব ক্রলিং (Web Crawling)
ওয়েব ক্রলিং হচ্ছে একটি সার্চ ইঞ্জিন অ্যালগরিদম যে অ্যালগরিদমের মাধ্যমে ওয়েব ক্রলার বিভিন্ন ওয়েবসাইট ঘুরে ডাটা সংগ্রহ করে এবং নিজস্ব সার্ভারে জমা রাখে। ওয়েব ক্রলার হচ্ছে একটি অটোমেটেড প্রোগ্রাম। সার্চ ইঞ্জিনগুলি বিভিন্ন ওয়েবসাইট থেকে ওয়েব ক্রলিং এর মাধ্যমে ওয়েবসাইটের তথ্য পেয়ে থাকে। স্পাইডার নামে সার্চ ইঞ্জিনের একটি ক্রলার রয়েছে যেটি সমস্ত ওয়েবসাইটের বিভিন্ন ফাইল এবং তথ্য পর্যবেক্ষণ করে থাকে। স্পাইডার কোন ফাইল পর্যবেক্ষণ করবে এবং কোন ফাইল পর্যবেক্ষণ করবে না সেটা নির্ভর করবে ওয়েবসাইটের স্ট্যান্ডার্ড ফাইল “robots.txt” এর উপরে। সাধারণত স্পাইডার ওয়েবসাইটের শিরোনাম, পৃষ্ঠার বিষয়বস্তু, জাভা স্ক্রিপ্ট, ক্যাশক্যাডিং স্টাইল শিটস “CSS”, হেডিং, HTML ট্যাগগুলিতে তথ্যের বিষয় বস্তু এছাড়াও HTML মেটা ট্যাগগুলো পর্যবেক্ষণ এবং ইনডেক্স করে।
ইনডেক্সিং (Indexing)
ক্রলার বা স্পাইডার বিভিন্ন ওয়েবসাইট পর্যবেক্ষণ করে বিভিন্ন তথ্য সংগ্রহ করে রাখে, এই সংগ্রহকৃত তথ্যগুলোকেই ইনডেক্স বলা হয় আর এই প্রক্রিয়াকেই বলা হয় সার্চ ইঞ্জিন ইনডেক্সিং। অর্থাৎ ইনডেক্সিং এর মানে হলো ওয়েব পেজগুলিতে তাদের ডোমেইন নাম, HTML ফাইল গুলিতে পাওয়া তথ্য এবং অন্যান্য নির্দিষ্ট টোকেনগুলি তাদের সার্ভারে জমা রাখা। এই সমস্ত তথ্যগুলি নিয়ে একটি সার্বজনীন ডাটাবেস তৈরি করা হয় যা ওয়েব সার্চ ইঞ্জিন গুলো কে প্রয়োজনীয় তথ্য প্রদান করে থাকে। ব্যবহারকারীর যে শব্দ গুলি লিখে সার্চ ইঞ্জিনে সার্চ করে সেগুলি কিওয়ার্ড নামে পরিচিত।
ইনডেক্সিং এবং ক্যাশিং এর মধ্যে কিছু বানিজ্যিক কৌশল রয়েছে। কিন্তু ওয়েব ক্রলিং পদ্ধতিগত ভাবে সমস্ত ওয়েবসাইট পরিদর্শন এবং পর্যবেক্ষণ করার একটি সহজ প্রক্রিয়া।
সার্চইং (Searching)
স্পাইডার দ্বারা ওয়েবসাইট পরিদর্শনের পরে সার্চ ইঞ্জিনের ডাটাবেসে সংরক্ষন করা পেজ এর ক্যাশ দ্রুত একজন অনুসন্ধানকারীকে পাঠানো হয়। সার্চ ইঞ্জিন ওয়েবসাইটের ট্রাফিকের একটি মাধ্যম হিসাবে কাজ করে। একটি ওয়েবসাইটের পেজ সার্চ ইঞ্জিনে ইনডেক্স করা পেজ থেকে আলাদা হতে পারে। কারন সার্চ ইঞ্জিন গুলো প্রতি দিন ওয়েবপেজ ক্রল করে না। সেজন্য ওয়েবপেজ হালনাগাদ করা হলে সেটি সার্চ ইঞ্জিনে ইনডেক্স হতে কিছু সময় লাগে।
সাধারণত কোনো ইউজার একটি সার্চ ইঞ্জিনে প্রবেশ করে এবং কোন কিওয়ার্ড দিয়ে সার্চ ইঞ্জিনে সার্চ করে। তখন সার্চ ইঞ্জিন খুব দ্রুত সেই কিওয়ার্ড সম্পর্কিত ইনডেক্সকৃত ডাটা প্রসেস করে এবং সার্চ ইঞ্জিন রেজাল্ট পেজ (SERP)-এ ওয়েবসাইটের লিংক গুলো প্রেরণ করে। প্রকৃপক্ষে ইনডেক্সিং এর সময় সার্চ ইঞ্জিন সার্চ রেজাল্টের জন্য একই কিওয়ার্ড সম্পর্কিত ওয়েবসাইটগুলোর পৃথক তালিকা তৈরি করে। প্রতিটা তালিকা নির্ভর করে ওয়েবসাইটের ইনডেক্সকৃত পেজের উপর। প্রতিটি সার্চ রেজাল্ট শুধুমাত্র ওয়েবপেজ ইনডেক্সিং এবং সঠিক প্রক্রিয়াকরণের অংশমাত্র।
প্রতিটি সার্চ ইঞ্জিনের নিজস্ব GUI বা গ্রাফিকাল ইউজার ইন্টারফেস থাকে। সার্চ ইঞ্জিনে সার্চের রেজাল্টগুলি সংশোধন করার জন্য কিছু প্যারামিটার রয়েছে। এই প্যারামিটার গুলোকে এডভান্সড সার্চ বলে। একটি সার্চ ইঞ্জিনের রেজাল্ট কিওয়ার্ডের প্রাসজ্ঞিকতার উপর নির্ভর করে থাকে। যদিও একই কিওয়ার্ড সম্পর্কিত লক্ষ লক্ষ ওয়েব পেজ রয়েছে তবুও কিছু কিছু ওয়েবপেজ অন্যান্য সকল ওয়েবপেজের তুলনায় সার্চ রেজাল্টের প্রথম দিকে থাকে। এই পেজ গুলো অধিক প্রাসঙ্গিক, জনপ্রিয় ও SEO ফ্রেন্ডলি। সার্চ ইঞ্জিনগুলি কিওয়ার্ড সম্পর্কিত শ্রেষ্ঠ রেজাল্টগুলি নির্বাচন করে র্যাংক করায়। র্যাংক করানোর জন্য সার্চ ইঞ্জিনগুলি বিভিন্ন টার্ম ব্যবহার করে থাকে। কিভাবে সার্চ ইঞ্জিন শ্রেষ্ঠ পেজ নির্ধারণ করে এবং রেজাল্টটি কিভাবে SERP – এ দেখানো হবে তা সার্চ ইঞ্জিন তার নিজস্ব অ্যালগরিদম দ্বারা পরিচালিত করে। ইন্টারনেট বাবহারের পরিবর্তন এবং নতুন প্রযুক্তি বিবর্তিত হওয়ার সাথে সাথে সার্চ ইঞ্জিনের পদ্ধতি এবং অ্যালগরিদমও পরিবর্তিত হয়। সার্চ ইঞ্জিনের প্রধানত দুই ধরণের প্রোগ্রাম রয়েছে, একটি ক্রমানুসারে সার্চ রেজাল্ট সাজানোর জন্য বিশেষ প্রোগ্রাম, অন্য আরেকটি সিস্টেম যা ওয়েব পেজ সনাক্ত করে এবং তা বিশ্লেষণ করে সার্ভারে একটি “ইনভার্টেড ইনডেক্স” তৈরি করে।
সার্চ ইঞ্জিন গুলি মূলত দুই ধরনের সার্চ রেজাল্ট প্রদর্শন করে। একটি অর্গানিক আর একটি পেইড। সার্চ ইঞ্জিনগুলি অর্গানিক সার্চ রেজাল্টের জন্য কোনো অর্থ গ্রহন করে না। তবে পেইড সার্চ রেজাল্টের জন্য সার্চ ইঞ্জিনগুলি নির্দিষ্ট পরিমান অর্থ নিয়ে থাকে। এই অর্থের পরিমান নির্ভর করে SERP এ ওয়েবসাইটের পজিশন, কত দিন বিজ্ঞাপনটি থাকবে এবং সার্চ ইঞ্জিনের বাণিজ্যিক চুক্তির উপর। সার্চ ইঞ্জিন সাধারনত অর্গানিক সার্চ রেজাল্টের পাশাপাশি সার্চ সম্পর্কিত বিজ্ঞাপনগুলি প্রদর্শনের মাধ্যমে অর্থ উপার্জন করে থাকে।
আজকের মত এ পর্যন্তই। দেখা হবে অন্য কোন টপিক নিয়ে। এই আর্টিকেলটি সম্পর্কে কোনো মতামত বা প্রশ্ন থাকলে কমেন্টবক্সে জানাতে পারেন। ধন্যবাদ।
আল্লাহ্ হাফেজ…
Very helpful and lot of information in this post
Nice Game
I got what you intend, thanks for putting up. Woh I am happy to find this website through google.