ইন্টারনেট সার্চ ইঞ্জিন: ইয়ানডেক্স, গুগল, র‌্যাম্বলার, ইয়াহু। রচনা, ফাংশন, অপারেশন নীতি। ইয়ানডেক্স সার্চ ইঞ্জিন কম্বিনেশনের অপারেশন নীতির সহজতম বর্ণনা: আগ্রহের ক্লাব

হ্যালো প্রিয় বন্ধুরা! এই নিবন্ধে আমরা ইয়ানডেক্স সার্চ ইঞ্জিনের দিকে তাকাতে থাকব, এবং আপনার মনে আছে, পূর্ববর্তী নিবন্ধগুলিতে আমরা এই মহান কোম্পানির সৃষ্টির ইতিহাস নিয়ে আলোচনা করেছি, যা রাশিয়া এবং তার বাইরের প্রতিযোগীদের মধ্যে প্রথম স্থান অধিকার করে।

এই সব ভাল, কিন্তু নতুন এবং অভিজ্ঞ সাইট নির্মাতারা সবচেয়ে গুরুত্বপূর্ণ প্রশ্নে আগ্রহী, অবশ্যই, কীভাবে তাদের প্রকল্পগুলিকে শীর্ষ অনুসন্ধান ফলাফলে প্রথম স্থানে আনতে হয় তার সাথে সম্পর্কিত।

অতএব, আসুন দেখি কীভাবে ইয়ানডেক্স সার্চ ইঞ্জিন কাজ করে তা বোঝার জন্য আপনি কোন ভুলগুলি করতে পারেন এবং সাধারণভাবে রাশিয়ান সার্চ ইঞ্জিন থেকে কী আশা করা যায়।

গত প্রবন্ধে আমরা আলোচনা করেছি। বিষয়টি বেশ আকর্ষণীয় এবং দরকারী হতে পরিণত হয়েছে। অতএব, আমি এটি সম্পূরক করার সিদ্ধান্ত নিয়েছি, এটিকে গভীরতর করার জন্য, তাই কথা বলতে।

সুতরাং, আমি সম্ভবত "কেন একটি সার্চ ইঞ্জিন সূচক ডকুমেন্টস" এই প্রশ্নটি নিয়ে কিছুটা দূরে চলে গিয়েছিলাম? যা অবশিষ্ট থাকে তা হল "কিভাবে" প্রশ্নটি বের করা।

ওয়েবসাইট র‌্যাঙ্কিং অ্যালগরিদম

প্রথমে, আসুন কিছু অ্যালগরিদমের সাথে পরিচিত হই যেগুলি যেকোনো সার্চ ইঞ্জিনের জন্য মৌলিক:

- সরাসরি অনুসন্ধান অ্যালগরিদম।

এটা কি - আপনি একটি বইয়ের মধ্যে একটি চমৎকার গল্প পড়া মনে আছে. আর আপনি এক এক করে দেখতে শুরু করেন। তারা একটি বই নিয়েছিল, এটি দেখেছিল, এটি খুঁজে পায়নি, আরেকটি নিয়েছে... নীতিটি পরিষ্কার, তবে এই পদ্ধতিটি অত্যন্ত দীর্ঘ। এটাও বোধগম্য।

- বিপরীত অনুসন্ধান অ্যালগরিদম।

এই অ্যালগরিদমের জন্য, আপনার ব্লগের প্রতিটি পৃষ্ঠা থেকে একটি পাঠ্য ফাইল তৈরি করা হয়। এই ফাইলটি আপনার ব্যবহৃত সমস্ত শব্দকে বর্ণানুক্রমিকভাবে তালিকাভুক্ত করে। এমনকি পাঠ্যে এই শব্দের অবস্থান নির্দেশিত (পাঠ্যের স্থানাঙ্ক)।

এটি একটি মোটামুটি দ্রুত পদ্ধতি, তবে অনুসন্ধানটি ইতিমধ্যে কিছু ত্রুটির সাথে ঘটে।

এখানে বোঝার মূল বিষয় হল এই অ্যালগরিদমটি ইন্টারনেটে অনুসন্ধান করে না, ব্লগে অনুসন্ধান করে নয়। এবং একটি পৃথক টেক্সট ফাইল যা অনেক আগে তৈরি করা হয়েছিল। যখন রোবট আপনার কাছে এসেছিল। এবং এই ফাইলগুলি (বিপরীত সূচকগুলি) ইয়ানডেক্স সার্ভারে সংরক্ষণ করা হয়।

সুতরাং, এই ছিল মৌলিক অনুসন্ধান অ্যালগরিদম. সেগুলো. ইয়ানডেক্স কীভাবে প্রয়োজনীয় নথিগুলি খুঁজে পায়। এই সঙ্গে কোনো সমস্যা আছে বলে মনে হচ্ছে না.

তবে ইয়ানডেক্স এক বা এমনকি 100 টিরও বেশি নথি জানে, তবে আমার উত্স থেকে সর্বশেষ তথ্য অনুসারে, ইয়ানডেক্স প্রায় 11 বিলিয়ন নথি (10,727,736,489 পৃষ্ঠা) জানে।

এবং এই সমস্ত পরিমাণের মধ্যে, আপনাকে অনুরোধের সাথে মেলে এমন নথি নির্বাচন করতে হবে। এবং আরো গুরুত্বপূর্ণ, আপনি একরকম তাদের র্যাঙ্ক করা প্রয়োজন. সেগুলো. গুরুত্বের মাত্রা অনুযায়ী সাজান, অথবা পাঠকের জন্য উপযোগিতার মাত্রা অনুযায়ী।

গাণিতিক অনুসন্ধান মডেল

এই সমস্যাটি সমাধান করার জন্য, গাণিতিক মডেলগুলি উদ্ধারে আসে। এখন আমরা সবচেয়ে সহজ মডেল সম্পর্কে কথা বলব।

বুলিয়ান গাণিতিক মডেল- যদি একটি নথিতে একটি শব্দ উপস্থিত হয়, নথিটি পাওয়া বলে মনে করা হয়। শুধু একটি কাকতালীয় এবং কিছু জটিল.

কিন্তু এখানে সমস্যা আছে। উদাহরণস্বরূপ, যদি আপনি, একজন ব্যবহারকারী হিসাবে, কিছু জনপ্রিয় শব্দ লিখুন, বা আরও ভাল, অব্যয়টি "v", যা রাশিয়ান ভাষার সবচেয়ে সাধারণ শব্দ এবং প্রতিটি নথিতে পাওয়া যায়, তাহলে আপনাকে অনেক ফলাফল দেওয়া হবে। আপনি যে এত সংখ্যা বুঝতে পারেন না, আপনি কত নথি খুঁজে পেয়েছেন? অতএব, নিম্নলিখিত মাদুর মডেল হাজির.

ভেক্টর গাণিতিক মডেল- এই মডেলটি নথির "ওজন" নির্ধারণ করে। শুধু কাকতালীয় ঘটনা ঘটলেই হবে না, শব্দটি বহুবার ঘটতে হবে। তদুপরি, একটি শব্দ যত বেশি প্রদর্শিত হবে, তত বেশি প্রাসঙ্গিকতা (সম্মতি)।

এটি ভেক্টর মডেল যা সমস্ত সার্চ ইঞ্জিন ব্যবহার করে।

সম্ভাব্য মডেল- আরো উন্নত. নীতি হল এই: সার্চ ইঞ্জিন নিজেই পেজ টেমপ্লেট খুঁজে পেয়েছে। উদাহরণস্বরূপ, আপনি ইয়ানডেক্সের ইতিহাস সম্পর্কে তথ্য খুঁজছেন। ইয়ানডেক্স কিছু ধরণের স্ট্যান্ডার্ড সঞ্চয় করে, ধরা যাক এটি ইয়ানডেক্স সম্পর্কে আমার আগের নিবন্ধ হবে।

এবং তিনি এই নিবন্ধের সাথে অন্যান্য সমস্ত নথির তুলনা করবেন। এবং এখানে যুক্তি হল: আপনার ব্লগ পৃষ্ঠাটি আমার নিবন্ধের সাথে যত বেশি মিলবে, তত বেশি সম্ভব যে আপনার ব্লগ পৃষ্ঠাটি পাঠকের জন্যও উপযোগী হবে এবং ইয়ানডেক্সের ইতিহাস সম্পর্কেও বলে।

ব্যবহারকারীকে দেখানো দরকার এমন নথির সংখ্যা কমাতে, প্রাসঙ্গিকতার ধারণাটি চালু করা হয়েছিল, যেমন সম্মতি

বিষয়ের সাথে আপনার ব্লগ পাতা কতটা প্রাসঙ্গিক? এটি একটি গুরুত্বপূর্ণ বিষয় যখন এটি অনুসন্ধান মানের আসে.

মূল্যায়নকারী - তারা কারা এবং তারা কি জন্য দায়ী?

অ্যালগরিদমের গুণমান মূল্যায়নের জন্যও এই প্রাসঙ্গিকতা প্রয়োজন।

এই উদ্দেশ্যে একটি বিশেষ বাহিনীর সদর দফতর রয়েছে - তাদের মূল্যায়নকারী বলা হয়। এরা বিশেষ মানুষ যারা তাদের হাত দিয়ে সার্চ রেজাল্ট দেখেন।

কিভাবে সাইট চেক করতে হয়, কিভাবে মূল্যায়ন করতে হয়, ইত্যাদি বিষয়ে তাদের নির্দেশনা রয়েছে। এবং তারা ম্যানুয়ালি নির্ধারণ করে যে আপনার পৃষ্ঠাগুলি অনুসন্ধান প্রশ্নের জন্য উপযুক্ত কিনা।

এবং অনুসন্ধান অ্যালগরিদমের গুণমান নির্ণয়কারীদের মতামতের উপর নির্ভর করে। যদি সমস্ত মূল্যায়নকারীরা বলে যে অনুসন্ধানের ফলাফলগুলি প্রশ্নের সাথে সঙ্গতিপূর্ণ নয়, এর মানে হল যে র‌্যাঙ্কিং অ্যালগরিদমটি ভুল এবং ইয়ানডেক্স একমাত্র দায়ী।

যদি মূল্যায়নকারীরা বলে যে শুধুমাত্র একটি সাইট অনুরোধ পূরণ করে না, তাহলে এর অর্থ হল সাইটটি দূরে কোথাও উড়ে যায় এবং অনুসন্ধানের ফলাফলে নামিয়ে দেওয়া হয়। আরও স্পষ্টভাবে, পুরো সাইট নয়, শুধুমাত্র একটি নিবন্ধ, কিন্তু এটি "বিন্দু নয়।"

অবশ্যই, মূল্যায়নকারীরা তাদের হাত এবং চোখ দিয়ে সমস্ত নিবন্ধ পর্যালোচনা এবং মূল্যায়ন করতে পারে না। এই বোধগম্য.

এবং অন্যান্য পরামিতি যার দ্বারা পৃষ্ঠাগুলিকে র‌্যাঙ্ক করা হয় সেগুলি উদ্ধারে আসে৷

তাদের মধ্যে অনেক আছে, উদাহরণস্বরূপ:

  • পৃষ্ঠার ওজন (vIC, PageRank, বেবি বাম্পসর্বেসর্বা);
  • ডোমেইন কর্তৃপক্ষ;
  • অনুরোধের সাথে পাঠ্যের প্রাসঙ্গিকতা;
  • ক্যোয়ারীতে বহিরাগত লিঙ্ক পাঠ্যের প্রাসঙ্গিকতা;
  • সেইসাথে অন্যান্য অনেক র্যাঙ্কিং কারণ।

মূল্যায়নকারীরা মন্তব্য করে, এবং যারা গাণিতিক র‌্যাঙ্কিং মডেল সেট আপ করার জন্য দায়ী, তারা ফলস্বরূপ, সূত্রটি সম্পাদনা করে, যার ফলস্বরূপ অনুসন্ধান ইঞ্জিন আরও দক্ষতার সাথে কাজ করে।

সূত্রের কর্মক্ষমতা মূল্যায়নের জন্য প্রধান মানদণ্ড:

1. সার্চ ইঞ্জিন ফলাফল নির্ভুলতা- অনুরোধের সাথে মেলে এমন নথির শতাংশ (প্রাসঙ্গিক)। সেগুলো. অনুরোধের সাথে মেলে না এমন পৃষ্ঠা যত কম, তত ভাল।

2. সার্চ ইঞ্জিন ফলাফলের সম্পূর্ণতা- এটি একটি প্রদত্ত প্রশ্নের জন্য প্রাসঙ্গিক ওয়েব পৃষ্ঠাগুলির অনুপাত সংগ্রহে প্রাসঙ্গিক নথির মোট সংখ্যা (সার্চ ইঞ্জিনে পাওয়া পৃষ্ঠাগুলির মোট)।

উদাহরণ স্বরূপ, সার্চের ফলাফলের তুলনায় সমগ্র সংগ্রহে আরও প্রাসঙ্গিক পৃষ্ঠা থাকলে, এর মানে হল ফলাফলগুলি অসম্পূর্ণ। এটি ঘটেছে কারণ কিছু প্রাসঙ্গিক ওয়েব পৃষ্ঠা ফিল্টার করা হয়েছিল৷

3. সার্চ ইঞ্জিন ফলাফলের প্রাসঙ্গিকতা- স্নিপেটে যা লেখা আছে তার সাথে এটি ওয়েব পৃষ্ঠার সম্মতি। উদাহরণস্বরূপ, একটি দস্তাবেজ খুব আলাদা হতে পারে বা একেবারেই বিদ্যমান নেই, কিন্তু তবুও অনুসন্ধান ফলাফলে উপস্থিত থাকবে।

অনুসন্ধানের ফলাফলের প্রাসঙ্গিকতা সরাসরি নির্ভর করে কত ঘন ঘন অনুসন্ধান রোবট তার সংগ্রহ থেকে নথি স্ক্যান করে।

সংগ্রহ সংগ্রহ (সাইট পৃষ্ঠাগুলির সূচীকরণ) একটি বিশেষ প্রোগ্রাম দ্বারা বাহিত হয় - একটি অনুসন্ধান রোবট।

অনুসন্ধান রোবট সূচীকরণের জন্য ঠিকানাগুলির একটি তালিকা পায়, সেগুলি অনুলিপি করে এবং তারপরে অনুলিপি করা ওয়েব পৃষ্ঠাগুলির বিষয়বস্তুগুলিকে একটি অ্যালগরিদমে প্রসেস করার জন্য পাঠায় যা সেগুলিকে বিপরীত সূচীতে রূপান্তর করে৷

ভাল, "সংক্ষেপে," তাই বলতে গেলে, আমরা সার্চ ইঞ্জিনের নীতিগুলি নিয়ে আলোচনা করেছি৷

আসুন সংক্ষিপ্ত করা যাক:

  1. আপনার ব্লগে একটি অনুসন্ধান রোবট আসে।
  2. অনুসন্ধান রোবট পরবর্তী অনুসন্ধানের জন্য পৃষ্ঠার বিপরীত সূচক সংরক্ষণ করে।
  3. একটি গাণিতিক মডেল ব্যবহার করে, নথিটি প্রক্রিয়া করা হয় এবং সূত্রগুলি ব্যবহার করে এবং মূল্যায়নকারীর মতামতকে বিবেচনা করে অনুসন্ধান ফলাফলে প্রদর্শিত হয়।

এটি খুব, খুব সরলীকৃত। ইয়ানডেক্স সার্চ ইঞ্জিন কিভাবে কাজ করে তার একটি প্রাথমিক বোঝার জন্য।

আমি এখন এত লেখা লিখেছি, এবং সম্ভবত এত কিছু স্পষ্ট নয়। অতএব, আমি আপনাকে একটু পরে এই নিবন্ধে ফিরে আসার এবং এই ভিডিওটি দেখার পরামর্শ দিই।

এটি একটি চমৎকার গাইড, যা আমি এক সময়ে থেকে শিখেছি।

আমি আশা করি এই তথ্যগুলি আপনাকে আরও ভালভাবে বুঝতে সাহায্য করবে কেন আপনার সাইটগুলির মধ্যে একটি অনুসন্ধানে উপযুক্ত অবস্থান দখল করে এবং সেগুলিকে উন্নত করার জন্য সবকিছু করে৷

এর সাথে আমি আপনাকে বিদায় জানাচ্ছি, যদি আপনার কোন প্রশ্ন থাকে, আমি মন্তব্যে তাদের উত্তর দিতে সর্বদা খুশি। অথবা হয়তো আপনি নিবন্ধে যোগ করতে চান?

যাই হোক না কেন, আপনার মতামত প্রকাশ করুন। !

ইয়ানডেক্স, আজ, রাশিয়ার সবচেয়ে জনপ্রিয় সার্চ ইঞ্জিন। পরিষেবা পরিসংখ্যান লাইভইন্টারনেট, অল-রাশিয়ান দর্শকদের ভরের মধ্যে ইয়ানডেক্সের ভাগ দেখায় - এটি 53.4%, যদি আমরা শুধুমাত্র মস্কো এবং অঞ্চলকে বিবেচনা করি তবে এটি আরও বেশি - 67.9% (অনুরোধ অনুসারে, মস্কো এর চেয়ে বেশি দখল করে) সমস্ত রাশিয়ার 50%)।

ওয়েবসাইট www.yandex.ru 1997 সালে তৈরি করা হয়েছিল; এটির জন্য শুধুমাত্র একটি সার্ভারই ​​যথেষ্ট ছিল, যা প্রথম ইয়ানডেক্স বিকাশকারী, দিমিত্রি, যার শেষ নাম ছিল তার ডেস্কটপের অধীনে। খোলার পরে খুব দ্রুত, আমরা একটি দ্বিতীয় সার্ভার কিনেছিলাম, এবং শীঘ্রই, যখন অন্য একটি ইনস্টল করার প্রয়োজন হয়, তখন এটি স্পষ্ট হয়ে যায় যে তিনটি ইয়ানডেক্স সার্ভারের জন্য টেবিলের নীচে পর্যাপ্ত জায়গা ছিল, বা […]

সার্চ ইঞ্জিন ডেভেলপাররা তাদের প্রশ্নের সর্বোত্তম উত্তর ব্যবহারকারীদের প্রদান করার চেষ্টা করে। কখনও কখনও এই জাতীয় উত্তর একটি সংখ্যা হতে পারে (উদাহরণস্বরূপ, একটি শহরের আবহাওয়া), একটি ছবি (উদাহরণস্বরূপ, একটি মানচিত্রে একটি ঠিকানা), একটি শব্দের অনুবাদ বা একটি কোয়াট্রেন। যখন আপনার কাছে তথ্যের একটি উপযুক্ত বিন্যাস থাকে, তখন উত্তরটি অবিলম্বে দেওয়া যেতে পারে। অতএব, ইয়ানডেক্স তার থেকে উত্তর সহ ইন্টারনেট অনুসন্ধান ফলাফলের পরিপূরক […]

ইয়ানডেক্সের প্রায় প্রতিটি দশম অনুরোধ "নেভিগেশনাল" হয়, অর্থাৎ, এটি একটি সংস্থা বা ওয়েবসাইটের নাম নিয়ে গঠিত এবং ব্যবহারকারী এই সংস্থার ওয়েবসাইটে যেতে চায়। এই ক্ষেত্রে, ব্রাউজারের ঠিকানা বারের পরিবর্তে ইয়ানডেক্স অনুসন্ধান বার ব্যবহার করা হয় এবং ব্যবহারকারী, একটি নিয়ম হিসাবে, অবশিষ্ট নয়টি অনুসন্ধান ফলাফলে আগ্রহী নয়। মূল লক্ষ্য থেকে ব্যবহারকারীকে বিভ্রান্ত না করে, আমরা মূলের পরে যোগ করেছি […]

সার্চ ইঞ্জিনের প্রধান কাজ হল ব্যবহারকারীর প্রশ্নের উত্তর দেওয়া। যখন একজন ব্যবহারকারী একটি প্রশ্ন জিজ্ঞাসা করে, সার্চ ইঞ্জিন ইন্টারনেটের প্রতিটি সাইট অ্যাক্সেস করে না, তবে এটি পরিচিত পৃষ্ঠাগুলির একটি ডাটাবেসের মাধ্যমে অনুসন্ধান করে - অনুসন্ধান সূচক। সেখানে তিনি ক্যোয়ারী থেকে শব্দ সহ সমস্ত পৃষ্ঠা খুঁজে পান। ব্যবহারকারী অনুসন্ধান ফলাফল পৃষ্ঠাগুলিতে এই পৃষ্ঠাগুলির লিঙ্কগুলি দেখেন৷

যেমনটি আমরা দেখি, ইয়ানডেক্স স্থির থাকে না, এবং আমি নিশ্চিত যে এই সিস্টেমের অনুসন্ধান প্রযুক্তিগুলি অনুসন্ধানের গুণমান উন্নত করার জন্য বিকাশ অব্যাহত রাখবে, যাকে এখনও আদর্শ বলা যেতে পারে।

10 নভেম্বর, 2009-এ, ইয়ানডেক্স অনুসন্ধান অ্যালগরিদমের একটি নতুন সংস্করণ ঘোষণা করেছে - স্নেজিনস্ক। প্রাসঙ্গিকতা গণনা করার জন্য অ্যালগরিদমে মৌলিক পরিবর্তন ঘটেছে - ইয়ানডেক্স প্রতিনিধিরা নিম্নলিখিতগুলি লিখেছেন: “আমরা আরও নির্ভুল এবং আরও জটিল গাণিতিক মডেল তৈরি করতে পেরেছি, যা অনুসন্ধানের গুণমানে উল্লেখযোগ্য বৃদ্ধির দিকে পরিচালিত করেছিল। অনুসন্ধান র‌্যাঙ্কিং আর্কিটেকচারের পুনরায় ডিজাইনের জন্য ধন্যবাদ, কয়েক হাজার অ্যাকাউন্টিং বাস্তবায়ন করা সম্ভব হয়েছিল [...]

ইয়ানডেক্স অ্যালগরিদমের নতুন সংস্করণের পরীক্ষা 9 জুলাই, 2008 এ শুরু হয়েছিল। ইয়ানডেক্সের মতে, "প্রোগ্রামের প্রধান পরিবর্তনগুলি মেশিন লার্নিংয়ের একটি নতুন পদ্ধতির সাথে সম্পর্কিত এবং ফলস্বরূপ, সূত্রে র‌্যাঙ্কিং ফ্যাক্টরগুলি যেভাবে বিবেচনা করা হয় তার মধ্যে পার্থক্য।"

14 এপ্রিল, 2008-এ, নতুন অনুসন্ধান অ্যালগরিদম "মাগাদান" buki.yandex.ru-তে পরীক্ষা করা শুরু হয়েছিল। র‌্যাঙ্কিং ফ্যাক্টর সংখ্যা দ্বিগুণ করার পাশাপাশি, নিম্নলিখিত উদ্ভাবনগুলিও যোগ করা হয়েছিল:

অ্যালগরিদমিক জঙ্গলে প্রবেশ করার আগে, আসুন মনে করি কিভাবে একটি সার্চ ইঞ্জিন সাধারণভাবে কাজ করে। একটি অনুসন্ধান সিস্টেমের যৌক্তিক কাঠামো তিনটি মডিউলের আকারে উপস্থাপন করা যেতে পারে (ডায়াগ্রাম দেখুন) রোবট (ক্রলার) একটি বিশেষ প্রোগ্রাম যা ইন্টারনেট সাইটগুলি ক্রল করে এবং তাদের সামগ্রী ডাউনলোড করে। রোবটটির একটি বিশেষ সময়সূচী রয়েছে যা অনুসারে এটি তার রাউন্ডগুলি বহন করে। ওয়েবসাইট পেজ একটি রোবট দ্বারা লোড, একটি বিশেষ [...]

66. কিসের বেশি প্রভাব আছে: একটি বিনামূল্যের প্ল্যাটফর্ম (ব্লগস্পট, এলজে, ইত্যাদি) বা অফলাইন সাইট/ব্লগ থেকে একটি লিঙ্ক? ফ্রি প্ল্যাটফর্মগুলি স্বতন্ত্র সাইটগুলির তুলনায় কম ওজন স্থানান্তর করে। তবে, প্রভাব আরও বেশি হতে পারে। এটি অনেক কারণের কারণে: বর্তমান অ্যাঙ্কর তালিকা, তুলনা করা হচ্ছে সাইটগুলির অবস্থা, ইত্যাদি। এই প্রশ্নের একটি দ্ব্যর্থহীন উত্তর দেওয়া অসম্ভব। 67. সর্বাধিক ওজনের মধ্যে স্থানান্তরিত হয় […]

বামন ভ্রমণ - সারা বিশ্বে ভ্রমণ, বিমান টিকিট এবং ভিসা এবং ভারত, নেপাল, শ্রীলঙ্কা, মালদ্বীপ, মরিশাস এবং গ্রহের অন্যান্য অনেক জায়গায়। ভ্রমণকারী এবং তীর্থযাত্রীদের জন্য পরামর্শ। কিভাবে আপনার ট্রিপ থেকে সবচেয়ে বেশী পেতে. আশ্চর্যজনক ঐতিহাসিক ঘটনাবলি এবং অভিজ্ঞ ভ্রমণকারীদের গল্প।

একটি সাইটের বাহ্যিক লিঙ্কগুলিকে বিবেচনায় নেওয়ার উদ্দেশ্য কী আপনি পূর্ববর্তী বিভাগ থেকে দেখতে পাচ্ছেন, র‍্যাঙ্কিংকে প্রভাবিতকারী প্রায় সমস্ত কারণই পৃষ্ঠার লেখকের নিয়ন্ত্রণে থাকে। এইভাবে, একটি সার্চ ইঞ্জিনের পক্ষে একটি প্রদত্ত অনুসন্ধান বাক্যাংশের জন্য বিশেষভাবে তৈরি করা একটি পৃষ্ঠা থেকে বা এমনকি একটি রোবট দ্বারা উত্পন্ন একটি পৃষ্ঠা থেকে সত্যিকারের উচ্চ-মানের নথিকে আলাদা করা অসম্ভব হয়ে ওঠে এবং যেটিতে মোটেই দরকারী তথ্য নেই৷ […]

তারা দীর্ঘদিন ধরে রাশিয়ান ইন্টারনেটের একটি অবিচ্ছেদ্য অংশ হয়ে উঠেছে। সার্চ ইঞ্জিনগুলি এখন বিশাল এবং জটিল প্রক্রিয়া যা শুধুমাত্র একটি তথ্য অনুসন্ধান সরঞ্জামই নয়, ব্যবসার জন্য লোভনীয় ক্ষেত্রও উপস্থাপন করে।

বেশিরভাগ সার্চ ইঞ্জিন ব্যবহারকারীরা সার্চ ইঞ্জিনের পরিচালনার নীতি সম্পর্কে, ব্যবহারকারীর অনুরোধগুলি প্রক্রিয়াকরণের স্কিম সম্পর্কে, এই সিস্টেমগুলি কী নিয়ে গঠিত এবং তারা কীভাবে কাজ করে সে সম্পর্কে কখনও ভাবেননি (বা এটি সম্পর্কে চিন্তা করেছেন, কিন্তু উত্তর খুঁজে পাননি) ...

এই মাস্টার ক্লাসটি সার্চ ইঞ্জিন কিভাবে কাজ করে সেই প্রশ্নের উত্তর দেওয়ার জন্য ডিজাইন করা হয়েছে। যাইহোক, আপনি এখানে নথিগুলির র‌্যাঙ্কিংকে প্রভাবিত করে এমন কারণ খুঁজে পাবেন না। তদুপরি, আপনার ইয়ানডেক্স অ্যালগরিদমের বিশদ ব্যাখ্যার উপর নির্ভর করা উচিত নয়। ইয়ানডেক্স সার্চ ইঞ্জিনের প্রযুক্তি ও বিকাশের পরিচালক ইলিয়া সেগালোভিচের মতে, তিনি শুধুমাত্র ইলিয়া সেগালোভিচ নিজেই "নির্যাতনের অধীনে" স্বীকৃত হতে পারেন...

2. একটি সার্চ ইঞ্জিনের ধারণা এবং কার্যাবলী

একটি সার্চ সিস্টেম হল একটি সফ্টওয়্যার এবং হার্ডওয়্যার কমপ্লেক্স যা ইন্টারনেটে অনুসন্ধান করার জন্য এবং ব্যবহারকারীর অনুরোধে সাড়া দেওয়ার জন্য ডিজাইন করা হয়েছে, একটি পাঠ্য বাক্যাংশ (অনুসন্ধান কোয়েরি) আকারে নির্দিষ্ট করা হয়েছে, প্রাসঙ্গিকতার ক্রমানুসারে তথ্যের উত্সগুলির লিঙ্কগুলির একটি তালিকা তৈরি করে ( অনুরোধ অনুযায়ী)। বৃহত্তম আন্তর্জাতিক সার্চ ইঞ্জিন: "গুগল", ইয়াহু, MSN। রাশিয়ান ইন্টারনেটে এগুলি হল ইয়ানডেক্স, র‌্যাম্বলার, এপোর্ট।

আসুন একটি উদাহরণ হিসাবে ইয়ানডেক্স অনুসন্ধান ইঞ্জিন ব্যবহার করে একটি অনুসন্ধান ক্যোয়ারী ধারণাটি ঘনিষ্ঠভাবে দেখে নেওয়া যাক। অনুসন্ধান ক্যোয়ারী ব্যবহারকারীর দ্বারা প্রণয়ন করা উচিত সে যা খুঁজতে চায়, যতটা সংক্ষিপ্ত এবং সহজভাবে সম্ভব। ধরা যাক আমরা ইয়ানডেক্সে কীভাবে গাড়ি বেছে নেব সে সম্পর্কে তথ্য পেতে চাই। এটি করার জন্য, ইয়ানডেক্সের প্রধান পৃষ্ঠাটি খুলুন এবং অনুসন্ধান ক্যোয়ারীটির পাঠ্য লিখুন "কীভাবে একটি গাড়ি চয়ন করবেন।" এরপরে, আমাদের কাজটি ইন্টারনেটে তথ্যের উত্সগুলিতে আমাদের অনুরোধে প্রদত্ত লিঙ্কগুলি খোলার জন্য নেমে আসে। যাইহোক, এটা খুবই সম্ভব যে আমরা আমাদের প্রয়োজনীয় তথ্য খুঁজে পাব না। যদি এটি ঘটে থাকে, তাহলে হয় আপনাকে আপনার অনুরোধের পুনরায় শব্দবন্ধ করতে হবে, অথবা সার্চ ইঞ্জিন ডাটাবেসের কাছে আমাদের অনুরোধের কোনও প্রাসঙ্গিক তথ্য নেই (খুব "সংকীর্ণ" প্রশ্ন জিজ্ঞাসা করার সময় এটি ঘটতে পারে, যেমন, "কীভাবে চয়ন করবেন আরখানগেলস্কে একটি গাড়ি")

যেকোন সার্চ ইঞ্জিনের প্রাথমিক লক্ষ্য হল লোকেদের কাছে সঠিক তথ্য প্রদান করা যা তারা খুঁজছে। এবং ব্যবহারকারীদের সিস্টেমে "সঠিক" অনুরোধ করতে শেখান, যেমন অনুসন্ধান ইঞ্জিনের অপারেটিং নীতির সাথে সম্মত হওয়া প্রশ্নগুলি অসম্ভব। অতএব, বিকাশকারীরা সার্চ ইঞ্জিনগুলির জন্য অ্যালগরিদম এবং অপারেটিং নীতিগুলি তৈরি করে যা ব্যবহারকারীদের তারা যে তথ্য খুঁজছে তা খুঁজে পেতে অনুমতি দেয়।

এর মানে সার্চ ইঞ্জিনকে অবশ্যই "চিন্তা" করতে হবে যেভাবে ব্যবহারকারী তথ্য অনুসন্ধান করার সময় ভাবেন। যখন একজন ব্যবহারকারী একটি সার্চ ইঞ্জিনের কাছে একটি অনুরোধ করেন, তখন তিনি যত তাড়াতাড়ি সম্ভব এবং সহজে যা প্রয়োজন তা খুঁজে পেতে চান। ফলাফল গ্রহণ করে, তিনি বেশ কয়েকটি মৌলিক পরামিতি দ্বারা পরিচালিত সিস্টেমের কর্মক্ষমতা মূল্যায়ন করেন। তিনি যা খুঁজছিলেন তা কি তিনি খুঁজে পেয়েছেন? যদি তিনি এটি খুঁজে না পান, তাহলে তিনি যা খুঁজছিলেন তা খুঁজে বের করার জন্য তাকে কতবার প্রশ্নটি পুনরায় বর্ণনা করতে হয়েছিল? তিনি কতটা প্রাসঙ্গিক তথ্য খুঁজে পেতে পারেন? কত দ্রুত সার্চ ইঞ্জিন অনুরোধ প্রক্রিয়া করেছে? অনুসন্ধান ফলাফল উপস্থাপন করা কতটা সুবিধাজনক ছিল? আপনি যে ফলাফলটি প্রথম খুঁজছিলেন নাকি শততম? দরকারী তথ্যের সাথে কতটা অপ্রয়োজনীয় আবর্জনা পাওয়া গেছে? একটি সার্চ ইঞ্জিন অ্যাক্সেস করার সময় প্রয়োজনীয় তথ্য পাওয়া যাবে, বলুন, এক সপ্তাহে, না এক মাসে?

এই সমস্ত প্রশ্নের উত্তর দিয়ে সন্তুষ্ট করার জন্য, সার্চ ইঞ্জিন ডেভেলপাররা ক্রমাগত সার্চ অ্যালগরিদম এবং নীতিগুলিকে উন্নত করছে, নতুন ফাংশন এবং ক্ষমতা যোগ করছে এবং সিস্টেমের ক্রিয়াকলাপকে গতিশীল করার জন্য প্রতিটি সম্ভাব্য উপায়ে চেষ্টা করছে৷

3. একটি সার্চ ইঞ্জিনের প্রধান বৈশিষ্ট্য

আসুন আমরা সার্চ ইঞ্জিনগুলির প্রধান বৈশিষ্ট্যগুলি বর্ণনা করি:

  • সম্পূর্ণতা

    সম্পূর্ণতা একটি অনুসন্ধান সিস্টেমের প্রধান বৈশিষ্ট্যগুলির মধ্যে একটি, যা ইন্টারনেটে প্রদত্ত অনুরোধকে সন্তুষ্ট করে এমন নথির মোট সংখ্যার সাথে অনুরোধের মাধ্যমে পাওয়া নথির সংখ্যার অনুপাত। উদাহরণস্বরূপ, যদি ইন্টারনেটে 100টি পৃষ্ঠা থাকে যেখানে "কীভাবে একটি গাড়ি চয়ন করবেন" বাক্যাংশ রয়েছে এবং এর মধ্যে কেবলমাত্র 60টি সংশ্লিষ্ট প্রশ্নের জন্য পাওয়া গেছে, তবে অনুসন্ধানের সম্পূর্ণতা হবে 0.6। স্পষ্টতই, অনুসন্ধান যত বেশি সম্পূর্ণ হবে, ব্যবহারকারী তার প্রয়োজনীয় নথিটি খুঁজে পাবে না এমন সম্ভাবনা তত কম, যদি এটি ইন্টারনেটে বিদ্যমান থাকে।

  • সঠিকতা

    নির্ভুলতা একটি সার্চ ইঞ্জিনের আরেকটি প্রধান বৈশিষ্ট্য, যা ব্যবহারকারীর প্রশ্নের সাথে পাওয়া ডকুমেন্টগুলি যে মাত্রায় মেলে তা দ্বারা নির্ধারিত হয়। উদাহরণস্বরূপ, যদি "কীভাবে একটি গাড়ি চয়ন করবেন" প্রশ্নটিতে 100টি নথি থাকে, তার মধ্যে 50টিতে "কীভাবে একটি গাড়ি চয়ন করবেন" বাক্যাংশ থাকে এবং বাকিগুলিতে কেবল এই শব্দগুলি থাকে ("কীভাবে সঠিক রেডিও চয়ন করবেন এবং এটি ইনস্টল করবেন) একটি গাড়ী”), তারপর অনুসন্ধানের নির্ভুলতা 50/100 (=0.5) এর সমান বলে মনে করা হয়। অনুসন্ধানটি যত বেশি নির্ভুল হবে, ব্যবহারকারী যত দ্রুত তার প্রয়োজনীয় নথিগুলি খুঁজে পাবে, তাদের মধ্যে কম বিভিন্ন ধরণের "আবর্জনা" পাওয়া যাবে, প্রায়শই পাওয়া নথিগুলি অনুরোধের সাথে মিলবে না।

  • প্রাসঙ্গিকতা

    প্রাসঙ্গিকতা অনুসন্ধানের একটি সমান গুরুত্বপূর্ণ উপাদান, যা ইন্টারনেটে নথিগুলি প্রকাশিত হওয়ার মুহূর্ত থেকে অনুসন্ধান ইঞ্জিন সূচক ডাটাবেসে প্রবেশ করা পর্যন্ত সময়ের দ্বারা চিহ্নিত করা হয়। উদাহরণস্বরূপ, আকর্ষণীয় খবর প্রকাশের পরের দিন, বিপুল সংখ্যক ব্যবহারকারী প্রাসঙ্গিক প্রশ্নগুলির সাথে সার্চ ইঞ্জিনে পরিণত হয়েছিল। উদ্দেশ্যমূলকভাবে, এই বিষয়ে সংবাদ তথ্য প্রকাশের পর এক দিনেরও কম সময় অতিবাহিত হয়েছে, তবে মূল নথিগুলি ইতিমধ্যেই সূচীবদ্ধ এবং অনুসন্ধানের জন্য উপলব্ধ করা হয়েছে, বড় সার্চ ইঞ্জিনগুলির তথাকথিত "দ্রুত ডেটাবেস" এর অস্তিত্বের জন্য ধন্যবাদ, যা দিনে কয়েকবার আপডেট করা হয়।

  • অনুসন্ধানের গতি

    অনুসন্ধানের গতি ঘনিষ্ঠভাবে এর লোড প্রতিরোধের সাথে সম্পর্কিত। উদাহরণস্বরূপ, র‌্যাম্বলার ইন্টারনেট হোল্ডিং এলএলসি অনুসারে, আজ, ব্যবসার সময়, র‌্যাম্বলার সার্চ ইঞ্জিন প্রতি সেকেন্ডে প্রায় 60টি অনুরোধ গ্রহণ করে। এই ধরনের কাজের চাপের জন্য একটি পৃথক অনুরোধের প্রক্রিয়াকরণের সময় হ্রাস করা প্রয়োজন। এখানে ব্যবহারকারী এবং সার্চ ইঞ্জিনের স্বার্থ মিলে যায়: ভিজিটর যত তাড়াতাড়ি সম্ভব ফলাফল পেতে চায়, এবং সার্চ ইঞ্জিনকে যত তাড়াতাড়ি সম্ভব অনুরোধটি প্রক্রিয়া করতে হবে, যাতে পরবর্তী প্রশ্নের গণনা ধীর না হয়।

  • দৃশ্যমানতা

4. সার্চ ইঞ্জিনের বিকাশের সংক্ষিপ্ত ইতিহাস

ইন্টারনেট বিকাশের প্রাথমিক সময়কালে, এর ব্যবহারকারীর সংখ্যা কম ছিল এবং উপলব্ধ তথ্যের পরিমাণ তুলনামূলকভাবে কম ছিল। বেশিরভাগ ক্ষেত্রে, শুধুমাত্র গবেষণা কর্মীদের ইন্টারনেট অ্যাক্সেস ছিল। এই সময়ে ইন্টারনেটে তথ্য অনুসন্ধানের কাজটি এখনকার মতো জরুরি ছিল না।

নেটওয়ার্ক তথ্য সংস্থানগুলিতে অ্যাক্সেস সংগঠিত করার প্রথম উপায়গুলির মধ্যে একটি ছিল সাইটগুলির উন্মুক্ত ডিরেক্টরি তৈরি করা, সংস্থানগুলির লিঙ্কগুলি যা বিষয় অনুসারে গোষ্ঠীবদ্ধ ছিল। এই ধরনের প্রথম প্রকল্প ছিল Yahoo.com ওয়েবসাইট, যা 1994 সালের বসন্তে খোলা হয়েছিল। ক্যাটালগে সাইটের সংখ্যা উল্লেখযোগ্যভাবে বৃদ্ধি পাওয়ার পরে, ক্যাটালগে প্রয়োজনীয় তথ্য অনুসন্ধান করার ক্ষমতা যুক্ত করা হয়েছিল। সম্পূর্ণ অর্থে, এটি এখনও একটি সার্চ ইঞ্জিন ছিল না, কারণ অনুসন্ধান এলাকাটি শুধুমাত্র ক্যাটালগে উপস্থিত সংস্থানগুলির মধ্যে সীমাবদ্ধ ছিল, এবং সমস্ত ইন্টারনেট সংস্থানগুলিতে নয়৷

লিঙ্ক ডিরেক্টরি অতীতে ব্যাপকভাবে ব্যবহৃত হত, কিন্তু বর্তমানে তাদের জনপ্রিয়তা প্রায় সম্পূর্ণ হারিয়েছে। যেহেতু এমনকি আধুনিক ক্যাটালগগুলি, আয়তনে বিশাল, শুধুমাত্র ইন্টারনেটের একটি নগণ্য অংশ সম্পর্কে তথ্য ধারণ করে। DMOZ নেটওয়ার্কের বৃহত্তম ডিরেক্টরিতে (ওপেন ডিরেক্টরি প্রজেক্ট বলা হয়) প্রায় 5 মিলিয়ন সম্পদের তথ্য রয়েছে, যখন Google অনুসন্ধান ইঞ্জিন ডাটাবেস 8 বিলিয়নেরও বেশি নথি নিয়ে গঠিত।

1995 সালে, সার্চ ইঞ্জিন Lycos এবং AltaVista হাজির। পরেরটি বহু বছর ধরে ইন্টারনেটে তথ্য অনুসন্ধানের ক্ষেত্রে একজন নেতা।

1997 সালে, সের্গেই ব্রিন এবং ল্যারি পেজ স্ট্যানফোর্ড ইউনিভার্সিটিতে একটি গবেষণা প্রকল্পের অংশ হিসেবে গুগল সার্চ ইঞ্জিন তৈরি করেন। গুগল বর্তমানে বিশ্বের সবচেয়ে জনপ্রিয় সার্চ ইঞ্জিন!

1997 সালের সেপ্টেম্বরে, ইয়ানডেক্স সার্চ ইঞ্জিন, যা রাশিয়ান ভাষার ইন্টারনেটে সর্বাধিক জনপ্রিয়, আনুষ্ঠানিকভাবে ঘোষণা করা হয়েছিল।

বর্তমানে, তিনটি প্রধান সার্চ ইঞ্জিন (আন্তর্জাতিক) রয়েছে - গুগল, ইয়াহু এবং, যাদের নিজস্ব ডেটাবেস এবং অনুসন্ধান অ্যালগরিদম রয়েছে। বেশিরভাগ অন্যান্য সার্চ ইঞ্জিন (যার মধ্যে প্রচুর সংখ্যক আছে) তালিকাভুক্ত তিনটি ফলাফল এক বা অন্য আকারে ব্যবহার করে। উদাহরণস্বরূপ, AOL অনুসন্ধান (search.aol.com) Google ডাটাবেস ব্যবহার করে, যখন AltaVista, Lycos এবং AllTheWeb Yahoo ডাটাবেস ব্যবহার করে।

5. সার্চ সিস্টেমের পরিচালনার রচনা এবং নীতিগুলি

রাশিয়ায়, প্রধান সার্চ ইঞ্জিন হল ইয়ানডেক্স, এর পরে রয়েছে Rambler.ru, Google.ru, Aport.ru, Mail.ru। তাছাড়া, এই মুহুর্তে, Mail.ru ইয়ানডেক্স সার্চ ইঞ্জিন এবং ডাটাবেস ব্যবহার করে।

প্রায় সব প্রধান সার্চ ইঞ্জিনের নিজস্ব গঠন আছে, অন্যদের থেকে আলাদা। যাইহোক, সমস্ত সার্চ ইঞ্জিনে সাধারণ প্রধান উপাদানগুলি সনাক্ত করা সম্ভব। কাঠামোর পার্থক্য শুধুমাত্র এই উপাদানগুলির মিথস্ক্রিয়া প্রক্রিয়ার বাস্তবায়নের আকারে হতে পারে।

ইন্ডেক্সিং মডিউল

ইন্ডেক্সিং মডিউল তিনটি সহায়ক প্রোগ্রাম (রোবট) নিয়ে গঠিত:

স্পাইডার হল ওয়েব পেজ ডাউনলোড করার জন্য ডিজাইন করা একটি প্রোগ্রাম। মাকড়সা পৃষ্ঠাটি ডাউনলোড করে এবং সেই পৃষ্ঠা থেকে সমস্ত অভ্যন্তরীণ লিঙ্ক পুনরুদ্ধার করে। প্রতিটি পৃষ্ঠার html কোড ডাউনলোড করা হয়। রোবট পৃষ্ঠাগুলি ডাউনলোড করতে HTTP প্রোটোকল ব্যবহার করে। মাকড়সা নিম্নরূপ কাজ করে। রোবট সার্ভারে অনুরোধ "গেট/পাথ/ডকুমেন্ট" এবং অন্য কিছু HTTP অনুরোধ কমান্ড পাঠায়। প্রতিক্রিয়া হিসাবে, রোবট একটি পাঠ্য স্ট্রীম পায় যার মধ্যে পরিষেবার তথ্য এবং নথিটি নিজেই রয়েছে।

  • পৃষ্ঠা URL
  • পৃষ্ঠাটি ডাউনলোড করার তারিখ
  • সার্ভার প্রতিক্রিয়া http শিরোনাম
  • পেজ বডি (এইচটিএমএল কোড)

ক্রলার (“ভ্রমণ” মাকড়সা) হল একটি প্রোগ্রাম যা স্বয়ংক্রিয়ভাবে পৃষ্ঠায় পাওয়া সমস্ত লিঙ্ক অনুসরণ করে। পৃষ্ঠায় উপস্থিত সমস্ত লিঙ্ক নির্বাচন করে। এর কাজ হল লিঙ্ক বা ঠিকানার পূর্বনির্ধারিত তালিকার উপর ভিত্তি করে মাকড়সাটির পরবর্তী কোথায় যেতে হবে তা নির্ধারণ করা। ক্রলার, পাওয়া লিঙ্কগুলি অনুসরণ করে, নতুন নথিগুলি অনুসন্ধান করে যা এখনও সার্চ ইঞ্জিনের কাছে অজানা।

ইনডেক্সার (রোবট ইনডেক্সার) হল একটি প্রোগ্রাম যা মাকড়সা দ্বারা ডাউনলোড করা ওয়েব পেজ বিশ্লেষণ করে। ইনডেক্সার পৃষ্ঠাটিকে তার উপাদান অংশে বিশ্লেষণ করে এবং তার নিজস্ব আভিধানিক এবং রূপগত অ্যালগরিদম ব্যবহার করে বিশ্লেষণ করে। পৃষ্ঠার বিভিন্ন উপাদান বিশ্লেষণ করা হয়, যেমন পাঠ্য, শিরোনাম, লিঙ্ক, কাঠামোগত এবং শৈলী বৈশিষ্ট্য, বিশেষ পরিষেবা HTML ট্যাগ ইত্যাদি।

এইভাবে, ইন্ডেক্সিং মডিউল আপনাকে লিঙ্কগুলি ব্যবহার করে প্রদত্ত সংস্থানগুলির একটি সেট ক্রল করতে, সম্মুখীন পৃষ্ঠাগুলি ডাউনলোড করতে, প্রাপ্ত নথিগুলি থেকে নতুন পৃষ্ঠাগুলির লিঙ্কগুলি বের করতে এবং এই নথিগুলির সম্পূর্ণ বিশ্লেষণ করতে দেয়৷

তথ্যশালা

একটি ডাটাবেস, বা সার্চ ইঞ্জিন ইনডেক্স হল একটি ডেটা স্টোরেজ সিস্টেম, একটি তথ্য বিন্যাস যেখানে ইনডেক্সিং মডিউল দ্বারা ডাউনলোড করা এবং প্রক্রিয়া করা সমস্ত নথির বিশেষভাবে রূপান্তরিত প্যারামিটার সংরক্ষণ করা হয়।

সার্ভার সার্চ করুন

অনুসন্ধান সার্ভার সমগ্র সিস্টেমের সবচেয়ে গুরুত্বপূর্ণ উপাদান, যেহেতু অনুসন্ধানের গুণমান এবং গতি সরাসরি অ্যালগরিদমগুলির উপর নির্ভর করে যা এটির কার্যকারিতাকে অধীন করে।

অনুসন্ধান সার্ভার নিম্নরূপ কাজ করে:

  • ব্যবহারকারীর কাছ থেকে প্রাপ্ত অনুরোধটি রূপগত বিশ্লেষণের বিষয়। ডাটাবেসে থাকা প্রতিটি নথির তথ্য পরিবেশ তৈরি করা হয় (যা পরবর্তীতে ফর্মে প্রদর্শিত হবে, অর্থাৎ, অনুসন্ধান ফলাফল পৃষ্ঠায় অনুরোধের সাথে সম্পর্কিত পাঠ্য তথ্য)।
  • প্রাপ্ত ডেটা ইনপুট প্যারামিটার হিসাবে একটি বিশেষ র‌্যাঙ্কিং মডিউলে প্রেরণ করা হয়। সমস্ত নথির জন্য ডেটা প্রক্রিয়া করা হয়, যার ফলস্বরূপ প্রতিটি নথির নিজস্ব রেটিং রয়েছে যা ব্যবহারকারীর দ্বারা প্রবেশ করা প্রশ্নের প্রাসঙ্গিকতা এবং অনুসন্ধান ইঞ্জিন সূচকে সংরক্ষিত এই নথির বিভিন্ন উপাদানকে চিহ্নিত করে৷
  • ব্যবহারকারীর পছন্দের উপর নির্ভর করে, এই রেটিংটি অতিরিক্ত শর্ত দ্বারা সামঞ্জস্য করা যেতে পারে (উদাহরণস্বরূপ, তথাকথিত "উন্নত অনুসন্ধান")।
  • এর পরে, একটি স্নিপেট তৈরি করা হয়, অর্থাৎ, পাওয়া প্রতিটি নথির জন্য, শিরোনাম, একটি সংক্ষিপ্ত বিমূর্ত যা কোয়েরির সাথে সবচেয়ে ভাল মেলে, এবং নথির একটি লিঙ্ক নিজেই নথির টেবিল থেকে বের করা হয়, এবং পাওয়া শব্দগুলি হাইলাইট করা হয়।
  • ফলস্বরূপ অনুসন্ধানের ফলাফলগুলি ব্যবহারকারীর কাছে একটি SERP (সার্চ ইঞ্জিন ফলাফল পৃষ্ঠা) আকারে প্রেরণ করা হয় - একটি অনুসন্ধান ফলাফল পৃষ্ঠা৷

আপনি দেখতে পাচ্ছেন, এই সমস্ত উপাদানগুলি একে অপরের সাথে ঘনিষ্ঠভাবে সম্পর্কিত এবং মিথস্ক্রিয়ায় কাজ করে, অনুসন্ধান ব্যবস্থা পরিচালনার জন্য একটি পরিষ্কার, বরং জটিল প্রক্রিয়া তৈরি করে, যার জন্য প্রচুর পরিমাণে সংস্থান প্রয়োজন।

6। উপসংহার

এখন উপরের সবগুলো সংক্ষিপ্ত করা যাক।

  • যেকোন সার্চ ইঞ্জিনের প্রাথমিক লক্ষ্য হল লোকেদের কাছে সঠিক তথ্য প্রদান করা যা তারা খুঁজছে।
  • সার্চ ইঞ্জিনের প্রধান বৈশিষ্ট্য:
    1. সম্পূর্ণতা
    2. সঠিকতা
    3. প্রাসঙ্গিকতা
    4. অনুসন্ধানের গতি
    5. দৃশ্যমানতা
  • প্রথম পূর্ণাঙ্গ সার্চ ইঞ্জিন ছিল WebCrawler প্রকল্প, যা 1994 সালে প্রকাশিত হয়েছিল।
  • অনুসন্ধান সিস্টেম নিম্নলিখিত উপাদানগুলি অন্তর্ভুক্ত করে:
    1. ইন্ডেক্সিং মডিউল
    2. তথ্যশালা
    3. সার্ভার সার্চ করুন

আমরা আশা করি যে আমাদের মাস্টার ক্লাস আপনাকে একটি সার্চ ইঞ্জিনের ধারণার সাথে আরও পরিচিত হতে এবং সার্চ ইঞ্জিনের প্রধান ফাংশন, বৈশিষ্ট্য এবং অপারেটিং নীতিগুলি আরও ভালভাবে বুঝতে সাহায্য করবে৷

1. শর্তাদি এবং সংজ্ঞা ব্যক্তিগত ডেটা প্রক্রিয়াকরণের এই চুক্তিতে (এর পরে চুক্তি হিসাবে উল্লেখ করা হয়েছে), নীচের শর্তাবলীতে নিম্নলিখিত সংজ্ঞা রয়েছে: অপারেটর - স্বতন্ত্র উদ্যোক্তা ওলেগ আলেকসান্দ্রোভিচ ডনেপ্রোভস্কি। চুক্তির স্বীকৃতি - ব্যক্তিগত তথ্য প্রেরণ এবং প্রক্রিয়াকরণের মাধ্যমে চুক্তির সমস্ত শর্তাবলীর সম্পূর্ণ এবং নিঃশর্ত স্বীকৃতি। ব্যক্তিগত ডেটা - সাইটে ব্যবহারকারী (ব্যক্তিগত ডেটার বিষয়) দ্বারা প্রবেশ করা তথ্য এবং এই ব্যবহারকারীর সাথে প্রত্যক্ষ বা পরোক্ষভাবে সম্পর্কিত। ব্যবহারকারী - যে কোনো ব্যক্তি বা আইনী সত্তা যিনি সফলভাবে সাইটে ইনপুট ক্ষেত্রগুলি পূরণ করার প্রক্রিয়াটি সম্পন্ন করেছেন। ইনপুট ক্ষেত্রগুলি পূরণ করা হল ব্যবহারকারীর তাদের প্রথম নাম, পদবি, ফোন নম্বর, ব্যক্তিগত ইমেল ঠিকানা (এর পরে ব্যক্তিগত ডেটা হিসাবে উল্লেখ করা হয়েছে) সাইটের নিবন্ধিত ব্যবহারকারীদের ডাটাবেসে পাঠানোর পদ্ধতি, যা সনাক্তকরণের উদ্দেশ্যে করা হয়। ব্যবহারকারী. ইনপুট ক্ষেত্রগুলি পূরণ করার ফলে, ব্যক্তিগত ডেটা অপারেটরের ডাটাবেসে পাঠানো হয়। ইনপুট ক্ষেত্রগুলি পূরণ করা স্বেচ্ছায়। ওয়েবসাইট - ইন্টারনেটে অবস্থিত একটি ওয়েবসাইট এবং একটি পৃষ্ঠা নিয়ে গঠিত। 2. সাধারণ বিধান 2.1. এই চুক্তিটি জুলাই 27, 2006 নং 152-FZ "ব্যক্তিগত ডেটার উপর" ফেডারেল আইনের প্রয়োজনীয়তার ভিত্তিতে এবং "ক্ষেত্রে রাশিয়ান ফেডারেশনের আইন লঙ্ঘন" সম্পর্কিত অনুচ্ছেদ 13.11 এর বিধানগুলির ভিত্তিতে তৈরি করা হয়েছে। রাশিয়ান ফেডারেশনের প্রশাসনিক অপরাধের কোডের "ব্যক্তিগত ডেটা" এবং সাইটটি ব্যবহার করার সময় অপারেটর ব্যবহারকারী সম্পর্কে প্রাপ্ত সমস্ত ব্যক্তিগত ডেটার জন্য বৈধ। 2.2। সাইটের ব্যবহারকারী দ্বারা ইনপুট ক্ষেত্রগুলি পূরণ করার অর্থ হল এই চুক্তির সমস্ত শর্তাবলীর সাথে ব্যবহারকারীর শর্তহীন চুক্তি (চুক্তির স্বীকৃতি)। এই শর্তগুলির সাথে মতানৈক্যের ক্ষেত্রে, ব্যবহারকারী সাইটের ইনপুট ক্ষেত্রগুলি পূরণ করবেন না। 2.3। অপারেটরকে ব্যক্তিগত তথ্য প্রদানের জন্য ব্যবহারকারীর সম্মতি এবং অপারেটর দ্বারা তাদের প্রক্রিয়াকরণ অপারেটরের কার্যক্রম বন্ধ না হওয়া পর্যন্ত বা ব্যবহারকারীর সম্মতি প্রত্যাহার না করা পর্যন্ত বৈধ। এই চুক্তিটি গ্রহণ করে এবং নিবন্ধন পদ্ধতির মধ্য দিয়ে যাওয়ার মাধ্যমে, সেইসাথে পরবর্তীতে সাইটটি অ্যাক্সেস করার মাধ্যমে, ব্যবহারকারী নিশ্চিত করে যে, তার নিজের ইচ্ছামত কাজ করে এবং তার নিজের স্বার্থে, সে অপারেটরের কাছে প্রক্রিয়াকরণের জন্য তার ব্যক্তিগত ডেটা স্থানান্তর করে এবং সম্মত হয় তাদের প্রক্রিয়াকরণ। ব্যবহারকারীকে অবহিত করা হয় যে তার ব্যক্তিগত ডেটা প্রক্রিয়াকরণ অপারেটর দ্বারা 27 জুলাই, 2006 নং 152-FZ "ব্যক্তিগত ডেটাতে" ফেডারেল আইনের ভিত্তিতে করা হবে৷ 3. অপারেটরে স্থানান্তরিত করার জন্য ব্যবহারকারীর ব্যক্তিগত ডেটা এবং অন্যান্য তথ্যের তালিকা 3৷ 1. অপারেটরের ওয়েবসাইট ব্যবহার করার সময়, ব্যবহারকারী নিম্নলিখিত ব্যক্তিগত ডেটা প্রদান করে: 3.1.1. নির্ভরযোগ্য ব্যক্তিগত তথ্য যা ব্যবহারকারী ইনপুট ক্ষেত্রগুলি পূরণ করার সময় এবং/অথবা শেষ নাম, প্রথম নাম, পৃষ্ঠপোষকতা, টেলিফোন নম্বর (বাড়ি বা মোবাইল), ব্যক্তিগত ইমেল ঠিকানা সহ সাইট পরিষেবাগুলি ব্যবহার করার সময় স্বাধীনভাবে নিজের সম্পর্কে সরবরাহ করে। 3.1.2। আইপি ঠিকানা, কুকিজ থেকে তথ্য, ব্যবহারকারীর ব্রাউজার সম্পর্কে তথ্য (বা পরিষেবাগুলি অ্যাক্সেস করা হয় এমন অন্যান্য প্রোগ্রাম) সহ ব্যবহারকারীর ডিভাইসে ইনস্টল করা সফ্টওয়্যার ব্যবহার করে তাদের ব্যবহারের সময় সাইট পরিষেবাগুলিতে স্বয়ংক্রিয়ভাবে স্থানান্তরিত হয়। 3.2। অপারেটর ব্যবহারকারীর দ্বারা প্রদত্ত ব্যক্তিগত ডেটার যথার্থতা যাচাই করে না। এই ক্ষেত্রে, অপারেটর অনুমান করে যে ব্যবহারকারী ইনপুট ক্ষেত্রগুলিতে প্রস্তাবিত প্রশ্নগুলির উপর নির্ভরযোগ্য এবং পর্যাপ্ত ব্যক্তিগত তথ্য প্রদান করে৷ 4. উদ্দেশ্য, ব্যক্তিগত তথ্য সংগ্রহ ও ব্যবহারের নিয়ম 4.1. অপারেটর ব্যক্তিগত ডেটা প্রক্রিয়া করে যা পরিষেবা প্রদান এবং ব্যবহারকারীকে পরিষেবা প্রদানের জন্য প্রয়োজনীয়। 4.2। ব্যবহারকারীর ব্যক্তিগত তথ্য অপারেটর নিম্নলিখিত উদ্দেশ্যে ব্যবহার করে: 4.2.1. ব্যবহারকারী সনাক্তকরণ; 4.2.2। ব্যবহারকারীকে ব্যক্তিগতকৃত পরিষেবা প্রদান করা (পাশাপাশি চিঠি পাঠানোর মাধ্যমে কোম্পানির নতুন প্রচার এবং পরিষেবা সম্পর্কে অবহিত করা); 4.2.3। প্রয়োজনে ব্যবহারকারীর সাথে যোগাযোগ বজায় রাখা, পরিষেবার ব্যবহার সম্পর্কিত বিজ্ঞপ্তি, অনুরোধ এবং তথ্য পাঠানো, পরিষেবার বিধান, সেইসাথে ব্যবহারকারীর কাছ থেকে অনুরোধ এবং অ্যাপ্লিকেশন প্রক্রিয়াকরণ সহ; 4.3। ব্যক্তিগত ডেটা প্রক্রিয়াকরণের সময়, নিম্নলিখিত ক্রিয়াগুলি সম্পাদিত হবে: সংগ্রহ, রেকর্ডিং, পদ্ধতিগতকরণ, সঞ্চয়, সঞ্চয়, স্পষ্টীকরণ (আপডেট করা, পরিবর্তন করা), নিষ্কাশন, ব্যবহার, ব্লক করা, মুছে ফেলা, ধ্বংস। 4.4। ব্যবহারকারী আপত্তি করেন না যে কিছু ক্ষেত্রে তার দ্বারা নির্দিষ্ট করা তথ্য রাশিয়ান ফেডারেশনের বর্তমান আইন অনুসারে রাশিয়ান ফেডারেশনের অনুমোদিত রাষ্ট্রীয় সংস্থাগুলিতে সরবরাহ করা যেতে পারে। 4.5। ব্যবহারকারীর ব্যক্তিগত ডেটা অপারেটর দ্বারা এই চুক্তিতে দেওয়া পদ্ধতিতে অপারেটর দ্বারা সঞ্চিত এবং প্রক্রিয়া করা হয় সমগ্র কার্যকলাপের সময়কালের জন্য। 4.6। ব্যক্তিগত তথ্যের প্রক্রিয়াকরণ অপারেটর দ্বারা ডাটাবেস, স্বয়ংক্রিয়, যান্ত্রিক এবং ম্যানুয়াল পদ্ধতি বজায় রাখার মাধ্যমে বাহিত হয়। 4.7। সাইটটি সাইট পরিষেবার ব্যবহার ট্র্যাক করতে কুকিজ এবং অন্যান্য প্রযুক্তি ব্যবহার করে৷ এই ডেটা সাইটের প্রযুক্তিগত ক্রিয়াকলাপকে অপ্টিমাইজ করতে এবং পরিষেবার বিধানের মান উন্নত করার জন্য প্রয়োজনীয়। সাইটটি স্বয়ংক্রিয়ভাবে সাইটের প্রতিটি দর্শক সম্পর্কে তথ্য (ইউআরএল, আইপি ঠিকানা, ব্রাউজারের ধরন, ভাষা, তারিখ এবং অনুরোধের সময় সহ) রেকর্ড করে। সাইট পরিদর্শন করার সময় বা কুকিজ নিষ্ক্রিয় করার সময় ব্যবহারকারীর ব্যক্তিগত ডেটা প্রদান করতে অস্বীকার করার অধিকার রয়েছে, তবে এই ক্ষেত্রে, সাইটের সমস্ত ফাংশন সঠিকভাবে কাজ করতে পারে না। 4.8। এই চুক্তিতে প্রদত্ত গোপনীয়তার শর্তগুলি সমস্ত তথ্যের জন্য প্রযোজ্য যা অপারেটর সাইটটিতে অবস্থান এবং সাইটের ব্যবহারের সময় ব্যবহারকারী সম্পর্কে প্রাপ্ত করতে পারে। 4.9। এই চুক্তি সম্পাদনের সময় যে তথ্য সর্বজনীনভাবে প্রকাশ করা হয়, সেইসাথে যে কোনও ব্যক্তির অবাধ অ্যাক্সেস রয়েছে এমন উত্স থেকে পক্ষ বা তৃতীয় পক্ষের দ্বারা প্রাপ্ত করা তথ্য গোপনীয় নয়। 4.10। অপারেটর অননুমোদিত অ্যাক্সেস, পরিবর্তন, প্রকাশ বা ধ্বংস থেকে ব্যবহারকারীর ব্যক্তিগত ডেটার গোপনীয়তা রক্ষা করার জন্য সমস্ত প্রয়োজনীয় ব্যবস্থা গ্রহণ করে, যার মধ্যে রয়েছে: ডেটা সংগ্রহ, সংরক্ষণ এবং প্রক্রিয়াকরণের প্রক্রিয়াগুলির ক্রমাগত অভ্যন্তরীণ যাচাইকরণ নিশ্চিত করা এবং নিরাপত্তা নিশ্চিত করা; ডেটার শারীরিক নিরাপত্তা নিশ্চিত করে, প্রযুক্তিগত সিস্টেমে অননুমোদিত অ্যাক্সেস রোধ করে যা সাইটের অপারেশন নিশ্চিত করে, যেখানে অপারেটর ব্যক্তিগত ডেটা সঞ্চয় করে; শুধুমাত্র অপারেটরের সেই সমস্ত কর্মচারী বা অনুমোদিত ব্যক্তিদের ব্যক্তিগত ডেটাতে অ্যাক্সেস প্রদান করে যাদের এই তথ্যের প্রয়োজন হয় সরাসরি ব্যবহারকারীকে পরিষেবা প্রদানের সাথে সাথে সাইটের অপারেশন, উন্নয়ন এবং উন্নতির সাথে সম্পর্কিত দায়িত্ব পালন করার জন্য। 4.11। ব্যবহারকারীর ব্যক্তিগত তথ্য গোপন থাকে, এমন ক্ষেত্রে ব্যতীত যেখানে ব্যবহারকারী সীমাহীন সংখ্যক ব্যক্তির কাছে সাধারণ অ্যাক্সেসের জন্য স্বেচ্ছায় নিজের সম্পর্কে তথ্য সরবরাহ করে। 4.12। অপারেটরের পুনর্গঠন এবং অপারেটরের আইনগত উত্তরাধিকারীর কাছে অধিকার হস্তান্তরের সময় ব্যবহারকারীর ব্যক্তিগত ডেটা অপারেটরের দ্বারা স্থানান্তর বৈধ, যখন তার দ্বারা প্রাপ্ত ব্যক্তিগত তথ্যের সাথে সম্পর্কিত এই চুক্তির শর্তাবলী মেনে চলার সমস্ত বাধ্যবাধকতা আইনি উত্তরাধিকারীর কাছে হস্তান্তর। 4.13। এই বিবৃতিটি শুধুমাত্র অপারেটরের ওয়েবসাইটে প্রযোজ্য। কোম্পানি অনুসন্ধান ফলাফল সহ অপারেটরের ওয়েবসাইটে উপলব্ধ লিঙ্কগুলির মাধ্যমে ব্যবহারকারী যে তৃতীয় পক্ষের সাইটগুলি (পরিষেবাগুলি) অ্যাক্সেস করতে পারে তার জন্য কোম্পানি নিয়ন্ত্রণ করে না এবং দায়ী নয়৷ এই ধরনের সাইটগুলিতে (পরিষেবাগুলিতে), ব্যবহারকারীর কাছ থেকে অন্যান্য ব্যক্তিগত তথ্য সংগ্রহ বা অনুরোধ করা যেতে পারে এবং অন্যান্য ক্রিয়াকলাপ সম্পাদিত হতে পারে 5. ব্যক্তিগত ডেটার বিষয় হিসাবে ব্যবহারকারীর অধিকার, ব্যবহারকারীর ব্যক্তিগত ডেটা পরিবর্তন এবং মুছে ফেলা 5.1। ব্যবহারকারীর অধিকার রয়েছে: 5.1.2। অপারেটরকে তার ব্যক্তিগত ডেটা স্পষ্ট করতে, ব্যক্তিগত ডেটা অসম্পূর্ণ, পুরানো, ভুল, অবৈধভাবে প্রাপ্ত বা প্রক্রিয়াকরণের উদ্দেশ্যের জন্য প্রয়োজনীয় না হলে এটি ব্লক বা ধ্বংস করতে হবে এবং তার অধিকার রক্ষার জন্য আইন দ্বারা প্রদত্ত ব্যবস্থা গ্রহণ করতে হবে। 5.1.3। 5.1.3.1 ধারণকারী তথ্য সহ তার ব্যক্তিগত ডেটা প্রক্রিয়াকরণ সংক্রান্ত তথ্য পান। অপারেটর দ্বারা ব্যক্তিগত তথ্য প্রক্রিয়াকরণের সত্যতা নিশ্চিতকরণ; 5.1.3.2। অপারেটর দ্বারা ব্যবহৃত ব্যক্তিগত তথ্য প্রক্রিয়াকরণের উদ্দেশ্য এবং পদ্ধতি; 5.1.3.3। অপারেটরের নাম এবং অবস্থান; 5.1.3.4। ব্যক্তিগত তথ্যের প্রাসঙ্গিক বিষয়ের সাথে সম্পর্কিত ব্যক্তিগত ডেটা প্রক্রিয়াকৃত, তাদের প্রাপ্তির উত্স, যদি না এই ধরনের ডেটা উপস্থাপনের জন্য একটি ভিন্ন পদ্ধতি ফেডারেল আইন দ্বারা সরবরাহ করা হয়; 5.1.3.5। ব্যক্তিগত ডেটা প্রক্রিয়াকরণের শর্তাবলী, তাদের সঞ্চয়ের সময়কাল সহ; 5.1.3.6। রাশিয়ান ফেডারেশনের বর্তমান আইন দ্বারা প্রদত্ত অন্যান্য তথ্য। 5.2। ব্যক্তিগত তথ্য প্রক্রিয়াকরণের সম্মতি প্রত্যাহার ব্যবহারকারী দ্বারা অপারেটরকে একটি উপযুক্ত লিখিত (একটি বাস্তব মাধ্যমে মুদ্রিত এবং ব্যবহারকারীর দ্বারা স্বাক্ষরিত) নোটিশ প্রেরণের মাধ্যমে সম্পন্ন করা যেতে পারে। 6. অপারেটরের দায়িত্ব। ব্যক্তিগত তথ্য অ্যাক্সেস 6.1. অপারেটর অপারেটরের ওয়েবসাইটের ব্যবহারকারীদের ব্যক্তিগত ডেটাতে অননুমোদিত এবং অ-লক্ষ্যবিহীন অ্যাক্সেস প্রতিরোধ নিশ্চিত করার দায়িত্ব নেয়। এই ক্ষেত্রে, সাইট ব্যবহারকারীদের ব্যক্তিগত ডেটাতে অনুমোদিত এবং লক্ষ্যযুক্ত অ্যাক্সেস সমস্ত আগ্রহী পক্ষের দ্বারা তাদের অ্যাক্সেস হিসাবে বিবেচিত হবে, যা অপারেটরের সাইটের উদ্দেশ্য এবং বিষয়ের কাঠামোর মধ্যে প্রয়োগ করা হয়েছে। একই সময়ে, অপারেটর ব্যবহারকারীদের ব্যক্তিগত ডেটার সম্ভাব্য অপব্যবহারের জন্য দায়ী নয় যা এর ফলে ঘটে: সফ্টওয়্যারে প্রযুক্তিগত সমস্যা এবং অপারেটরের নিয়ন্ত্রণের বাইরে হার্ডওয়্যার এবং নেটওয়ার্কে; তৃতীয় পক্ষের দ্বারা অপারেটরের ওয়েবসাইটগুলি তাদের উদ্দেশ্যমূলক উদ্দেশ্যে ব্যতীত ইচ্ছাকৃত বা অনিচ্ছাকৃত ব্যবহারের সাথে সম্পর্কিত; 6.2 অপারেটর ব্যবহারকারীর ব্যক্তিগত তথ্যকে অননুমোদিত বা দুর্ঘটনাজনিত অ্যাক্সেস, ধ্বংস, পরিবর্তন, ব্লক করা, অনুলিপি করা, বিতরণের পাশাপাশি তৃতীয় পক্ষের অন্যান্য বেআইনি ক্রিয়া থেকে রক্ষা করার জন্য প্রয়োজনীয় এবং পর্যাপ্ত সাংগঠনিক এবং প্রযুক্তিগত ব্যবস্থা গ্রহণ করে। 7. গোপনীয়তা নীতিতে পরিবর্তন। প্রযোজ্য আইন 7.1. ব্যবহারকারীদের কোনো বিশেষ বিজ্ঞপ্তি ছাড়াই এই প্রবিধানে পরিবর্তন করার অধিকার অপারেটরের আছে। বর্তমান সংস্করণে পরিবর্তন করা হলে, শেষ আপডেটের তারিখ নির্দেশিত হয়। প্রবিধানের নতুন সংস্করণটি প্রকাশের মুহূর্ত থেকে কার্যকর হয়, যদি না অন্যথায় প্রবিধানের নতুন সংস্করণ দ্বারা সরবরাহ করা হয়। 7.2। রাশিয়ান ফেডারেশনের আইন এই প্রবিধানে প্রযোজ্য হবে এবং প্রবিধানের প্রয়োগের সাথে উদ্ভূত ব্যবহারকারী এবং অপারেটরের মধ্যে সম্পর্কের ক্ষেত্রে। আমি মানি আমি মানি না

আমরা যতটা অদ্বিতীয় নই যেমনটা আমরা ভাবি: আমাদের আগে লক্ষ লক্ষ লোক বিভ্রান্তিতে পড়েছিল এবং আমাদের পরে লক্ষ লক্ষ মানুষ প্রায় একই রকম প্রশ্ন নিয়ে সার্চ ইঞ্জিনকে বিভ্রান্ত করবে৷ অন্যদিকে, আমরা খুব অপ্রত্যাশিত: আমাদের অনুরোধের প্রণয়নটি বিপুল সংখ্যক কারণ দ্বারা প্রভাবিত হয় যা আমরা সচেতন নই। এবং অন্তত এই কারণে, আমাদের প্রত্যেকের অনুরোধ, তা যতই সাধারণ হোক না কেন, একটি পৃথক পদ্ধতির প্রয়োজন।

প্রকৃতপক্ষে, ইয়ানডেক্স সার্চ ইঞ্জিনের পুরো কাজটি দুটি সাধারণ জিনিসে নেমে আসে: একজন ব্যক্তি আসলে কী জানতে চান তা বোঝার জন্য এবং কয়েক সেকেন্ডের মধ্যে ইন্টারনেটে কোটি কোটি নথির মধ্যে উপযুক্তগুলি খুঁজে পেতে।

আঙুলের ছাপ নিন

সার্চ ইঞ্জিনের অপারেটিং সিস্টেম কিছুটা ম্যাট্রিক্সের মতো, এবং অনুসন্ধান রোবট (জটিল, স্বাধীনভাবে সিদ্ধান্ত নেওয়ার প্রোগ্রাম এটি তৈরি করেছে) এজেন্ট স্মিথের মতো।

প্রত্যেকবার যখন কাউকে কিছু জানার প্রয়োজন হয় তখন সমগ্র ইন্টারনেটে অনুসন্ধান না করার জন্য, সার্চ ইঞ্জিন কাজটির কিছু অংশ আগে থেকেই করে - এটি হাজার হাজার অনুসন্ধান রোবট ব্যবহার করে ওয়েবে কী আছে এবং কোথায় আছে তা পরীক্ষা করে। তারা দুই ধরনের আসে: মৌলিক এবং দ্রুত। প্রধানটি পুরো ইন্টারনেটকে ক্রল করে এবং প্রক্রিয়া করে এবং দ্রুত একটি - নথি যা এক মিনিট বা কয়েক সেকেন্ড আগে উপস্থিত হয়েছিল। রোবট প্রোগ্রামগুলির কাজ হল ব্যবহারকারীদের জন্য উপযুক্ত এবং দরকারী তথ্য নির্বাচন করা, এটি প্রক্রিয়া করা, পুরানো এবং অপ্রয়োজনীয় সবকিছু আগাছা। কিছু উপায়ে, এটি আবর্জনা বাছাইয়ের স্মরণ করিয়ে দেয়: একটি পাত্রে কাগজ, অন্যটিতে গ্লাস, তৃতীয়টিতে প্লাস্টিক, চতুর্থটিতে খাদ্য বর্জ্য...

রোবট দ্বারা সংগৃহীত তথ্য তথাকথিত ইন্টারনেট কাস্ট গঠন করে। এটি হাজার হাজার ইয়ানডেক্স সার্ভারে সংরক্ষণ করা হয় এবং ক্রমাগত আপডেট করা হয়। একটি নাগেট একটি তালিকার মতো যা আপনাকে বলে যে কোন তথ্য কোথায় পাওয়া যাবে। এই তালিকায়, প্রতিটি কীওয়ার্ড একটি নয়, লক্ষ লক্ষ "পৃষ্ঠা" রয়েছে। সমস্ত নাগেট আপডেটগুলি ব্যবহারকারীদের জন্য উপলব্ধ রয়েছে তা নিশ্চিত করতে, সেগুলিকে সংগ্রহস্থল থেকে "বেস অনুসন্ধান" এ সরানো হয়৷ মূল রোবট থেকে ডেটা প্রতি কয়েকদিনে স্থানান্তরিত হয় এবং দ্রুত রোবট থেকে - রিয়েল টাইমে।

পরিষ্কার জল আনুন



দৃষ্টান্ত: ইভজেনি টনকনজি

একটি প্রস্তুত ডাটাবেসে একটি প্রদত্ত প্রশ্নের উত্তর অনুসন্ধান করার সময়, মেশিন দুটি প্রধান অসুবিধার সম্মুখীন হয়। প্রথম অসুবিধা হল ভাষা। একটি প্রশ্নের উত্তর খোঁজার আগে, মেশিনের জন্য এটি কোন ভাষায় করা উচিত তা বোঝা গুরুত্বপূর্ণ। উদাহরণস্বরূপ, একজন রাশিয়ান-ভাষী ব্যক্তির জন্য, "প্রিন্স ইগরের স্কোয়াড" এর অনুসন্ধান সেনাবাহিনী সম্পর্কে তথ্য সহ নথি খুঁজে পাবে এবং একজন ইউক্রেনীয়ের জন্য, "প্রিন্স ইগরের স্কোয়াড" তার স্ত্রী প্রিন্সেস ওলগা উল্লেখ করা নথিও ফিরিয়ে দেবে, যেহেতু ইউক্রেনীয় ভাষায় "স্ত্রী" হল "স্কোয়াড"। এবং সমৃদ্ধ রাশিয়ান ভাষায়, একই শব্দ বা এর ডেরিভেটিভগুলি বিভিন্ন জিনিসের অর্থ হতে পারে। উদাহরণস্বরূপ, "স্টিল" শব্দটি বিশেষ্য "স্টিল" এবং ক্রিয়াপদ "হয়েছে" এর একটি রূপ। দ্বিতীয় অসুবিধা হ'ল মানব মনোবিজ্ঞান। একটি অনুরোধ প্রবেশ করার সময়, আমরা একটি দ্রুত এবং নির্ভুল উত্তর আশা করি, স্বাভাবিকভাবেই অনুরোধের শব্দগুলি গাণিতিক বিশ্লেষণের নীতিগুলির সাথে মিলে কিনা তা নিয়ে চিন্তা না করেই, যার দ্বারা মেশিনের মস্তিষ্ক কাজ করে। উদাহরণস্বরূপ, অনুসন্ধান বারে "নেপোলিয়ন" শব্দটি প্রবেশ করে, একজন ব্যক্তি কী পেতে চান: একটি কেকের রেসিপি বা ফরাসি সম্রাটের একটি জীবনী, কগনাক কিনতে বা একটি মানসিক হাসপাতালের ঠিকানা খুঁজে পেতে?


এই ধরনের পরিস্থিতিতে, বেশ কয়েকটি প্রযুক্তি খেলায় আসে। আপনি অনুসন্ধান বারের নীচে আপনাকে বেশ কয়েকটি ইঙ্গিত দিতে পারেন যা আপনার অনুরোধ নির্দিষ্ট করবে। পছন্দ করুন, আপনার যা প্রয়োজন তা চয়ন করুন: নেপোলিয়ন রেসিপি বা নেপোলিয়ন - বোনাপার্ট। ব্যবহারকারী যদি মেশিনের অনুরোধে সাড়া না দেয় এবং "নেপোলিয়ন" এ শব্দ যোগ না করে, তবে "স্পেকট্রাম" প্রযুক্তি বিষয়টিকে সাহায্য করে: সাহায্যের আশা না করে, মেশিনটি অবিলম্বে বিভিন্ন বিভাগে তথ্য অনুসন্ধান করে (কেক সম্পর্কে, এবং সম্রাট সম্পর্কে, এবং ঘোড়া সম্পর্কে ..)। এছাড়াও, ব্যক্তিগতকরণ প্রক্রিয়াগুলি ব্যবহারকারীকে বুঝতে সাহায্য করে - এই ব্যবহারকারী তার কম্পিউটারে একদিন, দুই, তিন বা মাস আগে কী খুঁজছিলেন সে সম্পর্কে মেশিনের জ্ঞান: আপনি যদি প্রায়শই রান্না সম্পর্কে ইয়ানডেক্স প্রশ্ন জিজ্ঞাসা করেন, তবে মেশিনটি প্রথমে দেখাবে আপনি ফলাফল যে বলেন যে নেপোলিয়ন একটি কেক.

সংমিশ্রণ: আগ্রহের ক্লাব

সার্চ ইঞ্জিনের কাজ কেবল অনুসন্ধান ক্যোয়ারী থেকে শব্দ এবং বাক্যাংশ ধারণ করে এমন নথি নির্বাচন করা নয়। মেশিনটিকে অবশ্যই বুঝতে হবে কোন নথিগুলি আমাদের বিরোধপূর্ণ প্রয়োজনীয়তাগুলি পূরণ করে এবং কেন সেগুলি পূরণ করে৷ আমরা কি নেপোলিয়ন কেক সম্পর্কে তথ্য পেতে চাই, বা হয়তো আমরা কয়েক বছর ধরে ভৌতিক নাম সহ একটি ফিটনেস ক্লাব পরিদর্শন করেছি, বা এমনকি ছোট লোকদের জটিলতা সম্পর্কে সম্পূর্ণ উদ্বিগ্ন। যে কোনও ক্ষেত্রে, সমস্যা সমাধানের জন্য একটি অ-তুচ্ছ পদ্ধতির প্রয়োজন।


ইয়ানডেক্স অনুসন্ধান প্রোগ্রামের নির্মাতারা মেশিনে পছন্দের অধিকার অর্পণ করে এই পদ্ধতিটি খুঁজে পেয়েছেন। একদিকে, একটি আত্মাহীন, কিন্তু খুব দ্রুত এবং স্মার্ট মেশিন ব্যক্তি হিসাবে আমাদের সম্পর্কে কিছু জানে না এবং জানতে চায় না, এবং অন্যদিকে, এটি প্রত্যেকের সম্পর্কে যতটা সম্ভব খুঁজে বের করার চেষ্টা করে।

ব্যবহারকারীর ভৌগলিক অবস্থান এবং তার প্রশ্নের ভাষাগত বিশ্লেষণ ছাড়াও, সার্চ ইঞ্জিন কয়েক হাজার মানদণ্ড ব্যবহার করে যা মানুষের কাছে একেবারেই স্পষ্ট নয়।

কৌশলটি হল যে মেশিনটি এই মানদণ্ডগুলি স্বাধীনভাবে বিকাশ করে এবং আপডেট করে।

এটি কেবল লক্ষ লক্ষ মানুষের পছন্দ এবং ব্যবহারকারীর আচরণের ডেটা ব্যবহার করে এবং এই "পাটিগণিত গড়" কে আমাদের প্রশ্নের ইতিহাসের সাথে সম্পর্কিত করে। যে নীতিগুলি ম্যাট্রিক্সকে নিজের মধ্যে নির্দেশ করে, ব্যবহারকারীর আগ্রহের হাজার হাজার বিভাগের সাথে তুলনা করে, নীতিগতভাবে "আগ্রহ" কী হতে পারে সে সম্পর্কে প্রায়শই প্রথাগত মানুষের ধারণাগুলির সাথে খাপ খায় না। তাদের হাজার হাজার আছে. তারা একে অপরের সাথে বিভিন্ন, কখনও কখনও মজার, সমন্বয় তৈরি করে। উদাহরণস্বরূপ, এই সংমিশ্রণগুলির মধ্যে একটি হতে পারে যে অনুসন্ধানের ফলাফলগুলি নিউট প্রজননকারী ব্যক্তির আগ্রহের সাথে মেলে৷ একই সময়ে, একজন ব্যক্তি শুধুমাত্র নিউটগুলিতে আগ্রহী নয়, তবে ইতিমধ্যেই তাদের প্রজনন করছে, তবে শুধুমাত্র প্রথম বছরের জন্য।

রেটিং। সাহায্যকারী


ম্যাট্রিক্স, অবশ্যই, নিজেই সিদ্ধান্ত নেয় (উচ্চতর গণিতের সাহায্যে) হাজার হাজার মানদণ্ডের ভিত্তিতে ব্যবহারকারীদের কী এবং কী ক্রমানুসারে দেখানো হবে। কিন্তু ম্যাট্রিক্স জীবিত ব্যক্তিদেরও ব্যবহার করে - 1000 ইয়ানডেক্স কর্মচারী, তথাকথিত মূল্যায়নকারী, একটি নির্দিষ্ট অনুরোধের জন্য অনুসন্ধানের ফলাফলগুলি মূল্যায়ন করে (অবশ্যই, প্রতিটি অনুরোধের মূল্যায়ন করা হয় না এবং এটি বাস্তব সময়ে করা হয় না) তারা পূরণ করে কিনা তা নির্ধারণ করতে। একজন সাধারণ ব্যবহারকারীর প্রত্যাশা: যন্ত্রের মতো যুক্তিযুক্ত নয়, গঠনে সুনির্দিষ্ট নয়, পরস্পরবিরোধী এবং আবেগপূর্ণ।