Σπίτι συσκευές

Μηχανές αναζήτησης στο Διαδίκτυο: Yandex, Google, Rambler, Yahoo. Σύνθεση, λειτουργίες, αρχή λειτουργίας. Η απλούστερη περιγραφή της αρχής λειτουργίας της μηχανής αναζήτησης Yandex Συνδυασμοί: λέσχες ενδιαφέροντος

Γεια σας αγαπητοί φίλοι! Σε αυτό το άρθρο θα συνεχίσουμε να εξετάζουμε τη μηχανή αναζήτησης Yandex και όπως θυμάστε, σε προηγούμενα άρθρα συζητήσαμε την ιστορία της δημιουργίας αυτής της μεγάλης εταιρείας, η οποία κατέχει την πρώτη θέση μεταξύ των ανταγωνιστών της στη Ρωσία και όχι μόνο.

Όλα αυτά είναι καλά, αλλά οι αρχάριοι και οι έμπειροι κατασκευαστές ιστότοπων ενδιαφέρονται για το πιο σημαντικό ερώτημα, φυσικά, που σχετίζεται με το πώς να φέρουν τα έργα τους στις πρώτες θέσεις στα ΚΟΡΥΦΑΙΑ αποτελέσματα αναζήτησης.

Επομένως, ας δούμε πώς λειτουργεί η μηχανή αναζήτησης Yandex για να καταλάβουμε ποια λάθη μπορείτε να κάνετε και τι να περιμένετε από μια ρωσική μηχανή αναζήτησης γενικά.

Στο τελευταίο άρθρο που συζητήσαμε. Το θέμα αποδείχθηκε αρκετά ενδιαφέρον και χρήσιμο. Ως εκ τούτου, αποφάσισα να το συμπληρώσω, να το εμβαθύνω, ας το πω έτσι.

Λοιπόν, μάλλον παρασύρθηκα λίγο με την ερώτηση "Γιατί μια μηχανή αναζήτησης ευρετηριάζει έγγραφα"; Δεν είναι καθόλου έξυπνο. Το μόνο που μένει είναι να καταλάβουμε την ερώτηση «πώς».

Αλγόριθμοι κατάταξης ιστοσελίδων

Αρχικά, ας εξοικειωθούμε με ορισμένους αλγόριθμους που είναι θεμελιώδεις για κάθε μηχανή αναζήτησης:

— Αλγόριθμος άμεσης αναζήτησης.

Τι είναι αυτό - θυμάστε να διαβάσετε μια υπέροχη ιστορία σε ένα από τα βιβλία. Και αρχίζεις να ψάχνεις ένα προς ένα. Πήραν ένα βιβλίο, το έψαξαν, δεν το βρήκαν, πήραν ένα άλλο... Η αρχή είναι ξεκάθαρη, αλλά αυτή η μέθοδος είναι εξαιρετικά μεγάλη. Αυτό είναι επίσης κατανοητό.

— Αλγόριθμος αντίστροφης αναζήτησης.

Για αυτόν τον αλγόριθμο, δημιουργείται ένα αρχείο κειμένου από κάθε σελίδα του ιστολογίου σας. Αυτό το αρχείο παραθέτει με αλφαβητική σειρά ΟΛΕΣ τις λέξεις που χρησιμοποιήσατε. Υποδεικνύεται ακόμη και η θέση αυτής της λέξης στο κείμενο (συντεταγμένες στο κείμενο).

Αυτή είναι μια αρκετά γρήγορη μέθοδος, αλλά η αναζήτηση γίνεται ήδη με κάποιο σφάλμα.

Το κύριο πράγμα που πρέπει να καταλάβετε εδώ είναι ότι αυτός ο αλγόριθμος δεν κάνει αναζήτηση στο Διαδίκτυο, όχι με αναζήτηση σε ένα blog. Και σε ξεχωριστό αρχείο κειμένου που δημιουργήθηκε εδώ και πολύ καιρό. Όταν το ρομπότ ήρθε σε σένα. Και αυτά τα αρχεία (αντίστροφα ευρετήρια) αποθηκεύονται σε διακομιστές Yandex.

Έτσι, αυτοί ήταν οι βασικοί αλγόριθμοι αναζήτησης. Εκείνοι. πώς η Yandex απλώς βρίσκει τα απαραίτητα έγγραφα. Δεν θα πρέπει να φαίνεται να υπάρχουν προβλήματα με αυτό.

Αλλά η Yandex γνωρίζει περισσότερα από ένα ή και 100 έγγραφα, αλλά σύμφωνα με τα τελευταία δεδομένα από τις πηγές μου, η Yandex γνωρίζει περίπου 11 δισεκατομμύρια έγγραφα (10.727.736.489 σελίδες).

Και μεταξύ όλης αυτής της ποσότητας, πρέπει να επιλέξετε έγγραφα που ταιριάζουν με το αίτημα. Και το πιο σημαντικό, πρέπει να τα κατατάξετε με κάποιο τρόπο. Εκείνοι. τακτοποιήστε ανάλογα με το βαθμό σπουδαιότητας, ή μάλλον ανάλογα με το βαθμό χρησιμότητας για τον αναγνώστη.

Μοντέλα μαθηματικής αναζήτησης

Για να λυθεί αυτό το ζήτημα, μαθηματικά μοντέλα έρχονται στη διάσωση. Τώρα θα μιλήσουμε για τα πιο απλά μοντέλα.

Boolean μαθηματικό μοντέλο– Εάν μια λέξη εμφανίζεται σε ένα έγγραφο, το έγγραφο θεωρείται ότι βρέθηκε. Απλά μια σύμπτωση και τίποτα περίπλοκο.

Αλλά υπάρχουν προβλήματα εδώ. Για παράδειγμα, εάν εσείς, ως χρήστης, εισαγάγετε κάποια δημοφιλή λέξη, ή ακόμα καλύτερα, την πρόθεση «v», που είναι η πιο κοινή λέξη στη ρωσική γλώσσα και βρίσκεται σε ΚΑΘΕ έγγραφο, τότε θα λάβετε τόσα πολλά αποτελέσματα που δεν αντιλαμβάνεστε καν τέτοιο αριθμό, Πόσα έγγραφα βρήκατε; Ως εκ τούτου, εμφανίστηκε το ακόλουθο μοντέλο χαλιού.

Διανυσματικό μαθηματικό μοντέλο– αυτό το μοντέλο καθορίζει το «βάρος» του εγγράφου. Όχι μόνο συμβαίνει η σύμπτωση, αλλά η λέξη πρέπει να εμφανίζεται πολλές φορές. Επιπλέον, όσο περισσότερο εμφανίζεται μια λέξη, τόσο μεγαλύτερη είναι η συνάφεια (συμμόρφωση).

Είναι το διανυσματικό μοντέλο που χρησιμοποιούν ΟΛΕΣ οι μηχανές αναζήτησης.

Πιθανολογικό μοντέλο- πιο πολύπλοκο. Η αρχή είναι η εξής: η μηχανή αναζήτησης βρήκε το ίδιο το πρότυπο σελίδας. Για παράδειγμα, αναζητάτε πληροφορίες σχετικά με την ιστορία του Yandex. Το Yandex αποθηκεύει κάποιο είδος προτύπου, ας πούμε ότι αυτό θα είναι το προηγούμενο άρθρο μου για το Yandex.

Και θα συγκρίνει όλα τα άλλα έγγραφα με αυτό το άρθρο. Και η λογική εδώ είναι η εξής: όσο πιο παρόμοια είναι η σελίδα του ιστολογίου σας με το άρθρο μου, τόσο ΠΙΘΑΝΟΤΕΡΟ είναι το γεγονός ότι η σελίδα του ιστολογίου σας θα είναι επίσης χρήσιμη στον αναγνώστη και επίσης θα λέει για την ιστορία του Yandex.

Για να μειωθεί ο αριθμός των εγγράφων που πρέπει να εμφανίζονται στον χρήστη, εισήχθη η έννοια της συνάφειας, δηλ. συμμόρφωση.

Πόσο σχετική είναι η σελίδα του ιστολογίου σας με το θέμα; Αυτό είναι ένα σημαντικό θέμα όσον αφορά την ποιότητα αναζήτησης.

Αξιολογητές - ποιοι είναι και για τι είναι υπεύθυνοι;

Αυτή η συνάφεια είναι επίσης απαραίτητη για την αξιολόγηση της ποιότητας των αλγορίθμων.

Για το σκοπό αυτό υπάρχει ένα αρχηγείο ειδικών δυνάμεων - ονομάζονται Αξιολογητές. Αυτοί είναι ξεχωριστοί άνθρωποι που κοιτάζουν τα αποτελέσματα αναζήτησης με τα χέρια τους.

Έχουν οδηγίες για τον έλεγχο των τοποθεσιών, τον τρόπο αξιολόγησης κ.λπ. Και καθορίζουν με μη αυτόματο τρόπο εάν οι σελίδες σας είναι κατάλληλες για ερωτήματα αναζήτησης ή όχι.

Και η ποιότητα των αλγορίθμων αναζήτησης εξαρτάται από τη γνώμη των αξιολογητών. Εάν όλοι οι αξιολογητές λένε ότι τα αποτελέσματα αναζήτησης δεν ανταποκρίνονται στα αιτήματα, αυτό σημαίνει ότι ο αλγόριθμος κατάταξης είναι εσφαλμένος και η Yandex είναι η μόνη υπεύθυνη.

Εάν οι αξιολογητές λένε ότι μόνο ένας ιστότοπος δεν ικανοποιεί το αίτημα, σημαίνει ότι ο ιστότοπος πετάει κάπου μακριά και είναι χαμηλωμένος στα αποτελέσματα αναζήτησης. Πιο συγκεκριμένα, όχι ολόκληρος ο ιστότοπος, αλλά μόνο ένα άρθρο, αλλά αυτό δεν είναι "το θέμα".

Φυσικά, οι αξιολογητές δεν μπορούν να αναθεωρήσουν και να αξιολογήσουν ΟΛΑ τα άρθρα με τα χέρια και τα μάτια τους. Αυτό είναι κατανοητό.

Και άλλες παράμετροι βάσει των οποίων κατατάσσονται οι σελίδες έρχονται στη διάσωση.

Υπάρχουν πολλά από αυτά, για παράδειγμα:

βάρος σελίδας (vIC, PageRank, βρεφικά εξογκώματαΟλα για όλα);
αρχή τομέα?
συνάφεια του κειμένου με το αίτημα·
συνάφεια των κειμένων εξωτερικού συνδέσμου με το ερώτημα.
καθώς και πολλούς άλλους παράγοντες κατάταξης.

Οι αξιολογητές κάνουν σχόλια και τα άτομα που είναι υπεύθυνα για τη δημιουργία του μαθηματικού μοντέλου κατάταξης, με τη σειρά τους, επεξεργάζονται τον τύπο, με αποτέλεσμα η μηχανή αναζήτησης να λειτουργεί πιο αποτελεσματικά.

Τα κύρια κριτήρια για την αξιολόγηση της απόδοσης του τύπου:

1. Ακρίβεια αποτελεσμάτων μηχανών αναζήτησης- ποσοστό εγγράφων που αντιστοιχούν στο αίτημα (σχετικό). Εκείνοι. Όσο λιγότερες σελίδες δεν ταιριάζουν με το αίτημα, τόσο το καλύτερο.

2. Πληρότητα αποτελεσμάτων μηχανών αναζήτησης- αυτός είναι ο λόγος των σχετικών ιστοσελίδων για ένα δεδομένο ερώτημα προς τον συνολικό αριθμό των σχετικών εγγράφων στη συλλογή (το σύνολο των σελίδων που βρέθηκαν στη μηχανή αναζήτησης).

Για παράδειγμα, εάν υπάρχουν περισσότερες σχετικές σελίδες σε ολόκληρη τη συλλογή από ό,τι στα αποτελέσματα αναζήτησης, αυτό σημαίνει ότι τα αποτελέσματα είναι ελλιπή. Αυτό συνέβη επειδή ορισμένες από τις σχετικές ιστοσελίδες φιλτραρίστηκαν.

3. Συνάφεια των αποτελεσμάτων των μηχανών αναζήτησης- αυτή είναι η συμμόρφωση της ιστοσελίδας με αυτά που γράφονται στο απόσπασμα. Για παράδειγμα, ένα έγγραφο μπορεί να είναι πολύ διαφορετικό ή να μην υπάρχει καθόλου, αλλά εξακολουθεί να υπάρχει στα αποτελέσματα αναζήτησης.

Η συνάφεια των αποτελεσμάτων αναζήτησης εξαρτάται άμεσα από το πόσο συχνά το ρομπότ αναζήτησης σαρώνει έγγραφα από τη συλλογή του.

Η συλλογή συλλογών (ευρετηρίαση σελίδων ιστότοπου) πραγματοποιείται από ένα ειδικό πρόγραμμα - ένα ρομπότ αναζήτησης.

Το ρομπότ αναζήτησης λαμβάνει μια λίστα διευθύνσεων για ευρετηρίαση, τις αντιγράφει και στη συνέχεια στέλνει τα περιεχόμενα των αντιγραμμένων ιστοσελίδων για επεξεργασία σε έναν αλγόριθμο που τα μετατρέπει σε αντίστροφα ευρετήρια.

Λοιπόν, «με λίγα λόγια», ας πούμε έτσι, συζητήσαμε τις αρχές της μηχανής αναζήτησης.

Ας συνοψίσουμε:

Ένα ρομπότ αναζήτησης έρχεται στο ιστολόγιό σας.
Το ρομπότ αναζήτησης αποθηκεύει το αντίστροφο ευρετήριο της σελίδας για επόμενες αναζητήσεις.
Χρησιμοποιώντας ένα μαθηματικό μοντέλο, το έγγραφο επεξεργάζεται και εμφανίζεται στα αποτελέσματα αναζήτησης χρησιμοποιώντας τύπους και λαμβάνοντας υπόψη τη γνώμη του αξιολογητή.

Αυτό είναι πολύ, πολύ απλοποιημένο. Απλώς για να αποκτήσετε μια βασική κατανόηση του τρόπου λειτουργίας της μηχανής αναζήτησης Yandex.

Έχω γράψει τώρα τόσο πολύ κείμενο, και ίσως τόσα πολλά δεν είναι ξεκάθαρα. Επομένως, σας προτείνω να επιστρέψετε σε αυτό το άρθρο λίγο αργότερα και να παρακολουθήσετε αυτό το βίντεο.

Αυτός είναι ένας εξαιρετικός οδηγός, από τον οποίο επίσης έμαθα κάποτε.

Ελπίζω αυτές οι πληροφορίες να σας βοηθήσουν να κατανοήσετε καλύτερα γιατί ένας από τους ιστότοπούς σας καταλαμβάνει τις κατάλληλες θέσεις στις αναζητήσεις και να κάνετε τα πάντα για να τις βελτιώσετε.

Με αυτό σας αποχαιρετώ, αν έχετε οποιεσδήποτε ερωτήσεις, είμαι πάντα στην ευχάριστη θέση να τις απαντήσω στα σχόλια. Ή μήπως θέλετε να προσθέσετε στο άρθρο;

Σε κάθε περίπτωση πείτε τη γνώμη σας. !

Η Yandex, σήμερα, είναι η πιο δημοφιλής μηχανή αναζήτησης στη Ρωσία. Στατιστικά υπηρεσιών LiveInternet, δείχνει το μερίδιο της Yandex στη μάζα του πανρωσικού κοινού - είναι 53,4%, αν λάβουμε υπόψη μόνο τη Μόσχα και την περιοχή, τότε είναι ακόμη υψηλότερο - 67,9% (η Μόσχα, σύμφωνα με αιτήματα, καταλαμβάνει περισσότερα από 50% ολόκληρης της Ρωσίας).

Ο ιστότοπος www.yandex.ru δημιουργήθηκε το 1997· μόνο ένας διακομιστής ήταν αρκετός για αυτόν, ο οποίος βρισκόταν κάτω από την επιφάνεια εργασίας ενός από την ομάδα των πρώτων προγραμματιστών Yandex, του Ντμίτρι, του οποίου το επώνυμο ήταν Teiblyum. Πολύ γρήγορα μετά το άνοιγμα, αγοράσαμε έναν δεύτερο διακομιστή και σύντομα, όταν χρειάστηκε να εγκαταστήσουμε έναν άλλο, έγινε σαφές ότι υπήρχε αρκετός χώρος κάτω από το τραπέζι είτε για τρεις διακομιστές Yandex, είτε για […]

Οι προγραμματιστές μηχανών αναζήτησης προσπαθούν να παρέχουν στους χρήστες τις καλύτερες απαντήσεις στα ερωτήματά τους. Μερικές φορές μια τέτοια απάντηση μπορεί να είναι ένας αριθμός (για παράδειγμα, ο καιρός σε μια πόλη), μια εικόνα (για παράδειγμα, μια διεύθυνση σε χάρτη), μια μετάφραση μιας λέξης ή ένα τετράστιχο. Όταν έχετε στη διάθεσή σας μια κατάλληλη σειρά πληροφοριών, η απάντηση μπορεί να δοθεί αμέσως. Επομένως, η Yandex συμπληρώνει τα αποτελέσματα αναζήτησης στο Διαδίκτυο με απαντήσεις από […]

Περίπου κάθε δέκατο αίτημα προς το Yandex είναι "πλοήγησης", δηλαδή αποτελείται από το όνομα ενός οργανισμού ή ιστότοπου και ο χρήστης θέλει να μεταβεί στον ιστότοπο αυτού του οργανισμού. Σε αυτήν την περίπτωση, η γραμμή αναζήτησης Yandex χρησιμοποιείται αντί για τη γραμμή διευθύνσεων του προγράμματος περιήγησης και ο χρήστης, κατά κανόνα, δεν ενδιαφέρεται για τα υπόλοιπα εννέα αποτελέσματα αναζήτησης. Χωρίς να αποσπάσουμε την προσοχή του χρήστη από τον κύριο στόχο, προσθέσαμε μετά την κύρια […]

Το κύριο καθήκον μιας μηχανής αναζήτησης είναι να απαντήσει στην ερώτηση του χρήστη. Όταν ένας χρήστης κάνει ένα ερώτημα, η μηχανή αναζήτησης δεν έχει πρόσβαση σε κάθε ιστότοπο στο Διαδίκτυο, αλλά πραγματοποιεί αναζήτηση μέσω μιας βάσης δεδομένων σελίδων που είναι γνωστές σε αυτόν - το ευρετήριο αναζήτησης. Εκεί βρίσκει όλες τις σελίδες με τις λέξεις από το ερώτημα. Ο χρήστης βλέπει συνδέσμους προς αυτές τις σελίδες στις σελίδες αποτελεσμάτων αναζήτησης.

Όπως βλέπουμε, το Yandex δεν μένει ακίνητο και είμαι βέβαιος ότι οι τεχνολογίες αναζήτησης αυτού του συστήματος θα συνεχίσουν να αναπτύσσονται προκειμένου να βελτιωθεί η ποιότητα της αναζήτησης, η οποία δύσκολα μπορεί να ονομαστεί ιδανική ακόμα.

Στις 10 Νοεμβρίου 2009, η Yandex ανακοίνωσε μια νέα έκδοση του αλγορίθμου αναζήτησης - Snezhinsk. Έχουν συμβεί θεμελιώδεις αλλαγές στον αλγόριθμο για τον υπολογισμό της συνάφειας - οι εκπρόσωποι της Yandex έγραψαν τα εξής: «Καταφέραμε να δημιουργήσουμε ένα πιο ακριβές και πολύ πιο περίπλοκο μαθηματικό μοντέλο, το οποίο οδήγησε σε σημαντική αύξηση της ποιότητας αναζήτησης. Χάρη στον επανασχεδιασμό της αρχιτεκτονικής κατάταξης αναζήτησης, κατέστη δυνατή η υλοποίηση της λογιστικής πολλών χιλιάδων [...]

Η δοκιμή της νέας έκδοσης του αλγορίθμου Yandex ξεκίνησε στις 9 Ιουλίου 2008. Σύμφωνα με την Yandex, «οι κύριες αλλαγές στο πρόγραμμα σχετίζονται με μια νέα προσέγγιση στη μηχανική μάθηση και, ως εκ τούτου, οι διαφορές στον τρόπο με τον οποίο λαμβάνονται υπόψη οι παράγοντες κατάταξης στον τύπο».

Στις 14 Απριλίου 2008, ο νέος αλγόριθμος αναζήτησης "Magadan" άρχισε να δοκιμάζεται στο buki.yandex.ru. Εκτός από τον διπλασιασμό του αριθμού των παραγόντων κατάταξης, προστέθηκαν επίσης οι ακόλουθες καινοτομίες:

Πριν μπούμε στην αλγοριθμική ζούγκλα, ας θυμηθούμε πώς λειτουργεί γενικά μια μηχανή αναζήτησης. Η λογική δομή ενός συστήματος αναζήτησης μπορεί να αναπαρασταθεί με τη μορφή τριών ενοτήτων (βλ. διάγραμμα). Το ρομπότ έχει ένα ειδικό πρόγραμμα σύμφωνα με το οποίο πραγματοποιεί τους γύρους του. Σελίδες ιστοσελίδων που φορτώνονται από ένα ρομπότ, ένα ειδικό [...]

66. Τι έχει μεγαλύτερη επιρροή: ένας σύνδεσμος από μια δωρεάν πλατφόρμα (blogspot, LJ, κ.λπ.) ή από έναν ιστότοπο/ιστολόγιο εκτός σύνδεσης; Οι δωρεάν πλατφόρμες μεταφέρουν λιγότερο βάρος από τους αυτόνομους ιστότοπους. Ωστόσο, ο αντίκτυπος θα μπορούσε να είναι μεγαλύτερος. Αυτό οφείλεται σε πολλούς παράγοντες: την τρέχουσα λίστα αγκύρωσης, την κατάσταση των τοποθεσιών που συγκρίνονται κ.λπ. Είναι αδύνατο να δοθεί μια σαφής απάντηση σε αυτήν την ερώτηση. 67. Το μεγαλύτερο βάρος μεταφέρεται μεταξύ […]

Vamana Tour - ταξίδια, αεροπορικά εισιτήρια και βίζες σε όλο τον κόσμο και στην Ινδία, το Νεπάλ, τη Σρι Λάνκα, τις Μαλδίβες, τον Μαυρίκιο και πολλά άλλα μέρη στον πλανήτη. Συμβουλές για ταξιδιώτες και προσκυνητές. Πώς να αξιοποιήσετε στο έπακρο το ταξίδι σας. Καταπληκτικά ιστορικά χρονικά και ιστορίες έμπειρων ταξιδιωτών.

Ποιος είναι ο σκοπός του να λαμβάνονται υπόψη οι εξωτερικοί σύνδεσμοι σε έναν ιστότοπο; Όπως μπορείτε να δείτε από την προηγούμενη ενότητα, σχεδόν όλοι οι παράγοντες που επηρεάζουν την κατάταξη βρίσκονται υπό τον έλεγχο του συγγραφέα της σελίδας. Έτσι, καθίσταται αδύνατο για μια μηχανή αναζήτησης να διακρίνει ένα έγγραφο πραγματικά υψηλής ποιότητας από μια σελίδα που δημιουργήθηκε ειδικά για μια δεδομένη φράση αναζήτησης ή ακόμα και μια σελίδα που δημιουργήθηκε από ένα ρομπότ και η οποία δεν περιέχει καθόλου χρήσιμες πληροφορίες. […]

Έχουν γίνει εδώ και καιρό αναπόσπαστο μέρος του ρωσικού Διαδικτύου. Οι μηχανές αναζήτησης είναι πλέον τεράστιοι και περίπλοκοι μηχανισμοί που αντιπροσωπεύουν όχι μόνο ένα εργαλείο αναζήτησης πληροφοριών, αλλά και δελεαστικές περιοχές για τις επιχειρήσεις.

Οι περισσότεροι χρήστες μηχανών αναζήτησης δεν έχουν σκεφτεί ποτέ (ή το σκέφτηκαν, αλλά δεν βρήκαν απάντηση) για την αρχή λειτουργίας των μηχανών αναζήτησης, για το σχέδιο επεξεργασίας των αιτημάτων των χρηστών, για το τι αποτελούνται αυτά τα συστήματα και πώς λειτουργούν...

Αυτό το master class έχει σχεδιαστεί για να απαντήσει στο ερώτημα πώς λειτουργούν οι μηχανές αναζήτησης. Ωστόσο, δεν θα βρείτε εδώ παράγοντες που επηρεάζουν την κατάταξη των εγγράφων. Επιπλέον, δεν πρέπει να υπολογίζετε σε μια λεπτομερή εξήγηση του αλγόριθμου Yandex. Αυτός, σύμφωνα με τον Ilya Segalovich, διευθυντή τεχνολογίας και ανάπτυξης της μηχανής αναζήτησης Yandex, μπορεί να αναγνωριστεί "υπό βασανιστήριο" μόνο από τον ίδιο τον Ilya Segalovich...

2. Έννοια και λειτουργίες μιας μηχανής αναζήτησης

Ένα σύστημα αναζήτησης είναι ένα συγκρότημα λογισμικού και υλικού που έχει σχεδιαστεί για την αναζήτηση στο Διαδίκτυο και την απάντηση σε ένα αίτημα χρήστη, που καθορίζεται με τη μορφή μιας φράσης κειμένου (ερώτημα αναζήτησης), με την παραγωγή μιας λίστας συνδέσμων προς πηγές πληροφοριών, κατά σειρά συνάφειας ( σύμφωνα με το αίτημα). Οι μεγαλύτερες διεθνείς μηχανές αναζήτησης: "Google", Yahoo , MSN . Στο ρωσικό Διαδίκτυο αυτά είναι τα Yandex, Rambler, Aport.

Ας ρίξουμε μια πιο προσεκτική ματιά στην έννοια του ερωτήματος αναζήτησης χρησιμοποιώντας τη μηχανή αναζήτησης Yandex ως παράδειγμα. Το ερώτημα αναζήτησης πρέπει να διατυπώνεται από τον χρήστη σύμφωνα με αυτό που θέλει να βρει, όσο το δυνατόν πιο συνοπτικά και απλά. Ας υποθέσουμε ότι θέλουμε να βρούμε πληροφορίες στο Yandex σχετικά με τον τρόπο επιλογής αυτοκινήτου. Για να το κάνετε αυτό, ανοίξτε την κύρια σελίδα του Yandex και εισαγάγετε το κείμενο του ερωτήματος αναζήτησης "πώς να επιλέξετε ένα αυτοκίνητο". Στη συνέχεια, το καθήκον μας έγκειται στο άνοιγμα των συνδέσμων που παρέχονται κατόπιν αιτήματός μας σε πηγές πληροφοριών στο Διαδίκτυο. Ωστόσο, είναι πολύ πιθανό να μην βρούμε τις πληροφορίες που χρειαζόμαστε. Εάν συμβεί αυτό, τότε είτε πρέπει να αναδιατυπώσετε το αίτημά σας ή η βάση δεδομένων της μηχανής αναζήτησης δεν έχει πραγματικά καμία σχετική πληροφορία σχετικά με το αίτημά μας (αυτό μπορεί να συμβεί όταν κάνετε πολύ «στενές» ερωτήσεις, όπως, για παράδειγμα, «πώς να επιλέξετε ένα αυτοκίνητο στο Αρχάγγελσκ»)

Ο πρωταρχικός στόχος κάθε μηχανής αναζήτησης είναι να παρέχει στους ανθρώπους ακριβώς τις πληροφορίες που αναζητούν. Και διδάξτε τους χρήστες να κάνουν «σωστά» αιτήματα στο σύστημα, π.χ. ερωτήματα που συμμορφώνονται με τις αρχές λειτουργίας των μηχανών αναζήτησης είναι αδύνατον. Επομένως, οι προγραμματιστές δημιουργούν αλγόριθμους και αρχές λειτουργίας για τις μηχανές αναζήτησης που θα επιτρέπουν στους χρήστες να βρίσκουν τις πληροφορίες που αναζητούν.

Αυτό σημαίνει ότι η μηχανή αναζήτησης πρέπει να «σκέφτεται» με τον ίδιο τρόπο που σκέφτεται ο χρήστης όταν αναζητά πληροφορίες. Όταν ένας χρήστης κάνει ένα αίτημα σε μια μηχανή αναζήτησης, θέλει να βρει αυτό που χρειάζεται όσο το δυνατόν πιο γρήγορα και εύκολα. Λαμβάνοντας το αποτέλεσμα, αξιολογεί την απόδοση του συστήματος, καθοδηγούμενος από αρκετές βασικές παραμέτρους. Βρήκε αυτό που έψαχνε; Αν δεν το βρήκε, πόσες φορές έπρεπε να αναδιατυπώσει το ερώτημα για να βρει αυτό που έψαχνε; Πόσες σχετικές πληροφορίες μπορούσε να βρει; Πόσο γρήγορα επεξεργάστηκε το ερώτημα η μηχανή αναζήτησης; Πόσο βολικά παρουσιάστηκαν τα αποτελέσματα αναζήτησης; Το αποτέλεσμα που ψάχνατε ήταν το πρώτο ή το εκατοστό; Πόσα περιττά σκουπίδια βρέθηκαν μαζί με χρήσιμες πληροφορίες; Θα βρεθούν οι απαραίτητες πληροφορίες κατά την πρόσβαση σε μια μηχανή αναζήτησης, ας πούμε, σε μια εβδομάδα ή σε ένα μήνα;

Για να ικανοποιηθούν όλες αυτές οι ερωτήσεις με απαντήσεις, οι προγραμματιστές μηχανών αναζήτησης βελτιώνουν συνεχώς τους αλγόριθμους και τις αρχές αναζήτησης, προσθέτουν νέες λειτουργίες και δυνατότητες και προσπαθούν με κάθε δυνατό τρόπο να επιταχύνουν τη λειτουργία του συστήματος.

3. Κύρια χαρακτηριστικά μιας μηχανής αναζήτησης

Ας περιγράψουμε τα κύρια χαρακτηριστικά των μηχανών αναζήτησης:

Πληρότητα
Η πληρότητα είναι ένα από τα κύρια χαρακτηριστικά ενός συστήματος αναζήτησης, το οποίο είναι η αναλογία του αριθμού των εγγράφων που βρέθηκαν κατόπιν αιτήματος προς τον συνολικό αριθμό των εγγράφων στο Διαδίκτυο που ικανοποιούν το συγκεκριμένο αίτημα. Για παράδειγμα, εάν υπάρχουν 100 σελίδες στο Διαδίκτυο που περιέχουν τη φράση "πώς να επιλέξετε ένα αυτοκίνητο" και μόνο 60 από αυτές βρέθηκαν για το αντίστοιχο ερώτημα, τότε η πληρότητα της αναζήτησης θα είναι 0,6. Προφανώς, όσο πιο ολοκληρωμένη είναι η αναζήτηση, τόσο λιγότερο πιθανό είναι ο χρήστης να μην βρει το έγγραφο που χρειάζεται, με την προϋπόθεση ότι υπάρχει καθόλου στο Διαδίκτυο.
Ακρίβεια
Η ακρίβεια είναι ένα άλλο βασικό χαρακτηριστικό μιας μηχανής αναζήτησης, το οποίο καθορίζεται από το βαθμό στον οποίο τα έγγραφα που βρέθηκαν ταιριάζουν με το ερώτημα του χρήστη. Για παράδειγμα, εάν το ερώτημα "πώς να επιλέξετε ένα αυτοκίνητο" περιέχει 100 έγγραφα, τα 50 από αυτά περιέχουν τη φράση "πώς να επιλέξετε ένα αυτοκίνητο" και τα υπόλοιπα περιέχουν απλώς αυτές τις λέξεις ("πώς να επιλέξετε το σωστό ραδιόφωνο και να το εγκαταστήσετε στο ένα αυτοκίνητο»), τότε η ακρίβεια αναζήτησης θεωρείται ίση με 50/100 (=0,5). Όσο πιο ακριβής είναι η αναζήτηση, τόσο πιο γρήγορα θα βρει ο χρήστης τα έγγραφα που χρειάζεται, τόσο λιγότερα διάφορα είδη «σκουπιδιών» θα βρεθούν ανάμεσά τους, τόσο λιγότερο συχνά τα έγγραφα που βρέθηκαν δεν θα ανταποκρίνονται στο αίτημα.
Συνάφεια
Η συνάφεια είναι ένα εξίσου σημαντικό στοιχείο της αναζήτησης, το οποίο χαρακτηρίζεται από το χρόνο που περνά από τη στιγμή που δημοσιεύονται τα έγγραφα στο Διαδίκτυο μέχρι να εισαχθούν στη βάση δεδομένων ευρετηρίων της μηχανής αναζήτησης. Για παράδειγμα, την επόμενη μέρα που εμφανίστηκαν ενδιαφέρουσες ειδήσεις, ένας μεγάλος αριθμός χρηστών στράφηκε σε μηχανές αναζήτησης με σχετικά ερωτήματα. Αντικειμενικά, έχει περάσει λιγότερο από μια μέρα από τη δημοσίευση των ειδήσεων σχετικά με αυτό το θέμα, αλλά τα κύρια έγγραφα έχουν ήδη ευρετηριαστεί και είναι διαθέσιμα για αναζήτηση, χάρη στην ύπαρξη της λεγόμενης «γρήγορης βάσης δεδομένων» μεγάλων μηχανών αναζήτησης, η οποία ενημερώνεται πολλές φορές την ημέρα.
Ταχύτητα αναζήτησης
Η ταχύτητα αναζήτησης σχετίζεται στενά με την αντίσταση φορτίου. Για παράδειγμα, σύμφωνα με την Rambler Internet Holding LLC, σήμερα, κατά τις εργάσιμες ώρες, η μηχανή αναζήτησης Rambler λαμβάνει περίπου 60 αιτήματα ανά δευτερόλεπτο. Αυτός ο φόρτος εργασίας απαιτεί τη μείωση του χρόνου επεξεργασίας ενός μεμονωμένου αιτήματος. Εδώ τα ενδιαφέροντα του χρήστη και της μηχανής αναζήτησης συμπίπτουν: ο επισκέπτης θέλει να λάβει αποτελέσματα όσο το δυνατόν γρηγορότερα και η μηχανή αναζήτησης πρέπει να επεξεργαστεί το αίτημα όσο το δυνατόν γρηγορότερα, ώστε να μην επιβραδύνει τον υπολογισμό των επόμενων ερωτημάτων.
Ορατότητα

4. Σύντομη ιστορία της ανάπτυξης των μηχανών αναζήτησης

Στην αρχική περίοδο ανάπτυξης του Διαδικτύου, ο αριθμός των χρηστών του ήταν μικρός και ο όγκος των διαθέσιμων πληροφοριών ήταν σχετικά μικρός. Ως επί το πλείστον, μόνο το ερευνητικό προσωπικό είχε πρόσβαση στο Διαδίκτυο. Αυτή τη στιγμή, το έργο της αναζήτησης πληροφοριών στο Διαδίκτυο δεν ήταν τόσο επείγον όσο είναι τώρα.

Ένας από τους πρώτους τρόπους οργάνωσης της πρόσβασης σε πόρους πληροφοριών δικτύου ήταν η δημιουργία ανοιχτών καταλόγων ιστότοπων, συνδέσμων σε πόρους στους οποίους ομαδοποιήθηκαν ανάλογα με το θέμα. Το πρώτο τέτοιο έργο ήταν ο ιστότοπος Yahoo.com, ο οποίος άνοιξε την άνοιξη του 1994. Αφού αυξήθηκε σημαντικά ο αριθμός των τοποθεσιών στον κατάλογο, προστέθηκε η δυνατότητα αναζήτησης των απαραίτητων πληροφοριών στον κατάλογο. Με την πλήρη έννοια, δεν ήταν ακόμη μηχανή αναζήτησης, καθώς η περιοχή αναζήτησης περιοριζόταν μόνο στους πόρους που υπήρχαν στον κατάλογο και όχι σε όλους τους πόρους του Διαδικτύου.

Οι κατάλογοι συνδέσμων χρησιμοποιήθηκαν ευρέως στο παρελθόν, αλλά έχουν χάσει σχεδόν εντελώς τη δημοτικότητά τους προς το παρόν. Δεδομένου ότι ακόμη και οι σύγχρονοι κατάλογοι, τεράστιοι σε όγκο, περιέχουν πληροφορίες μόνο για ένα αμελητέο μέρος του Διαδικτύου. Ο μεγαλύτερος κατάλογος του δικτύου DMOZ (ονομάζεται επίσης Open Directory Project) περιέχει πληροφορίες για 5 εκατομμύρια πόρους, ενώ η βάση δεδομένων της μηχανής αναζήτησης Google αποτελείται από περισσότερα από 8 δισεκατομμύρια έγγραφα.

Το 1995 εμφανίστηκαν οι μηχανές αναζήτησης Lycos και AltaVista. Η τελευταία είναι εδώ και πολλά χρόνια ηγέτης στον τομέα της αναζήτησης πληροφοριών στο Διαδίκτυο.

Το 1997, ο Sergey Brin και ο Larry Page δημιούργησαν τη μηχανή αναζήτησης Google ως μέρος ενός ερευνητικού έργου στο Πανεπιστήμιο του Στάνφορντ. Η Google είναι αυτή τη στιγμή η πιο δημοφιλής μηχανή αναζήτησης στον κόσμο!

Τον Σεπτέμβριο του 1997, ανακοινώθηκε επίσημα η μηχανή αναζήτησης Yandex, η οποία είναι η πιο δημοφιλής στο ρωσόφωνο Διαδίκτυο.

Επί του παρόντος, υπάρχουν τρεις κύριες μηχανές αναζήτησης (διεθνείς) - η Google, η Yahoo και, οι οποίες έχουν τις δικές τους βάσεις δεδομένων και αλγόριθμους αναζήτησης. Οι περισσότερες άλλες μηχανές αναζήτησης (από τις οποίες υπάρχει μεγάλος αριθμός) χρησιμοποιούν με τη μια ή την άλλη μορφή τα αποτελέσματα των τριών που αναφέρονται. Για παράδειγμα, η αναζήτηση AOL (search.aol.com) χρησιμοποιεί τη βάση δεδομένων Google, ενώ οι AltaVista, Lycos και AllTheWeb χρησιμοποιούν τη βάση δεδομένων Yahoo.

5. Σύνθεση και αρχές λειτουργίας του συστήματος αναζήτησης

Στη Ρωσία, η κύρια μηχανή αναζήτησης είναι η Yandex και ακολουθούν οι Rambler.ru, Google.ru, Aport.ru, Mail.ru. Επιπλέον, αυτή τη στιγμή, το Mail.ru χρησιμοποιεί τη μηχανή αναζήτησης και τη βάση δεδομένων Yandex.

Σχεδόν όλες οι μεγάλες μηχανές αναζήτησης έχουν τη δική τους δομή, διαφορετική από άλλες. Ωστόσο, είναι δυνατό να εντοπιστούν τα κύρια στοιχεία που είναι κοινά σε όλες τις μηχανές αναζήτησης. Οι διαφορές στη δομή μπορούν να είναι μόνο με τη μορφή υλοποίησης των μηχανισμών αλληλεπίδρασης αυτών των στοιχείων.

Μονάδα ευρετηρίασης

Η ενότητα ευρετηρίασης αποτελείται από τρία βοηθητικά προγράμματα (ρομπότ):

Το Spider είναι ένα πρόγραμμα που έχει σχεδιαστεί για τη λήψη ιστοσελίδων. Η αράχνη κατεβάζει τη σελίδα και ανακτά όλους τους εσωτερικούς συνδέσμους από αυτήν τη σελίδα. Γίνεται λήψη του κώδικα html κάθε σελίδας. Τα ρομπότ χρησιμοποιούν πρωτόκολλα HTTP για τη λήψη σελίδων. Η αράχνη λειτουργεί ως εξής. Το ρομπότ στέλνει το αίτημα «get/path/document» και κάποιες άλλες εντολές αιτήματος HTTP στον διακομιστή. Σε απόκριση, το ρομπότ λαμβάνει μια ροή κειμένου που περιέχει πληροφορίες υπηρεσίας και το ίδιο το έγγραφο.

Διεύθυνση Ιστοσελίδας
ημερομηνία λήψης της σελίδας
Επικεφαλίδα http απόκρισης διακομιστή
σώμα σελίδας (κώδικας html)

Το Crawler («ταξιδεύοντας» αράχνη) είναι ένα πρόγραμμα που ακολουθεί αυτόματα όλους τους συνδέσμους που βρίσκονται στη σελίδα. Επιλέγει όλους τους συνδέσμους που υπάρχουν στη σελίδα. Η δουλειά του είναι να καθορίσει πού θα πάει η αράχνη στη συνέχεια, με βάση συνδέσμους ή μια προκαθορισμένη λίστα διευθύνσεων. Το Crawler, ακολουθώντας τους συνδέσμους που βρέθηκαν, αναζητά νέα έγγραφα που είναι ακόμα άγνωστα στη μηχανή αναζήτησης.

Το Indexer (robot indexer) είναι ένα πρόγραμμα που αναλύει ιστοσελίδες που κατεβαίνουν από αράχνες. Ο δείκτης αναλύει τη σελίδα στα συστατικά μέρη της και τα αναλύει χρησιμοποιώντας τους δικούς του λεξιλογικούς και μορφολογικούς αλγόριθμους. Αναλύονται διάφορα στοιχεία σελίδας, όπως κείμενο, επικεφαλίδες, σύνδεσμοι, χαρακτηριστικά δομής και στυλ, ετικέτες HTML ειδικών υπηρεσιών κ.λπ.

Έτσι, η μονάδα ευρετηρίασης σάς επιτρέπει να ανιχνεύσετε ένα δεδομένο σύνολο πόρων χρησιμοποιώντας συνδέσμους, να κάνετε λήψη σελίδων που συναντήθηκαν, να εξαγάγετε συνδέσμους σε νέες σελίδες από τα ληφθέντα έγγραφα και να εκτελέσετε μια πλήρη ανάλυση αυτών των εγγράφων.

Βάση δεδομένων

Μια βάση δεδομένων, ή ευρετήριο μηχανής αναζήτησης, είναι ένα σύστημα αποθήκευσης δεδομένων, ένας πίνακας πληροφοριών στον οποίο αποθηκεύονται οι ειδικά μετατρεπόμενες παράμετροι όλων των εγγράφων που λήφθηκαν και υποβάλλονται σε επεξεργασία από τη μονάδα ευρετηρίου.

Διακομιστής αναζήτησης

Ο διακομιστής αναζήτησης είναι το πιο σημαντικό στοιχείο ολόκληρου του συστήματος, καθώς η ποιότητα και η ταχύτητα της αναζήτησης εξαρτώνται άμεσα από τους αλγόριθμους που διέπουν τη λειτουργία του.

Ο διακομιστής αναζήτησης λειτουργεί ως εξής:

Το αίτημα που λαμβάνεται από τον χρήστη υποβάλλεται σε μορφολογική ανάλυση. Δημιουργείται το περιβάλλον πληροφοριών κάθε εγγράφου που περιέχεται στη βάση δεδομένων (το οποίο στη συνέχεια θα εμφανίζεται με τη μορφή, δηλαδή πληροφορίες κειμένου που αντιστοιχούν στο αίτημα στη σελίδα αποτελεσμάτων αναζήτησης).
Τα δεδομένα που λαμβάνονται διαβιβάζονται ως παράμετροι εισόδου σε μια ειδική μονάδα κατάταξης. Τα δεδομένα υποβάλλονται σε επεξεργασία για όλα τα έγγραφα, με αποτέλεσμα κάθε έγγραφο να έχει τη δική του βαθμολογία που χαρακτηρίζει τη συνάφεια του ερωτήματος που έχει εισαχθεί από τον χρήστη και των διαφόρων στοιχείων αυτού του εγγράφου που είναι αποθηκευμένα στο ευρετήριο της μηχανής αναζήτησης.
Ανάλογα με την επιλογή του χρήστη, αυτή η βαθμολογία μπορεί να προσαρμοστεί από πρόσθετες συνθήκες (για παράδειγμα, τη λεγόμενη "προχωρημένη αναζήτηση").
Στη συνέχεια, δημιουργείται ένα απόσπασμα, δηλαδή για κάθε έγγραφο που βρέθηκε, ο τίτλος, μια σύντομη περίληψη που ταιριάζει καλύτερα με το ερώτημα και ένας σύνδεσμος προς το ίδιο το έγγραφο εξάγονται από τον πίνακα εγγράφων και επισημαίνονται οι λέξεις που βρέθηκαν.
Τα αποτελέσματα αναζήτησης που προκύπτουν μεταδίδονται στον χρήστη με τη μορφή SERP (Search Engine Result Page) - μια σελίδα αποτελεσμάτων αναζήτησης.

Όπως μπορείτε να δείτε, όλα αυτά τα στοιχεία συνδέονται στενά μεταξύ τους και λειτουργούν σε αλληλεπίδραση, διαμορφώνοντας έναν σαφή, μάλλον περίπλοκο μηχανισμό για τη λειτουργία του συστήματος αναζήτησης, ο οποίος απαιτεί τεράστια ποσά πόρων.

6. Συμπέρασμα

Τώρα ας συνοψίσουμε όλα τα παραπάνω.

Ο πρωταρχικός στόχος κάθε μηχανής αναζήτησης είναι να παρέχει στους ανθρώπους ακριβώς τις πληροφορίες που αναζητούν.
Κύρια χαρακτηριστικά των μηχανών αναζήτησης:
1. Πληρότητα
2. Ακρίβεια
3. Συνάφεια
4. Ταχύτητα αναζήτησης
5. Ορατότητα
Η πρώτη πλήρης μηχανή αναζήτησης ήταν το έργο WebCrawler, που δημοσιεύτηκε το 1994.
Το σύστημα αναζήτησης περιλαμβάνει τα ακόλουθα στοιχεία:
1. Μονάδα ευρετηρίασης
2. Βάση δεδομένων
3. Διακομιστής αναζήτησης

Ελπίζουμε ότι η κύρια τάξη μας θα σας επιτρέψει να εξοικειωθείτε περισσότερο με την έννοια της μηχανής αναζήτησης και να κατανοήσετε καλύτερα τις κύριες λειτουργίες, τα χαρακτηριστικά και τις αρχές λειτουργίας των μηχανών αναζήτησης.

1. Όροι και ορισμοί Στην παρούσα συμφωνία για την επεξεργασία προσωπικών δεδομένων (εφεξής η Συμφωνία), οι παρακάτω όροι έχουν τους ακόλουθους ορισμούς: Χειριστής - Μεμονωμένος Επιχειρηματίας Oleg Aleksandrovich Dneprovsky. Αποδοχή της Σύμβασης - πλήρης και ανεπιφύλακτη αποδοχή όλων των όρων της Σύμβασης με αποστολή και επεξεργασία προσωπικών δεδομένων. Προσωπικά δεδομένα - πληροφορίες που εισάγονται από τον Χρήστη (αντικείμενο προσωπικών δεδομένων) στον ιστότοπο και σχετίζονται άμεσα ή έμμεσα με αυτόν τον Χρήστη. Χρήστης - κάθε φυσικό ή νομικό πρόσωπο που έχει ολοκληρώσει επιτυχώς τη διαδικασία συμπλήρωσης των πεδίων εισαγωγής στον ιστότοπο. Η συμπλήρωση των πεδίων εισαγωγής είναι η διαδικασία αποστολής του ονόματος, του επωνύμου, του αριθμού τηλεφώνου, της προσωπικής διεύθυνσης ηλεκτρονικού ταχυδρομείου (εφεξής "Προσωπικά Δεδομένα) από τον Χρήστη στη βάση δεδομένων των εγγεγραμμένων χρηστών του ιστότοπου, η οποία πραγματοποιείται με σκοπό την ταυτοποίηση ο χρήστης. Ως αποτέλεσμα της συμπλήρωσης των πεδίων εισαγωγής, τα προσωπικά δεδομένα αποστέλλονται στη βάση δεδομένων του Χειριστή. Η συμπλήρωση των πεδίων εισαγωγής είναι εθελοντική. ιστότοπος - ένας ιστότοπος που βρίσκεται στο Διαδίκτυο και αποτελείται από μία σελίδα. 2. Γενικές διατάξεις 2.1. Η παρούσα συμφωνία καταρτίζεται με βάση τις απαιτήσεις του ομοσπονδιακού νόμου της 27ης Ιουλίου 2006 αριθ. προσωπικά δεδομένα» του Κώδικα Διοικητικών Αδικημάτων της Ρωσικής Ομοσπονδίας και ισχύει για όλα τα προσωπικά δεδομένα που μπορεί να λάβει ο Διαχειριστής σχετικά με τον Χρήστη κατά τη χρήση της Ιστοσελίδας. 2.2. Η συμπλήρωση των πεδίων εισαγωγής από τον Χρήστη στον Ιστότοπο σημαίνει την ανεπιφύλακτη συμφωνία του Χρήστη με όλους τους όρους της παρούσας Συμφωνίας (Αποδοχή της Συμφωνίας). Σε περίπτωση διαφωνίας με αυτούς τους όρους, ο Χρήστης δεν συμπληρώνει τα πεδία εισαγωγής στον Ιστότοπο. 2.3. Η συγκατάθεση του Χρήστη για την παροχή προσωπικών δεδομένων στον Διαχειριστή και την επεξεργασία τους από τον Διαχειριστή ισχύει μέχρι τον τερματισμό των δραστηριοτήτων του Χειριστή ή έως ότου ο Χρήστης αποσύρει τη συγκατάθεσή του. Με την αποδοχή της παρούσας Σύμβασης και τη διεκπεραίωση της διαδικασίας Εγγραφής, καθώς και με τη μετέπειτα πρόσβαση στην Ιστοσελίδα, ο Χρήστης επιβεβαιώνει ότι, ενεργώντας με δική του ελεύθερη βούληση και προς το συμφέρον του, μεταφέρει τα προσωπικά του δεδομένα προς επεξεργασία στον Διαχειριστή και συμφωνεί να την επεξεργασία τους. Ο Χρήστης ειδοποιείται ότι η επεξεργασία των προσωπικών του δεδομένων θα πραγματοποιηθεί από τον Χειριστή βάσει του Ομοσπονδιακού Νόμου της 27ης Ιουλίου 2006 Αρ. 152-FZ «Περί Προσωπικών Δεδομένων». 3. Κατάλογος προσωπικών δεδομένων και άλλων πληροφοριών σχετικά με τον χρήστη που πρόκειται να μεταφερθούν στον Διαχειριστή 3. 1. Κατά τη χρήση της Ιστοσελίδας του Διαχειριστή, ο Χρήστης παρέχει τα ακόλουθα προσωπικά δεδομένα: 3.1.1. Αξιόπιστες προσωπικές πληροφορίες που παρέχει ο Χρήστης για τον εαυτό του ανεξάρτητα κατά τη συμπλήρωση πεδίων εισαγωγής ή/και κατά τη διαδικασία χρήσης των υπηρεσιών του ιστότοπου, όπως επώνυμο, όνομα, πατρώνυμο, αριθμός τηλεφώνου (οικία ή κινητό), προσωπική διεύθυνση email. 3.1.2. Δεδομένα που μεταφέρονται αυτόματα στις υπηρεσίες του ιστότοπου κατά τη χρήση τους χρησιμοποιώντας λογισμικό εγκατεστημένο στη συσκευή του Χρήστη, συμπεριλαμβανομένης της διεύθυνσης IP, πληροφοριών από Cookies, πληροφοριών σχετικά με το πρόγραμμα περιήγησης του Χρήστη (ή άλλου προγράμματος μέσω του οποίου γίνεται πρόσβαση στις υπηρεσίες). 3.2. Ο Διαχειριστής δεν επαληθεύει την ακρίβεια των προσωπικών δεδομένων που παρέχονται από τον Χρήστη. Σε αυτήν την περίπτωση, ο Διαχειριστής υποθέτει ότι ο Χρήστης παρέχει αξιόπιστες και επαρκείς προσωπικές πληροφορίες για τις ερωτήσεις που προτείνονται στα Πεδία Εισόδου. 4. Σκοποί, κανόνες συλλογής και χρήσης προσωπικών δεδομένων 4.1. Ο Διαχειριστής επεξεργάζεται προσωπικά δεδομένα που είναι απαραίτητα για την παροχή υπηρεσιών και την παροχή υπηρεσιών στον Χρήστη. 4.2. Τα προσωπικά δεδομένα του Χρήστη χρησιμοποιούνται από τον Διαχειριστή για τους ακόλουθους σκοπούς: 4.2.1. Αναγνώριση χρήστη. 4.2.2. Παροχή εξατομικευμένων υπηρεσιών στον Χρήστη (καθώς και ενημέρωση για νέες προσφορές και υπηρεσίες της εταιρείας με αποστολή επιστολών). 4.2.3. Διατήρηση επαφής με τον Χρήστη εάν είναι απαραίτητο, συμπεριλαμβανομένης της αποστολής ειδοποιήσεων, αιτημάτων και πληροφοριών που σχετίζονται με τη χρήση των υπηρεσιών, την παροχή υπηρεσιών, καθώς και την επεξεργασία αιτημάτων και αιτήσεων από τον Χρήστη. 4.3. Κατά την επεξεργασία των προσωπικών δεδομένων θα γίνονται οι ακόλουθες ενέργειες: συλλογή, καταγραφή, συστηματοποίηση, συσσώρευση, αποθήκευση, διευκρίνιση (ενημέρωση, αλλαγή), εξαγωγή, χρήση, αποκλεισμός, διαγραφή, καταστροφή. 4.4. Ο χρήστης δεν αντιτίθεται στο ότι οι πληροφορίες που καθορίζονται από αυτόν σε ορισμένες περιπτώσεις ενδέχεται να παρέχονται σε εξουσιοδοτημένα κρατικά όργανα της Ρωσικής Ομοσπονδίας σύμφωνα με την ισχύουσα νομοθεσία της Ρωσικής Ομοσπονδίας. 4.5. Τα προσωπικά δεδομένα του Χρήστη αποθηκεύονται και υφίστανται επεξεργασία από τον Διαχειριστή με τον τρόπο που προβλέπεται στην παρούσα Συμφωνία για όλη την περίοδο δραστηριότητας του Διαχειριστή. 4.6. Η επεξεργασία των προσωπικών δεδομένων πραγματοποιείται από τον Διαχειριστή με τη διατήρηση βάσεων δεδομένων, αυτοματοποιημένες, μηχανικές και μη αυτόματες μεθόδους. 4.7. Ο ιστότοπος χρησιμοποιεί cookies και άλλες τεχνολογίες για την παρακολούθηση της χρήσης των υπηρεσιών του ιστότοπου. Αυτά τα δεδομένα είναι απαραίτητα για τη βελτιστοποίηση της τεχνικής λειτουργίας της Ιστοσελίδας και τη βελτίωση της ποιότητας της παροχής υπηρεσιών. Ο ιστότοπος καταγράφει αυτόματα πληροφορίες (συμπεριλαμβανομένης της διεύθυνσης URL, της διεύθυνσης IP, του τύπου προγράμματος περιήγησης, της γλώσσας, της ημερομηνίας και της ώρας αιτήματος) για κάθε επισκέπτη στον Ιστότοπο. Ο χρήστης έχει το δικαίωμα να αρνηθεί την παροχή προσωπικών δεδομένων όταν επισκέπτεται τον Ιστότοπο ή να απενεργοποιήσει τα Cookies, αλλά σε αυτήν την περίπτωση, ενδέχεται να μην λειτουργούν σωστά όλες οι λειτουργίες του ιστότοπου. 4.8. Οι όροι εμπιστευτικότητας που προβλέπονται στην παρούσα Συμφωνία ισχύουν για όλες τις πληροφορίες που μπορεί να λάβει ο Διαχειριστής σχετικά με τον Χρήστη κατά τη διάρκεια της παραμονής του τελευταίου στον Ιστότοπο και της χρήσης του. 4.9. Οι πληροφορίες που αποκαλύπτονται δημόσια κατά την εκτέλεση της παρούσας Συμφωνίας, καθώς και οι πληροφορίες που μπορούν να ληφθούν από τα μέρη ή τρίτα μέρη από πηγές στις οποίες οποιοδήποτε πρόσωπο έχει ελεύθερη πρόσβαση, δεν είναι εμπιστευτικές. 4.10. Ο Διαχειριστής λαμβάνει όλα τα απαραίτητα μέτρα για την προστασία του απορρήτου των προσωπικών δεδομένων του Χρήστη από μη εξουσιοδοτημένη πρόσβαση, τροποποίηση, αποκάλυψη ή καταστροφή, όπως: εξασφάλιση συνεχούς εσωτερικής επαλήθευσης των διαδικασιών συλλογής, αποθήκευσης και επεξεργασίας δεδομένων και διασφάλιση της ασφάλειας. διασφαλίζει τη φυσική ασφάλεια των δεδομένων, αποτρέποντας τη μη εξουσιοδοτημένη πρόσβαση σε τεχνικά συστήματα που διασφαλίζουν τη λειτουργία του Ιστότοπου, στον οποίο ο Διαχειριστής αποθηκεύει προσωπικά δεδομένα· παρέχει πρόσβαση στα προσωπικά δεδομένα μόνο σε όσους υπαλλήλους του Διαχειριστή ή εξουσιοδοτημένα πρόσωπα χρειάζονται αυτές τις πληροφορίες για την εκτέλεση καθηκόντων που σχετίζονται άμεσα με την παροχή υπηρεσιών στον Χρήστη, καθώς και με τη λειτουργία, ανάπτυξη και βελτίωση του Ιστότοπου. 4.11. Τα προσωπικά δεδομένα του Χρήστη παραμένουν απόρρητα, εκτός από τις περιπτώσεις που ο Χρήστης παρέχει οικειοθελώς πληροφορίες για τον εαυτό του για γενική πρόσβαση σε απεριόριστο αριθμό προσώπων. 4.12. Η μεταφορά από τον Χειριστή των προσωπικών δεδομένων του Χρήστη είναι νόμιμη κατά την αναδιοργάνωση του Χειριστή και τη μεταβίβαση δικαιωμάτων στον νόμιμο διάδοχο του Χειριστή, ενώ όλες οι υποχρεώσεις συμμόρφωσης με τους όρους της παρούσας Σύμβασης σε σχέση με τα προσωπικά στοιχεία που λαμβάνει είναι μεταβιβάζεται στον νόμιμο διάδοχο. 4.13. Η παρούσα Δήλωση ισχύει μόνο για τον Ιστότοπο του Χειριστή. Η Εταιρεία δεν ελέγχει και δεν ευθύνεται για ιστότοπους (υπηρεσίες) τρίτων στις οποίες μπορεί να έχει πρόσβαση ο χρήστης μέσω συνδέσμων που είναι διαθέσιμοι στον Ιστότοπο του Διαχειριστή, συμπεριλαμβανομένων των αποτελεσμάτων αναζήτησης. Σε τέτοιους Ιστότοπους (υπηρεσίες), ενδέχεται να συλλέγονται ή να ζητούνται από τον χρήστη άλλες προσωπικές πληροφορίες και να εκτελούνται άλλες ενέργειες 5. Δικαιώματα του χρήστη ως υποκείμενο προσωπικών δεδομένων, αλλαγή και διαγραφή προσωπικών δεδομένων από τον χρήστη 5.1. Ο χρήστης έχει το δικαίωμα: 5.1.2. Απαιτήστε από τον Διαχειριστή να διευκρινίσει τα προσωπικά του δεδομένα, να τα μπλοκάρει ή να τα καταστρέψει εάν τα προσωπικά δεδομένα είναι ελλιπή, παρωχημένα, ανακριβή, παράνομα ή μη απαραίτητα για τον αναφερόμενο σκοπό επεξεργασίας, καθώς και να λάβει μέτρα που προβλέπονται από το νόμο για την προστασία των δικαιωμάτων του. 5.1.3. Λήψη πληροφοριών σχετικά με την επεξεργασία των προσωπικών του δεδομένων, συμπεριλαμβανομένων πληροφοριών που περιέχουν: 5.1.3.1. επιβεβαίωση του γεγονότος της επεξεργασίας προσωπικών δεδομένων από τον Διαχειριστή· 5.1.3.2. τους σκοπούς και τις μεθόδους επεξεργασίας προσωπικών δεδομένων που χρησιμοποιούνται από τον χειριστή· 5.1.3.3. όνομα και τοποθεσία του Διαχειριστή· 5.1.3.4. επεξεργασμένα προσωπικά δεδομένα που σχετίζονται με το σχετικό αντικείμενο των προσωπικών δεδομένων, την πηγή της λήψης τους, εκτός εάν προβλέπεται διαφορετική διαδικασία για την παρουσίαση τέτοιων δεδομένων από την ομοσπονδιακή νομοθεσία· 5.1.3.5. τους όρους επεξεργασίας των προσωπικών δεδομένων, συμπεριλαμβανομένων των περιόδων αποθήκευσης τους· 5.1.3.6. άλλες πληροφορίες που προβλέπονται από την ισχύουσα νομοθεσία της Ρωσικής Ομοσπονδίας. 5.2. Η ανάκληση της συγκατάθεσης για την επεξεργασία προσωπικών δεδομένων μπορεί να πραγματοποιηθεί από τον Χρήστη αποστέλλοντας στον Διαχειριστή κατάλληλη γραπτή (εκτυπωμένη σε απτό μέσο και υπογεγραμμένη από τον Χρήστη) ειδοποίηση. 6. Αρμοδιότητες του Διαχειριστή. Πρόσβαση σε προσωπικά δεδομένα 6.1. Ο Διαχειριστής αναλαμβάνει να διασφαλίζει την αποτροπή μη εξουσιοδοτημένης και μη στοχευμένης πρόσβασης στα προσωπικά δεδομένα των Χρηστών της Ιστοσελίδας του Διαχειριστή. Στην περίπτωση αυτή, η εξουσιοδοτημένη και στοχευμένη πρόσβαση στα προσωπικά δεδομένα των Χρηστών της Ιστοσελίδας θα θεωρείται πρόσβαση σε αυτά από όλα τα ενδιαφερόμενα μέρη, η οποία υλοποιείται στο πλαίσιο των σκοπών και του αντικειμένου της Ιστοσελίδας του Διαχειριστή. Ταυτόχρονα, ο Διαχειριστής δεν ευθύνεται για πιθανή κατάχρηση των προσωπικών δεδομένων των Χρηστών που προκύπτει ως αποτέλεσμα: τεχνικών προβλημάτων στο λογισμικό και σε υλικό και δίκτυα που δεν ελέγχουν ο Διαχειριστής. σε σχέση με την εσκεμμένη ή ακούσια χρήση των Ιστοσελίδων του Χειριστή εκτός από τον προορισμό τους από τρίτα μέρη· 6.2 Ο Διαχειριστής λαμβάνει τα απαραίτητα και επαρκή οργανωτικά και τεχνικά μέτρα για την προστασία των προσωπικών πληροφοριών του χρήστη από μη εξουσιοδοτημένη ή τυχαία πρόσβαση, καταστροφή, τροποποίηση, αποκλεισμό, αντιγραφή, διανομή, καθώς και από άλλες παράνομες ενέργειες τρίτων με αυτά. 7. Αλλαγές στην Πολιτική Απορρήτου. Ισχύουσα νομοθεσία 7.1. Ο Διαχειριστής έχει το δικαίωμα να κάνει αλλαγές στους παρόντες Κανονισμούς χωρίς καμία ειδική ειδοποίηση προς τους Χρήστες. Όταν γίνονται αλλαγές στην τρέχουσα έκδοση, υποδεικνύεται η ημερομηνία της τελευταίας ενημέρωσης. Η νέα έκδοση των Κανονισμών τίθεται σε ισχύ από τη στιγμή της δημοσίευσής της, εκτός εάν ορίζεται διαφορετικά από τη νέα έκδοση των Κανονισμών. 7.2. Το δίκαιο της Ρωσικής Ομοσπονδίας εφαρμόζεται στον παρόντα Κανονισμό και στη σχέση μεταξύ του Χρήστη και του Διαχειριστή που προκύπτει σε σχέση με την εφαρμογή του Κανονισμού. δέχομαι δεν δέχομαι

Δεν είμαστε τόσο μοναδικοί όσο νομίζουμε: εκατομμύρια άνθρωποι πριν από εμάς προβληματίζονται και εκατομμύρια μετά από εμάς θα προβληματίσουν τη μηχανή αναζήτησης με σχεδόν πανομοιότυπες ερωτήσεις. Από την άλλη πλευρά, είμαστε πολύ απρόβλεπτοι: η διατύπωση του αιτήματός μας επηρεάζεται από έναν τεράστιο αριθμό παραγόντων που δεν γνωρίζουμε. Και τουλάχιστον για αυτόν τον λόγο, το αίτημα του καθενός μας, όσο κοινότοπο κι αν είναι, απαιτεί ατομική προσέγγιση.

Στην πραγματικότητα, ολόκληρο το έργο της μηχανής αναζήτησης Yandex καταλήγει σε δύο απλά πράγματα: να καταλάβει τι θέλει πραγματικά να μάθει ένα άτομο και σε λίγα δευτερόλεπτα να βρει τα κατάλληλα ανάμεσα σε δισεκατομμύρια έγγραφα στο Διαδίκτυο.

Πάρτε δακτυλικά αποτυπώματα

Το λειτουργικό σύστημα της μηχανής αναζήτησης είναι κάπως παρόμοιο με το Matrix και το ρομπότ αναζήτησης (το πολύπλοκο πρόγραμμα λήψης αποφάσεων που δημιούργησε ανεξάρτητα) είναι παρόμοιο με τον Πράκτορα Σμιθ.

Για να μην πραγματοποιεί αναζήτηση σε ολόκληρο το Διαδίκτυο κάθε φορά που κάποιος χρειάζεται να μάθει κάτι, η μηχανή αναζήτησης κάνει μέρος της δουλειάς εκ των προτέρων - ελέγχει τι υπάρχει στον Ιστό και πού βρίσκεται, χρησιμοποιώντας χιλιάδες ρομπότ αναζήτησης. Κυκλοφορούν σε δύο τύπους: βασικό και γρήγορο. Το κύριο ανιχνεύει και επεξεργάζεται το Διαδίκτυο στο σύνολό του, και το γρήγορο - έγγραφα που εμφανίστηκαν πριν από ένα λεπτό ή ακόμα και μερικά δευτερόλεπτα. Το καθήκον των προγραμμάτων ρομπότ είναι να επιλέγουν κατάλληλες και χρήσιμες πληροφορίες για τους χρήστες, να τις επεξεργάζονται, εξαλείφοντας οτιδήποτε ξεπερασμένο και περιττό. Κατά κάποιο τρόπο, αυτό θυμίζει τη διαλογή των σκουπιδιών: χαρτί σε ένα δοχείο, γυαλί σε άλλο, πλαστικό σε ένα τρίτο, απόβλητα τροφίμων σε ένα τέταρτο...

Οι πληροφορίες που συλλέγονται από τα ρομπότ σχηματίζουν το λεγόμενο cast του Διαδικτύου. Αποθηκεύεται σε χιλιάδες διακομιστές Yandex και ενημερώνεται συνεχώς. Ένα nugget είναι σαν μια λίστα που σας λέει πού να βρείτε ποιες πληροφορίες. Σε αυτήν τη λίστα, κάθε λέξη-κλειδί έχει όχι μία, αλλά εκατομμύρια «σελίδες». Για να διασφαλιστεί ότι όλες οι ενημερώσεις nugget είναι διαθέσιμες στους χρήστες, μετακινούνται από το χώρο αποθήκευσης στη «βασική αναζήτηση». Τα δεδομένα από το κύριο ρομπότ μεταφέρονται κάθε λίγες μέρες και από το γρήγορο ρομπότ - σε πραγματικό χρόνο.

Φέρτε σε καθαρό νερό

ΕΙΚΟΝΙΣΗ: EVGENY TONKONOGY

Κατά την αναζήτηση της απάντησης σε μια δεδομένη ερώτηση σε μια προετοιμασμένη βάση δεδομένων, το μηχάνημα αντιμετωπίζει δύο κύριες δυσκολίες. Η πρώτη δυσκολία είναι η γλώσσα. Πριν αναζητήσετε μια απάντηση σε μια ερώτηση, είναι σημαντικό για το μηχάνημα να καταλάβει σε ποια γλώσσα πρέπει να το κάνει. Για παράδειγμα, για ένα ρωσόφωνο άτομο, η αναζήτηση για την «ομάδα του πρίγκιπα Ιγκόρ» θα βρει έγγραφα με πληροφορίες για τον στρατό και για έναν Ουκρανό, η «ομάδα του Πρίγκιπα Ιγκόρ» θα επιστρέψει επίσης έγγραφα που αναφέρουν την πριγκίπισσα Όλγα, τη σύζυγό του, καθώς στα ουκρανικά "σύζυγος" είναι "ομάδα". Και στην πλούσια ρωσική γλώσσα, η ίδια λέξη ή τα παράγωγά της μπορεί να σημαίνουν διαφορετικά πράγματα. Για παράδειγμα, η λέξη «ατσάλι» είναι μία από τις μορφές του ουσιαστικού «ατσάλι» και του ρήματος «γίνομαι». Η δεύτερη δυσκολία είναι η ανθρώπινη ψυχολογία. Κατά την εισαγωγή ενός αιτήματος, αναμένουμε μια γρήγορη και ακριβή απάντηση, χωρίς φυσικά να ανησυχούμε για το αν η διατύπωση του αιτήματος αντιστοιχεί στις αρχές της μαθηματικής ανάλυσης με τις οποίες λειτουργεί ο εγκέφαλος της μηχανής. Για παράδειγμα, εισάγοντας τη λέξη «Ναπολέων» στη γραμμή αναζήτησης, τι θέλει να πάρει ένα άτομο: μια συνταγή για κέικ ή μια βιογραφία του Γάλλου αυτοκράτορα, να αγοράσει κονιάκ ή να βρει τη διεύθυνση ενός ψυχιατρείου;

Σε τέτοιες περιπτώσεις, πολλές τεχνολογίες μπαίνουν στο παιχνίδι. Μπορείτε να σας δώσετε πολλές συμβουλές κάτω από τη γραμμή αναζήτησης που θα καθορίσουν το αίτημά σας. Κάντε like, επιλέξτε αυτό που χρειάζεστε: Συνταγές Napoleon ή Napoleon - Bonaparte. Εάν ο χρήστης δεν ανταποκριθεί στο αίτημα του μηχανήματος και δεν προσθέσει λέξεις στο "Napoleon", τότε η τεχνολογία "Spectrum" βοηθά το θέμα: χωρίς να ελπίζει σε βοήθεια, το μηχάνημα αναζητά αμέσως πληροφορίες σε διάφορες κατηγορίες (σχετικά με το κέικ, και για τον αυτοκράτορα, και για το άλογο) ..). Επιπλέον, οι μηχανισμοί εξατομίκευσης βοηθούν στην κατανόηση του χρήστη - οι γνώσεις του μηχανήματος για το τι έψαχνε ο χρήστης στον υπολογιστή του μια μέρα, δύο, τρεις ή μήνες πριν: αν κάνατε συχνά ερωτήσεις στο Yandex σχετικά με το μαγείρεμα, τότε το μηχάνημα θα εμφανίσει πρώτα αποτελέσματα που λένε ότι ο Ναπολέων είναι κέικ.

Συνδυασμοί: σύλλογοι συμφερόντων

Το καθήκον μιας μηχανής αναζήτησης δεν είναι απλώς να επιλέγει έγγραφα που περιέχουν λέξεις και φράσεις από το ερώτημα αναζήτησης. Το μηχάνημα πρέπει να κατανοήσει ποια έγγραφα πληρούν τις αντικρουόμενες απαιτήσεις μας και γιατί τις πληρούν. Θέλουμε να πάρουμε πληροφορίες για τον Ναπολέοντα την τούρτα, ή μήπως επισκεφθήκαμε ένα γυμναστήριο με ένα επιβλητικό όνομα για μερικά χρόνια ή ακόμη και ανησυχούμε εντελώς για τα κόμπλεξ των κοντών ανθρώπων. Σε κάθε περίπτωση, η επίλυση του προβλήματος απαιτεί μια μη τετριμμένη προσέγγιση.

Οι δημιουργοί του προγράμματος αναζήτησης Yandex βρήκαν αυτήν την προσέγγιση αναθέτοντας το δικαίωμα επιλογής στο μηχάνημα. Από τη μια μια άψυχη, αλλά πολύ γρήγορη και έξυπνη μηχανή δεν ξέρει και δεν θέλει να μάθει τίποτα για εμάς ως άτομα και από την άλλη προσπαθεί να μάθει όσο το δυνατόν περισσότερα για όλους.

Εκτός από τη γεωγραφική θέση του χρήστη και τη γλωσσική ανάλυση των ερωτημάτων του, η μηχανή αναζήτησης χρησιμοποιεί αρκετές χιλιάδες κριτήρια που δεν είναι καθόλου προφανή για τον άνθρωπο.

Το κόλπο είναι ότι το μηχάνημα αναπτύσσει και ενημερώνει αυτά τα κριτήρια ανεξάρτητα.

Απλώς χρησιμοποιεί δεδομένα για τις προτιμήσεις και τη συμπεριφορά των χρηστών εκατομμυρίων ανθρώπων και συσχετίζει αυτόν τον «αριθμητικό μέσο όρο» με το ιστορικό των ερωτήσεών μας. Οι αρχές που καθοδηγούν το Matrix μέσα του, συγκρίνοντας τις χιλιάδες κατηγορίες ενδιαφερόντων των χρηστών που έχει αναπτύξει, συχνά δεν ταιριάζουν στις παραδοσιακές ανθρώπινες ιδέες για το τι μπορεί να είναι καταρχήν τα «ενδιαφέροντα». Υπάρχουν δεκάδες χιλιάδες από αυτούς. Δημιουργούν διαφορετικούς, ενίοτε αστείους, συνδυασμούς μεταξύ τους. Για παράδειγμα, ένας από αυτούς τους συνδυασμούς θα μπορούσε να είναι ότι τα αποτελέσματα αναζήτησης ταιριάζουν με τα ενδιαφέροντα ενός ατόμου που εκτρέφει τρίτωνες. Ταυτόχρονα, ένα άτομο δεν ενδιαφέρεται μόνο για τους τρίτωνες, αλλά τους εκτρέφει ήδη, αλλά μόνο για τον πρώτο χρόνο.

Ακροαματικότητα. Χέρια βοηθείας

Ο πίνακας, φυσικά, αποφασίζει μόνος του (με τη βοήθεια ανώτερων μαθηματικών) τι και με ποια σειρά πρέπει να εμφανίζεται στους χρήστες με βάση δεκάδες χιλιάδες κριτήρια. Αλλά το Matrix χρησιμοποιεί επίσης ζωντανούς ανθρώπους - 1000 υπάλληλοι της Yandex, οι λεγόμενοι αξιολογητές, αξιολογούν τα αποτελέσματα αναζήτησης για ένα συγκεκριμένο αίτημα (φυσικά, δεν αξιολογείται κάθε αίτημα και αυτό δεν γίνεται σε πραγματικό χρόνο) για να προσδιορίσουν εάν πληρούν τις προσδοκίες ενός απλού χρήστη: όχι τόσο λογικές όσο μια μηχανή, όχι τόσο ακριβείς στη διατύπωση, αντιφατικές και συναισθηματικές.