IPS είναι Σκοπός και λειτουργίες των συστημάτων ανάκτησης πληροφοριών
IPS είναι Σκοπός και λειτουργίες των συστημάτων ανάκτησης πληροφοριών

Βίντεο: IPS είναι Σκοπός και λειτουργίες των συστημάτων ανάκτησης πληροφοριών

Βίντεο: IPS είναι Σκοπός και λειτουργίες των συστημάτων ανάκτησης πληροφοριών
Βίντεο: 12o OTS Forum: 4η Θεματική Ενότητα: Διαχείριση Υδατικών Πόρων 2024, Νοέμβριος
Anonim

Είναι δύσκολο για έναν σύγχρονο άνθρωπο να φανταστεί τη ζωή χωρίς το Διαδίκτυο και σχεδόν ακαριαία πρόσβαση σε πηγές πληροφοριών. Ο χρήστης σπάνια σκέφτεται πώς πραγματοποιείται η αναζήτηση του επιθυμητού περιεχομένου στο δίκτυο. Αλλά αυτό είναι πολύ ενδιαφέρον.

Ένα σύστημα ανάκτησης πληροφοριών (IPS) είναι ένα πολύπλοκο σύστημα λογισμικού και υλικού που επιλέγει πληροφορίες κατόπιν αιτήματος του χρήστη. Οι πληροφορίες αποθηκεύονται σε διακομιστές σε ψηφιακή μορφή, όπως παλιά τα βιβλία στα ράφια των βιβλιοθηκών. Το σύστημα αποτελείται από πολλά υποσυστήματα. Το καθένα εκτελεί το καθήκον του κατά τη διαδικασία επεξεργασίας του αιτήματος του χρήστη και παροχής του πληροφοριών σε μορφή κειμένου ή ήχου. Η πολλαπλότητα των εργασιών που πρέπει να επιλυθούν καθορίζει την πολυπλοκότητα της αρχιτεκτονικής των σύγχρονων συστημάτων ανάκτησης πληροφοριών (μια συντομογραφία του συστήματος ανάκτησης πληροφοριών). Ένα είδος "μαύρου κουτιού": στην είσοδο - το κείμενο του αιτήματος, αυτό που υπάρχει μέσα - είναι άγνωστο, στην έξοδο - ολοκληρωμένες πληροφορίες.

Αρχείο καρτών στην πραγματική ζωή
Αρχείο καρτών στην πραγματική ζωή

Ροές εισόδου

Αιτήματα για πληροφορίες που σχηματίζει ένα άτομο σε μορφή κειμένου στην οθόνη του gadget του,αποτελούν ένα μικρό μέρος των αιτημάτων που επεξεργάζεται η μηχανή αναζήτησης. Οι κύριες συστοιχίες ερωτημάτων αναζήτησης σχηματίζονται από ρομπότ που δέχονται ένα ανθρώπινο αίτημα και εκτελούν αναζήτηση και ανατροφοδότηση πολλαπλών βημάτων με τον χρήστη. Τα συστήματα ανάκτησης πληροφοριών περιλαμβάνουν γνωστά Google, Yandex και άλλα, τα οποία επεξεργάζονται εκατομμύρια αιτήματα καθημερινά.

Αντικείμενα αναζήτησης πηγής

Το σύνολο των αρχικών αντικειμένων ενδιαφέροντος για την αναζήτηση είναι έγγραφα, εγγραφές, βίντεο, εικόνες και άλλα. Δημιουργούνται εκτός του IPS. Το γενικό σύστημα αποθήκευσης και ανάκτησης πληροφοριών θα πρέπει να διαθέτει ένα ενσωματωμένο βιβλιογραφικό σύστημα - ένα είδος καταλόγου που σας επιτρέπει να αναζητάτε οποιοδήποτε είδος αντικειμένων.

Τα αντικείμενα ή οι ψηφιακοί μετασχηματισμοί τους γίνονται «πόρος εισόδου» στο IPS. Είναι μεταξύ αυτών που επιλέγονται οι πληροφορίες που χρειάζεται ο χρήστης.

Αναζήτηση πληροφοριών
Αναζήτηση πληροφοριών

Εξωτερικές πηγές

Η προβολή επιλογής πληροφοριών χρησιμοποιεί εξωτερικές πηγές γνώσης. Αυτές είναι οι πληροφορίες που αναζητά ο χρήστης. Ο τίτλος της ταινίας, ένα απόσπασμα από το βιβλίο, και πολλά άλλα. Για μια αναζήτηση υπολογιστή, αυτές οι πληροφορίες πρέπει να μεταφραστούν σε ένα ερώτημα σε μια αλγοριθμική γλώσσα. Στο IPS, αυτό γίνεται χρησιμοποιώντας το μπλοκ για τη δημιουργία, την ευρετηρίαση και την ανάπτυξη ερωτημάτων.

Ιδανικά, αυτές οι τρεις διαδικασίες-αναπαράσταση, ευρετηρίαση και ανάπτυξη ερωτημάτων-θα πρέπει να βασίζονται σε πανομοιότυπες πηγές γνώσης, αλλά στην πράξη, αυτό δεν είναι εφικτό.

Οι πηγές γνώσης θα πρέπει να ελέγχονται και να ενημερώνονται συνεχώς και η ενημέρωση πρέπει να είναι πανομοιότυπη καισυγχρονισμένη. Και μια εξωτερική πηγή γνώσης πάντα προηγείται χρονολογικά της χρήσης της στις μηχανές αναζήτησης για ένα ερώτημα, μερικές φορές κατά αρκετά χρόνια.

Σύστημα ανάκτησης πληροφοριών
Σύστημα ανάκτησης πληροφοριών

Performances

Οι αναπαραστάσεις των αρχικών αντικειμένων αποτελούνται από δεδομένα εισόδου σε κάποιο συνδυασμό ή μετασχηματίζονται σύμφωνα με τους κανόνες και τους αλγόριθμους ενός συγκεκριμένου συστήματος ανάκτησης πληροφοριών.

Οι προβολές είναι περισσότερο ή λιγότερο μετασχηματισμένα αντίγραφα του αρχικού αντικειμένου αναζήτησης. Στη συλλογή των μη επεξεργασμένων πλήρων κειμένων, κάθε κείμενο είναι η δική του αναπαράσταση. Στη συλλογή αντικειμένων των μουσειακών εκθεμάτων και αντικειμένων, η αναπαράσταση μπορεί να είναι μια μεταμορφωμένη περιγραφή του αντικειμένου με την εικόνα του. Σε ορισμένες περιπτώσεις, η αναπαράσταση μπορεί εν μέρει να προέρχεται από το αρχικό αντικείμενο και εν μέρει από την περιγραφή: στις μηχανές βιβλιογραφικής αναζήτησης, οι αναπαραστάσεις προέρχονται από το αντικείμενο - για παράδειγμα, ο τίτλος, το όνομα του συγγραφέα θα συνδυαστούν με τον σχολιασμό του έργου.

Βρίσκοντας αυτό που χρειάζεστε
Βρίσκοντας αυτό που χρειάζεστε

Ευρετήριο με δυνατότητα αναζήτησης

Δεδομένου ότι οι πληροφορίες στα συστήματα ανάκτησης πληροφοριών αποθηκεύονται με τη μορφή αναπαράστασης, είναι λογικό να υποθέσουμε ότι η αναζήτηση πραγματοποιείται σύμφωνα με την αναπαράσταση και, μετά την επιλογή, δίνεται στον χρήστη. Στην πράξη, αυτό δεν ισχύει. Για παράδειγμα, οι τρέχοντες διαδικτυακοί κατάλογοι βιβλιοθηκών συνήθως περιορίζουν τις αναζητήσεις σε μερικά πεδία: συγγραφέας, τίτλος και υπότιτλοι σε μια προβολή που περιέχει άλλα πεδία που δεν αναζητούνται. Αυτός είναι επαρκής λόγος για τον οποίο είναι απαραίτητο να γίνει διάκρισημια προβολή και ένα ευρετήριο με δυνατότητα αναζήτησης, το οποίο είναι το τμήμα αναζήτησης της προβολής. Καθορίζει όλα όσα πρέπει να αναζητηθούν. Ένα ευρετήριο με δυνατότητα αναζήτησης, όπως το αντικείμενο προβολής και πηγής, μπορεί να χωριστεί σε ξεχωριστά υποευρετήρια για να παρέχει πιο ακριβείς, στοχευμένες αναζητήσεις

Οι μηχανές αναζήτησης έχουν συνήθως μια συνθετική δομή εσωτερικά για αντιστοίχιση έγκυρων αποτελεσμάτων αναζήτησης. Αυτή η δομή είναι το δεύτερο στοιχείο του ευρετηρίου με δυνατότητα αναζήτησης.

Διαδικαστικά, η διαδικασία δημιουργίας ευρετηρίου μπορεί να εφαρμοστεί με διαφορετικούς τρόπους: ένα ευρετήριο με δυνατότητα αναζήτησης μπορεί να ληφθεί με:

  • κυριολεκτικά αντιγραφή αναπαράστασης με δυνατότητα αναζήτησης;
  • αντιγράφοντας τις λεπτομέρειες της προβολής. Αυτό μπορεί να είναι μέρος ή το σύνολο των προβολών που υπάρχουν φυσικά μόνο ως θραύσματα, κατανεμημένες σύμφωνα με τους κανόνες για τη δημιουργία ευρετηρίου για αναζήτηση, το οποίο θα συλλέγεται όταν είναι απαραίτητο.
Διαχείριση αναζήτησης
Διαχείριση αναζήτησης

Αίτηση κανόνων σχεδίασης και επίσημων αιτημάτων

Η μηχανική ερωτημάτων είναι μια συνάρτηση που μεσολαβεί μεταξύ ενός ερωτήματος χρήστη και ενός τυπικού ερωτήματος. Μεταμορφώνει το ερώτημα του χρήστη, ταιριάζοντάς το με τα λεξικά εντολών ανάκτησης, τις προδιαγραφές ευρετηρίου και το ευρετήριο πριν από την ανάκτηση. Στην αυγή της ανάπτυξης του IPS, αυτός ο ρόλος παραδοσιακά ανατέθηκε σε ειδικευμένους ειδικούς πληροφορικής.

Η ανάπτυξη ερωτημάτων υπολογιστή που μπορούν να αντιστοιχίσουν ερωτήματα λεξικού σε ένα σύστημα ευρετηρίου με δυνατότητα αναζήτησης αναφέρεται συνήθως ως ενότητα "εισαγωγή λεξικού". Η αυτοματοποίηση αυτής της λειτουργίας είναι πολλά υποσχόμενη και προσφέρει ευκαιρίες για εξειδικευμένες και πιθανολογικές μεθόδους αναζήτησης.

Ένα επίσημο αίτημα γίνεται επίσημο αίτημα μετά τη μετατροπή του αιτήματος του χρήστη. Παραδείγματα τέτοιων τυπικών μετασχηματισμών περιλαμβάνουν περικοπή, αντικατάσταση, κανονικοποίηση, διανυσματοποίηση και άλλους μετασχηματισμούς της "εξωτερικής" αναπαράστασης σε "εσωτερικές" αναπαραστάσεις του IPS υπολογιστή (αποκρυπτογράφηση - σύστημα ανάκτησης πληροφοριών).

Σύνολα συνδέσμων εγγράφων που έχουν εξαχθεί

Το σύνολο πηγών πληροφοριών που προκύπτει είναι λογικά ένα υποσύνολο των προβολών που δημιουργούνται από τους κανόνες αντιστοίχισης που εφαρμόζονται στο επίσημο ερώτημα από ένα ευρετήριο με δυνατότητα αναζήτησης.

Συνήθως, αλλά όχι απαραίτητα, υπάρχει ξεχωριστή διαδικασία ταξινόμησης για το σύνολο πληροφοριών που ανακτήθηκε. Οι κατάλογοι διαδικτυακών βιβλιοθηκών συνήθως αναδιατάσσουν τα ληφθέντα σύνολα αλφαβητικά ανά συγγραφέα πριν από την εμφάνιση τους. Στα συστήματα ανάκτησης πληροφοριών που παράγουν αυστηρές ταξινομήσεις, η σειρά κατάταξης προηγείται κάθε αναδιάταξης.

Ανάλυση δεδομένων
Ανάλυση δεδομένων

Ροές εξόδου

Η έξοδος των αποτελεσμάτων αναζήτησης γίνεται παραδοσιακά στην οθόνη, πιο συχνά με τη μορφή μιας ροής αντικειμένων που θα χρησιμοποιηθούν αλλού ή για κάποιον άλλο σκοπό, ολοκληρώνει τον κύριο βρόχο αναζήτησης. Τέτοιες ροές μπορούν να σταλούν σε συσκευές οπτικοποίησης, αποθήκευση για περαιτέρω επεξεργασία ή χρήση ως ροές εισόδου σε άλλες υπηρεσίες επιλογής.

Συστήματα ανάκτησης πληροφοριών επιτρέπουν την ανάδραση απότο αποτέλεσμα οποιασδήποτε διαδικασίας επιλογής. Το αποτέλεσμα οποιασδήποτε διαδικασίας μπορεί να είναι ανατροφοδότηση σε άλλες διεργασίες. Τα σχόλια μπορούν να παρέχουν τη βάση για την κρίση των ειδικών σε οποιοδήποτε στάδιο.

Συνιστάται:

Η επιλογή των συντακτών

Κάρτα "Molodezhnaya" (Sberbank): χαρακτηριστικά, προϋποθέσεις απόκτησης, κριτικές

IBAN - τι είναι; Διεθνής αριθμός τραπεζικού λογαριασμού

Κωδικός του θέματος του πιστωτικού ιστορικού πώς να μάθετε στη Sberbank;

Πώς να μάθετε τον αριθμό λογαριασμού μιας κάρτας Sberbank: βασικές προσεγγίσεις

IBAN - τι είναι; Τι σημαίνει ο αριθμός IBAN της τράπεζας;

Κατάθεση είναι Καταθέσεις σε τράπεζες. Τόκοι καταθέσεων

Πώς να κλείσετε την κάρτα Svyaznoy Bank: δυσκολίες που μπορεί να αντιμετωπίσετε

Δάνειο και πίστωση: ποια είναι η διαφορά και πώς μοιάζουν

Κάρτα "Euroset", "Corn": πώς να αποκτήσετε. Πιστωτική κάρτα "Καλαμπόκι": προϋποθέσεις απόκτησης, τιμολόγια και κριτικές

Πιστωτική κάρτα MTS - κριτικές. Πιστωτικές κάρτες MTS-Bank: πώς να αποκτήσετε, όρους εγγραφής, τόκοι

Πώς και πού να πάρετε δάνειο χωρίς πιστοποιητικό εισοδήματος;

Η φορολογική υπηρεσία της Ρωσικής Ομοσπονδίας: δομή και κύριες λειτουργίες

Ασφάλιση ατυχήματος εφάπαξ

Καταθέσεις, ζημίες και έσοδα επενδυτικών εταιρειών

Η έννοια του οικονομικού και λογιστικού κέρδους: ορισμός, χαρακτηριστικά και τύπος