Καταργήστε τις διπλές εγγραφές δεδομένων στο Excel
Τα προγράμματα υπολογιστικών φύλλων, όπως το Excel, χρησιμοποιούνται συχνά ως βάσεις δεδομένων για πράγματα όπως καταλόγους ανταλλακτικών, αρχεία πωλήσεων και λίστες αλληλογραφίας.
Οι βάσεις δεδομένων στο Excel αποτελούνται από πίνακες δεδομένων που συνήθως οργανώνονται σε σειρές δεδομένων που ονομάζονται εγγραφές.
Σε μια εγγραφή, τα δεδομένα σε κάθε κελιά ή πεδίο στη σειρά σχετίζονται - όπως το όνομα, η διεύθυνση και ο αριθμός τηλεφώνου της εταιρείας.
Ένα κοινό πρόβλημα που παρουσιάζεται ως βάση δεδομένων μεγαλώνει σε μέγεθος είναι αυτό των διπλών εγγραφών ή σειρών δεδομένων.
Αυτή η επανάληψη μπορεί να συμβεί αν:
- Πλήρη αρχεία εισάγονται στη βάση δεδομένων περισσότερες από μία φορές με αποτέλεσμα δύο ή περισσότερες πανομοιότυπες εγγραφές
- Πολλαπλές εγγραφές έχουν ένα ή περισσότερα πεδία - όπως όνομα και διεύθυνση - που περιέχουν τα ίδια δεδομένα.
Είτε έτσι είτε αλλιώς, οι διπλότυπες εγγραφές μπορούν να προκαλέσουν μια σειρά από προβλήματα - όπως η αποστολή πολλαπλών αντιγράφων εγγράφων στο ίδιο άτομο όταν οι πληροφορίες βάσης δεδομένων χρησιμοποιούνται σε συγχώνευση αλληλογραφίας - γι 'αυτό είναι καλή ιδέα να σαρώσετε και να αφαιρέσετε διπλές εγγραφές σε τακτική βάση.
Και ενώ είναι εύκολο να διαλέξουμε διπλές εγγραφές σε ένα μικρό δείγμα όπως αυτό στην παραπάνω εικόνα, οι πίνακες δεδομένων θα μπορούσαν εύκολα να περιέχουν εκατοντάδες αν όχι χιλιάδες εγγραφές καθιστώντας πολύ δύσκολο να διαλέξουμε διπλές εγγραφές - ειδικά μερικώς αντιστοιχούσες εγγραφές.
Για να καταστεί ευκολότερη η πραγματοποίηση αυτής της εργασίας, το Excel διαθέτει ένα ενσωματωμένο εργαλείο δεδομένων που ονομάζεται, δεν αποτελεί έκπληξη, Κατάργηση διπλότυπων, το οποίο μπορεί να χρησιμοποιηθεί για την εύρεση και αφαίρεση ταυτόσημων και μερικώς ταιριαστών αρχείων.
Ωστόσο, ο τρόπος με τον οποίο Κατάργηση διπλότυπων το εργαλείο έχει σχεδιαστεί, πανομοιότυπα και εν μέρει ταιριαστά αρχεία πρέπει να αντιμετωπίζονται χωριστά.
Αυτό συμβαίνει επειδή το Κατάργηση διπλότυπων το παράθυρο διαλόγου εμφανίζει τα ονόματα πεδίων για τον επιλεγμένο πίνακα δεδομένων και επιλέγετε τα πεδία που θα συμπεριληφθούν στην αναζήτηση αντιστοιχιών εγγραφών:
- Για πανομοιότυπα αρχεία, αναζητήστε όλα τα πεδία - αφήστε τα σημάδια ελέγχου δίπλα σε όλα τα ονόματα των στηλών ή πεδίων.
- Για καταχωρίσεις που ταιριάζουν μερικώς - αφήστε τα σημάδια ελέγχου δίπλα μόνο στα πεδία που αντιστοιχούν.
Ονόματα πεδίων και γράμματα στηλών
Όπως αναφέρθηκε, το Κατάργηση διπλότυπων εργαλείο αποτελείται από ένα πλαίσιο διαλόγου όπου επιλέγετε τα αντίστοιχα πεδία για αναζήτηση, ελέγχοντας τα επιθυμητά ονόματα πεδίων ή στηλών.
Οι πληροφορίες που εμφανίζει το παράθυρο διαλόγου - ονόματα πεδίων ή γράμματα στηλών - εξαρτώνται από το αν τα δεδομένα σας περιέχουν μια σειρά από επικεφαλίδες - ή κεφαλίδες - στην κορυφή του πίνακα δεδομένων όπως φαίνεται στην παραπάνω εικόνα.
Αν το κάνει - σιγουρευτείτε ότι η επιλογή στη δεξιά πλευρά του παραθύρου διαλόγου - Τα δεδομένα μου έχουν κεφαλίδες - είναι απενεργοποιημένο και το Excel θα εμφανίσει τα ονόματα αυτής της σειράς ως ονόματα πεδίων στο παράθυρο διαλόγου.
Εάν τα δεδομένα σας δεν έχουν μια σειρά κεφαλίδας, το παράθυρο διαλόγου θα εμφανίσει τα κατάλληλα γράμματα στη στήλη διαλόγου για το επιλεγμένο εύρος δεδομένων.
Συνεχή σειρά δεδομένων
Για το Κατάργηση διπλότυπων εργαλείο για να λειτουργεί σωστά, ο πίνακας δεδομένων πρέπει να είναι ένα συνεχόμενο εύρος δεδομένων - δηλαδή δεν πρέπει να υπάρχουν κενές σειρές, στήλες και, εάν είναι δυνατόν, δεν υπάρχουν κενά κελιά τοποθετημένα μέσα στον πίνακα.
Το να μην έχετε κενά μέσα σε έναν πίνακα δεδομένων είναι μια καλή πρακτική όταν πρόκειται για τη διαχείριση δεδομένων γενικά και όχι μόνο όταν ψάχνετε για διπλότυπα δεδομένα. Τα άλλα εργαλεία δεδομένων του Excel - όπως η ταξινόμηση και το φιλτράρισμα - λειτουργούν καλύτερα όταν ο πίνακας δεδομένων είναι ένα συνεχόμενο εύρος δεδομένων.
Καταργήστε το παράδειγμα διπλής καταγραφής δεδομένων
Στην παραπάνω εικόνα, ο πίνακας δεδομένων περιέχει δύο ίδιες εγγραφές για Α. Thompson και δυο μερικώς αντίστοιχες εγγραφές για R. Holt - όπου όλα τα πεδία ταιριάζουν εκτός από τον αριθμό φοιτητή.
Τα παρακάτω βήματα περιγράφουν λεπτομερώς τον τρόπο χρήσης του Κατάργηση διπλότυπων εργαλείο δεδομένων σε:
- Καταργήστε τη δεύτερη από τις δύο πανομοιότυπες εγγραφές για Α. Thompson .
- Καταργήστε τη δεύτερη εγγραφή μερικής αντιστοίχισης για R. Holt .
Ανοίγοντας το πλαίσιο διαλόγου Κατάργηση διπλότυπων
- Κάντε κλικ σε οποιοδήποτε κελί που περιέχει δεδομένα στη βάση δεδομένων δείγματος.
- Κάντε κλικ στο Δεδομένα στην καρτέλα.
- Κάνε κλικ στο Κατάργηση διπλότυπων για να επισημάνετε όλα τα δεδομένα στον πίνακα δεδομένων και για να ανοίξετε το Κατάργηση διπλότυπων κουτί διαλόγου.
- ο Κατάργηση διπλότυπων το παράθυρο διαλόγου εμφανίζει όλες τις επικεφαλίδες στηλών ή τα ονόματα πεδίων από το δείγμα δεδομένων μας
- Τα σύμβολα ελέγχου δίπλα στα ονόματα πεδίων υποδεικνύουν ποιες στήλες το Excel θα προσπαθήσει να ταιριάξει κατά την αναζήτηση διπλών εγγραφών
- Από προεπιλογή, όταν ανοίξει το παράθυρο διαλόγου, όλα τα ονόματα πεδίων έχουν απενεργοποιηθεί
Εύρεση ταυτόσημων αρχείων
- Δεδομένου ότι ψάχνουμε για εντελώς πανομοιότυπες εγγραφές σε αυτό το παράδειγμα, θα αφήσουμε όλες τις επικεφαλίδες της στήλης να ελεγχθούν
- Κάντε κλικ Εντάξει
Σε αυτό το σημείο πρέπει να δούμε τα ακόλουθα αποτελέσματα:
- Το παράθυρο διαλόγου πρέπει να κλείσει και να αντικατασταθεί από ένα μήνυμα που λέει: 1 διπλές τιμές βρέθηκαν και αφαιρέθηκαν. Διατηρούνται 7 μοναδικές τιμές.
- Η σειρά που περιέχει το αντίγραφο Α. Thompson η εγγραφή θα έχει καταργηθεί από τη βάση δεδομένων
- Παρόλο που υπάρχουν δύο εγγραφές που ταιριάζουν μερικά R. Hol t, επειδή δεν συμφωνούν όλα τα πεδία - ο αριθμός φοιτητή για τα δύο αρχεία διαφέρει - το Excel θεωρεί ότι είναι ένα μοναδικό αρχείο δεδομένων
Εντοπίστε και καταργήστε τις εν μέρει αντιστοιχούσες εγγραφές με την κατάργηση διπλότυπων
Έλεγχος ενός πεδίου κάθε φορά
Δεδομένου ότι το Excel αφαιρεί μόνο τις εγγραφές δεδομένων που ταιριάζουν ακριβώς με τα επιλεγμένα πεδία δεδομένων, ο καλύτερος τρόπος για να βρείτε όλες τις εν μέρει αντιστοιχισμένες εγγραφές δεδομένων είναι να αφαιρέσετε το σημάδι ελέγχου μόνο για ένα πεδίο τη φορά, όπως γίνεται στα παρακάτω βήματα.
Οι επακόλουθες αναζητήσεις για αρχεία που ταιριάζουν σε όλα τα πεδία, εκτός από το όνομα, την ηλικία ή το πρόγραμμα, θα αφαιρέσουν όλους τους πιθανούς συνδυασμούς για την μερική αντιστοιχία εγγραφών.
Εύρεση εγγραφών που ταιριάζουν εν μέρει
- Κάντε κλικ σε οποιοδήποτε κελί που περιέχει δεδομένα στον πίνακα δεδομένων, εάν είναι απαραίτητο
- Κάντε κλικ στο Δεδομένα στην καρτέλα.
- Κάνε κλικ στο Κατάργηση διπλότυπων για να επισημάνετε όλα τα δεδομένα στον πίνακα δεδομένων και για να ανοίξετε το Κατάργηση διπλότυπων κουτί διαλόγου.
- Επιλέγονται όλα τα ονόματα πεδίων ή επικεφαλίδες στηλών για τον πίνακα δεδομένων.
- Για να εντοπίσετε και να καταργήσετε αρχεία που δεν έχουν αντιστοιχία σε κάθε πεδίο, καταργήστε το σημάδι ελέγχου εκτός από τα ονόματα πεδίων που πρέπει να αγνοήσει το Excel.
- Για αυτό το παράδειγμα, κάντε κλικ στο πλαίσιο ελέγχου δίπλα στο Αναγνωριστικό σπουδαστών επικεφαλίδα στήλης για να αφαιρέσετε το σημάδι ελέγχου.
- Το Excel θα πραγματοποιήσει μόνο αναζήτηση και κατάργηση εγγραφών που έχουν αντίστοιχα δεδομένα στο Επίθετο , Αρχικός , και Πρόγραμμα πεδία.
- Κάντε κλικ Εντάξει
- Το παράθυρο διαλόγου πρέπει να κλείσει και να αντικατασταθεί από ένα μήνυμα που λέει: 1 διπλές τιμές βρέθηκαν και αφαιρέθηκαν. Διατηρούνται 6 μοναδικές τιμές.
- Η σειρά που περιέχει τη δεύτερη εγγραφή για R. Holt με το αναγνωριστικό φοιτητή του ST348-252 θα έχουν αφαιρεθεί από τη βάση δεδομένων.
- Κάντε κλικ Εντάξει για να κλείσετε το πλαίσιο μηνυμάτων
Σε αυτό το σημείο, ο πίνακας δεδομένων παραδειγμάτων πρέπει να είναι απαλλαγμένος από όλα τα διπλάσια δεδομένα.