Skip to main content

Τι είναι ένα αρχείο κειμένου;

Ένα αρχείο κειμένου είναι ένα αρχείο υπολογιστή που αποθηκεύει ένα δακτυλογραφημένο έγγραφο ως σειρά αλφαριθμητικών χαρακτήρων, συνήθως χωρίς πληροφορίες οπτικής μορφοποίησης.Το περιεχόμενο μπορεί να είναι μια προσωπική σημείωση ή λίστα, ένα άρθρο περιοδικών ή εφημερίδων, ένα βιβλίο ή οποιοδήποτε άλλο κείμενο που μπορεί να γίνει με ακρίβεια σε δακτυλογραφημένη μορφή.Τα αρχεία κειμένου είναι παρόμοια με τα αρχεία επεξεργασίας κειμένου στο ότι το περιεχόμενο και των δύο είναι κυρίως κειμένου.Διαφέρουν σε αυτά τα αρχεία κειμένου συνήθως δεν καταγράφουν πληροφορίες όπως το στυλ και το μέγεθος του χαρακτήρα, η σελιδοποίηση ή άλλες λεπτομέρειες που θα καθορίζουν την εμφάνιση ενός τελικού εγγράφου.Ορισμένα λειτουργικά συστήματα υπολογιστών κάνουν μια βασική διάκριση μεταξύ ενός αρχείου κειμένου, το οποίο προορίζεται να μεταφραστεί απευθείας σε κείμενο αναγνώσιμο από τον άνθρωπο και σε ένα δυαδικό αρχείο, το οποίο ερμηνεύεται απευθείας από τον υπολογιστή.

Στα περισσότερα από τα σχήματα που χρησιμοποιούνται για την κωδικοποίηση κειμένου, κάθε χαρακτήρας έχει εκχωρηθεί μια αριθμητική τιμή, με το κείμενο στη συνέχεια γραμμένο ως μια σειρά δυαδικών αριθμών.Μια οικογένεια σχημάτων κωδικοποίησης, που ονομάζεται Αμερικανός πρότυπος κώδικας για την Information Interchange (ASCII), έγινε ένα ευρέως χρησιμοποιούμενο πρότυπο νωρίς στην ιστορία της πληροφορικής, παρά την κακή υποστήριξή της σε άλλες γλώσσες εκτός από τα αγγλικά.Η οικογένεια κωδικών ISO 8859 έδωσε πολύ καλύτερη υποστήριξη για τις γλώσσες που βασίζονται στο λατινικό αλφάβητο και παρόμοια αλφάβητα, αλλά δεν μπόρεσαν να κωδικοποιήσουν τους χαρακτήρες από τις γλώσσες της Ανατολικής Ασίας, όπως οι Ιάπωνες, οδηγώντας σε πολλαπλασιασμό ασυμβίβαστων προτύπων.το Unicode reg;Η Consortium έχει αναπτύξει ένα σύστημα κωδικοποίησης που ονομάζεται

Unicode reg;Αυτό θα επιτρέψει σε έναν μόνο κωδικό να χρησιμοποιηθεί για κάθε γλώσσα και να επιτρέψει να εμφανιστούν κείμενα από πολλές γλώσσες σε ένα μόνο αρχείο.Το πρώτο τμήμα του Unicode βασίζεται στο ISO 8859, το οποίο βασίζεται στο ASCII.Χρησιμοποιώντας το Unicode reg;μπορεί να έχει πλεονεκτήματα ακόμη και σε αγγλόφωνες χώρες, καθώς το κείμενο που κωδικοποιείται χρησιμοποιώντας παλαιότερα σχήματα μπορεί να εμφανίζει μικρές ασυνέπειες όταν μετακινούνται από σύστημα σε σύστημα.Κιλοβυτά ή megabytes μικρότερα από τα ίδια δεδομένα που είναι αποθηκευμένα σε άλλες μορφές, μπορούν να ανταλλάσσονται ταχέως και μαζικά μέσω ηλεκτρονικού ταχυδρομείου ή δίσκου.Οι περισσότεροι μπορούν να ανοίξουν σε υπολογιστές που εκτελούν διαφορετικά λειτουργικά συστήματα, χρησιμοποιώντας πολύ βασικό λογισμικό.Το κύριο μειονέκτημα είναι η έλλειψη μορφοποίησης.Ένα αρχείο κειμένου μπορεί να είναι μια κακή επιλογή για την εκπροσώπηση ενός εγγράφου που περιέχει εικόνες ή βασίζεται σε στοιχεία σχεδιασμού για να κοινοποιήσει το νόημά του mdash;Ένα αρχείο που περιέχει δεδομένα πίνακα, μαθηματικούς τύπους ή συγκεκριμένη ποίηση, για παράδειγμα.

Τα αρχεία κειμένου προορίζονται γενικά να διαβαστούν και να επεξεργαστούν από τους ανθρώπους, αλλά όχι όλοι περιέχουν περιεχόμενο που είναι κυρίως για ανθρώπινη κατανάλωση.Ο περισσότερος κώδικας προγραμματισμού αποθηκεύεται σε ένα αρχείο κειμένου πριν από την καταρτισμό mdash;δηλαδή, μεταφρασμένο σε ένα δυαδικό αρχείο που μπορεί να διαβάσει μηχανήματα.Τα αρχεία ενδέχεται επίσης να περιέχουν ετικέτες κειμένων με δυνατότητα μηχανής που δίνουν πληροφορίες μορφοποίησης εκτός από το απλό κείμενο.Για παράδειγμα, ένα αρχείο HyperText Markup Language (HTML) μπορεί να ανοίξει ως αρχείο απλού κειμένου σε έναν επεξεργαστή κειμένου ή να εμφανιστεί ως μορφοποιημένη ιστοσελίδα αφού ερμηνεύεται από ένα πρόγραμμα περιήγησης ιστού.Παρόμοια σχήματα περιλαμβάνουν λατέξ, που χρησιμοποιούνται για την τοποθέτηση επιστημονικών εγγράφων και την επεκτάσιμη γλώσσα σήμανσης (XML), που χρησιμοποιείται για τη δομή των δεδομένων.