Skip to main content

Tệp văn bản là gì?

Tệp văn bản là một tệp máy tính lưu trữ một tài liệu được đánh máy dưới dạng một loạt các ký tự chữ và số, thường không có thông tin định dạng trực quan.Nội dung có thể là một ghi chú cá nhân hoặc danh sách, một bài báo hoặc bài báo, một cuốn sách hoặc bất kỳ văn bản nào khác có thể được hiển thị chính xác ở dạng đánh máy.Các tệp văn bản tương tự như các tệp xử lý văn bản ở chỗ nội dung của cả hai chủ yếu là văn bản;Chúng khác nhau ở những tệp văn bản thường không ghi lại thông tin như kiểu và kích thước ký tự, phân trang hoặc các chi tiết khác sẽ chỉ định sự xuất hiện của một tài liệu đã hoàn thành.Một số hệ điều hành máy tính tạo ra sự khác biệt cơ bản giữa một tệp văn bản, được dự định sẽ được dịch trực tiếp thành văn bản có thể đọc được của con người và một tệp nhị phân, được giải thích trực tiếp bởi máy tính. Trong hầu hết các sơ đồ được sử dụng để mã hóa văn bản, mỗi ký tự được gán một giá trị số, với văn bản sau đó được viết dưới dạng một chuỗi các số nhị phân.Một gia đình của các chương trình mã hóa, được gọi là mã tiêu chuẩn của Mỹ để trao đổi thông tin (ASCII), đã trở thành một tiêu chuẩn được sử dụng rộng rãi ngay từ đầu lịch sử điện toán, mặc dù sự hỗ trợ kém cho các ngôn ngữ khác ngoài tiếng Anh.Họ mã ISO 8859 đã hỗ trợ tốt hơn nhiều cho các ngôn ngữ dựa trên bảng chữ cái Latin và bảng chữ cái tương tự, nhưng không thể mã hóa các ký tự từ các ngôn ngữ Đông Á như tiếng Nhật, dẫn đến sự phát triển của các tiêu chuẩn không tương thích.Unicode Consortium đã phát triển một hệ thống mã hóa gọi là

unicode reg; có mục tiêu gán một số duy nhất cho mọi nhân vật được sử dụng trong mọi ngôn ngữ trên trái đất.Điều này sẽ cho phép một mã duy nhất được sử dụng cho mọi ngôn ngữ và cho phép các văn bản từ nhiều ngôn ngữ xuất hiện trong một tệp.Phần đầu tiên của Unicode dựa trên ISO 8859, chính nó dựa trên ASCII.Sử dụng Unicode Có thể có lợi thế ngay cả ở các quốc gia nói tiếng Anh, vì văn bản được mã hóa bằng các sơ đồ cũ có thể hiển thị sự không nhất quán nhỏ khi được chuyển từ hệ thống này sang hệ thống khác. Ưu điểm của các tệp văn bản bao gồm kích thước nhỏ và tính linh hoạt.Kilobyte hoặc megabyte nhỏ hơn cùng một dữ liệu được lưu trữ ở các định dạng khác, chúng có thể được trao đổi nhanh chóng và ồ ạt qua email hoặc đĩa.Hầu hết có thể được mở trên các máy tính chạy các hệ điều hành đa dạng, sử dụng phần mềm rất cơ bản.Nhược điểm chính là thiếu định dạng.Một tệp văn bản có thể là một lựa chọn kém để đại diện cho một tài liệu chứa hình ảnh hoặc dựa vào các yếu tố thiết kế để truyền đạt ý nghĩa của nó mdash;Một tệp chứa dữ liệu dạng bảng, công thức toán học hoặc thơ cụ thể, ví dụ. Các tệp văn bản thường được sử dụng và chỉnh sửa bởi con người, nhưng không phải tất cả chúng đều chứa nội dung chủ yếu cho con người.Hầu hết các mã lập trình được lưu trữ trong một tệp văn bản trước khi được biên dịch mdash;Đó là, được dịch thành một tệp nhị phân có thể đọc được bằng máy.Các tệp cũng có thể chứa các thẻ văn bản có thể đọc được bằng máy cung cấp thông tin định dạng ngoài văn bản thuần túy.Chẳng hạn, tệp ngôn ngữ đánh dấu siêu văn bản (HTML) có thể được mở dưới dạng tệp văn bản đơn giản trong trình soạn thảo văn bản hoặc hiển thị dưới dạng trang web được định dạng sau khi được trình duyệt web diễn giải.Các sơ đồ tương tự bao gồm latex, được sử dụng để đưa ra các bài báo khoa học và ngôn ngữ đánh dấu mở rộng (XML), được sử dụng để cấu trúc dữ liệu.