ไฟล์ข้อความคืออะไร?

ไฟล์ข้อความเป็นไฟล์คอมพิวเตอร์ที่เก็บเอกสารที่พิมพ์ไว้เป็นชุดของตัวอักษรและตัวเลขโดยปกติจะไม่มีข้อมูลการจัดรูปแบบภาพ เนื้อหาอาจเป็นบันทึกส่วนตัวหรือรายการบทความวารสารหรือหนังสือพิมพ์หนังสือหรือข้อความอื่น ๆ ที่สามารถแสดงผลได้อย่างถูกต้องในรูปแบบเครื่องพิมพ์ดีด ไฟล์ข้อความคล้ายกับไฟล์ประมวลผลคำโดยที่เนื้อหาของทั้งคู่เป็นข้อความหลัก พวกเขาแตกต่างกันในไฟล์ข้อความที่มักจะไม่บันทึกข้อมูลเช่นลักษณะตัวอักษรและขนาดการแบ่งหน้าหรือรายละเอียดอื่น ๆ ที่จะระบุลักษณะที่ปรากฏของเอกสารเสร็จ ระบบปฏิบัติการคอมพิวเตอร์บางระบบสร้างความแตกต่างพื้นฐานระหว่างไฟล์ข้อความซึ่งมีจุดประสงค์ที่จะแปลโดยตรงเป็นข้อความที่มนุษย์อ่านได้และไฟล์ไบนารีซึ่งคอมพิวเตอร์ตีความโดยตรง

ในโครงร่างส่วนใหญ่ที่ใช้ในการเข้ารหัสข้อความอักขระแต่ละตัวจะถูกกำหนดค่าตัวเลขโดยข้อความจะถูกเขียนเป็นสตริงของเลขฐานสอง ตระกูลหนึ่งของแผนการเข้ารหัสเรียกว่า American Standard Code สำหรับการแลกเปลี่ยนข้อมูล (ASCII) กลายเป็นมาตรฐานที่ใช้กันอย่างแพร่หลายในช่วงต้นของประวัติศาสตร์ของการคำนวณแม้จะได้รับการสนับสนุนที่ไม่ดีสำหรับภาษาอื่นที่ไม่ใช่ภาษาอังกฤษ รหัสในตระกูล ISO 8859 นั้นให้การสนับสนุนที่ดีกว่ามากสำหรับภาษาที่ใช้ตัวอักษรละตินและตัวอักษรที่คล้ายกัน แต่ไม่สามารถเข้ารหัสอักขระจากภาษาเอเชียตะวันออกเช่นญี่ปุ่นซึ่งนำไปสู่การแพร่กระจายของมาตรฐานที่เข้ากันไม่ได้

เมื่อไม่นานมานี้Unicode® Consortium ได้พัฒนาระบบการเข้ารหัสที่เรียกว่า Unicode® ที่มีเป้าหมายในการกำหนดหมายเลขเฉพาะให้กับตัวละครทุกตัวที่ใช้ในทุกภาษาบนโลก การทำเช่นนี้จะอนุญาตให้ใช้รหัสเดียวสำหรับทุกภาษาและอนุญาตให้ข้อความจากหลายภาษาปรากฏในไฟล์เดียว ส่วนแรกของ Unicode ขึ้นอยู่กับ ISO 8859 ซึ่งเป็นพื้นฐานของ ASCII การใช้Unicode®อาจมีข้อได้เปรียบแม้ในประเทศที่พูดภาษาอังกฤษเนื่องจากข้อความที่เข้ารหัสโดยใช้แบบแผนเก่าอาจแสดงความไม่สอดคล้องเล็กน้อยเมื่อถูกย้ายจากระบบหนึ่งไปอีกระบบ

ข้อดีของไฟล์ข้อความประกอบด้วยขนาดเล็กและความสามารถรอบด้าน กิโลไบต์หรือเมกะไบต์ที่เล็กกว่าข้อมูลเดียวกันที่จัดเก็บในรูปแบบอื่น ๆ สามารถแลกเปลี่ยนได้อย่างรวดเร็วและหนาแน่นผ่านอีเมลหรือดิสก์ ส่วนใหญ่สามารถเปิดได้ในคอมพิวเตอร์ที่ใช้ระบบปฏิบัติการที่หลากหลายโดยใช้ซอฟต์แวร์พื้นฐานมาก ข้อเสียเปรียบหลักคือการขาดการจัดรูปแบบ ไฟล์ข้อความอาจเป็นทางเลือกที่ไม่ดีสำหรับการแสดงเอกสารที่มีรูปภาพหรือที่อาศัยองค์ประกอบการออกแบบเพื่อสื่อสารความหมายของมัน - ไฟล์ที่มีข้อมูลแบบตารางสูตรทางคณิตศาสตร์หรือบทกวีที่เป็นรูปธรรม

โดยทั่วไปแล้วไฟล์ข้อความมีวัตถุประสงค์เพื่อให้มนุษย์สามารถอ่านและแก้ไข แต่ไม่ทั้งหมดมีเนื้อหาที่มีวัตถุประสงค์เพื่อการบริโภคของมนุษย์เป็นหลัก รหัสการเขียนโปรแกรมส่วนใหญ่จะถูกเก็บไว้ในไฟล์ข้อความก่อนที่จะรวบรวม - นั่นคือแปลเป็นไฟล์ไบนารีที่เครื่องอ่านได้ ไฟล์อาจมีแท็กข้อความที่เครื่องอ่านได้ซึ่งให้ข้อมูลการจัดรูปแบบเพิ่มเติมจากข้อความธรรมดา ตัวอย่างเช่นไฟล์ Hypertext Markup Language (HTML) สามารถเปิดเป็นไฟล์ข้อความธรรมดาในโปรแกรมแก้ไขข้อความหรือแสดงเป็นหน้าเว็บที่จัดรูปแบบหลังจากที่ถูกตีความโดยเว็บเบราว์เซอร์ แผนการที่คล้ายกัน ได้แก่ LaTeX ใช้สำหรับจัดเค้าโครงเอกสารทางวิทยาศาสตร์และ Extensible Markup Language (XML) ใช้สำหรับจัดโครงสร้างข้อมูล