Skip to main content

Nhận dạng mẫu là gì?

Nhận dạng mẫu là khả năng của một hệ thống để nhận ra các mẫu trong các tập dữ liệu, dựa vào kiến thức được lập trình cũng như học.Đây là một phần quan trọng của khoa học máy tính, bởi vì nó cho phép phát triển các hệ thống có khả năng phân tích dữ liệu phức tạp.Điều này có thể giúp các nhà nghiên cứu sắp xếp dữ liệu nhanh chóng để tìm thông tin có ý nghĩa, bởi vì chúng không cần phải đọc thủ công qua dữ liệu để tìm điểm quan tâm.Nhận dạng mẫu cũng có thể hữu ích cho việc phát hiện lỗi, gian lận và các vấn đề khác trong các bộ dữ liệu. Điều này khác với khớp mẫu, trong đó hệ thống có thể khớp chính xác với các tài liệu bằng cách sử dụng cơ sở dữ liệu đã biết.Một ví dụ rõ ràng về sự khác biệt này có thể được nhìn thấy trong các bộ lọc email.Nhiều tài khoản email dựa trên web đi kèm với một thư mục thư rác.Nhà cung cấp email quét thư đến và sử dụng nhận dạng mẫu để xác định thư rác và thả nó vào thư mục này.Người dùng cũng có thể lọc email của mình, yêu cầu khách hàng gửi email từ một người gửi cụ thể hoặc có nội dung cụ thể vào một thư mục cụ thể. Hành động kiểm tra thư rác đòi hỏi khả năng nhận biết các mẫu chung, chẳng hạn nhưCác từ cụ thể, địa chỉ giao thức Internet đáng ngờ (IP) được biết đến và các cờ đỏ khác có thể đánh dấu một chữ cái là giả.Điều này nâng cao hơn một bộ lọc, đơn giản là yêu cầu hệ thống khớp với các mẫu.Nếu hệ thống nhìn thấy một từ hoặc người gửi phù hợp với mẫu, nó có thể di chuyển email đến thư mục thích hợp.

Các thuật toán phức tạp hỗ trợ nhận dạng mẫu.Hệ thống có thể sử dụng một số phương tiện để khám phá dữ liệu đến và quyết định cách xử lý nó tốt nhất.Nó có thể được lập trình để thực hiện các chức năng cụ thể, chẳng hạn như định tuyến dữ liệu đáng ngờ hoặc tham nhũng đến một vị trí cụ thể, phân loại dữ liệu một cách có ý nghĩa và vv.Hệ thống này có khả năng học và sử dụng điều này như một công cụ để nhận được nhận dạng mẫu tốt hơn.Ví dụ, mỗi khi người dùng đánh dấu email là thư rác, hệ thống sẽ quét email để tìm hiểu thêm về nó và hệ thống sẽ không tiếp tục mắc lỗi khi đặt các email tương tự vào hộp thư đến. Các nhà khoa học máy tính phát triển các kỹ thuật nhận dạng mẫu mớitrong phòng thí nghiệm và môi trường nghiên cứu.Chúng có thể được áp dụng cho một loạt các nhiệm vụ và yêu cầu xây dựng các mạng thần kinh có khả năng tương tác với dữ liệu và thay đổi theo thời gian.Một số chương trình cực kỳ tinh vi và có khả năng nhận dạng mẫu rất chi tiết, và một số khác là đơn giản hơn.Các chương trình như vậy cắt giảm số giờ của con người cần thiết để phân tích dữ liệu và có thể bắt được những thứ mà con người có thể bỏ lỡ, chẳng hạn như bằng chứng gian lận dưới dạng bất thường kéo dài hàng ngàn yêu cầu bảo hiểm.