Skip to main content

Hàm băm là gì?

Hàm một hàm băm là một phương pháp kiểm tra lỗi máy tính và tổ chức dữ liệu.Một lượng lớn dữ liệu được thao tác với một thuật toán toán học cho đến khi một số lượng nhỏ còn lại.Con số này được sử dụng như một phần của danh mục cho phép máy tính tìm thấy thông tin cụ thể đó sau.Một hàm băm tốt sẽ cho kết quả đủ nhỏ để dễ sử dụng, nhưng cung cấp một kết quả duy nhất cho mỗi bộ dữ liệu.Chức năng băm cũng cung cấp kiểm tra lỗi tối thiểu, vì một phần dữ liệu bị hỏng và một phần dữ liệu tốt sẽ mang lại kết quả khác nhau khi băm. Trong cơ sở dữ liệu máy tính, thường dễ dàng lưu vị trí có số hơn là các chữ cái.Các chữ số có số lượng phương thức lớn hơn nhiều cho tổ chức và sắp xếp so với các chữ cái.Do đó, các số thường được gán cho các vị trí chứa thông tin biến trong cơ sở dữ liệu máy tính.Những con số này có thể là tùy ý hoặc đại diện cho thông tin. Các số tùy ý được chỉ định dựa trên vị trí trong bộ nhớ máy tính hoặc thứ tự dữ liệu được lưu.Lưu thông tin theo cách này là phổ biến trong các cơ sở dữ liệu nhỏ hơn hoặc ở những nơi mà dữ liệu không thay đổi rất thường xuyên.Khi được sử dụng trong các khu vực khác, chỉ mục lại cơ sở dữ liệu bắt đầu mất nhiều thời gian hơn cho đến khi nó không còn hiệu quả nữa. Thông tin đại diện là nơi hàm băm xuất hiện. Thông tin, bất kể nó chứa gì, được dịch thành các số.Những con số này được đưa vào một cấu trúc toán học tạo ra một số nhỏ, thường là một số nguyên.Nếu hàm băm hoạt động đúng, mọi vị trí trong phần đó của cơ sở dữ liệu sẽ có kết quả duy nhất.Nếu hai hoặc nhiều vị trí có cùng một kết quả, các chương trình có thể đưa ra thông tin sai dựa trên hàm băm trùng lặp. Có thể sử dụng hàm băm cho những thứ khác.Một lượng lớn dữ liệu lặp đi lặp lại cao có thể được chia thành các giá trị nhỏ hơn.Điều này đặc biệt tốt khi tìm kiếm các chuỗi lặp đi lặp lại trong các bộ dữ liệu lớn.Ví dụ, axit deoxyribonucleic (DNA) được tạo thành từ một số lượng rất nhỏ các thành phần khác nhau.Khi phá vỡ các thành phần đó bằng cách sử dụng các giá trị băm, các nơi có hai chuỗi DNA giống nhau và khác nhau trở nên rất rõ ràng, chỉ đơn giản là từ việc so sánh hai cột nhỏ của số. Khu vực cuối cùng trong đó các hàm băm rất hữu ích khi kiểm tra lỗi.Khi thông tin được băm ban đầu, giá trị được ghi lại như một phần của chỉ số vị trí.Nếu thông tin đó là cần thiết sau, thông tin được lấy cùng với giá trị đó.Nếu chương trình thử lại thông tin và kết quả là khác nhau, thì tham nhũng xảy ra vào một lúc nào đó.Tham nhũng này thường là với dữ liệu, vì tham nhũng băm sẽ ngăn chặn dữ liệu được truy xuất ngay từ đầu.