Skip to main content

Apa itu penambangan struktur?

Penambangan struktur adalah jenis penambangan data di mana sumber data semi-terstruktur dipindai, dan elemen-elemen strukturnya ditemukan dan disorot.Sumber data semi-terstruktur adalah salah satu yang tidak menggunakan struktur basis data tradisional tabel, tetapi memang memiliki elemen semantik yang memisahkan informasi melalui tag dan penanda.Penambangan struktur dapat digunakan untuk menambang basis data, situs web, dan banyak bentuk informasi komputer lainnya untuk menemukan elemen struktur.Ini membantu pengguna memahami bagaimana potongan berinteraksi satu sama lain atau bagaimana menemukan informasi di bawah tag tertentu.Penambangan ini juga dapat digunakan untuk memprediksi apa item itu, berdasarkan aturan yang ditulis oleh pengguna.

Ada banyak jenis penambangan data, dan sebagian besar berkaitan dengan penambangan sumber yang terstruktur secara tradisional.Ini termasuk sumber apa pun yang menggunakan tabel dan node yang khas dari sebagian besar database.Dalam penambangan struktur, hanya data semi-terstruktur yang digunakan.Dalam hal ini, data berasal dari situs web atau basis data sederhana yang memiliki struktur tetapi tidak sesuai dengan aturan basis data tradisional.Data membutuhkan tag atau penanda yang membedakan setiap item untuk ditambang dengan benar.

Dengan membaca set data semi-terstruktur, penambangan struktur dapat menemukan bagaimana struktur berinteraksi.Misalnya, setiap situs web memiliki model navigasi, dan model inilah yang menentukan bagaimana halaman berinteraksi.Misalnya, jika ada set data buku, pengguna dapat menulis aturan bahwa buku apa pun tanpa indeks harus kembali sebagai fiksi, dan mereka yang memiliki indeks harus kembali sebagai non-fiksi.Sebagian besar buku fiksi tidak memiliki indeks, jadi aturan ini akan memprediksi dengan akurasi tinggi apa data itu.Ini membantu pengguna saat melihat set semi-terstruktur yang memiliki metode organisasi tetapi tidak sesuai dengan apa yang dicari pengguna.

Setelah mencari tahu struktur unit semi-terstruktur, pengguna biasanya akan membandingkannya dengan yang lain dengan yang lainUnit semi-terstruktur.Jika pengguna memiliki situs web bisnis, ia dapat menambang situs web bisnis lain untuk navigasi dan tautan, dan melihat bagaimana situs webnya serupa.Dengan membandingkan informasi yang ditambang, pengguna dapat menemukan cara untuk meningkatkan efisiensi struktur.