Skip to main content

Apa itu stop word?

Dalam aplikasi komputasi dan online, stop word adalah kata yang disaring selama pemrosesan beberapa jenis teks, seperti selama inisiasi pencarian online.Dikenal sebagai salah satu komponen pemrosesan bahasa alami atau NLP, ide di balik jenis penyaringan ini adalah untuk membantu mempercepat pencarian dengan menghilangkan artikel umum dari permintaan.Sebaliknya, mesin pencari menggunakan penanda sederhana untuk mencatat keberadaan kata dalam string teks tetapi tidak mencegah keberadaan penanda itu memasukkan halaman itu dalam hasil pencarian.

Salah satu cara untuk memahami bagaimana kata berhenti dapat memperumit fungsi mesin pencari adalah dengan mempertimbangkan fakta bahwa ketika melakukan pencarian, mesin akan mempertimbangkan setiap kata yang termasuk dalam permintaan pencarian yang diajukan oleh pengguna.Sebagai bagian dari pertimbangan itu, mesin mencari halaman yang berisi setiap kata.Itu berarti jika permintaan pencarian berisi tiga kata, mesin membuat tiga sapuan internet, akhirnya memberikan prioritas pada halaman yang mencakup ketiga kata.

Misalnya, pencarian seperti "The House on the Hill" akan membutuhkan mesin untuk melakukan pencarian pada setiap kata dalam urutan, dengan beberapa bahkan menjalankan pencarian pada kata berhenti "the" dua kali.Ini memakan waktu dan sumber daya yang dapat dialihkan untuk membantu dalam pencarian kata kunci lain yang sedang dilakukan pengguna akhir lainnya.Dengan menggunakan penanda untuk menggantikan "The" dan "ON" selama pencarian, mesin dapat mencurahkan lebih sedikit sumber daya dan masih mengembalikan hasil yang sangat mungkin memuaskan pengguna akhir.

Sementara kata berhenti kadang -kadang disebut sebagai

kata racun , benar -benar tidak ada yang salah dengan memasukkan artikel pidato dalam teks yang digunakan untuk melakukan pencarian.Penggunaan kata -kata atau kata -kata sebagai bagian dari permintaan pencarian dapat memperumit proses pengindeksan mesin pencari ketika mencoba mengambil data yang memenuhi kriteria pencarian.Namun, pengguna akhir tidak mungkin melihat banyak perbedaan dalam ekstraksi informasi yang pada akhirnya dikembalikan.

Tidak ada daftar kata berhenti yang keras dan cepat yang digunakan secara universal oleh semua mesin pencari.Bahkan, beberapa mesin pencari tidak menggunakan daftar kata stop apa pun sebagai bagian dari tugas pemrosesan bahasa alami sama sekali.Mesin lain, bagaimanapun, akan memanfaatkan daftar kata stop sebagai cara mengalokasikan sumber daya dengan cara yang lebih efisien, sambil tetap mengembalikan hasil mesin pencari yang akurat dan cenderung sangat tepat untuk permintaan pencarian yang dikirimkan oleh siapa pun yang menggunakan tertentumesin.