Skip to main content

Co je to zastávky?

Při výpočetních a online aplikacích je slovo stop slovo, které se filtruje během zpracování nějakého typu textu, například během zahájení vyhledávání online.Myšlenkou tohoto typu filtrování, známá jako jedna složka zpracování přirozeného jazyka nebo NLP, je pomoci urychlit vyhledávání vynecháním společných řečových článků z žádosti.Místo toho vyhledávač používá jednoduchý značka k zaznamenávání přítomnosti slova v textovém řetězci, ale nebrání přítomnosti této značky v zahrnutí této stránky do výsledků vyhledávání.

Jedním ze způsobů, jak porozumět tomu, jak mohou slova zastavení komplikovat funkci vyhledávačů, je zvážit skutečnost, že při provádění vyhledávání motor zváží každé slovo, které je zahrnuto do požadavku na vyhledávání předložené uživatelem.V rámci této úvahy motor hledá stránky obsahující každé slovo.To znamená, že pokud požadavek na vyhledávání obsahuje tři slova, motor vytváří tři zametání internetu a nakonec upřednostňuje stránky, které obsahují všechna tři slova.

Například vyhledávání, jako je „Dům na kopci“, by vyžadovalo, aby motor prohledal každé slovo v sekvenci, přičemž některé dokonce dvakrát probíhaly vyhledáváním na stop „The“.To vyžaduje čas a zdroje, které by mohly být odkloněny k pomoci při jiných vyhledáváních klíčových slov, které ostatní koncoví uživatelé v současné době provádějí.Použitím značek k nahrazení „the“ a „on“ může během vyhledávání motor věnovat méně zdrojů a stále vrátit výsledky, které je vysoce pravděpodobné, že koncového uživatele uspokojí.

Zatímco Stop Slovo je někdy označováno jako

Poison Word , ve skutečnosti není nic špatného zahrnutí článků řeči do textu používaného pro provádění vyhledávání.Použití slova nebo slov v rámci žádosti o vyhledávání může komplikovat proces indexování vyhledávače při pokusu o načtení dat, která splňují kritéria vyhledávání.Přesto koncový uživatel pravděpodobně nebude vidět velký rozdíl v extrakci informací, která se nakonec vrátí.

Neexistuje žádný těžký a rychlý výpis slov, který všeobecně používají všechny vyhledávače.Ve skutečnosti některé vyhledávače nepoužívají žádný typ seznamu Stop Word jako součást úkolu zpracování přirozeného jazyka.Jiné motory však budou zcela využívat seznam stop slov jako prostředek k přidělování zdrojů efektivnějším způsobem, přičemž stále vracejí výsledky vyhledávače, které jsou přesné a pravděpodobně budou velmi vhodné pro žádosti o vyhledávání, které někdo, kdo používá konkrétnímotor.