Bp 15 cz

Z DCEwiki
Skočit na navigaci Skočit na vyhledávání

Kontextové prehľadávanie textu

Autor: Biroščák Rastislav

Bakalářské práce 2006

Stáhnout práci v PDF

15img.gif

V tejto bakalárskej práci sa zaoberáme IR (Information Retrieval) systémami, presnejšie TR (Text Retrieval) z hľadiska indexácie a vyhľadávania vo väčšom množstve dokumentov, za účelom rýchleho vyhľadávania v texte z kolekcie dokumentov. Uvádzame prehľad metód, ktoré sa používajú pri spracovaní textu dokumentov z dôvodu rýchleho vyhľadávania.

Pri návrhu IR systému sme použili knižnicu DotLucene pre C# ( port Java Lucene open-source projekt z dielne Jakarta Apache). Výsledkom návrhu vznikol vyhľadávaci nástroj, vytvarajúci Lucene index. Ten je možno zdielať so všetkými vyhľadávacími nástrojmi založenými na ktoromkoľvek porte Lucene API.

Bp 2006 biroscak rastislav.pdf