Semestrální práce k předmětu KKY/ITE, vytvářená v trojčlenných týmech. Cílem této aplikace je fulltextové vyhledávání nad daty získaných z webových stránek. Více informací zde.
Program se skládá ze 2 částí, první částí je webscaping, který prohledá do šířky strom stránek pod stránkou startovní a uloží na disk data potřebná pro část druhou. Druhou částí je samotná webová aplikace sloužící k vyhledávání textu v uložených webových stránkách.
Seznam nadstandartních balíčků nad balíčky 'Anaconda Distribution' nutných k chodu programu je uveden v souboru 'requirements.txt'.
pip install -r requirements.txt
Přes příkazovou řádku se program spouští příkazem > python -m ite
v adresáři programu. Pro více info viz docs.python.org. V případě použití PyCharm IDE spustit soubor __main__.py
. Pro změnu startovní stránky změňte proměnnou 'start_url' v souboru __main__.py
v metodě 'main()' a pro změnu hloubky prohledávání změňte proměnnou 'max_depth' ve stejném souboru a metodě.
Funkčnost aplikace je podmíněna staženými daty (pomocí webscrapping robota). Přes příkazovou řádku se server spouští příkazem > python -m ite.server
v adresáři programu. V případě použití PyCharm IDE spustit soubor server.py
.
Webová aplikace je přístupná pod url localhost:8885
.