Skip to content

KUBDatalab/datasets

Repository files navigation

Datasets

Mindre datasæts tilhørende notebooks.

hca.zip indeholder 15 digitaliserede HC Andersen eventyr. Tekstkvaliteten er perfekt. Sproget er ikke moderniseret.

ft_20151.zip indeholder taler og metadata om talerne fra folketinget år 2015.

stopord.zip indeholder stopordslister til nederlandsk/fransk (be.txt), tysk (de.txt), dansk (dk.txt), engelsk (en.txt), fransk (fr.txt), italiensk (it.txt), portugisisk (pt.txt) og 1800tals dansk (danish_stopwords19c.txt).

About

Mindre datasæts tilhørende notebooks

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published