hierarchical-nmf-python

fork of https://github.com/rudvlf0413/hierarchical-nmf-python
with familiar SKLearn interface

Installation

pip install hnmf

Usage

20 Newsgroups

from sklearn.datasets import fetch_20newsgroups
from sklearn.feature_extraction.text import TfidfVectorizer
from hnmf.model import HierarchicalNMF

n_features = 1000
n_leaves = 20

data, _ = fetch_20newsgroups(shuffle=True, random_state=1,
                             remove=('headers', 'footers', 'quotes'),
                             return_X_y=True)


# Use tf-idf features for NMF.
tfidf = TfidfVectorizer(max_df=0.95, min_df=2,
                                   max_features=n_features,
                                   stop_words='english')

X = tfidf.fit_transform(data)
id2feature = {i: token for i, token in enumerate(tfidf.get_feature_names_out())}

# hNMF
model = HierarchicalNMF(k=n_leaves)
model.fit(X)
model.cluster_features(id2feature=id2feature)

Reference

Papers: Fast rank-2 nonnegative matrix factorization for hierarchical document clustering
Original version of codes (matlab): https://github.com/dakuang/hiernmf2

Name		Name	Last commit message	Last commit date
Latest commit History 101 Commits
docs		docs
docs_		docs_
hnmf		hnmf
tests		tests
.gitattributes		.gitattributes
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
MANIFEST.in		MANIFEST.in
README.md		README.md
requirements.dev.txt		requirements.dev.txt
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

hierarchical-nmf-python

Installation

Usage

20 Newsgroups

Reference

About

Releases

Packages

Languages

estasney/hNMF

Folders and files

Latest commit

History

Repository files navigation

hierarchical-nmf-python

Installation

Usage

20 Newsgroups

Reference

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages