HF Space #10

Samoed · 2024-06-17T15:34:22Z

Решил сделать отдельное issue для обсуждения leaderboard (из #9).

Я посмотрел как делает MTEB и они собирают evaluation metrics, которые хранятся в readme.md у каждой модели отдельно (например Alibaba-NLP/gte-Qwen2-7B-instruct), поэтому не думаю что получится подтягивать информацию о метриках. Пока можно просто какую-то мета-информамцию только получать о моделях.

Документация по evaluation metrics. Как запускать MTEB. Как метрики создаются в MTEB. Можно сделать по аналогии (генерировать yaml для каждой метрики), чтобы можно было сразу на карточку модели добавить.

Samoed · 2024-06-19T17:45:54Z

@avidale Если тебе это интересно, то могу попробовать добавить такую генерацию метрик

avidale · 2024-06-20T09:24:31Z

Мне это не супер интересно, потому что в целом я скорее подумываю вообще закопать бенчмарк Encodechka как самостоятельную сущность, встроив его напрямую в MTEB.

Samoed · 2024-06-20T10:20:40Z

Да, там на mteb есть конфиг для теста русского языка, но его использования кем-то я не нашел

Samoed · 2024-06-20T11:43:59Z

Сейчас как раз активно начинают развивать русский язык там из Салюта embeddings-benchmark/mteb#815 embeddings-benchmark/mteb#962

avidale · 2024-07-25T09:28:27Z

В принципе, ruMTEB выехал (https://habr.com/ru/companies/sberdevices/articles/831150/), и Энкодечку можно с читсой совестью закапывать :)

Samoed · 2024-07-25T09:58:09Z

Скоро еще лидиерборд сделаю для русского, чтобы пользоваться можно было

Samoed · 2024-07-28T22:22:32Z

embeddings-benchmark/leaderboard#21

Samoed · 2024-08-07T07:06:18Z

Теперь добавили https://huggingface.co/spaces/mteb/leaderboard

Samoed closed this as completed Aug 7, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

HF Space #10

HF Space #10

Samoed commented Jun 17, 2024 •

edited

Loading

Samoed commented Jun 19, 2024

avidale commented Jun 20, 2024

Samoed commented Jun 20, 2024 •

edited

Loading

Samoed commented Jun 20, 2024

avidale commented Jul 25, 2024

Samoed commented Jul 25, 2024

Samoed commented Jul 28, 2024

Samoed commented Aug 7, 2024

HF Space #10

HF Space #10

Comments

Samoed commented Jun 17, 2024 • edited Loading

Samoed commented Jun 19, 2024

avidale commented Jun 20, 2024

Samoed commented Jun 20, 2024 • edited Loading

Samoed commented Jun 20, 2024

avidale commented Jul 25, 2024

Samoed commented Jul 25, 2024

Samoed commented Jul 28, 2024

Samoed commented Aug 7, 2024

Samoed commented Jun 17, 2024 •

edited

Loading

Samoed commented Jun 20, 2024 •

edited

Loading