Speech Style Convert Model

말투를 변환해주는 모델 입니다. gogamza/kobart-base-v2 모델을 korean SmileStyle Dataset을 활용해 fine-tuning 했습니다. 모델은 huggingface에 업로드 되어있습니다.

Model Details

Model Description: Speech style converter model based on gogamza/kobart-base-v2
Developed by: Juhwan, Lee and Jisu, Kim
Model Type: Text-generation
Language: Korean
License: CC-BY-4.0

Dataset

korean SmileStyle Dataset
Randomly split train/valid dataset (9:1)

BLEU Score

25.35

Package

poetry install
poetry shell

Usage

아래와 같은 옵션을 통해 말투를 생성할 수 있습니다.

formal: 문어체
informal: 구어체
android: 안드로이드
azae: 아재
chat: 채팅
choding: 초등학생
emoticon: 이모티콘
enfp: enfp
gentle: 신사
halbae: 할아버지
halmae: 할머니
joongding: 중학생
king: 왕
naruto: 나루토
seonbi: 선비
sosim: 소심한
translator: 번역기

from transformers import pipeline

model = "KoJLabs/bart-speech-style-converter"
tokenizer = AutoTokenizer.from_pretrained(model)

nlg_pipeline = pipeline('text2text-generation',model=model, tokenizer=tokenizer)
styles = ["문어체", "구어체", "안드로이드", "아재", "채팅", "초등학생", "이모티콘", "enfp", "신사", "할아버지", "할머니", "중학생", "왕", "나루토", "선비", "소심한", "번역기"]

for style in styles:
    text = f"{style} 형식으로 변환:오늘은 닭볶음탕을 먹었다. 맛있었다."
    out = nlg_pipeline(text, max_length=100)
    print(style, out[0]['generated_text'])

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
configs		configs
README.md		README.md
dataset.py		dataset.py
inference.ipynb		inference.ipynb
model.py		model.py
poetry.lock		poetry.lock
pyproject.toml		pyproject.toml
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Speech Style Convert Model

Model Details

Dataset

BLEU Score

Package

Usage

About

Releases

Packages

Languages

KoJLabs/speech-style-bart

Folders and files

Latest commit

History

Repository files navigation

Speech Style Convert Model

Model Details

Dataset

BLEU Score

Package

Usage

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages