Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

juristische Gesetzesangaben #65

Open
T-o-m-H-u opened this issue Jun 12, 2024 · 4 comments
Open

juristische Gesetzesangaben #65

T-o-m-H-u opened this issue Jun 12, 2024 · 4 comments

Comments

@T-o-m-H-u
Copy link

Juristische Gestzesangaben funktionieren gar nicht, ein Satz wird dabei unkenntlich. Könnte man das ins Trainingsprogramm aufnehmen?

Schon einfach Dinge: "§ 177 Abs. 1 Nr. 3 i. V. m. § 174 Abs. 1 Satz 3 und Abs. 5 TKG" sind dem Modell offenbar völlig unbekannt.

@domcross
Copy link

Da würde ich eine Vorverarbeitung empfehlen, die für den Jura-Kontext spezifisch die Abkürzungen in ausgeschriebenen Klartext "übersetzt":

Paragraph einhundertsiebenundsiebzig Absatz eins Nummer drei in Verbindung mit Paragraph einhundertvierundsiebzig Absatz eins Satz drei und Absatz fünf Telekommunikationsgesetz

@thorstenMueller
Copy link
Owner

Hallo @T-o-m-H-u 👋,

ich würde es machen, wie @domcross vorgeschlagen hat. Solche spezifischen Abkürzungen und Begriffe am besten im Vorfeld in die ausgeschriebene Langform umwandeln und dann erst sprechen lassen.

Ggf. hilft dir dieses Projekt dafür etwas weiter: https://github.com/repodiac/german_transliterate

@T-o-m-H-u
Copy link
Author

Danke, ich habe angefangen Abkürzungen in einem .dic für piper zu sammeln. Den Weg über python will ich nicht gehen, weil es einfach über speech-dispatcher funktionieren soll.
Ein Problem sind dort noch Ordnungszahlen. Gibt es für das .dic Format eine formelle Dokumentation?

@thorstenMueller
Copy link
Owner

Welches .dic Format meinst du denn genau? Ich habe mal ein Video dazu gemacht, wie du das eSpeak Dictionary anpassen kannst um die Aussprache zu verändern. Meinst Du sowas?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants