Russian STT Text Normalization
Russian text normalization pipeline for speech-to-text and other applications based on tagging s2s networks.
Requirements
pip install torch
pip install tqdm
Usage
from normalizer import Normalizer
text = 'С 12.01.1943 г. площадь сельсовета — 1785,5 га.'
norm = Normalizer()
result = norm.norm_text(text)
print(result)
>>> С двенадцатого января тысяча девятьсот сорок третьего года площадь сельсовета
>>> — тысяча семьсот восемьдесят пять целых и пять десятых гектара