论文标题

俄罗斯文本用Levenshtein编辑排毒

Russian Texts Detoxification with Levenshtein Editing

论文作者

Gusev, Ilya

论文摘要

文本排毒是创建中性版本的有毒文本的样式转移任务。在本文中,我们使用文本编辑的概念来使用平行的俄罗斯文本语料库构建基于两步标记的排毒模型。通过此模型,我们在Russe排毒共享任务中所有模型中达到了最佳样式转移精度,超过了更大的序列到序列模型。

Text detoxification is a style transfer task of creating neutral versions of toxic texts. In this paper, we use the concept of text editing to build a two-step tagging-based detoxification model using a parallel corpus of Russian texts. With this model, we achieved the best style transfer accuracy among all models in the RUSSE Detox shared task, surpassing larger sequence-to-sequence models.

扫码加入交流群

加入微信交流群

微信交流群二维码

扫码加入学术交流群,获取更多资源