Meta 发布全新 AI 翻译大模型,实时语音转换不超 2 秒

来源: 巴比特2023-12-22
据站长之家 12 月 22 日报道,Meta 最新发布了一系列 AI 翻译大模型,实现实时语音转换延迟不超过 2 秒,支持多种语言翻译,并具备模仿语气、语速、情感等特征的能力。这一系列模型名为 Seamless Communication,包括 SeamlessExpressive、SeamlessStreaming、SeamlessM4 T v2 和 Seamless,其中前三个已经在 GitHub 上开源。 为确保翻译准确性和避免滥用,Meta 采用了毒性缓解技术,在训练前过滤“有毒内容”并在翻译生成过程中自动检测和调整生成的有毒单词,同时为音频添加了水印以追踪来源。为了防止滥用风险,Meta 还为音频添加了水印,通过在音频中嵌入不可察觉的信号,可以准确追踪音频的来源,并对抗各种攻击手段。
利好利好
0
利空利空
0