首页   

Krisp利用AI技术,让印度人在通话中拥有美国口音作者:Iva-20250328130504

宝玉xp  · AI  · 4 天前

正文

2025-03-28 13:05

Krisp利用AI技术,让印度人在通话中拥有美国口音
作者:Ivan Mehta

近日,音频创业公司Krisp发布了一项全新功能,运用人工智能技术,可以在通话过程中实时改变用户的口音。首个上线的功能是将印度英语口音转换成美式英语口音。

据该公司介绍,这种口音转换技术可以保留说话者原有的声音特点,只是将发音中的音素(phonemes)改变为接近美国口音的版本。这项功能已在企业环境中进行过测试,现在以Beta版形式推出,用户只需在桌面端应用上开启功能,即可在通话前或通话中随时启用。

公司联合创始人阿尔托·米纳斯扬(Arto Minasyan)表示,研发这项功能的灵感源于他自身交流中的困扰:“尽管我英语讲得不错,但很多人仍听不懂我的口音。我们认为如果能改变口音,人们之间的交流可能会更加顺畅。我们两年前就开始研发,现在终于以Beta版形式发布了。”

然而,当记者实际测试该功能时,发现处理后的语音听起来并不自然,有时甚至会漏掉一些单词。公司回应称,由于是Beta版本,技术还有待完善,未来会不断改进。

Krisp表示,在企业中进行功能测试后,销售转化率提升了26.1%,每单业务收入增加了14.8%。

该公司表示,首先选择对印度口音进行优化,是因为印度在全球STEM领域(科学、技术、工程和数学)拥有庞大的从业人员群体。未来,公司还将陆续推出更多的口音支持,比如菲律宾口音。

除了Krisp,也有其他公司在开发类似的技术,比如GV投资支持的Sanas,该公司已在多个呼叫中心大规模部署类似的AI功能。

Krisp称他们的模型是在获得用户许可的情况下,通过对数以千计的不同口音和方言的语音样本,以及会议助手工具收集的数据进行训练而成的。

米纳斯扬还指出,这项功能的另一大优势是不需要事先对用户的声音进行预训练,它可以实时创建说话者的语音档案。

Krisp上一次融资是在2021年,目前计划在今年晚些时候发布iOS和安卓版本的应用,以支持面对面的会议场景。此外,公司还计划开发新的Chrome扩展插件,以更好地与Google Meet进行集成。
© 2024 精读
删除内容请联系邮箱 2879853325@qq.com