对他们来说,这只是没有意义。 他能说流利的英语和西班牙语,非常友好,是系统工程方面的专家。 为什么他不能在呼叫中心找到一份工作?
这位朋友说,他的口音让很多客户难以理解; 有些人甚至因为他说话的方式而辱骂。
这三个学生意识到问题比他们朋友的经历还要大。 所以他们成立了一家初创公司来解决这个问题。
现在,他们的公司 Sanas 正在测试基于人工智能的软件,该软件旨在通过实时改变人们的口音来消除误解。 例如,菲律宾的呼叫中心工作人员通常可以对着麦克风讲话,但最终看起来就像是从 KS 到另一端的客户。
这家初创公司的创始人说,呼叫中心只是一个开始。 该公司的网站将其计划描述为“重新构想的谈话”。
最终,他们希望他们开发的应用程序 它们将被各种行业和个人使用。 他们说,这可能有助于医生更好地了解患者,或者帮助孙辈更好地了解他们的祖父母。
“我们对 Sanas 有一个非常大的愿景,”首席执行官 Maxim Serebryakov 说。
对于 Serebryakov 和他的联合创始人来说,这个项目是个人的。
你听不到别人的声音,听不到他们的口音
Sanas的三人在斯坦福大学相识,但他们原本都来自不同的国家——Serebryakov,现任CEO,来自俄罗斯; Andrés Pérez Sodiri,现任首席财务官,来自委内瑞拉。 以及来自中国的现任首席技术官张顺。
他们不再是斯坦福大学的学生。 谢列布里亚科夫和佩雷斯毕业; Chang退出,专注于让萨纳斯起死回生。
他们去年成立了这家公司,给它取了一个可以用不同语言轻松发音的名字,“以突出我们将人们聚集在一起的全球使命和愿望,”佩雷斯说。
多年来,这三个人都说他们已经尝试过方言是如何妨碍他们的。
“我们都来自国际背景,”Serebryakov 说,“我们亲眼目睹了人们如何仅仅因为你说话的方式而区别对待你。” “有时令人心碎。”
张说,他的母亲 20 多年前从中国来到美国,当他们一起去杂货店购物时,她仍然让他和收银员说话,因为她觉得很尴尬。
“这就是我加入 Max 和 Andres 建立这家公司的原因之一,并试图帮助那些认为自己的声音不像他们的口音那么容易被听到的人,”他说。
Serebryakov 说,他亲眼目睹了他的父母在美国探望他时在旅馆里的待遇——人们在听到他们的口音时是如何做出假设的。
“他们说话的声音有点大,”他说,“他们改变了自己的行为。”
佩雷斯说,在上完一所英国学校后,他刚到美国时就很难理解美国方言。
并且不要开始谈论当他的父亲试图使用他家人在圣诞节时送给他的亚马逊 Alexa 时会发生什么。
“我们很快发现,当 Alexa 在房子里随机的地方打开灯并让它们变成粉红色时,Alexa 根本听不懂我爸爸的口音,”佩雷斯说。
呼叫中心正在测试技术
这为帮助用户练习英语发音的应用创造了一个不断增长的市场。 但萨纳斯正在使用人工智能采取不同的方法。
前提:技术可以为您做到,而不是学习不同的发音。 不再需要昂贵或耗时的培训来减少口音。 并且领悟几乎是瞬间的。
Serebryakov 说,他知道人们的方言和身份可以密切相关,并强调公司并没有试图消除方言,或者暗示一种说话方式比另一种更好。
“我们允许人们不必为了占据职位和工作而改变他们的说话方式。身份和方言至关重要。它们是相互交织的,”他说。 “你永远不希望有人为了取悦某人而改变语气。”
Sanas 的算法目前可以将英语与美国、澳大利亚、英国、菲律宾、印地语和西班牙方言相互转换,该团队计划增加更多。 他们可以通过使用专业演员的录音和其他数据训练神经网络,为系统添加新的基调——这一过程需要数周时间。
Sanas 团队播放了两个 CNN 节目。 其中一个是一个印度口音的男人正在阅读一系列文学句子。 这些相同的短语然后被转换成美国方言:
另一个在呼叫中心设置中可能更常见的短语示例,例如“如果您给我您的全名和订单号,我们可以继续为您进行更正。”
带有美国口音的结果听起来有些人为和综合,就像 Siri 和 Alexa 等虚拟助手的声音一样,但佩雷斯表示,该团队正在努力改进技术。
“语气会改变,但语调被保留下来,”他说。 “我们将继续致力于如何使结果尽可能自然、情绪化和令人兴奋。”
佩雷斯说,尝试过这项技术的呼叫中心的早期反馈是积极的。 因此,随着有关他们项目的消息传开,请在他们的网站上提交评论。
创业公司的创始人如何看待它的未来
这使得 Sanas 能够增加其员工数量。 Palo Alto 位于加利福尼亚的大部分员工都来自国际背景。 Serebryakov 说,这并非巧合。
“我们正在建造的东西引起了很多人的共鸣,甚至是我们雇用的人……看到它真的很令人兴奋,”他说。
随着公司的发展壮大,可能需要一段时间 Sanas 才会出现在 App Store 中或出现在您附近的手机上。
该团队表示,他们目前正在与最大的呼叫中心外包公司合作,并为个人用户选择较慢的部署,以便他们改进技术并确保安全。
但他们最终希望任何需要它的人都能使用它——在其他领域也是如此。
Perez 设想它在帮助人们与医生建立联系方面发挥重要作用。
他说:“由于时间损失或错误信息造成的误解而造成的任何一秒损失都可能产生非常大的影响。” “我们真的想确保在翻译过程中不会丢失任何东西。”
他说,有一天,它还可以帮助人们学习语言、改进电影配音,并帮助家庭中的智能扬声器和汽车中的语音助手理解不同的方言。
而且不仅是英语——Sanas 团队还希望在算法中加入其他语言。
三位创始人仍在研究细节。 但他们说,这项技术在未来如何使连接变得更好,这是很容易理解的。
More Stories
Android 15/One UI 7 正在针对 Galaxy A53、A54 等进行测试
《Helldivers 2》的重大更新招致了负面评价,而且玩家数量并未增加一倍
据报道,谷歌 Pixel 9 将获得一些新的 Gemini AI 功能