手机版

让失语人士“找回声音”,苹果的新短片不止是秀技术

2023-12-04 11:01:59
380

在略带迷雾的丛林当中,一位小女孩迷茫地矗立在树从底部。她失去了自己的“声音”,并且正不只如何是好。此时,一位高大的、友善的、毛茸茸的生物出现了,它以独特、平和的声调开口,安慰了女孩,并表示自己可以帮助她来寻找失去的声音。

在这之后,“两人”便开始了他们的探寻之旅,从树林到高原,再到狂暴的大海……冒险的环境在不断改变,但双方始终相互扶持,直到最后被卷上荒凉的滩涂。当女孩陷入失望的情绪中时,毛茸茸的大朋友温柔地搂住了她,并轻声安慰到,“看起来你有很多想说的……别担心,我们一定还有办法的。”

此时镜头一转,原来一切的故事都是一位慈祥的老者,在为他的孙女讲述着睡前故事。不过与一般情形不同的是,老人并非通过自己的口舌发声,而是借助面前的一台iPhone,用它所搭载的语言辅助功能在“替”自己说话。

这是一个童话,但也是真实的故事

以上我们所描述的,便是苹果为纪念2023年12月3日、也就是今天“国际残疾人日”,推出的最新短片《丢失的声音》的大致剧情。值得一提的是,该片由奥斯卡获奖导演Taika Waititi执导,影片配乐使用了夫妻二人组X Carbon的前卫曲目 "Yodeler",这是一首几乎完全由和声构成的乐曲,并且为了契合本片的主题还进行了重新的编制。

当然最为重要的是,影片中老人的主演,以及毛茸茸生物的配音和全片旁白,都出自一位真实的、面临失语风险的残疾人权利倡导者。而他,便是来自新西兰的Tristram Ingham医生。

作为一位内科医生、学术研究人员和残疾人社区领袖,Ingham患有面肩肱型肌营养不良(FSHD),这种疾病会导致患者的面部、双肩和双臂肌肉逐渐萎缩,并最终可能会失去说话、自主进食,甚至是眨眼的能力。

“上个月,我要在一场会议上发表演讲。但当天我没法完成讲话,因为我的呼吸出现了问题”。在回忆不久前的经历时,Ingham说到,“我不得不让别人代替我演讲,尽管稿子都是我写的。”

然而Ingham总是会希望能够保持自主说话的能力,他表示,“我有三个孙辈,我很喜欢为他们读睡前故事。他们常来我家留宿,也很喜欢关于海洋生物、海啸之类的故事。我希望能确保自己在未来仍然可以继续为他们读这些故事。”

幸好,iPhone替他找回了“丢失的声音”

对于Ingham来说,“自主发声”不只是一种亲情的纽带,更是残障人士保证自身权利的重要方式。从这一点来说,Ingham并不喜欢过去那些、由照护人员或家人“替”他们说话的做法,在他看来,这在一定程度上否定了残障人士的自决权利,并且有扭曲当事人意思表示的风险。

可能有的朋友看到这里,会想到传奇科学家史蒂夫·霍金,以及他那副特殊的、基于语音转换软件的合成“嗓音”。的确,霍金使用的“说话”方式,代表了几十年前行业里的最高技术水平。但它的价格极其昂贵,而且最终效果也距离真人的音色相去甚远。

但好在,现在我们有了简单得多的办法。就在不久前,苹果方面在iOS 17、iPadOS 17和macOS Sonoma中推出了新的功能“个人声音”,用户只需按照一系列文字提示录制15分钟的音频,便可以在系统里“创建”与他们自己声音极其相似的语音音色。

再通过另一项名为“实时语音”的功能,用户便可以让相关设备“说”出他们想要说的话。如果你设定了“个人声音”,那么这些话将会以你个人的语音、语调来讲述,一如Ingham在拍摄上述短片时所做的那样。即便你没有录制“个人声音”,那么实时语音功能也将使用系统预设的音色进行讲述,而这则将会方便那些已经完全失语的用户重获“开口说话”的能力。

如何让智能设备真正帮助到人,苹果的做法值得深思

如果在苹果官网上搜索“辅助功能”就会发现一个专门的页面,里面按照视力、听力、语音、肢体活动能力、认知能力一共分了五个类别,每个类别都提供了一系列设备端的辅助功能说明。它会详细地教你如何更好地使用苹果的各类产品,来帮助各种各样的身障人士改善他们的生活,让他们也能享受与人沟通以及感知周围环境的乐趣。

细究之下不难发现,其中有大量的功能都用到了苹果如今非常强调的“设备端智能”能力。也就是说,它们是由端侧的AI算力所驱动,在作动时无需设备连接到网络也能使用。

从技术层面来说,这很复杂吗?其实并不见得。毕竟关注这一领域的朋友可能都知道,无论是如今的iPhone、iPad,还是Mac设备,它们理论上的AI算力其实在同类产品中并不算看起来很高的那种。例如最新的A17 Pro内置NPU算力是35TOPs,相比之下,好几款Android阵营的旗舰SoC,至少在两年前就已声称它们达到了50TOPs以上的综合AI性能。

然而吊诡的是,在使用这些“端侧AI”能力的方式上,不同的厂商之间呈现出了截然不同的策略。当苹果方面在着给他们的iPhone配备更精确的环境噪音检测、跌倒检测、合成用户自己的语音时,许多其他手机厂商,则将目光瞄准了“AI绘画”、“AI问答”等领域。

当然,并不是说用AI去画画,技术难度就一定会比用AI去帮助残障人士要来得低,它们或许反而更加困难,也更需要长时间来研发。但也正因为如此,多少就显得有点讽刺,也解释了为什么许多用户一旦用过了苹果的设备,便不会再换用其他品牌的原因。

最新文章

更多