在BEYOND Expo的NVIDIA Inception展区,SlidesOrator是一个小而美,也颇具实用性的项目。它没有机械臂、没有AR眼镜,展台也并不花哨,但它的方针直指每一个打工人都了解的场景:怎么展现PPT。
用AI做PPT这件事,几乎是伴随着大言语模型的诞生而诞生的。SlidesOrator并不想重复前人做过的工作,他们以为让表达变得“主动而可信”,或许比让AI写出100篇PPT更重要。
SlidesOrator的体会也很简单,用户只需求上传一份PDF格局的幻灯片,它就能主动生成语音解说内容,并经过3D虚拟数字人完结整场演示。整个进程无需真人录音,也不依赖事前练习。
更重要的是,这并不仅仅做一场播片式的演示,数字人还能够依据PPT内容实时答复观众发问,模仿一个完好、互动的“AI演讲者”形象。
SlidesOrator团队表明,他们在多言语TTS语音、语义摘要、图文匹配以及3D数字人驱动方面都做了深度优化,力求在不依赖专业团队的前提下,让任何人都能够快速“保管”一场演说。
现在,这套体系现已应用于教育训练、企业宣讲、产品发布等场景,特别合适内容高度结构化、需求多语种传达的职业客户。比如在跨国展会、在线公开课、草创路演等场合。团队介绍说,现在他们的服务招引了许多发展中区域的用户,我在他们的演示中也看到了一些来自越南、泰国等地用户上传的本地言语PPT。