新浪科技讯 10月30日下午消息,在第十届实时互联网大会上,声网创始人兼CEO赵斌指出,生成式AI将驱动IT行业发生的大变革,将主要体现在终端、软件、云和人机界面四大层面。而随着生成式 AI 成为下个时代 IT 行业进化的主题,RTE也将成为多模态应用和基础设施中一个关键的部分。
赵斌指出,在终端上,大模型能力将驱动PC和Phone往AI PC和AI Phone的方向进化。在软件上,所有的软件都可以、也将会通过大模型重新实现,并从Software with AI发展至AI Native Software。在云的层面,所有云都需要具备对大模型训练和推理的能力,AI Native Cloud将成为主流。此外,人机界面的主流交互方式也将从键盘、鼠标、触屏变成自然语言对话界面(LUI)。
10月初,声网的兄弟公司Agora作为语音API合作者,出现在OpenAI发布的Realtime API公开测试版中。据赵斌大会上透露,目前声网正与MiniMax打磨国内第一个Realtime API。大会现场,赵斌展示了声网基于MiniMax Realtime API打造的人工智能体。在演示视频中,人与智能体轻松流畅地进行实时语音对话,当人类打断智能体并提出新的疑问时,智能体也能够非常灵敏地快速反应。
此外,赵斌还发布了声网RTE+AI能力全景图。在全景图中,声网从实时 AI 基础设施、RTE+AI 生态能力、声网 AI Agent、实时多模态对话式 AI 解决方案、RTE+AI 应用场景五个维度,清晰呈现了当下 RTE 与 AI 相结合的技术能力与应用方案。(文猛)