Openai发布的语音模型GPT
发布时间:2025-09-19 17:39
8月28日,美国人工智能公司OpenAI发布了所谓的“标准的语音到声音模型” GPT-REALTIME,并支持实时API(实时应用程序程序接口)。图像来源:OpenAI的官方网站,该模型在理解复杂的说明,准确的通话工具以及开发自然和表现力的声音方面具有出色的性能,并且在各种情况下具有广泛的应用潜力,例如客户服务,教育和私人助理。与传统的语音模型不同,GPT-Realtime添加了两个独特的声音,即Marins和Cedar,并全面升级了原始的八个声音。该模型不仅可以产生自然而光滑的声音,而且还可以努力捕获非官方信号,例如笑声,语言在句子之间自由移动,并且根据场景的需求而感到无聊地调整语气,因此语音接触更接近人类的交流。通过实时API,开发人员可以实现实时语音输入和输出,而无需经过复杂的多模型转换过程。在实际应用中,该技术可用于客户服务系统,使虚拟助手可以回答实时问题,提高效率和经验。它也可以应用于教育领域,具有发音和言语技能。在家里的个人助理,办公室或聪明的情况下,用户可以快速完成组织或语音信息。与图像或文本输入结合使用,开发人员还可以创建更智能的虚拟Spineg或机器人系统。 Openai表示,GPT-RealTime和实时API从8月28日开始向所有付费开发人员开放。资料来源:科学和技术日报 特别声明:上面的内容(包括照片或视频(如果有))已由“ NetEase”自助媒体平台的用户上传和发布。该平台仅提供信息存储服务。 注意:内容上面(包括照片和视频(如果有))已由NetEase Hao用户上传和发布,该用户是一个社交媒体平台,仅提供信息存储服务。