在本周的Gamescom上,NVIDIA宣布推出Nemotron-4 4B Instruct,这是其首款小型设备语言模型(SLM)。根据NVIDIA博客,这一创新模型旨在增强游戏和其他互动体验中的数字人类的逼真度。
SLM的优势
像Nemotron-4 4B这样的SLM针对特定使用场景进行优化,使其能够比大型通用语言模型提供更准确和更快速的响应。Nemotron-4 4B是从更大的Nemotron-4 15B模型精炼而来,减少了内存占用,提高了速度而不影响准确性。这使其适合在搭载GeForce RTX显卡的PC和笔记本上本地运行,以及NVIDIA RTX显卡的工作站上运行。
该模型包括高级功能,如角色扮演、检索增强生成和功能调用等。这些功能使游戏角色能够更好地理解和响应玩家指令,使游戏中的互动更加直观和吸引人。
ACE的优势
NVIDIA的ACE(Avatar Creation Engine)技术,包括Nemotron-4 4B,使开发者能够在云端和RTX AI PC及工作站上部署最先进的生成式AI模型。这个套件包括关键的AI模型,如语音转文字、语言处理、文字转语音和面部动画,使其具有模块化和适应性,可以适应各种开发者需求。
例如,在电子游戏Mecha BREAK中,玩家可以与机械师角色对话,并指示其切换和定制机甲,展示了Nemotron-4 4B功能的实际应用。
灵活的AI
ACE还支持混合推理,允许开发者在云端或本地运行AI模型。NVIDIA AI推理管理软件开发工具包简化了这些模型的部署和集成,根据开发者的具体需求提供灵活的解决方案。
当前本地运行的ACE NIM微服务包括Audio2Face和新的Nemotron-4 4B Instruct,以及高级自动语音识别系统Whisper ASR。这些服务增强了游戏和其他应用中数字角色的互动性和现实感。
无限可能
NVIDIA在数字人类技术方面的进步不仅限于游戏。在最近的SIGGRAPH会议上,公司展示了“James”,一个能够通过情感和幽默与用户连接的互动数字人类。James是使用ACE框架构建的,展示了数字人类在包括客户服务、医疗保健、零售和机器人在内的各种行业的潜力。
根据Gartner的数据,到2025年,80%的会话服务将嵌入生成式AI,75%的面向客户的应用将具有情感功能的会话AI。这表明了人机交互向更具吸引力和自然的方向转变的重大变化。
对于那些对这项未来技术感兴趣的人,可以在ai.nvidia.com实时体验与James的互动。
Image source: Shutterstock