Multimodal Dialogue System
Moshi Chat
官网: https://moshi.chat/
自媒体: https://mp.weixin.qq.com/s/iwH23jkt7rdZ7WwZ45Z9jg
发布时间:2024.07.04
Latency: 160ms
Open Source: ✅
Features:
- 支持听、说、看
- 支持 70 余种情绪和风格
- 支持打断、抢答
- 听说是同时处理的(是基于文本和音频混合的联合预训练,用 Helium 中合成的文本数据,训出的70亿参数的模型。)
- 最小版本可运行于消费级 GPU
- 存在预测编码,可以及时更新说话内容
- 语音压缩系数 300 倍