关于 语音转录 的快讯列表
时间 | 详情 |
---|---|
2025-03-19 14:53 |
微软推出Phi-4-Multimodal:基于Transformer的文本、图像和语音处理模型
据DeepLearning.AI报道,微软推出了Phi-4-multimodal,这是一个拥有56亿参数的高性能模型,旨在同时处理文本、图像和语音。这种基于Transformer的架构在语音转录和图像处理方面展示了令人印象深刻的能力,可能会影响依赖AI进行数据分析和自动化的行业。 |