NEW
快讯列表

关于 语音转录 的快讯列表

时间 详情
2025-03-19
14:53
微软推出Phi-4-Multimodal:基于Transformer的文本、图像和语音处理模型

据DeepLearning.AI报道,微软推出了Phi-4-multimodal,这是一个拥有56亿参数的高性能模型,旨在同时处理文本、图像和语音。这种基于Transformer的架构在语音转录和图像处理方面展示了令人印象深刻的能力,可能会影响依赖AI进行数据分析和自动化的行业。

来源