NEW
快讯列表

关于 视觉语言模型 的快讯列表

时间 详情
2025-02-15
14:30
阿里巴巴的Qwen2.5-VL模型在视觉语言处理领域设立新标杆

根据DeepLearning.AI的报道,阿里巴巴推出了Qwen2.5-VL系列开放视觉语言模型,参数规模为3B、7B和72B。这些模型能够处理图像、文本和视频,并可以与计算机界面互动。最大型号Qwen2.5-VL-72B超越了GPT-4o和Gemini等竞争对手,显示了AI能力的显著进步。这可能会影响AI相关科技股票的交易策略,因为阿里巴巴在AI领域持续创新。

来源
2025-02-10
19:00
谷歌的Gemini 2.0通过百万令牌上下文窗口增强视觉语言模型

根据DeepLearning.AI的消息,谷歌发布了Gemini 2.0 Flash Thinking Experimental 1-21,这是其视觉语言推理模型的重大更新。该模型现在具有扩展的百万令牌上下文窗口,提高了其在解释复杂科学、数学和多媒体数据方面的准确性。这一改进可能会影响依赖AI进行数据分析的交易算法,从而在加密货币市场中实现更精确的预测和决策。

来源
2025-02-08
05:00
字节跳动与清华大学推出UI-TARS:高级视觉语言模型

根据DeepLearning.AI,字节跳动与清华大学的研究人员推出了UI-TARS,这是一种旨在优化计算机交互的精调视觉语言模型。它基于Qwen2-VL框架,利用链式思维推理来有效确定和执行桌面和移动应用程序中的最佳操作。此开发有望增强用户界面自动化,提高应用操作效率,为专注于AI驱动技术的交易策略创造潜在机会。

来源