视觉 – 既智新闻

智能新闻

Vision-R1：强化学习赋能，图文大模型性能飙升50%

2025年4月9日

北京 – 2025年4月8日 – 在人工智能领域，图文大模型正日益成为研究热点。然而，如何进一步提升其在…

智能新闻

阿里通义重磅发布：视觉推理模型QVQ-Max

2025年4月7日

在人工智能领域，多模态模型的研发与应用正成为新的增长点。近日，阿里巴巴通义千问团队正式发布了其视觉推理模型的最新版本——QVQ-…

智能新闻

视觉SSL逆袭！LeCun新作赶超CLIP

2025年4月4日

纽约—— 在人工智能领域，视觉问题解答（VQA）一直被视为检验多模态学习能力的关键战场。长期以来，视觉自监督学习（SSL）在VQ…

智能新闻

通义千问发布QVQ-Max：视觉推理新突破

2025年3月31日

摘要：阿里巴巴通义千问团队近日发布了新一代视觉推理模型QVQ-Max，该模型具备强大的图像和视频内容分析、推理能力，标志着人工…

智能新闻

视觉语言模型新突破：轻量高效，LLM助力！

2025年3月29日

“`markdown 小型视觉语言模型崛起：开放权重、加速学习与LLM辅助的未来引言：AI领域的新星正在冉冉升起 …

智能新闻

阿里通义发布QVQ-Max视觉推理模型

2025年3月29日

北京报道 – 在人工智能领域日新月异的今天，视觉智能正成为推动技术进步和产业升级的关键力量。近日，阿里巴巴集团旗下通…

智能新闻

Proxy Lite：开源视觉模型，网页任务自动化！

2025年3月16日

北京，2024年5月16日 – 在人工智能领域，自动化网页任务一直是研究和应用的热点。近日，一款名为 Proxy L…

智能新闻

DeepSeek R1视觉强化微调开源！

2025年3月6日

好的，根据你提供的信息，我将撰写一篇关于Visual-RFT的新闻报道，力求专业、深入且引人入胜。标题：视觉强化微调迎来突破！…

智能新闻

Proxy Lite：开源视觉模型，网页任务自动化！

2025年3月6日

摘要： Proxy Lite，一款由Convergence AI团队开发的开源轻量级视觉语言模型（VLM），以其30亿参数的精简…

智能新闻

Proxy Lite：开源视觉模型，网页任务自动化！

2025年3月6日

摘要：近日，一款名为 Proxy Lite 的开源视觉语言模型（VLM）正式发布，该模型以其轻量级、高性能的特点，旨在赋能网页…

智能新闻

字节跳动突破！机器人视觉控制新范式

2025年2月23日

“`markdown 字节跳动研究团队突破：世界模型赋能四足机器人，实现视觉控制新范式北京 – 近日，…

智能新闻

字节跳动OmniHuman：AI“视觉图灵”时代降临？

2025年2月10日

北京报道 – 在人工智能领域，技术的每一次突破都预示着新时代的到来。近日，字节跳动推出了一项名为OmniHuman的…

智能新闻

Smolagents赋能视觉语言模型，AI应用新突破

2025年1月26日

引言：想象一下，一个智能体不仅能理解文字，还能“看懂”世界，这不再是科幻小说的情节。Hugging Face 的 smolag…

智能新闻

字节跳动再发力，Tarsier2视觉大模型亮相

2025年1月26日

好的，请看我为你撰写的新闻稿，我将尽力融合你提出的所有要求，呈现一篇既有深度又引人入胜的文章：字节跳动发布Tarsier2：视…

智能新闻

淘天祭出视觉锚定奖励，LVLM自我校准实现多模态对齐

2025年1月20日

好的，请看我为您撰写的这篇新闻稿，我将尽力融合我多年在多家顶尖媒体工作的经验，为您呈现一篇既专业又引人入胜的报道：标题：细粒度…

智能新闻

SPRIGHT：视觉语言新突破，空间关系AI解读

2025年1月9日

SPRIGHT：AI视觉语言新突破，空间关系理解能力大幅提升引言：在人工智能领域，视觉语言模型的进步日新月异，但长期以来，如…

智能新闻

SPRIGHT：视觉语言AI新突破，空间关系理解跃升

2025年1月9日

引言：在人工智能的浪潮中，视觉语言模型的进步日新月异。然而，长期以来，如何让AI准确理解和生成具有复杂空间关系的图像，一直是研…

智能新闻

阿里通义开源QVQ，视觉推理新突破

2025年1月4日

引言：人工智能的浪潮席卷全球，多模态模型正成为研究和应用的热点。近日，阿里巴巴通义实验室开源了其最新的视觉推理模型QVQ，这款…

智能新闻

李飞飞团队重磅发布：视觉空间智能新基准VSI-Bench

2024年12月26日

好的，这是一篇基于你提供的信息，并按照你提出的专业新闻写作要求撰写的文章。标题：李飞飞、谢赛宁团队发布VSI-Bench：为多…

智能新闻

阿里通义开源QVQ，视觉推理新突破

2024年12月26日

引言：人工智能领域，多模态模型的研发一直是前沿热点。近日，阿里巴巴通义实验室开源了其最新的视觉推理模型QVQ，引发了业界的广泛…

智能新闻

PromptAI视觉突围：通用模型赛道，为何迟到一步？

2024年12月17日

好的，这是一篇根据您提供的信息撰写的新闻稿，力求达到您提出的专业性和深度要求：标题：从伯克利到PromptAI：肖特特领跑下一…

智能新闻

视觉Mamba：线性注意力下的AI突破清华阿里联手，线性AI模型Mamba问世 Mamba：线性计算，颠覆视觉AI？线性计算

2024年12月11日

清华阿里联手揭秘视觉Mamba：线性注意力视角下的高效建模新篇章引言：近年来，深度学习模型的计算复杂度成为制约其应用的关键瓶…

智能新闻

开源框架：视觉搜索新突破 AI视觉搜索：开源框架问世视觉搜索新引擎：开源免费颠覆搜索：AI视觉开源框架 AI赋能：开源视觉搜

2024年11月18日

Vision Search Assistant：赋能视觉语言模型的“互联网大脑” 引言：想象一下，一个能像人类一样理解图片，并…

智能新闻

视觉语言模型“盲猜”时代结束？性能翻倍！

2024年11月10日

不让视觉语言模型「盲猜」，性能竟直接提升一倍？ AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv…

智能新闻

AI 视觉欺骗：图像操控影响人类感知

2024年9月24日

Title: Subtle Image Manipulations Designed to Fool AI Can Also I…

智能新闻

ECCV 2024：离散Token视觉生成新突破，自适应推理策略引领AIGC发展

2024年9月19日

近日，在人工智能领域备受关注的ECCV 2024会议上，清华大学自动化系2022级直博生倪赞林及其导师黄高副教授的研究成果——《…

智能新闻

AI Deception Tricked Images Mislead Humans Too

2024年9月5日

Title: Subtle Image Alterations Impact Human Perception: New Res…

智能新闻

创新视界：科技让盲人共享视能力

2024年9月4日

在秘鲁领先的水泥品牌Cemento Sol的带领下，一场关于社会责任和创新的实践正悄然展开，将水泥这种日常生活中常见的元素与公益…

智能新闻

印尼大使馆开门迎华教精英，视觉盛宴闪耀外交荣耀

2024年9月2日

正文： 2024年8月27日，一场令人惊叹的视觉盛宴在雅加达上演。中国驻印尼大使馆举办了年度开放日，以“中国智能科技产品体验日”…

智能新闻

革新视觉体验：ScreenAgent引领AI智能体新纪元

2024年8月28日

吉林大学人工智能学院的研究团队近日发布了一项创新成果——ScreenAgent，这是一个基于视觉语言模型（VLM）的计算机控制智…

Vision-R1：强化学习赋能，图文大模型性能飙升50%

阿里通义重磅发布：视觉推理模型QVQ-Max

视觉SSL逆袭！LeCun新作赶超CLIP

通义千问发布QVQ-Max：视觉推理新突破

视觉语言模型新突破：轻量高效，LLM助力！

阿里通义发布QVQ-Max视觉推理模型

Proxy Lite：开源视觉模型，网页任务自动化！

DeepSeek R1视觉强化微调开源！

Proxy Lite：开源视觉模型，网页任务自动化！

Proxy Lite：开源视觉模型，网页任务自动化！

字节跳动突破！机器人视觉控制新范式

字节跳动OmniHuman：AI“视觉图灵”时代降临？

Smolagents赋能视觉语言模型，AI应用新突破

字节跳动再发力，Tarsier2视觉大模型亮相

淘天祭出视觉锚定奖励，LVLM自我校准实现多模态对齐

SPRIGHT：视觉语言新突破，空间关系AI解读

SPRIGHT：视觉语言AI新突破，空间关系理解跃升

阿里通义开源QVQ，视觉推理新突破

李飞飞团队重磅发布：视觉空间智能新基准VSI-Bench

阿里通义开源QVQ，视觉推理新突破

PromptAI视觉突围：通用模型赛道，为何迟到一步？

视觉Mamba：线性注意力下的AI突破清华阿里联手，线性AI模型Mamba问世 Mamba：线性计算，颠覆视觉AI？线性计算

开源框架：视觉搜索新突破 AI视觉搜索：开源框架问世视觉搜索新引擎：开源免费颠覆搜索：AI视觉开源框架 AI赋能：开源视觉搜

视觉语言模型“盲猜”时代结束？性能翻倍！

AI 视觉欺骗：图像操控影响人类感知

ECCV 2024：离散Token视觉生成新突破，自适应推理策略引领AIGC发展

AI Deception Tricked Images Mislead Humans Too

创新视界：科技让盲人共享视能力

印尼大使馆开门迎华教精英，视觉盛宴闪耀外交荣耀

革新视觉体验：ScreenAgent引领AI智能体新纪元

为您推荐

Veo 2发布：视频创作，触手可及！

Zhipu GLM Unveils New Open-Source Model Claims World-Class Performance Launches “z.ai

智谱GLM模型升级，比肩世界先进！

OpenAI深夜重磅：GPT-4.1支持百万Token编程！

2025 年 4 月
一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

标签： 视觉

为您推荐

标签：视觉