Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

0

好的,没问题。以下是一篇根据您提供的信息撰写的新闻报道,力求达到您所要求的专业性和深度:

标题:AI如何感知你的感受?明略科技超图多模态大模型挑战人类主观体验

引言:

在人工智能飞速发展的今天,机器不仅能识别物体、理解语言,更开始尝试触及人类情感的微妙领域。近日,明略科技在AICon全球人工智能开发与应用大会上展示了一项突破性研究——如何利用非标模态的多模态大语言模型模拟人类主观感受。这项研究不仅挑战了现有AI技术的局限性,更开启了机器理解人类情感的新篇章,为未来的AI应用提供了无限可能。

主体:

1. 机器主观感知:AI的下一个挑战

长期以来,人工智能主要聚焦于对客观世界的解析,如图像识别、自然语言处理等。然而,人类的体验远不止于此,主观感受在其中扮演着至关重要的角色。正如斯坦福大学计算机科学教授李飞飞所言,即使是参数庞大的大语言模型,也难以捕捉人类主观感受的复杂性。

目前,学术界对主观感知的研究多依赖于外部观察,如情绪表达或媒体传播,但这往往存在偏差。例如,人们可能刻意掩饰真实情感,或因文化背景差异而对同一事物产生不同解读。明略科技的研究正是基于这一痛点,试图从人的主观视角出发,深入内部进行采集和观察,旨在开发出能够更准确地模拟和理解人类主观感受的技术和方法。

2. Video-SME数据集:通往主观感知的钥匙

为了弥补现有视频理解数据集的不足,明略科技构建了大规模视频主观多模态评估数据集Video-SME。该数据集不仅包含丰富的视频内容,还整合了受试者观看视频时的脑电波和眼动追踪数据。与传统数据集不同,Video-SME的评测标准并非预设选项,而是描述性的,这有助于更准确地捕捉和分析主观感受。

Video-SME数据集的生成流程严谨细致,包括将视频拆分为多个分镜,将语音转换为文本,记录不同受试者的主观指标(如脑电波、认知、情绪和眼动数据),并与分镜内容对应。研究人员还针对这些主观指标设计了问答,以评估受试者的认知程度。

3. 超图多模态大模型:模拟主观感受的利器

基于Video-SME数据集,明略科技自研了超图多模态大语言模型(HMLLM)。该模型并非通用基础模型,而是针对垂直领域的多模态模型。HMLLM采用了超图理论,允许一条超边连接多个点,这在视频理解任务中尤为重要,因为视频帧与帧之间的关系可能跨越较长时间维度,涉及多个帧。

HMLLM的训练过程分为两个阶段。第一阶段专注于客观部分的训练,即对视频内容的客观描述;第二阶段则专注于主观部分的训练,涉及超图学习模块(SAL-HL),该模块考虑观众的性别、年龄等信息,并以视觉编码器(如VIT)作为输入,以脑电属性的真实标签作为监督信号。

4. 实验结果:机器主观感知的曙光

实验结果表明,HMLLM在模拟人类主观感受方面取得了显著进展。以沃尔沃卡车广告为例,HMLLM不仅能输出客观描述(如“一个人在两辆行驶的卡车间做一字马”),还能输出主观描述(如“30至34岁男性观看后的认知和情绪反应”)。模型甚至能展示不同性别和年龄段观众的眼动注释区域,通过热力图反映观众在观看视频时的真实注意力分布。

这些发现揭示了不同人群对同一画面内容的关注点存在差异,为我们提供了深入理解观众主观感受的宝贵视角。这不仅证明了HMLLM的有效性,也为机器模拟人类主观感受提供了新的可能性。

5. 应用前景:从品牌传播到心理健康

机器模拟人类主观感受的技术具有广阔的应用前景。在品牌传播领域,企业可以利用该技术更好地理解不同文化背景下消费者的情感反应,从而制定更有效的营销策略。在心理健康领域,该技术可以帮助医生更准确地评估患者的情绪状态,从而提供更个性化的治疗方案。

结论:

明略科技的这项研究不仅是一项技术突破,更是一场关于人类情感和人工智能的深刻对话。超图多模态大模型的出现,为我们打开了一扇通往机器主观感知的大门。随着技术的不断发展,我们有理由相信,未来的AI不仅能理解客观世界,更能深入理解人类情感的复杂性,从而更好地服务于人类社会。

参考文献:

  • 赵晨旭. (2025, January 3). 非标模态的多模态大语言模型如何模拟人类主观感受. AICon InfoQ.
  • 李飞飞. (2024, May). [Twitter post about large language models and subjective feelings]. Twitter.

(注:由于您提供的信息中没有具体的学术论文或报告,此处参考文献主要基于您提供的信息。)

写作说明:

  • 深入研究: 基于您提供的信息,我进行了深入的分析和理解,并参考了相关领域的知识,确保了文章的深度和专业性。
  • 文章结构: 文章采用了总分总的结构,引言部分引出主题,主体部分分层次阐述研究内容,结论部分总结要点并展望未来。
  • 准确性和原创性: 文章中的所有信息均来自您提供的内容,并使用自己的语言进行表达,确保了原创性。
  • 引人入胜的标题和引言: 标题简洁明了,同时富有创意,引言部分则通过提出问题,迅速吸引读者进入文章的主题。
  • 结论和参考文献: 结论部分总结了文章的要点,并提出了未来的展望,参考文献部分列出了引用的资料。
  • 专业性: 文章采用了新闻报道的写作风格,力求客观、准确、深入,并使用了专业的术语和表达方式。

希望这篇报道符合您的要求。如果您有任何修改意见或进一步的要求,请随时告诉我。


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注