华东师大、上海大学联手打造机器人操控VLA模型

作者智能小编

10 月 10, 2024 #机器人, #每日AI快讯

TinyVLA: 机器人操控领域的“小巨人”

华东师范大学和上海大学联合推出面向机器人操控的视觉-语言-动作（VLA）模型TinyVLA，为机器人控制领域带来了一场革新。

近年来，人工智能技术飞速发展，机器人操控领域也迎来了新的突破。然而，现有的VLA模型存在着推理速度慢、需要大量数据预训练等问题，限制了其在实际应用中的推广。为了解决这些问题，华东师范大学和上海大学的研究团队联合推出了TinyVLA，一种面向机器人操控的轻量级VLA模型。

TinyVLA的优势在于：

快速推理：TinyVLA能在极短的时间内处理视觉数据和语言指令，生成相应的机器人动作，显著提高了决策和执行的速度。
数据高效： 模型减少对大规模机器人数据集的依赖，无需昂贵的预训练过程，降低训练成本和资源消耗。
多任务处理： 能处理多种不同的任务，如抓取、放置、堆积等，展示良好的多任务学习能力。
强泛化能力： 在未见过的新环境、新物体和新指令下，TinyVLA仍能保持较高的执行成功率，表现出强大的泛化能力。

TinyVLA的技术原理：

TinyVLA基于预训练的多模态模型（如Pythia）作为策略网络的基础，并通过训练轻量级的多模态模型（VLM）来优化策略骨干。模型还采用了扩散策略解码器，直接输出机器人的动作，提高了动作预测的连续性和准确性。此外，TinyVLA还利用LoRA微调技术，只更新模型中一小部分参数，从而保持模型的原有知识并提高训练效率。

TinyVLA的应用场景：

TinyVLA在家庭自动化、工业自动化、服务机器人、灾难响应、教育和培训、实验室助理等多个领域具有广泛的应用前景。例如，在智能家居环境中，TinyVLA可以帮助机器人理解自然语言指令执行家务任务；在工业生产线上，TinyVLA可以控制机器人进行精密的组装和分拣工作。

TinyVLA的推出，为机器人控制领域提供了一种快速、高效的新方法，有望在资源受限的环境中实现快速部署和应用。 随着人工智能技术的不断发展，TinyVLA有望进一步提升性能，并应用于更多场景，推动机器人技术的进步，为人类社会带来更多便利。

项目地址：