Meta发布开源AI模型ImageBind，推动虚拟世界发展

浏览：102|时间：2023-11-11 10:07:00

《科创板日报》5月10日报道，Meta公司宣布开源了一种名为ImageBind的全新AI模型，可以横跨6种不同模态，包括视觉、温度、文本、音频、深度信息和运动读数。相关源代码已托管至GitHub。

ImageBind是一种以视觉为核心的AI模型，可以理解和转换6种不同模态之间的数据。Meta展示了一些案例，比如听到狗叫可以画出一只狗，并给出深度图和文字描述；输入鸟的图像加海浪的声音可以得到鸟在海边的图像。

与之前只支持一个或两个模态且难以互动和检索的多模态AI模型相比，ImageBind具有突破性意义。它是第一个能够同时处理6种感官数据的AI模型，也是第一个在没有明确监督的情况下学习一个单一嵌入空间的AI模型。

ImageBind的核心方法是将所有模态的数据放入一个统一的联合嵌入空间，无需通过不同模态组合进行训练。利用近期的大型视觉语言模型，将视觉和其他模态扩展到新的联合嵌入空间。

对于那些原始数据中没有直接联系的模态，如语音和热量，ImageBind表现出了涌现能力，可以自动将它们联系起来。

有行业观察者将ImageBind与元宇宙联系在一起，为设计和体验身临其境的虚拟世界打开了大门。Meta的研究团队表示，未来还将加入触觉、语音、嗅觉和大脑功能磁共振信号，进一步探索多模态大模型的可能性。

同时，Meta表示ImageBind可以利用DINOv2的强大视觉功能进一步提高能力。DINOv2是Meta开源的计算机视觉预训练模型，与Meta的元宇宙愿景密不可分。Meta的CEO扎克伯格强调，DINOv2可以为元宇宙的建设提供强大支持，提升用户在元宇宙中的沉浸体验。

尽管ImageBind目前还只是研究项目，没有直接的消费者用户或实际应用，但随着模型的完善，AI应用场景将进一步扩展，元宇宙建设也将更加先进。

例如，当ImageBind融入虚拟现实设备时，使用者可以获得更沉浸式的体验，不仅可以感受游戏场景的温度，还能感知物理层面上的运动。

据国盛证券分析师刘高畅预测，随着多模态的发展，AI的泛化能力将提高，通用视觉、机械臂、物流搬运机器人、行业服务机器人和智能家居等将进入人们的生活。未来5-10年内，复杂多模态方案结合的大模型有望具备与世界交互的能力，在通用机器人和虚拟现实等领域得到应用。

来源：科创板日报作者：科创板日报

定投推动期货模型融资模型国债模型信贷模型

<<上一条

下一条>>

定投比特币靠谱吗？该用什么定投策略定投BTC？
2022-06-22 00:27:41
定投比特币是啥？指“定期定额”买进比特币。这一和大家正常的抄币是不一样的，正常的抄币感觉便宜了就多买些，感觉贵了也不买。可是如果是定投比特币，那么就无论价钱多少都需要买。且一般不会由于感觉价格高了少买，价格便宜了多买。什...
FLOKI 盘整后或突破，受鲸鱼活动与 CAT 代币空投推动
2024-09-11 23:20:10
FLOKI 盘整，可能出现突破，这得益于鲸鱼活动和即将到来的 CAT 代币空投。Memecoin 季节即将到来。FLOKI 价格走势似乎很有希望。加密货币市场一直以高收益回报而闻名，比特币通常作为其他资产的基准。根据加密...
关于定投的投资建议：币圈跌坚持定投？还是低买高卖？
2022-09-10 13:55:57
有读者在留言中问到一些代币的定投价格，由于问到的那些代币都不是我定投的品种（其中一些不是我看好的品种，另一些是我关注不多的品种），所以关于这些代币具体的定投价设为多少比较合适我不太方便回复，恐怕误导。但是，对一个品种定投...
为什么我们要做定投？定投对于数字货币有用吗？
2023-02-10 13:53:43
参与过投资的人都深有感触，面对这复杂的k线，我到底该怎么办啊？我在这个位置是买还是卖啊……？当然买卖大家都会，但是就是找不到一个好的切入点。今天我们来聊聊一个比较简单并且实用的方法——定投。因为人性会让普通的投资者在亢奋...

币圈相关知识

首页 资讯 消息 常识 快讯 交流 注册 合作

Meta发布开源AI模型ImageBind，推动虚拟世界发展

定投比特币靠谱吗？该用什么定投策略定投BTC？

FLOKI 盘整后或突破，受鲸鱼活动与 CAT 代币空投推动

关于定投的投资建议：币圈跌坚持定投？还是低买高卖？

为什么我们要做定投？定投对于数字货币有用吗？

首页

资讯

消息

常识

快讯

交流

注册

合作