MAG:横跨6种模态 Meta开源AI模型ImageBind 为虚拟世界打开大门_MagicTheLeagueCoin

来源:《科创板日报》

编辑宋子乔

当地时间5月9日,Meta宣布开源了一种可以将可以横跨6种不同模态的全新AI模型ImageBind,包括视觉、温度、文本、音频、深度信息、运动读数。目前,相关源代码已托管至GitHub。

何为横跨6种模态?

即以视觉为核心,ImageBind可做到6个模态之间任意的理解和转换。Meta展示了一些案例,如听到狗叫画出一只狗,同时给出对应的深度图和文字描述;如输入鸟的图像+海浪的声音,得到鸟在海边的图像。

新华社:百倍杠杆!疯狂的币圈带来“暴富”还是“爆仓”?:5月29日晚,新华社发布题为《百倍杠杆!疯狂的“币圈”带来“暴富”还是“爆仓”?》的文章,再次对虚拟货币表示关注。这是新华社在两天内第3次发问虚拟货币。

文章表示,让众多投资者一夜之间账面清零的背后,是“币圈”的期货合约交易。近年来,除了现货交易,期货合约交易逐步成为虚拟货币交易的重要衍生品。此类合约具有双向交易、高杠杆等特征。从表面上看,此类合约可以对冲风险,但更多投资者把其视为“一夜暴富”的工具。因为,加杠杆后,随着“币值”涨跌,收益也会成倍变化。虚拟货币的交易风险远不止价格剧烈波动,在交易炒作的背后还常常伴随着“庄家”操纵市场价格。业内人士表示,虚拟货币交易没有实物依托,价格容易被操纵。尤其是不少“空气币”发行技术模糊,发行上限不确定,存在巨量持有者,极易被“庄家”操纵价格。高杠杆下的爆仓,众多投资者两手空空血本无归,虚拟货币交易平台却在其中稳赚收益。

此前消息,5月28日晚,新华社发布了《1万台“矿机”一个月能“吃”4500万度电!挖的是“币”还是“坑”?》,就比特币“挖矿”带来的巨大能源损耗提出质疑。29日中午,新华社发布《加密货币,是金融创新还是“庞氏局”?》,再次就比特币等虚拟货币发问。[2021/5/30 22:55:57]

直播|唐诗 > 币圈少女创业之路——给BP找爸爸:金色财经 · 直播主办的《 币圈 “后浪” 仙女直播周》第6期20:00准时开始,本期“后浪”仙女BP Combinator联创 唐诗将在直播间聊聊“币圈少女创业之路——给BP找爸爸”,感兴趣的朋友扫码移步收听![2020/6/23]

而此前的多模态AI模型一般只支持一个或两个模态,且不同模态之间难以进行互动和检索。ImageBind无疑具有突破性意义,Meta称,ImageBind是第一个能够同时处理6种感官数据的AI模型,也是第一个在没有明确监督的情况下学习一个单一嵌入空间的AI模型。

比特币矿企Marathon Digital 5月比特币产量较预期数量降低47%:6月10日消息,比特币矿企Marathon Digital 5月比特币产量较基于其4月算力的预期数量降低47%,其位于西德克萨斯州的矿场仍未开始供电。Marathon表示该公司自2020年10月以来从未出售比特币,截至2022年6月1日,Marathon共持有9941枚比特币,价值约3亿美元。(Coindesk)[2022/6/10 23:05:45]

ImageBind能做到这些,核心方法是把所有模态的数据放入统一的联合嵌入空间,无需使用每种不同模态组合对数据进行训练

先利用最近的大型视觉语言模型它将最近的大规模视觉语言模型的零样本能力扩展到新的模态,它们与图像的自然配对,如视频-音频和图像-深度数据,来学习一个联合嵌入空间。

而以图像/视频为中心训练好AI后,对于原始数据中没有直接联系的模态,比如语音和热量,ImageBind表现出涌现能力,把他们自发联系起来。

有行业观察者已经迫不及待地将ImageBind于元宇宙联系在一起。

正如Meta的研究团队所说,ImageBind为设计和体验身临其境的虚拟世界打开了大门。该团队还表示,未来还将加入触觉、语音、嗅觉和大脑功能磁共振信号,进一步探索多模态大模型的可能性,“人类可使用多种感官学习、了解世界,借助ImageBin,机器离人类又近了一步”。

值得注意的是,Meta还表示,ImageBind可以利用DINOv2强大的视觉功能进一步提高其能力。DINOv2是Meta开源的计算机视觉领域的预训练大模型,同样与Meta的元宇宙愿景密不可分,MetaCEO扎克伯格此前强调,DINOv2可以极大地加持元宇宙的建设,让用户在元宇宙中的沉浸体验更出色。

尽管ImageBind目前只是研究项目,没有直接的消费者用户或实际应用。但可以想象的是,随着ImageBind模型逐步完善,AI应用场景将进一步拓展,元宇宙建设也将更进一步。

比如当ImageBind融入虚拟现实设备,使用者能获得更沉浸式的体验,玩家进入游戏后不仅能感受游戏场景的温度,还能感知物理层面上运动。

国盛证券分析师刘高畅此前大胆预测,1-5年内,随着多模态的发展带来AI泛化能力提升,通用视觉、通用机械臂、通用物流搬运机器人、行业服务机器人、真正的智能家居会进入生活。未来5-10年内,结合复杂多模态方案的大模型有望具备完备的与世界交互的能力,在通用机器人、虚拟现实等领域得到应用。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

大币网

Gateio区块链:一文讲透新公链 Sui_STE

来源/messari 编译/章鱼哥 01 摘要 Sui是即将推出的L1智能合约平台,具有独特的、以对象为中心的数据模型,这是其扩展网络吞吐量能力的关键.

[0:0ms0-6:452ms