英特尔研究院发布全新AI扩散模型,可根据文本提示生成360度全景图-天天新要闻
时间:2023-06-22 21:39:28来源:面包芯语

LDM3D是业界领先的可创建深度图的生成式AI模型,有望革新内容创作、元宇宙和数字体验

英特尔研究院宣布与Blockade Labs合作发布LDM3D(Latent Diffusion Model for 3D)模型,这一全新的扩散模型使用生成式AI创建3D视觉内容。LDM3D是业界领先的利用扩散过程(diffusion process)生成深度图(depth map)的模型,进而生成逼真的、沉浸式的360度全景图。LDM3D有望革新内容创作、元宇宙应用和数字体验,改变包括娱乐、游戏、建筑和设计在内的许多行业。

英特尔研究院人工智能和机器学习研究专家Vasudev Lal表示:“生成式AI技术旨在提高和增强人类创造力,并节省时间。然而,目前的大部分生成式AI模型仅限于生成2D图像,仅有少数几种可根据文本提示生成3D图像。在使用几乎相同数量参数的情况下,不同于现存的潜在扩散模型,LDM3D可以根据用户给定的文本提示同时生成图像和深度图。与深度估计中的标准后处理方法相比,LDM3D能够为图像中的每个像素提供更精准的相对深度,并为开发者省去了大量用于场景开发的时间。”


(资料图)

封闭的生态系统限制了规模。英特尔致力于推动AI的真正普及,通过开放的生态系统让更多人从这项技术中受益。计算机视觉领域近年来取得了重大进展,特别是在生成式AI方面。然而,当今许多先进的生成式AI模型只能生成2D图像。与通常只能根据文本提示生成2D RGB图像的现有扩散模型不同,LDM3D可以根据用户给定的文本提示同时生成图像和深度图。与深度估计(depth estimation)中的标准后处理(post-processing)方法相比,LDM3D在使用与潜在扩散模型Stable Diffusion几乎相同数量参数的情况下,能够为图像中的每个像素提供更精准的相对深度(relative depth)。

这项研究有望改变我们与数字内容的互动方式,基于文本提示为用户提供全新的体验。LDM3D生成的图像和深度图能够将诸如宁静的热带海滩、摩天大楼、科幻宇宙等文本描述转化为细致的360度全景图。LDM3D捕捉深度信息的能力,可以即时增强整体真实感和沉浸感,使各行各业的创新应用成为可能,包括娱乐、游戏、室内设计、房产销售 ,以及虚拟博物馆与沉浸式VR体验等。

6月20日,在IEEE/CVF计算机视觉和模式识别会议(CVPR)的3DMV工作坊上,LDM3D模型获得了“Best Poster Award”

LDM3D是在LAION-400M数据集包含一万个样本的子集上训练而成的。LAION-400M是一个大型图文数据集,包含超过4亿个图文对。对训练语料库进行标注时,研究团队使用了之前由英特尔研究院开发的稠密深度估计模型DPT-Large,为图像中的每个像素提供了高度准确的相对深度。LAION-400M数据集是基于研究用途创建而成的,以便广大研究人员和其它兴趣社群能在更大规模上测试模型训练。

LDM3D模型在一台英特尔AI超级计算机上完成了训练,该超级计算机由英特尔®至强®处理器和英特尔®Habana Gaudi® AI加速器驱动。最终的模型和流程整合了RGB图像和深度图,生成360度全景图,实现了沉浸式体验。

为了展示LDM3D的潜力,英特尔和Blockade的研究人员开发了应用程序DepthFusion,通过标准的2D RGB图像和深度图创建沉浸式、交互式的360度全景体验。DepthFusion利用了TouchDesigner,一种基于节点的可视化编程语言,用于实时互动多媒体内容,可将文本提示转化为交互式和沉浸式数字体验。LDM3D是能生成RGB图像及其深度图的单一模型,因此能够节省内存占用和降低延迟。

LDM3D和DepthFusion的发布,为多视角生成式AI和计算机视觉的进一步发展铺平了道路。英特尔将继续探索如何使用生成式AI增强人类能力,并致力于打造一个强大的开源AI研发生态系统,让更多人能够使用AI技术。延续英特尔对开放AI生态系统的大力支持,LDM3D正在通过HuggingFace进行开源,让AI研究人员和从业者能对这一系统作出进一步改进,并针对特定应用进行微调。

在2023年6月18日至22日举行的IEEE/CVF计算机视觉和模式识别会议上,英特尔将发表这项研究成果。欲了解更多信息,请参考论文《LDM3D: Latent Diffusion Model for 3D》。

标签:

最新
  • 英特尔研究院发布全新AI扩散模型,可根据文本提示生成360度全景图-天天新要闻

    LDM3D是业界领先的可创建深度图的生成式AI模型,有望革新内容创作、

  • 北矿科技:公司已在微信公众号平台开通官方账号“北矿科技”|世界热消息

    北矿科技60098006月21日在投资者关系平台上答复了投资者关心的问题投资

  • 世界速看:雷声:中国女花队需要一位“灵魂人物”

    新华社无锡6月21日电(记者王浩宇、王恒志)面对老对手日本队,中国女

  • [视频]中方代表“捍卫《联合国宪章》之友小组”阐述在人权问题上的原则立场

    央视网消息(新闻联播):联合国人权理事会第53届会议20日就人权高专年

  • 川崎病呈现发病高峰 孩子不明原因发热要警惕

    央广网北京6月21日消息(记者雷妍)入夏以来,“很多孩子出现反复发热

  • 马来西亚企业考察吉林促农业合作 当前焦点

    地处东北亚区域地理中心的中国吉林省与远在东南亚的马来西亚沙巴州

  • 阴阳师共赴寻森之涂活动怎么玩?阴阳师哪里刷涂壁?

    阴阳师共赴寻森之涂活动怎么玩?活动时间:2023年6月22日10:00-18:00

  • 竞选演讲稿的格式(演讲稿的格式)

    1、演讲稿写作格式写作格式要写好演讲稿,首先必须要了解听众对象,了

  • 环球热头条丨做喷绘用到哪几种材质的_做喷绘用到哪几种材质

    1、以下五种喷绘版材可以说是喷绘企业常用的材料:2、Kt板3、KT板是一

  • 日本拟推进开放第三方手机应用商店:苹果表示反对,谷歌称将继续沟通_全球热门

    据日本《读卖新闻》报道,日本内阁数字市场竞争委员会今日编制最终报告

  • 打掉“盗、运、销”煤炭犯罪团伙,镇江警方追回60余万元发还

    扬子晚报网6月16日讯(通讯员韩瑶吴步琴记者万凌云)“感谢你们公安民

  • 杨梅弄衣服上怎么洗 杨梅弄到衣服上可以洗掉吗

    1、杨梅在市面上比较常见,是一种非常好吃的水果,富含丰富的营养成分

  • 【热闻】毕业祝福语短句唯美

    1 愿你未来的人生道路充满美好与幸福。2 祝贺你毕业,也祝愿你

  • 10cm的尖头细高跟让你这个春天不一样,流苏高腰裙很精致-观焦点

    我们看到高跟鞋很好看,但是只有试穿之后,你才会明白穿高跟鞋的快乐和

  • 黄鳝饲料多少钱(黄鳝养殖饲料投放比例)|全球热点

    大家好,小编现在给大家详细介绍关于黄鳝饲料多少钱的核心内容以及黄鳝

  • 天天播报:常态保障多元服务加速公交复苏 ——访衡水市公共交通总公司总经理张双义

    近几年,受新冠肺炎疫情影响,公交企业普遍面临票款收入低、运营成本高

  • 旅游
    • 环球今亮点!2020珠海担杆岛简介+介绍 珠海市担杆镇

    • 全球快资讯丨皮脂膜和角质层受损怎么修复?到底是什么东西是皮脂膜?

    • 围生期心肌病怀孕了怎么办?围生期心肌病是什么原因引起的?

    • 公积金贷款利率下调对已买房的影响是什么?公积金贷款后利率会变化吗?-今日热搜