内容持续更新中
最近,来自大连理工大学和莫纳什大学的研究团队推出了一种全新的视频生成框架,名为VLIPP,这个框架的亮点在于它能够生成符合物理规律的视频内容。 传统的视频扩散模型(VDMs)虽然在生成视觉效果上表现出…
在当今的科技时代,推理能力的提升成为了人工智能领域的一个重要课题。最近,一篇名为《迈向推理时代:900+篇参考文献揭示长链思维的前世今生》的论文引起了广泛关注。 这篇论文深入探讨了长链思维(Long …
在当今科技迅速发展的时代,AMD推出了一款名为“Agent Laboratory”的科研AI系统,这个系统的出现彻底改变了传统科研的方式。 通过运用大语言模型(LLM),这个系统能够在科研过程中承担多…
在机器人技术不断发展的今天,如何让机器人更好地理解和适应三维物理环境,成为了研究者们关注的焦点。 最近,来自上海AI Lab、TeleAI和上科大等团队的研究人员提出了一种名为SpatialVLA的空…
在数字化时代,图形用户界面(GUI)为我们提供了便捷的操作体验,但随着应用环境的复杂化,传统的操作方式逐渐显露出不足。 最近,微软研究团队发布了一篇名为《Large Language Model-Br…
在当今数字化时代,3D 场景的生成技术正逐渐成为各种创意产业的核心工具。 最近,来自北航和 VAST 的研究团队推出了一款名为 MIDI 的创新模型,它可以从单张图像中生成高质量的三维组合场景。 这项…
在当今快速发展的机器人技术领域,RoboVerse项目的出现无疑是一个激动人心的里程碑。 这个项目是由来自UC伯克利和北京大学等顶尖高校的研究团队共同打造的,旨在解决机器人领域面临的诸多挑战,尤其是在…
在数字化时代,视频内容的创作与编辑需求越来越高,尤其是在电影制作和社交媒体的影响下,高质量的视频编辑技术成为了行业的核心竞争力之一。 然而,视频重打光这一技术却一直是个难题。 视频重打光是指对视频中的…
在当今的数字时代,动画和游戏制作的复杂性不断增加,尤其是在多人互动场景中,如何让角色之间的动作自然流畅成为了一个难题。 最近,北京航空航天大学、香港中文大学(深圳)、悉尼科技大学和中山大学的研究者们提…
在当今信息爆炸的时代,用户对信息检索的需求日益多样化,尤其是在图文结合的场景中,传统的检索方式已经无法满足人们的需求。 智源研究院最近推出的BGE-VL多模态向量模型,正是为了解决这一问题而生。 BG…