VAE(Variational Autoencoder)变分自编码器是一种使用变分推理的自编码器,其主要用于生成模型。 VAE 的编码器是模型的一部分,用于将输入数据压缩成潜在表示,即编码。 VAE 编码器包括两个子网络:一个是推断网络,另一个是生成网络。推断网络输入原始输入 ...
在 LDM、DiT 这类两阶段生成框架里,第一阶段的 visual tokenizer(常见是 VAE 或者是 AutoEncoder) 把图像压进 latent,第二阶段扩散模型在 latent 上学生成。
本项目包括了Feature-based magnetotelluric inversion by variational autoencoder using a subdomain encoding scheme一文中实测算例反演的开源代码。 大地电磁(Magnetotelluric, MT)反演通过地表测量到的电磁场推测地质结构分布,被广泛地应用于油气矿产资源勘探、深部地质调查等领域。
核心挑战:视觉基础模型虽然在理解与感知上表现出色,但其表征空间尚未被充分用于大规模、高质量的视觉生成。 研究空白:在VFM特征空间内端到端地训练大规模文本到图像生成模型是一个未经充分探索的领域,缺乏相关验证和可行的方案。 提出的方案 模型 ...
【AIbase新闻】德国人工智能公司Black Forest Labs在今年感恩节期间正式发布了其新的图像生成和编辑系统FLUX.2。此次发布标志着该公司在图像生成技术方面取得了重大进展,旨在支持高效的生产级创意工作流程。 FLUX.2系列包括四种不同大小和用途的模型,具有显著 ...
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!一人剧组时代到来,Seko ...
Black Forest Labs正式发布FLUX.2系列,推出了Pro、Flex、Dev和Klein(即将推出)四款模型。同时,开源了拥有320亿参数的FLUX.2 [dev]权重和代码,声称这是目前最强大的开源文本到图像(text-to-image)模型,具有多图像参考和4MP编辑工具。 核心升级: 10图参考:一次性上传 ...
Tianyu He is a Senior Researcher at Machine Learning Group, Microsoft Research Asia. His research interests include machine learning, generative learning, and their applications on content ...
本文针对MIMO通信中信道状态信息(CSI)反馈面临的三大挑战:异构信道分布、数据稀缺性和隐私保护需求,提出了一种基于聚类联邦学习(CFL)的上下文相关解码框架。研究人员通过设计CFL-GP算法,实现了无需原始数据共享的上下文聚类和模型训练,在COST2100和3GPP-3D ...
数字化孪生(Digital Twin)是物理实体的 **“虚拟镜像”,通过实时数据交互实现 “监控 - 诊断 - 预测 - 优化” 的闭环。AI 的核心作用是为孪生体注入“智能决策能力”,将孪生从 “静态映射” 升级为 “动态优化引擎”。以下从AI ...
第六代通信中智能反射面(IRS)的混合预编码优化研究,提出DVAE-CATT-Precoding模型,通过变分自编码器(VAE)优化参数并捕捉跨频空域特征,结合交叉注意力机制增强时域信道预编码,采用CNN模块抑制干扰,显著提升误码率、频谱效率和系统鲁棒性。 摘要: 第六 ...