近期,卡内基梅隆大学与斯坦福大学联合非营利性机构AI Safeguard开发出一款轻量级多模态模型——Ivy-VL。
凭借高效、轻量化和强性能的设计理念,Ivy-VL解决了多模态大模型在端侧部署中的诸多难题。这一模型不仅推动了移动端AI应用的发展,也为更多设备在低功耗环境下运行AI技术铺平了道路。
据了解,Ivy-VL的参数量仅为3B,与7B以几十B的多模态模型相比,具有更小的硬件占用。模型可高效运行于AI眼镜、智能手机等资源受限的设备上。
通过结合先进的视觉编码器(google/siglip-so400m-patch14-384)与强大的语言模型(Qwen2.5-3B-Instruct),Ivy-VL在视觉问答、图像描述、复杂推理等任务中表现优异,完美满足端侧应用的多模态需求。
另外,Ivy-VL将模型开源,并且允许商用,方便开发者快速上手。无论是AI创新团队还是个人开发者,都可以利用Ivy-VL构建自己的多模态应用。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有