DeepSeek再掀波澜:发布多模态大模型Janus-Pro,引领文生图新纪元
1月28日,国产大模型DeepSeek带来了震撼的消息。在凌晨的更新中,他们推出了全新的多模态大模型——Janus-Pro,正式进军文生图领域。
一、性能炸裂:Janus-Pro在基准测试中大放异彩
在GenEval和DPG-Bench的严格基准测试中,Janus-Pro-7B展现了惊人的实力。它不仅击败了当前大热的OpenAI的DALL-E 3,还超越了Stable Diffusion、Emu3-Gen等热门模型。
二、开放商用:MIT开源协议下的Janus-Pro
DeepSeek方面宣布,Janus-Pro采用MIT开源协议,这意味着该模型可无限制地应用于商业场景。无论是企业还是个人,都可以自由地使用和研发基于Janus-Pro的应用。
三、升级自JanusFlow大模型
据DeepSeek透露,Janus-Pro是其2024年11月13日发布的JanusFlow大模型的高级版本。相较于前代模型,Janus-Pro在训练策略、训练数据等方面进行了全面优化和扩展。
四、多模态理解与文本到图像的突破
得益于这些优化,Janus-Pro在多模态理解和文本到图像的指令跟踪功能方面取得了显著进步。不仅如此,它在文本到图像生成的稳定性方面也表现出色。虽然当前版本只能处理384x384分辨率的图像,但考虑到其紧凑性和性能,已经足够令人惊艳。
五、不只是文生图,Janus-Pro的多模态功能
作为多模态模型,Janus-Pro的功能远不止于文生图。它还能对图片进行描述、识别地标景点、识别图像中的文字,并具备对图片中的知识进行介绍的能力。这一特点使得Janus-Pro在实际应用中更具价值。
结语:
DeepSeek的这次更新无疑给人工智能领域带来了全新的活力。Janus-Pro的出现,不仅展现了国产大模型的实力,也为文生图领域带来了新的可能性。期待DeepSeek在未来能够带来更多令人惊艳的产品。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。