【PaliGemma 2 mix:Google推出的多任务视觉语言模型,可以处理图像分割、短视频描述、科学问题回答等多种视觉和文本相关任务。亮点:1. 一个模型搞定多种任务,如图像分割、视频字幕生成、科学问答等;2. 提供多种模型大小(3B、10B、28B参数),适配不同需求;3. 支持多种框架,包括Hugging Face、Keras、PyTorch等】
'Introducing PaliGemma 2 mix: A vision-language model for multiple tasks'
网页链接 #视觉语言模型# #多任务AI# #模型优化# #AI创造营#