首页 > 资讯

阿里达摩院开源Video-LLaMA 帮大语言模型加上“眼睛”“耳朵”

连云港发布 2023-06-13 09:10:29

来源: 网络 ,如有侵权请联系删除。如果您觉得对你有帮助的话,记得关注我们,我们会出更好的内容。

12日讯,阿里达摩院的研究人员提出了Video-LLaMA,一个具有综合视听能力大模型。Video-LLaMA能够感知和理解视频中的视频和音频信号,并能理解用户输入的指令,完成一系列基于音视频的复杂任务,例如音/视频描述,写作,问答等。目前论文,代码,交互demo都已开放。另外,在Video-LLaMA的项目主页中,该研究团队还提供了中文版本的模型,让中文用户的体验更好。


(相关资料图)

论文链接:

代码地址:https://github.com/DAMO-NLP-SG/Video-LLaMA

Demo 地址:

Modelscope: https://modelscope.cn/studios/damo/video-llama/summary

Huggingface: https://huggingface.co/spaces/DAMO-NLP-SG/Video-LLaMA

样例输入文件地址:

https://github.com/DAMO-NLP-SG/Video-LLaMA/tree/main/examples

T HE EN D

温馨提醒&广告

郑重声明: 本文绝非小编编写,版权归原作者所有,转载文章仅为传播更多信息之目的,如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容!

上一篇 下一篇
热文推荐 更多

阿里达摩院开源Video-LLaMA 帮大语言模型加上“眼睛”“耳朵”

2023-06-13

创业板疫苗板块股票一览,代码查询

2023-06-13

天天观天下!热水器打不燃怎么回事_热水器打不燃

2023-06-13

月度劳动力调查制度(对于月度劳动力调查制度简单介绍)

2023-06-13

空姐自拍尴尬部位,结果被辞退,声称被网暴也要为自己发声_天天热消息

2023-06-13

世界观天下!关于华安安和债券型证券投资基金暂停机构投资者大额申购、大额转换转入及大额定期定额投资的公告

2023-06-13

美丽的光

2023-06-13

赛博朋克2077角色技能有哪些 赛博朋克2077所有技能

2023-06-13

艾瑞咨询:2023年中国供应链金融数字化行业研究报告(附下载)

2023-06-13

阿圭罗:我对巴萨有特殊的感情,就像在那里效力了10年一样 当前通讯

2023-06-13

农商行板块6月12日跌1.07%,渝农商行领跌,主力资金净流出6133.16万元

2023-06-13

快看点丨dnf无法连接(dnf组队连接不上)

2023-06-13

速读:LG宣布2022年LG GRAM笔记本电脑系列的美国定价和可用性

2023-06-13

金牌主播德莱文炫彩价格 金牌主播德莱文炫彩 环球观天下

2023-06-13

天天通讯!姓名藏头诗在线制作 姓名藏头诗免费制作下载)

2023-06-12

当一篇文章结尾时没有直接说出结果,而是用另一种方式来暗示结果,这种写作手法有什么?帮帮我吧!|世界快播

2023-06-12

每日精选:江西南昌地标性建筑绿地双子塔上演网络普法主题灯光秀

2023-06-12

光伏圈巨震!“三角贸易”还是签证问题?多名光伏企业高管在德国被带走_当前热点

2023-06-12

春节菜谱大全: 必吃的6道团圆饭,荤素搭配,好吃下饭快,学会给家人露一手

2023-06-12

电脑电源线接法图解华硕主板(电脑电源线接法)

2023-06-12