Page 3 - Showing 8 of 33 posts
View all posts by years →
- vllm-qwen2.5-omni
qwen2.5-omni vllm
4 min 中文 - 测试实验1
LongVLAE 在新分割的数据集上与 Qwen2.5-omni-3B 的评估对比
3 min 中文 - Qwen2.5-omni VL部分详解
结合代码分析 Qwen2.5-omni 是如何处理视频的
4 min 中文 - Mac 配置
转载朋友的
13 min 中文 - LongVALE 论文复现
LongVALE: Vision-Audio-Language-Event Benchmark Towards Time-Aware Omni-Modal Perception of Long Videos——论文复现
3 min 中文 - Whisper 论文阅读
Robust Speech Recognition via Large-Scale Weak Supervision——论文研读
7 min 中文 - Transformer 论文阅读
Attention Is All You Need——论文精读(详解)
10 min 中文 - LongVALE 论文阅读
LongVALE: Vision-Audio-Language-Event Benchmark Towards Time-Aware Omni-Modal Perception of Long Videos——论文研读
2 min 中文