Cosmo's Blog

Back

本周工作#

Qwen2.5-omni 3B#

分数-层数

分数-性能

Qwen2.5-vl 7B#

补充了一部分实验

分数-层数

分数-性能

llava-v1.5-7b#

分数-层数

分数-性能

还在改动代码

在 11 层剪枝,保留率 0.5

TasksFiltern-shotMetricValueStderrStderr_CLT
mmenone0mme_cognition_score1.4286±N/A0.0054
mmenone0mme_perception_score0.0000±N/A0.0000

迁移中间层剪枝到 llava 上,但是分数掉到一个很夸张的地步,应该是剪枝完后面位置编码之类的对不上之类的

Boosting Multimodal Large Language Models with Visual Tokens Withdrawal for Rapid Inference 复现#

MethodsTFLOPs ↓MME ↑
LLaVA-1.5-7B8.481866.10
VTW (K=16)4.68 (55.19%)1872.43
LLaVA-1.5-7B-1509.97
VTW (K=16)-1442.67

因为这个 TFLOPs 我没找到他原始怎么算的就还没统计

  • 更多 baseline
week13
https://astro-pure.js.org/blog/2_week12
Author Cosmo
Published at June 12, 2026