| 分享时间 | 2025-01-13 13:40 |
| 最后更新 | 2025-03-19 15:37 |
| 修订版本 | 8 |
| 用户许可 | 可自己使用或修改,不可再分享 |
| Quicker版本 | 1.43.63 |
| 动作大小 | 69 KB |
视频演示效果使用的是 gemini-2.0-flash。
有条件的可以尝试阿里最新的 qwen-vl-max。
(复杂文本识别请务必使用能力强的多模态模型)
| 修订版本 | 更新时间 | 更新说明 |
|---|---|---|
| 8 | 2025-03-19 15:37 |
- 更新支持了Mistral OCR
- 硅基流动的默认模型更改为Qwen/Qwen2.5-VL-72B-Instruct - 通义千问的默认模型改为qwen-vl-ocr-latest |
| 7 | 2025-03-07 20:18 | 增加了通义千问 |
| 6 | 2025-02-08 22:20 | 更新了图片的上传方式,以适应更多平台,比如gemini |