图片AI-OCR

图片AI-OCR 公开 已发布(自动)

如何安装动作?
复制Ta的推荐码
加QQ群9522464学习, 关注知乎https://www.zhihu.com/people/qiu-feng-80-16/answers

适用于
分类(旧)



更多信息
分享时间 16小时59分钟前
最后更新 16小时4分钟前
修订版本 3
用户许可 -未设置-
Quicker版本 1.44.13
动作大小 29.9 KB

分享到

「不是传统的光学OCR, 是具备AI思考推理能力的OCR,能自动分类整理图片中的任何信息」

简介

先看效果:

自动化写入本地文件txt效果:

无限量调用,无需账号key密钥,打开动作就能用,一天内可以处理上万张图片,整理成你想要的效果,根据你写的提示词,提取只需要的内容。可以输出为txt word md excle表格形式先看效果。如下图演示。

可以帮你整理截图数据,手写填表,把每一次实拍图或者截图jpg png都汇总在一个表格中。以日期为排序,方便查看

以此类推,包含考试 试卷学生 姓名 成绩,

能指定内容行和列提取。

还可以帮你排查图片中是否有包含某个违规文字,错误元素,商品物品,动物名,植物名,只要该图片包含就输出true 否则false

原理解析,通过api传输图片和提示词,然后等待一会返回结果。根据图片大小和输出内容所决定时间。

目前采用采用最新2025年12月发布的 智谱glm v4.6 9b大模型。具备思维推理,所需要时间更长,但是准确率更高。

所有请求处理都是在我建立的主机上运行,不会泄露资料,大模型不会学习记录对话内容,只是机械回答问题,用完就清除对话了,请放心使用。

目前初次开放。欢迎大家尝试使用,如有不稳定 请加qq 598801682 反馈问题 。

用的人多,我会更加完善处理速度和输出精度。

请节约资源,每次处理将会占用宽带和高功耗电费,如果频繁请求使用,造成服务器卡顿,将会禁止该ip使用。

本地离线大模型和线上模型有什么区别?

区别在于 可以无限量调用,可以一直重复做任务。大模型思维格式固定,不会升级,调试好 一劳永逸。只需要购买电脑硬件和电费,而且数据不会公开在网上,不会让大模型学习到隐私数据 。内网 快速0.3秒反馈结果。

开放理念,利用现有ai大模型,帮助我们完成学习工作和生活中繁琐的事情,普惠每个人提高效率。

如需企业级稳定使用,欢迎私聊,本人将会从业务需求,测试业务需求,模型大小完成能力,购买私有化GPU 电脑主机组装,构建局域网 内网让每个同事 通过简单的对话界面就可以离线使用大模型(如需外地外网访问也可以配置),处理图片,视频分享,编程,RAG知识库检索,智能AI工作流等等,本地离线模型相比在线的豆包,deepseek会笨一点点,但是面对简单的事物处理已够用。最低6000元硬件起成本+搭配服务费1000元起,一条龙服务,包含后续维护和调试。 让ai应用成为中小企业 替代高劳动力,提高产出和节省工资成本。

北京地区可以上门服务。外地可视频远程一对一指导。

也可以一直用我建立共享ai服务,需要更高级的定制功能需要收费。1000元起步做。包含多端 文件同步,数据合并,图像报表查看。


模型介绍:

实测智谱GLM-4.6V,国产最强多模态Agent底座模型

https://zhuanlan.zhihu.com/p/1983557631059698513



Claude买不起,智谱GLM4.6怎么样,有人测评嘛? 

https://www.zhihu.com/question/1957109699880153900/answer/1982019313457181715

作者所声明的动作特征:
  • 依赖本地特定路径或文件
  • 依赖第三在线服务
  • 会保存状态数据
  • 含有写入本地文件的功能
  • 含有上传数据到网络的功能

最近更新

修订版本 更新时间 更新说明
3 16小时4分钟前 1
2 16小时36分钟前 1
1 16小时58分钟前 1

最近讨论

暂无讨论