介绍
OmniParser 是一个屏幕解析工具,用于将通用 GUI 屏幕转换为结构化元素。运行此子程序需要系统已经安装python
子程序的参数
输入
image_path
需要解析的界面截图文件路径
Text
输出
结构化数据
解析后的输出,格式:Loaded as API: https://microsoft-omniparser-v2.hf.space ✔\r\n
('C:\\Users\\Administrator\\AppData\\Local\\Temp\\gradio\\13895bda4d85fca7af891ce3b53070968fdd0d4bb949eb0789a6704415c33072\\image.webp', "icon 0: {'type': 'text', 'bbox': [0.31385281682014465
Text
最近更新
修订版本
|
更新时间
|
更新说明
|
1
|
1天23小时前
|
更新注释
|
0
|
1天23小时前
|
|