功能介绍

三大引擎,覆盖所有屏幕识别场景

OCR 文字识别 RapidOCR

基于 RapidOCR 深度学习框架,在移动端高效运行。支持自动方向检测、低对比度图像增强、颜色掩码过滤等多种预处理策略,复杂界面也能准确识别。

参数说明默认
imagePath图片路径必填
sortOrder排序方式:top / lefttop
assumeUpright是否已是正向true
singleLine单行模式false
targetSize目标尺寸1024
boxThreshold文本框检测阈值0.45
scoreThreshold识别置信度阈值0.35
autoExpand自动调优增强false

OpenCV 模板匹配 颜色 · 边缘 · 形状

采用颜色、边缘、形状三重加权匹配算法,比传统 FindPic 更精准。支持多尺度降采样搜索,可调节各维度权重,快速模式可跳过边缘/形状计算。

参数说明默认
largeImagePath大图路径必填
smallImagePath小图路径必填
threshold匹配阈值 0~10.85
maxResults最大返回结果数10
overlapThreshold重叠抑制阈值0.0
colorWeight颜色权重0.30
edgeWeight边缘权重0.35
shapeWeight形状权重0.35
fast快速模式false

YOLO 目标检测 NCNN

基于 NCNN 推理框架的端侧 YOLOv5 / YOLOv26 模型。毫秒级推理,支持自定义类别过滤、NMS 去重、输入图像旋转。

参数说明默认
image_path图片路径必填
class_names检测类别列表必填
sim相似度阈值0.4
confidence置信度阈值0.25
nms_thresholdNMS 去重阈值0.45
rotation输入旋转 0/90/180/2700
input_size输入尺寸640
model_version模型版本 auto/v5/v26auto