功能介绍

三大引擎，覆盖所有屏幕识别场景

OCR 文字识别 RapidOCR

基于 RapidOCR 深度学习框架，在移动端高效运行。支持自动方向检测、低对比度图像增强、颜色掩码过滤等多种预处理策略，复杂界面也能准确识别。

参数	说明	默认
imagePath	图片路径	必填
sortOrder	排序方式：top / left	top
assumeUpright	是否已是正向	true
singleLine	单行模式	false
targetSize	目标尺寸	1024
boxThreshold	文本框检测阈值	0.45
scoreThreshold	识别置信度阈值	0.35
autoExpand	自动调优增强	false

OpenCV 模板匹配颜色 · 边缘 · 形状

采用颜色、边缘、形状三重加权匹配算法，比传统 FindPic 更精准。支持多尺度降采样搜索，可调节各维度权重，快速模式可跳过边缘/形状计算。

参数	说明	默认
largeImagePath	大图路径	必填
smallImagePath	小图路径	必填
threshold	匹配阈值 0~1	0.85
maxResults	最大返回结果数	10
overlapThreshold	重叠抑制阈值	0.0
colorWeight	颜色权重	0.30
edgeWeight	边缘权重	0.35
shapeWeight	形状权重	0.35
fast	快速模式	false

YOLO 目标检测 NCNN

基于 NCNN 推理框架的端侧 YOLOv5 / YOLOv26 模型。毫秒级推理，支持自定义类别过滤、NMS 去重、输入图像旋转。

参数	说明	默认
image_path	图片路径	必填
class_names	检测类别列表	必填
sim	相似度阈值	0.4
confidence	置信度阈值	0.25
nms_threshold	NMS 去重阈值	0.45
rotation	输入旋转 0/90/180/270	0
input_size	输入尺寸	640
model_version	模型版本 auto/v5/v26	auto