我不知道你是如何设置你的用户界面,以及用户应该如何与图像交互,但如果你的场景图像和伴随的目标图像大小相同,你可以将伴随图像用作掩码。
让用户单击图像(视觉场景)并捕捉他们选择的位置。然后在该位置检查伴随目标图像的值。如果该值为1(或0,取决于您选择的“活动”值),您会得到一个点击并继续前进。基本上,您可以使用目标图像作为ROI。
下面是一个如何实现的小示例
import matplotlib.pyplot as plt
import numpy as np
fig, ax = plt.subplots()
ax.imshow(mask)
mask = np.zeros((50,50))
mask[5:10,5:10]=1
xi = 0
yi = 0
def onclick(event):
global xi,yi,mask
xi,yi = event.xdata,event.ydata
if mask[int(xi),int(yi)]>=1:
print('inside')
else:
print('outside')
cid = fig.canvas.mpl_connect('button_press_event', onclick)
https://matplotlib.org/users/event_handling.html
.