代码之家  ›  专栏  ›  技术社区  ›  JimDaniel

谷歌购物者的图像识别是如何工作的?

  •  0
  • JimDaniel  · 技术社区  · 15 年前

    3 回复  |  直到 15 年前
        1
  •  2
  •   Rex Kerr    15 年前

    我不知道谷歌购物者 作品。但是它 能够 像这样工作:

    • 拍摄图像并转换为边(使用边过滤器,保留颜色信息)。
    • 找到边相交的点并列出它们(包括颜色和相交边的角度)。
    • 通过选择一对高对比度点并测量它们之间的距离,转换为与旋转无关的度量。现在书的封面被表示为一组数字:(edgecolor1a,edgecolor1b,edgecolor2a,edgecolor2b,distance)。
    • 选取最显著的距离值对,并对距离进行比率。

    Google Shopper也可以发送整个图片,此时Google可以使用更强大的处理器来处理图像处理数据,这意味着它可以使用更复杂的预处理(我选择上面的步骤非常简单,可以在智能手机上实现)。

    总之,一般的步骤很可能是(1)提取尺度和旋转不变的特征,(2)将该特征向量与预先计算的特征库相匹配。

        2
  •  1
  •   Moacir Ponti    14 年前

    1. 提取 特征
    2. 提取 从图像中。有几种方法可以做到这一点,通常是基于OCR(光学字符识别)
    3. 使用特征和文本对数据库执行搜索,以查找最接近的相关产品。

      这也可能是图像也被切割成子图像,因为算法往往会发现一个特定的标志上的图像。

      不同的

      另一个有趣的软件是Google Googles,它使用CBIR(基于内容的图像检索)来搜索与智能手机拍摄的照片相关的其他图像。这与购物者要解决的问题有关。

        3
  •  -1
  •   Nicholas Zieve    15 年前

    模式识别。