前言

兔年当然要大展宏兔。因为刚好在处理物体识别开发,所以就简单做下总结自己使用 Go 实现对兔子图片的识别的操作。

前期工作

这里主要使用的是旷视Face 的接口来完成这部分的工作。所以只要能获取接口地址或者SDK的权限就可以完成工作。简单的步骤:注册账号==> 控制台中创建应用==> 获取对应的 Api Key 和 Secret。详细的接口说明可以查看旷视提供的接口文档console.faceplusplus.com.cn/documents/5…

请求封装

接口请求方法是 post 请求,请求格式是 multipart/form-data。所以可以对请求进行简单的封装。这里先简单抽出图片地址方式进行封装,其他的key 和secret 可以使用配置在方式。

// 二进制文件形式封装
func RequestFormImgPath(imgPath string) (result []byte, err error) {
    url := "https://api-cn.faceplusplus.com/imagepp/beta/detectsceneandobject"
    method := "POST"
    payload := &bytes.Buffer{}
    writer := multipart.NewWriter(payload)
    _ = writer.WriteField("api_key", _ConfigKey)
    _ = writer.WriteField("api_secret", _ConfigSecret)
    var file *os.File
    if file, err = os.Open(imgPath); err != nil {
        return nil, err
    }
    defer file.Close()
    part3, err := writer.CreateFormFile("image_file", filepath.Base(imgPath))
    _, err = io.Copy(part3, file)
    if err != nil {
        return nil, err
    }
    if err = writer.Close(); err != nil {
        return nil, err
    }
    client := &http.Client{}
    req, err := http.NewRequest(method, url, payload)
    if err != nil {
        fmt.Println(err)
        return
    }
    req.Header.Set("Content-Type", writer.FormDataContentType())
    var res *http.Response
    if res, err = client.Do(req); err != nil {
        return nil, err
    }
    defer res.Body.Close()
    return ioutil.ReadAll(res.Body)
}

这种可使用的场景是,当你的图片存储在OSS 上或者是你本地的课访问的图片地址。当然可以进一步封装请求,可以增加

两个标识请求类型和图片字符串格式值,然后根据请求type 读取不同的值进行请求。

func RequestFormImgPath(imgType int,imgStr string,imgPath string) (result []byte, err error) {
    if imgType =1 {
        imgage_url =imgStr
    }
      if imgType =2 {
        image_base64 =imgStr
    }
      if imgType =3 {
        image_file =imgPath
    }
}

然后就可以根据返回值进行解析结果:objects[0].value == "Rabbit" 说明就是我们想要的兔子。

{
    "time_used": 1398,
    "scenes": [
        {
            "confidence": 42.366,
            "value": "Coast"
        }
    ],
    "image_id": "tJw8Sy1jtTJ+9/DBZNSvvQ==",
    "objects": [
        {
            "confidence": 85.478,
            "value": "Rabbit"
        }
    ],
    "request_id": "1675855779,71f61465-240d-4174-b82b-f98f4b22b082"
}

因为 Go语言没有类的定义,所以如何反序列化请求接口也很是很重要的问题,因为这就要求你的 response 的结构体要定义好的。以上的 json 格式是当你请求成功时的返回结果,但是当请求失败的时候返回结果是不一样的。

所以在设计的时候可以将错误返回的字段也定义在响应结构体上,然后根据 error_message 字段是否非空来判断是否成功与否。

type RabbitResponse struct {
	TimeUsed     int          `json:"time_used"`
	ErrorMessage string       `json:"error_message"` // 接口错误时才有值
	Scenes       []ScenesDto  `json:"scenes"`
	ImageId      string       `json:"image_id"`
	Objects      []ObjectsDto `json:"objects"`
	RequestId    string       `json:"request_id"`
}
type ScenesDto struct {
	Confidence float64 `json:"confidence"`
	Value      string  `json:"value"`
}
type ObjectsDto struct {
	Confidence float64 `json:"confidence"`
	Value      string  `json:"value"`
}

这样就简单的完成了兔子图片的识别接口封装。