CLIP Contrastive Language-Image Pre-Training 是OpenAI于2021年提出的一个模型。CLIP将图像和文本编码成向量,可以在同一空间进行比较的表示。

https://mp.weixin.qq.com/s/wOqBjAfEGheevtVykpHeIg

https://mazzzystar.github.io/2022/12/29/Run-CLIP-on-iPhone-to-Search-Photos/

https://github.com/mazzzystar/Queryable