CLIP Contrastive Language-Image Pre-Training 是OpenAI于2021年提出的一个模型。CLIP将图像和文本编码成向量,可以在同一空间进行比较的表示。
https://mp.weixin.qq.com/s/wOqBjAfEGheevtVykpHeIg
https://mazzzystar.github.io/2022/12/29/Run-CLIP-on-iPhone-to-Search-Photos/
https://github.com/mazzzystar/Queryable