CLIP(对比语言-图像预训练)是在各种(图像,文本)对上训练的神经网络。-Python开发

时间:2024-06-14 09:24:48
【文件属性】:

文件名称:CLIP(对比语言-图像预训练)是在各种(图像,文本)对上训练的神经网络。-Python开发

文件大小:3.87MB

文件格式:ZIP

更新时间:2024-06-14 09:24:48

Python Deep Learning

CLIP(对比语言-图像预训练)是在各种(图像,文本)对上训练的神经网络。 与GPT-2和3的零射功能类似,可以用自然语言指示它预测给定图像的最相关的文本片段,而无需直接针对任务进行优化。CLIP [Blog] [Paper] [Model Card ] [Colab] CLIP(对比语言-图像预训练)是在各种(图像,文本)对上训练的神经网络。 可以用自然语言指示它来预测给定图像的最相关的文本片段,而无需直接针对任务进行优化,类似于GPT-2和3的零射功能。我们发现CLIP与原始ResNet50的性能匹配在ImageNet上实现“零镜头”,而无需使用任何原始的1.28M带有标签的示例,


【文件预览】:
CLIP-main
----MANIFEST.in(42B)
----data()
--------yfcc100m.md(912B)
----tests()
--------test_consistency.py(802B)
----LICENSE(1KB)
----CLIP.png(247KB)
----clip()
--------bpe_simple_vocab_16e6.txt.gz(1.29MB)
--------clip.py(7KB)
--------__init__.py(20B)
--------model.py(17KB)
--------simple_tokenizer.py(5KB)
----requirements.txt(48B)
----setup.py(491B)
----.gitignore(105B)
----model-card.md(7KB)
----README.md(7KB)
----notebooks()
--------Prompt_Engineering_for_ImageNet.ipynb(61KB)
--------Interacting_with_CLIP.ipynb(3.14MB)

网友评论