分享
多模态神经元
输入“/”快速插入内容
多模态神经元
飞书用户2749
2024年8月7日修改
📌
推荐 PC 端打开
手机端浏览体验没PC端体验效果好
点击蓝字立即跳转:
🧭课程学习
知识库预览
技术指导
神经元家族预览
CLIP
模型中存在哪些功能?
💾
在本节中,检查了四个模型在视觉侧的最终卷积层中发现的神经元。这些神经元中的大多数似乎是可以解释的。 每一层都由数千个神经元组成,因此在初步分析中,我们研究了特征可视化、最能激活神经元的数据集示例,以及在栅格化
为图像时最能激活神经元的英语单词
。这揭示了令人难以置信的功能多样性,在下面分享其中的示例:
49%
51%
49%
51%
图 1:
该图显示了从四个 CLIP 模型的最后一层中选定的神经元,这些模型手工组织成相似神经元的“家族”。每个神经元都由特征可视化(从常规或
分面特征可视化
中选择,以最好地说明神经元)表示,并带有人工选择的标签,以帮助快速提供每个神经元的感觉。除了特征可视化之外,在查看了数百种激活神经元的刺激后,还选择了标签。
人神经元
案例研究
:唐纳德—特朗普神经元
该模型为哪些人开发专用神经元是随机的,但似乎与该人在整个数据集中的流行率相关。以及人们对它们的反应强度。在每个
CLIP
模型中都能找到一个人,那就是唐纳德·特朗普。
人神经元
案例研究
:唐纳德—特朗普神经元
该模型为哪些人开发专用神经元是随机的,但似乎与该人在整个数据集中的流行率相关。以及人们对它们的反应强度。在每个
CLIP
模型中都能找到一个人,那就是唐纳德·特朗普。
💾
•
它强烈地回应了他在各种环境中的形象,包括许多艺术媒介中的肖像和漫画,以及与他密切合作的人,如迈克·彭斯和史蒂夫·班农。它还响应他的政治符号和信息(例如。“墙”和“让美国再次伟大”的帽子)。
•
另一方面,它对 Nicky Minaj 和 Eminem 等音乐家、Fortnite 等视频游戏、Martin Luther King Jr. 等民权活动家以及彩虹旗等 LGBT 符号最
*消极*
激活。
•
为了更好地理解
这个神经元
,使用人类标记来估计不同激活水平的几类图像的条件概率。
零激活的标准偏差
💾
•
图2:
为了更深入地了解特朗普神经元,收集了大约650张图像,这些图像导致它发射不同的数量,并将它们手工标记到我们创建的类别中。这让我们可以估计标签在给定激活水平上的条件概率。
•
详见
附录
。由于黑人/LGBT类别仅包含少量图像,因为它们在数据集中并不经常出现,因此我们通过进一步的实验验证了它们会引起负面激活 。
•
在所有类别中,我们看到特朗普神经元的较高激活是高度选择性的,因为超过90%的标准差大于30的图像与唐纳德特朗普有关。
区域神经元
💾
从当地的天气和食物,到旅行和移民,再到语言和种族:地理是大量在线话语中重要的隐性或显性背景。暴风雪更有可能在
加拿大
被讨论。Vegemite更有可能
出现在澳大利亚
。关于
中国
的讨论更有可能是用中文进行的。
💾
CLIP模型发展出对地理区域有反应
的区域神经元
。这些神经元可以看作是词嵌入中地理信息的视觉类似物。它们对与特定地区相关的各种模式和方面做出反应:国家和城市名称、建筑、杰出的公众人物、最常见种族的面孔、独特的服装、野生动物和当地文字(如果不是罗马字母)。如果显示世界地图,即使没有标签,这些神经元也会选择性地针对地图上的相关区域进行发射。