特征交互重要性提供了所有模型特征之间交互的完全透明性,并结合了对这些双变量交互进行排序、过滤和排名的能力。 在最重要的双变量交互作用中,交互作用按重要性度量归零。
生成数据:如果这是第一次请求交互重要性数据,则需要先通过点击“Generate Interaction Data生成交互数据”按钮来生成数据。 将出现以下提示:
在上面的提示中,选择日期范围并为模型的实时部分启用/禁用生成 - 这将在每次重新训练模型时自动为实时模型生成数据,频率是在设置时预定义的。
解释:
屏幕可以显示在列表和卡片视图中,按重要性度量排列,如下所示:
列表显示:
展示双变量特征交互,按重要性排序
卡片视图:
在直观的卡片视图中展示双变量特征交互。 Y 轴代表买入/卖出信号强度,第一个特征绘制在 X 轴上,从蓝色(低)到橙色(高)的点颜色渐变代表第二个特征的值。
顶部的搜索栏可用于将功能缩小到仅感兴趣的功能。 用户还可以通过转换和归一化进行过滤。 例如,您可以仅过滤绝对值(转换)和局部 Z 分数(标准化)。
最后,重要性度量可以是最大绝对值或平均绝对值。
解释双因素相互作用:点击每一行或卡片会弹出一个带有详细双变量图表的弹出窗口。
该图展示了两个选定的特征如何与买入/卖出信号强度相互作用。
以上图为例 - 我们正在研究分析师预期和对数市值之间的相互作用。 分析师预期由右侧的色标表示,对数市值绘制在 X 轴上,买入/卖出信号绘制在 Y 轴上。
该图向我们显示,对于高市值公司,分析师预期与买入/卖出信号的相关性较弱,并且分散性较小,高市值股票的结果更加一致。 然而,分析师对小公司的高预期实际上可能是一个卖出信号,而对小公司的低预期可能会产生强劲的买入信号。
笔记:
1) 可以交换轴以获得不同的交互视角。
2) 可以基于值或百分位数绘制轴,这将因子值归一化以获得潜在的更清晰的表示。
3) 对于二进制变量 (True / False),例如 Sectors - 值 1(亮橙色)将代表 True,而 0 将代表错误。