我们的风险热图/矩阵需要 1 到 10 的值,但如果您的数据是连续的,不在这个区间内,该怎么办?或者如果您的风险表达由单词组成?以下是四种解决方案,包括分档、五分位数、自定义阈值和单词到数字的映射。
分选
在这种求解方法中,数据集中的所有连续值都会被划分为五个仓。请注意,分仓的大小始终保持不变。
举例说明:您的数值介于 0 和 100 之间: 将创建以下分区:
- 0 至 20
- 21 岁至 40 岁
- 41 至 60
- 61 至 80
- 81 至 100
因此,这并没有考虑到各个垃圾箱内的风险数量。 数据范围只是平均分配。
在侧边栏中,首先右键单击要转换的字段。在我们的示例中,字段是 "影响示例"。
然后左击选择 "新建组"。这时就会打开 "组 "窗口。
在 "分仓类型 "中选择 "分仓数量 "选项。在左下角的 "箱数 "中输入数值 "10"。然后,系统会在 "分仓尺寸 "下自动计算分仓的宽度。
最后点击 "确定"。
最后一步,再次点击侧边栏中新建的字段。
现在 "组 "窗口再次出现。
在这里,您选择的分组类型是 "列表 "而不是 "分组"。未分组的值将显示在左侧框中。
现在开始选择每个值,并通过 "分组 "按钮将其移动到右栏。
差不多准备好了!现在,您可以双击每个超级组并插入数值,从而为十个数值分配 1 至 10 的值。最后点击 "确定"。
完成!您已经转换了数据,现在可以将其拖到风险矩阵的坐标轴上。
Quintiles
首先,我们再次右键单击要离散化的字段。在我们的例子中是 "影响示例"。然后选择 "新建措施"。仪表盘上方会打开 DAX 编辑器。
现在我们添加以下代码,并根据数据集中的表格和所需列进行定制。重要:这是五分位数的示例。如有需要,您可以将其调整为百分位数:
定量 =
var FirstQuantile = CALCULATE(PERCENTILE.INC(Table[Column], .2), ALL(Table[Column]))
var SecondQuantile = CALCULATE(PERCENTILE.INC(Table[Column], .4), ALL(Table[Column]))
var ThirdQuantile = CALCULATE(PERCENTILE.INC(Table[Column], .6), ALL(Table[Column]))
var FourthQuantile = CALCULATE(PERCENTILE.INC(Table[Column], .8), ALL(Table[Column]))
var ThisVal = Min(Table[Column])
返回
IF(HASONEVALUE(Table[Column])、
IF(ThisVal FirstQuantile && ThisVal SecondQuantile && ThisVal ThirdQuantile && ThisVal <= FourthQuantile, 4、
5)
)
)
) )
准备就绪!这样我们就离散化并得到了 1 到 5 的值。现在,我们就可以在风险矩阵中使用这个字段了!
自定义阈值
首先,我们再次右键单击要离散化的字段。在我们的例子中是 "影响示例"。然后选择 "新建措施"。仪表盘上方会打开 DAX 编辑器。
现在我们添加以下代码,并根据数据集中的表格和所需列进行定制:
自定义阈值 =
var FirstThreshold = your_first_threshold_value_here
var SecondThreshold = your_second_threshold_value_here
var ThirdThreshold = your_third_threshold_value_here
var FourthThreshold = your_fourth_threshold_value_here
var ThisVal = Min(Table[Column])
返回
IF(HASONEVALUE(Table[Column])、
IF(ThisVal FirstThreshold && ThisVal SecondThreshold && ThisVal ThirdThreshold && ThisVal <= FourthThreshold, 4、
5)
)
)
) )
从文字到数字
首先点击菜单中的 "转换数据"。这将打开 Power Query 编辑器。
选择要转换的列。在本例中是 "概率文本 "列。然后点击左上角的 "来自示例的列",选择 "来自选择"。
新增一列。点击新列的第一个单元格,然后插入所需的数值。在我们的示例中,"Remote"(最低表达式)对应的数值是 "1"。 您不必逐一更改所有数值。Power BI 可以识别这些数字,并根据以下标准自动映射它们 二 你的例子
对数据集中的每一个表达式重复上述操作...
绘制完最后一个表达式后,点击 "确定"。就这样:概率 "的转换列。在 "影响 "中重复上述操作,就得到了所需的数据格式。我们选择这种 1 到 10 的逻辑,是因为每个人对这五个类别都有不同的表述。