您当前的位置：首页 > IT编程 > python
\| C语言 \| Java \| VB \| VC \| python \| Android \| TensorFlow \| C++ \| oracle \| 学术与代码 \| cnn卷积神经网络 \| gnn \| 图像修复 \| Keras \| 数据集 \| Neo4j \| 自然语言处理 \| 深度学习 \| 医学CAD \| 医学影像 \| 超参数 \| pointnet \| pytorch \| 异常检测 \| Transformers \| 情感分类 \| 知识图谱 \|

自学教程：python数据挖掘使用Evidently创建机器学习模型仪表板

51自学网 2022-02-21 10:47:44

python

这篇教程python数据挖掘使用Evidently创建机器学习模型仪表板写得很实用，希望能帮到您。

1、安装包

使用 pip 软件包管理器安装，运行

$ pip install evidently

该工具允许在 Jupyter notebook 中以及作为单独的HTML文件构建交互式报告。如果你只想将交互式报告生成为HTML文件或导出为JSON配置文件，则安装现已完成。

为了能够在 Jupyter notebook 中构建交互式报告，我们使用Jupyter nbextension。如果想在 Jupyter notebook 中创建报告，那么在安装之后，您应该在 terminal 中运行以下两个命令。

要安装 jupyter Nbextion，请运行：

$ jupyter nbextension install --sys-prefix --symlink --overwrite --py evidently

运行

jupyter nbextension enable evidently --py --sys-prefix

有一点需要注意：安装后单次运行就足够了。无需每次都重复最后两个命令。

2、导入所需的库

在这一步中，我们将导入创建ML模型所需的库。我们还将导入用于创建用于分析模型性能的仪表板的库。此外，我们将导入 pandas 以加载数据集。

import pandas as pdimport numpy as npfrom sklearn.ensemble import RandomForestRegressorfrom evidently.dashboard import Dashboardfrom evidently.tabs import RegressionPerformanceTabfrom evidently.model_profile import Profilefrom evidently.profile_sections import RegressionPerformanceProfileSection

3、加载数据集

在这一步中，我们将加载数据并将其分离为参考数据和预测数据。

raw_data = pd.read_csv('/content/day.csv', header = 0, sep = ',', parse_dates=['dteday'])ref_data = raw_data[:120]prod_data = raw_data[120:150]ref_data.head()

4、创建模型

在这一步中，我们将创建机器学习模型，对于这个特定的数据集，我们将使用随机森林回归模型。

target = 'cnt'datetime = 'dteday'numerical_features = ['mnth', 'temp', 'atemp', 'hum', 'windspeed']categorical_features = ['season', 'holiday', 'weekday', 'workingday', 'weathersit',]features = numerical_features + categorical_featuresmodel = RandomForestRegressor(random_state = 0)model.fit(ref_data[features], ref_data[target])ref_data['prediction']  = model.predict(ref_data[features])prod_data['prediction'] = model.predict(prod_data[features])

5、创建仪表板

在这一步中，我们将创建仪表板来解释模型性能并分析模型的不同属性，如 MAE、MAPE、误差分布等。

column_mapping = {}column_mapping['target'] = targetcolumn_mapping['prediction'] = 'prediction'column_mapping['datetime'] = datetimecolumn_mapping['numerical_features'] = numerical_featurescolumn_mapping['categorical_features'] = categorical_featuresdashboard = Dashboard(tabs=[RegressionPerformanceTab])dashboard .calculate(ref_data, prod_data, column_mapping=column_mapping)dashboard.save('bike_sharing_demand_model_perfomance.html')