这篇教程如何使用SMOT增强自己的数据集解决类不平衡问题写得很实用,希望能帮到您。
不平衡数据处理之SMOTE、Borderline SMOTE和ADASYN详解及Python使用 解决办法
from collections import Counter
from sklearn.datasets import make_classification
from imblearn.over_sampling import ADASYN
把XXX.fit_sample改为XXX.fit_resample就可以了!
X_train, X_test, y_train, y_test = train_test_split(df['posts'], df['type'], test_size=0.2, random_state=123)
# Balance training data ads = ADASYN () X_train_b, y_train_b = ads.fit_resample(X_train, y_train) 返回列表 基于机器学习和TFIDF的情感分类算法,详解自然语言处理 |