Я попытался использовать данные шахт и камней ( http://archive.ics.uci.edu/ml/datasets/connectionist+bench+(sonar,+mines+vs.+rocks) ) для выполнения EDA. Я применил следующий код, который может отображать график плотности для каждого числового столбца.
Есть ли способ построить один и тот же график для каждой числовой переменной в наборе данных, но с двумя строками в каждом графике плотности на основе, если это M или R (последний столбец). Поэтому мы можем видеть, какая переменная показывает разное распределение для метки M vs R.
import pandas as pd
# import file
file = 'https://archive.ics.uci.edu/ml/machine-learning-
databases/undocumented/connectionist-bench/sonar/sonar.all-data'
mr_df = pd.read_table(file, sep=',', header=None)
mr_df.plot(kind='density', subplots=True, layout=(8,8), sharex=False, legend=False, fontsize=1, figsize=(12,12))
plt.savefig('density plot.png')
python,python-3.x,pandas,matplotlib,