機械学習のアルゴリズムの中に、「決定木」というものがあります。
条件により、分岐していく構造をもつ、樹形図です。
データを分類するとき、「決定木」の形で結果を表示すると分かりやすく示すことができます。
データを分類し、決定木形式で出力するプログラムの書き方はいろいろあります。
その中で、比較的容易にできるプログラムの書き方を紹介します。
言語には「Python」を使い、ライブラリに「scikit-learn」を使用します。
また、コードの入力と実行には「Google Colaboratory」を使用します。
scikit-learn: machine learning in Python — scikit-learn 1.6.1 documentation
まずは「Google Colaboratory」にアクセスします。
ここで、Google アカウントが必要になるので、作成していない方は別に作成ください。

Google Colab
「ノートブックを新規作成」を選択し、プログラムの入力画面にします。

以下のコードを入力します。
from sklearn import tree
from sklearn.datasets import load_iris
iris = load_iris()
lng = tree.DecisionTreeClassifier()
lng = lng.fit(iris.data, iris.target)
import pydotplus
from IPython.display import Image
from graphviz import Digraph
dot_data = tree.export_graphviz(lng, out_file=None, feature_names=iris.feature_names, class_names=iris.target_names, filled=True, proportion=True)
graph = pydotplus.graph_from_dot_data(dot_data)
Image(graph.create_png())
赤の矢印で示した領域にコードを入力し、赤い四角形で囲んだ▶を押すとプログラムが実行されます。

決定木が表示されます。

コメント