機械学習② 決定木のサンプル

機械学習

機械学習のアルゴリズムの中に、「決定木」というものがあります。

条件により、分岐していく構造をもつ、樹形図です。

データを分類するとき、「決定木」の形で結果を表示すると分かりやすく示すことができます。

データを分類し、決定木形式で出力するプログラムの書き方はいろいろあります。
その中で、比較的容易にできるプログラムの書き方を紹介します。

言語には「Python」を使い、ライブラリに「scikit-learn」を使用します。
また、コードの入力と実行には「Google Colaboratory」を使用します。

scikit-learn: machine learning in Python — scikit-learn 1.6.1 documentation

まずは「Google Colaboratory」にアクセスします。
ここで、Google アカウントが必要になるので、作成していない方は別に作成ください。

Google Colab

「ノートブックを新規作成」を選択し、プログラムの入力画面にします。

以下のコードを入力します。

from sklearn import tree
from sklearn.datasets import load_iris
iris = load_iris()
lng = tree.DecisionTreeClassifier()
lng = lng.fit(iris.data, iris.target)

import pydotplus
from IPython.display import Image
from graphviz import Digraph

dot_data = tree.export_graphviz(lng, out_file=None, feature_names=iris.feature_names, class_names=iris.target_names, filled=True, proportion=True)
graph = pydotplus.graph_from_dot_data(dot_data)
Image(graph.create_png())

赤の矢印で示した領域にコードを入力し、赤い四角形で囲んだ▶を押すとプログラムが実行されます。

決定木が表示されます。

コメント