自分のデータがある時は、それでグラフを書くのがいいのだが、サンプルのデータが合った方がイメージがしやすかったりする。よく出てくる例は iris である。
こちらは、FisherとAndersonによるアヤメの分類データで、3品種について、がく片(Sepal)と花弁(Petal)について長さと幅のデータを集めたデータとのことではあるが、医療系の私には、なじみがなさ過ぎて、そもそもピンとこない。アヤメのSepalとPetalってそもそもどこなのとさえ思う。
ということで真面目に調べてみた。
アヤメの大きな花びらは、もとは、3枚のがく片である。 その内側の花びらは3枚あり、花の中央にウサギの耳のように立っている。 がく片と花びらが同じ色なので、がく片を外花被片、花びらを内花被片と呼ぶ。 雌しべは1本で、先が3本に分かれて、3本の雄しべの上にかぶさる。
国立科学博物館)
https://www.kahaku.go.jp/research/db/botany/wild_p100/summer/19_ayame.html
3種の品種についてはこちら。
画像引用: https://dataaspirant.com/svm-classifier-implemenation-python-scikit-learn/
花弁とがくは、ここを測るみたい…
画像引用: https://sebastianraschka.com/Articles/2014_python_lda.html
これで少しはデータの意味も理解出来るかなと思う。
コメント