ソフトマージンSVM
ソフトマージン
ハードマージンSVMでは、導出過程で「データは線形分離可能である」という仮定をしており、 線形分離不可能な場合にはうまく動きません。 線形分離できない点ができてしまうのは仕方のないことなので、そのような点を許すことにしましょう。 しかし、無制限に許すと分類ができなくなってしまうので、代わりに、ペナルティを与えることにします。
このペナルティをどの程度重要視するかをCというパラメータで表します。 Cが大きいほどペナルティを重要視されます。C=∞でハードマージンSVMと同じになります。
数学的に考えてみる
すこし長くなりそうなので、別ページへ。 「数学的に考えてみる(ソフトマージンSVM)」を参照してください。
実際にやってみよう
ハードマージンSVMと同様に、2変数の場合についてやってみました。 赤の点と、青の点を、黒い線で分けます。各点はドラッグ&ドロップで動かせるのでいじってみてください。
下あるスライドバーはCパラメータ調整用です。右に行くほど大きく(つまりハードマージンSVMに近く)なります。