PyInv

プログラミングのメモ、海外投資のメモ

2020-02-01から1ヶ月間の記事一覧

第二回:Ensemble Model - Gradient Boosted Decistion Trees(GBDT)

概要 引き続いてMachine Learning のEnsemble Model。Gradient Boosted Decision Trees 概要 Gradient-Boosted Decision Trees(GBDT) Pros and Cons Pros Cons Structure 主なParameters Usage Gradient-Boosted Decision Trees(GBDT) 連続したいくつもの…

第一回:Ensemble Model - Random Forestsとはなんぞや

Ensemble Model Random Forests Pros and Cons Structure Parmeters Usage Ensemble Model たくさんのMahcine Learning Model をたばねたもの。ひとつひとつにのOverfittingのような問題があっても、全体としては安定。 サンプルはBootstrapによって集められ…

続Python Machine Laerning Models

モデルの書き忘れ. Logistic Regression Structure Parameters Sample Decision Tree Structure 主なParameters Sample Visualization Feature importance モデルの書き忘れ. Logistic Regression, Decision Tree singapp.hatenablog.com Logistic Regressio…

その他のLinear Classifier - Naive Bayes Classifiers

その他のLinear ClassifierとしてNaive Bayes Classifiersがある Naive Bayes Classifiers Bernoulli Naive Bayes Multinomial Naive Bayes Gaussian Naive Bayes Strucuture Naive Bayes Classifiers 特徴量間で独立となる確率分布を用いて事後確率が最大と…

Modelの選び方 - k分割交差検証(k-fold Cross Validation by Validation Curve)とグリッドサーチ(Grid Search)

どのようにModelを選ぶか Validation Curveを使う Structure 主なParameters Usage Sample Furthermore Grid Search Structure 主なParameters Usage Sample どのようにModelを選ぶか Validation Curveを使って仮定した選んだModelに対して、サンプルのとり…

続続続Modelの評価 - ROC曲線とAUC

予測確率を用いたClassification Modelの評価 Confusion MatrixではPredicted Label (予測ラベル as 0 or 1)を用いてモデルを評価した。しかし、Predict Probability (予測確率)→Predicted Labelへと写すthreshold(閾値)が事前には決められるとは限らない…

続続Modelの評価 - Precision-Recall Curve (RecallとPrecisionの可視化)

RecallとPrecisioinの可視化 前準備としてDecision Function Structure Precision-recall curves Structure RecallとPrecisioinの可視化 前準備としてDecision Function SVC等で推定された境界平面からそのアウトプットへの距離。例えばX_testをインプットし…

続Modelの評価 - Dummy ClassifierとConfusion Matrix

Accuracy以外での評価 Dummy Classifier Usage Confusion Matrix Structure Sample Claffisicatoin Report Structure Sample Accuracy以外での評価 例えばImbalance Data(不均衡データ)の評価はどうあってもAccuracyが高くなるため、他の指標を用いる必要…

Modelの評価 (Accuracy)

Modelの評価値 R値(Score) Usage 評価値の検証用ツール Cross-validation Usage Validation Curve Modelの評価値 R値(Score) 統計の決定係数=(単回帰では)被説明変数の分散をどの程度説明変数の分散でカバーしているか、Accuracy の代表 Usage 各skle…

Python Machine Laerning Models

Machine Learning の基礎 全体の流れ モデルの種類 K-nearest neighbor classifier Ridge Regression Lasso Regression Lasso vs Ridge SVM(RBF) Machine Learning の基礎 Supervised Learning 全体の流れ データを学習用とテスト用に分割する X_train, X_te…

プライバシーポリシー

こんにちは管理人のsingappです。下記、「プライバシーポリシー」に関して記載致しましたので、ご一読願います。 当サイトに掲載されている広告について 当サイトが使用しているアクセス解析ツールについて 当サイトへのコメントについて 免責事項 プライバ…