<h1 id="cross-validation">Cross Validation<a aria-hidden="true" class="anchor-heading icon-link" href="#cross-validation"></a></h1>
"Trust your CV score in Kaggle competitions more than the public LB score."
<ul>
<li>Hold-out (standard one 80/20 split)</li>
<li>K-folds (split data into k folds and each fold would be a validation set)</li>
<li>Leave-one-out (extreme K-folds)</li>
<li>Leave-p-out</li>
<li>Stratified K-folds (useful for imbalanced datasets)</li>
<li>Repeated K-folds (pick 80/20 split data randomly k times, bad for imbalanced datasets)</li>
<li>Nested K-folds: need to implement mannually, good for hyperparameter tuning</li>
<li>Time series CV (deals with forwardlooking bias in TS data)</li>
</ul>
<a href="https://neptune.ai/blog/cross-validation-in-machine-learning-how-to-do-it-right">Description of CV techniques</a>
<pre class="language-python"><code class="language-python">from sklearn.model_selection import KFold, GroupKFold
</code></pre>
Nested Cross Validation:
<img src="/dendron-wiki/./assets/images/nested_cv.png" alt="alt text">

Cross Validation


Welcome to my Knowledge Base! Here I write about my perception of life, document exciting things I've learned, debate (with myself) on controversial topics. If you know me you will not be surprised to find out that I write mostly about engineering and maths. Other topics I'm interested in are economics, politics, business, chess and poker.