這是進入 Kaggle 的第一個試題:Kaggle digit recognizer。
這是一個用 CSV 儲存的 MNIST 問題,因此選用 CNN 來解決。資料格式如下:
If we omit the “pixel” prefix, the pixels make up the image like this:
000 001 002 003 ... 026 027
028 029 030 031 ... 054 055
056 057 058 059 ... 082 083
| | | | ... | |
728 729 730 731 ... 754 755
756 757 758 759 ... 782 783
The test data set, (test.csv), is the same as the training set, except that it does not contain the “label” column. Your submission file should be in the following format:
ImageId,Label
1,3
2,7
3,8
(27997 more lines)
The evaluation metric for this contest is the categorization accuracy. For example, a categorization accuracy of 0.97 indicates that you have correctly classified all but 3% of the images.
圖像化類似這個樣子;一個 28*28 黑白階的圖片。程式代碼和 MNIST 練習時代碼類似,額外加上了 CSV 的讀取與儲存邏輯。
Kaggle 分數:0.98614
使用了兩次卷積加上一層隱藏層,配上 SGD 優化,目前差不多就是這樣的結果。準備往下一個題目邁進。